44.
Технология AMD64
Восьмое
поколение
процессоров AMD основано
на совершенно
новой
технологии
AMD64, которая
существенно
расширяет
традиционную
архитектуру
x86. В
результате
достигается
не только
увеличение
общей
производительности,
но и
обеспечивается
масштабируемость
и гибкость
системы.
Переход на 64-разрядные
вычисления
дает
индустрии
новые
возможности
для роста.
Преимуществами
новой
архитектуры
смогут
воспользоваться
в первую
очередь
приложения,
требовательные
к скорости
обработки
больших
массивов
данных:
высокопроизводительные
серверы,
САПР,
системы
управления
базами
данных,
мощные
вычислительные
комплексы. |
|
Стратегический
подход AMD к
переходу на 64-битные
вычисления
основывается
на
обеспечении
совместимости
с
существующими
32-разрядными
приложениями
и
операционными
системами и
одновременно,
возможности
использовать
64-разрядные
приложения,
там, где это
необходимо.
Микроархитектура
процессора AMD
Opteron™
обеспечивает
уникальную
гибкость,
позволяя
использовать
новые 64-битные
операционные
системы и
программы,
при этом
оставаясь
совместимой
со всем
существующим
32-битным
программным
обеспечением.
Новая
микроархитектура
оперирует 64-битными
адресными
регистрами и
регистрами
данных, что
позволяет
расширить
адресуемое
пространство
оперативной
памяти и
избавиться
от
существующего
ограничения
в 4 Гб, которое
создает
ощутимые
трудности
при
построении
систем
обработки
информации.
Усовершенствованное
ядро
процессора
позволит
получить
новый
уровень
быстродействия
как для 64 -
разрядных,
так и для 32-разрядных
систем.
Сравнительные
характеристики
архитектуры
AMD64 и других 64-битных
решений,
присутствующих
в настоящее
время на
рынке,
приведены в
таблице.
Архитектура
AMD64 |
Другие
64-битные
решения |
Полная
совместимость
с
существующей
архитектурой
x86 |
Набор
инструкций НЕСОВМЕСТИМ
с
существующей
x86
архитектурой
|
Высокая
производительность
в 32-битном и в 64-битном
режиме |
Низкая
производительность
в 32-битном
режиме.
Будущее
развитие
сосредоточено
только на
увеличении
производительности
в 64-битном
режиме. |
Обеспечивает
плавный
переход к
новой
архитектуре
по мере
необходимости
|
Вынуждают
переходить
на 64-битные
вычисления,
даже когда
это не
требуется. |
Позволяет
сохранить
инвестиции
в
существующие
32-битные
приложения,
средства и
базы данных |
Требует
удвоенных
инвестиций: 2
набора
инструкций, 2
операционных
среды, 2
набора
прикладных
приложений, 2
команды
разработчиков
и поддержки |
Полная
поддержка 16-, 32-
и 64-разрядных
приложений,
работающих
одновременно
|
Поддержка
16- и 32-разрядных
приложений
только в
режиме
программной
или
аппаратной
эмуляции |
32-битный
код
работает
без
изменений.
Возможность
работы
старых
приложений
с 64-разрядным
адресным
пространством
|
Необходимо
перерабатывать
32-разрядный
код для
получения
максимальной
производительности.
В течении
времени
перехода
необходимо
управлять
двумя
версиями
программного
кода. |
Архитектура AMD64 расширяет существующую x86 архитектуру, вводя несколько режимов исполнения кода в зависимости от выполняемой задачи.
Режим “Long mode” реализует главное преимущество новой технологии. Он имеет два подрежима: 64-битный режим и режим совместимости.
Режим
“Long mode” имеет
следующие
особенности:
· 64-разрядное виртуальное адресное пространство и 52-разрядное физическое адресное пространство (первые версии процессора AMD Opteron™ будут ограничены меньшими значениями);
·
страничное
управление
памятью;
·
ограниченная
поддержка
сегментации;
·
механизм
переключения
задач
архитектуры
x86 не
поддерживается;
·
устаревший
реальный
режим и режим
Virtual-8086 не
поддерживаются,
поддерживаются
только 64-битные
приложения и
16- и 32-битные
приложения
защищённого
режима.
64-битный
режим поддерживает
все новые
возможности
процессора:
·
64-разрядная
виртуальная
адресация;
·
расширения
регистров,
доступные с
помощью
нового
префикса (REX):
·
8 новых
регистров
общего
назначения (R8 -
R15);
·
расширение
всех
регистров
общего
назначения
до 64 бит;
·
8 новых
128-битных
регистров SSE (XMM8 -
XMM15);
·
64-разрядный
указатель
команд (RIP);
·
новый
режим
адресации
относительно
RIP;
·
плоское
адресное
пространство,
единое для
кода, данных и
стека.
Режим
совместимости
позволяет
64-разрядным
операционным
системам
сохранить
полную
совместимость
с
существующими
16- и 32-разрядными
приложениями,
т.е.
возможность
исполнять
любые
приложения
без
перекомпиляции
в 64-разрядной
операционной
системе. В
режиме
совместимости
приложения
имеют доступ
к первым 4
гигабайтам
виртуального
адресного
пространства.
С точки
зрения
исполняющегося
приложения,
режим
совместимости
выглядит как
защищённый
режим x86. С
точки зрения
операционной
системы,
трансляция
адресов,
обработка
прерываний и
исключений, а
также
системные
структуры
данных
используют
механизмы
режима “Long mode”.
Режим
“Legacy mode”. В
дополнение к
режиму “Long mode”
архитектура
поддерживает
режим “Legacy mode”,
который
сохраняет
полную
двоичную
совместимость
с
существующими
16- и 32-разрядными
приложениями
и
операционными
системами.
Режим “Legacy mode”
полностью
совместим с
существующей
32-разрядной
реализацией
архитектуры
x86.
Архитектура
режима “Long mode”
предоставляет
приложениям
64-разрядное
виртуальное
адресное
пространство
и 52-разрядное
физическое
адресное
пространство.
Однако в
первой
реализации
процессоры AMD
Opteron™ будут
поддерживать
трансляцию 48-разрядных
(256 терабайт)
виртуальных
адресов в 40-разрядные
физические (1
терабайт).
Кроме
того,
технология AMD64
открывает
новые
возможности
по
оптимизации
программного
кода для
разработчиков
программ.
Классическая
архитектура
x86 имеет
достаточно
малое
количество
регистров
общего
назначения,
что
сдерживает
возможность
распараллеливания
вычислений.
Частый обмен
данными
между
регистрами и
кэшем
процессора
уменьшает
производительность
и усложняет
программный
код. В
архитектуру
AMD64 добавлено 8
новых
регистров,
что
открывает
новые
перспективы
для
совершенствования
вычислительной
обработки.
Полная
аппаратная
поддержка
классической
системы
команд x86 (включая
расширенные
наборы
команд SSE, SSE2, MMX, 3DNow!)
позволяет
начать
эксплуатацию
AMD64 систем, не
дожидаясь
появления 64-битных
версий всего
используемого
программного
обеспечения.
Отсутствие
необходимости
приобретать
новые версии
приложений,
которым не
нужна 64-битная
технология,
сохраняет
средства,
вложенные в
программное
обеспечение.
4.3.
Технология HyperTransport™
Технология
HyperTransport™ – это еще
одна
составляющая
новой
архитектуры
AMD,
представляющая
собой
высокопроизводительный
интерфейс
типа “точка-точка”
предназначенный
для связи
интегральных
микросхем и
спроектированный
для
обеспечения
необходимой
пропускной
способности
для будущих
вычислительных
и
коммуникационных
платформ.
Обеспечивая
пиковую
производительность
до 12,8 Гб/c,
технология
HyperTransport™
предлагает
идеальное
решение для
большинства
требовательных
к полосе
пропускания
системных
приложений.
Применение
HyperTransport™ в
вычислительных
системах
способствует
увеличению
общей
производительности
за счет
устранения
узких мест
при передаче
данных,
увеличения
пропускной
способности
и уменьшения
задержек
доступа.
Основные
технические
характеристики
технологии
HyperTransport™
приведены в
таблице:
Тип
шины |
“Точка-точка”,
ненаправленная
|
Ширина
|
2, 4,
8,16 или 32 бита |
Протокол
|
Пакетная
пересылка
данных, с
множественными
пакетами по
четыре
байта (32 бита) |
Полоса
пропускания
(в каждом
направлении)
|
От
100 до 6500 Мб/c |
Пиковая
производительность
|
До
12,8 Гб/c |
Сигналы
|
1,2
В –
низковольтные
дифференциальные
сигналы (LVDS) c
дифференциальным
импедансом 100
Ом |
Поддержка
многопроцессорности
|
Да
|
Модель
памяти |
Когерентная
и
некогерентная
|
На
рисунке
показаны
узкие места
классической
архитектуры
построения
систем,
которые
отсутствуют
при
использовании
технологии
HyperTransport™.
1 – системная
шина
процессора
2 – интерфейс
памяти
3 – межчиповое
соединение
4 – интерфейсы
ввода-вывода
для
высокоскоростных
индустриальных
шин
Таким
образом, шина
HyperTransport™
позволяет
обеспечить
высокоскоростные
связи между
компонентами
системы для
их
эффективного
взаимодействия.
Основные
особенности
технологии
HyperTransport™:
·
Может
объединять
до 32
устройств;
·
Требует
небольшое
количество
сигнальных
проводников,
что
значительно
упрощает
разработку
системы;
·
Использование
низковольтных
дифференциальных
сигналов
помогает
решить
проблемы
перекрестных
помех и
электромагнитной
совместимости;
·
Продлевает
жизненный
цикл PCI,
обеспечивая
полную
обратную
совместимость
с
программной
моделью PCI,
драйверами и
операционными
системами
при
устранении
узких мест и
обеспечении
пропускной
способности
необходимой
для будущих
быстродействующих
чипов;
·
Использование
низковольтных
дифференциальных
сигналов
позволяет
проектировщикам
эффективно
использовать
технологии
энергосбережения
и
разрабатывать
простые и
дешевые
платы;
·
Поддержка
ассиметричных
связей и
масштабируемость
в скорости,
ширине шины,
частоте и
направлении,
позволяет
разработчикам
выбирать
решение,
соответствующее
их задачам;
·
Обеспечивает
широкую
полосу
пропускания,
что
позволяет
легко
добавлять
новые
высокопроизводительные
части;
·
Сокращает
время
разработки
проекта,
поскольку
добавление
новых чипов
может быть
выполнено
без полного
перепроектирования
системы.
4.4.
Нумерация
моделей
и
позиционирование
С
выходом
нового
поколения
процессоров
корпорация AMD
меняет
принцип их
маркировки.
Процессоры AMD
Opteron™
маркируются
номером
модели,
который не
связан с
какой-либо
частотой и
служит
только для
сравнения
производительности
в пределах
одной
линейки.
Подобный
принцип
давно
используется
в других
отраслях IT-индустрии
и помогает
легко
определить
общую
производительность
и
позиционирование
относительно
других
продуктов.
Такая
интегральная
методика
учитывает не
только
тактовую
частоту
процессора,
но и другие
факторы,
влияющие на
производительность
системы,
такие как
размер кэша,
количество
каналов
памяти, число
соединений
шины HyperTransport™,
полосу
пропускания
шины HyperTransport™ и т.п.
Процессор
AMD Opteron™
выпускается
тремя
сериями: 800 – для
построения 4-х
и 8-ми
процессорных
конфигураций,
200 – для
двухпроцессорных
и 100 – для
однопроцессорных
конфигураций.
Номер модели
состоит из
трех цифр,
первая из
которых
обозначает
номер серии, а
вторая и
третья –
производительность
относительно
других
процессоров
AMD Opteron™. Например,
модель AMD Opteron™ 242
означает
процессор,
предназначенный
для
построения
двухпроцессорных
систем с
тактовой
частотой 1.6
ГГц.
Производительность
новых 64-битных
процессоров
AMD
определяется
на наборе
индустриальных
тестов в
число
которых
входят TPC-C (сервер
баз данных), SPECWeb (Web-сервер),
MMB2 (сервер
сообщений), Linpack (HPC),
SPECJBB (Java-сервер), SPECCPU2000 (производительность
процессора) и
SPECWeb SSL (Web-сервер).
Процессоры AMD
Opteron™ 800-ой и 200-ой
серии
позиционируются
главным
образом
против
семейства Xeon и
Xeon MP, имея при
этом 64-битную
архитектуру.
AMD
Opteron™ 100-ой серии
предназначены
в основном
для
построения
графических
рабочих
станций.
Нижеприведённая
таблица
объясняет
различия
между
сериями и
номерами
моделей
процессора AMD
Opteron.
Серия |
100
Серия |
200
Серия |
800
Серия |
Маштабируемость |
1 |
до
2 |
до
8 |
Частота |
Номера
моделей |
||
1.4ГГц |
Модель
140 |
Модель
240 |
Модель
840 |
1.6ГГц |
Модель
142 |
Модель
242 |
Модель
842 |
1.8ГГц |
Модель
144 |
Модель
244 |
Модель
844 |
Интегрированный
контроллер
памяти DDR |
Да
|
Да |
Да |
Разрядность
контроллера
памяти |
128-бит |
128-бит |
128-бит |
Защита
ECC DRAM |
Да |
Да |
Да |
Технология
HyperTransport™ |
Да |
Да |
Да |
Число
каналов HyperTransport (всего/когерентных) |
3/0 |
3/1 |
3/3 |
Пропускная
способность
канала HyperTransport |
16
бит x |
16
бит x |
16
бит x |
Частота
шины
HyperTransport |
800МГц |
800МГц |
800МГц |
AMD64 |
Да |
Да |
Да |
Одновременная
работа в 32 и 64-разрядной
вычислительной
среде |
Да |
Да |
Да |
Размер
кэша
первого
уровня (L1) (данные/инструкции) |
64Кбайт/ |
64Кбайт/ |
64Кбайт/ |
Размер
кэша
второго
уровня (L2) |
1Мб |
1Мб |
1Мб |
Количество
ступеней в
целочисленном
блоке/блоке
плавающей
точки |
12/17 |
12/17 |
12/17 |
Защита
данных кэша
второго и
первого
уровня |
ECC |
ECC |
ECC |
Защита
инструкций
кэша
второго и
первого
уровня |
Parity |
Parity |
Parity |
Объём
реестра
выполняемых
операций |
16Кбайт |
16Кбайт |
16Кбайт |
Объём
буфера
быстрого
преобразования
(TLB) адреса
кэша
первого
уровня (данные/инструкции) |
40/40 |
40/40 |
40/40 |
Ассоциативность
кэша
первого
уровня (данные/инструкции) |
Полная/Полная |
Полная/Полная |
Полная/Полная |
Объём
буфера
быстрого
преобразования
адреса кэша
второго
уровня (данные/инструкции) |
512/512 |
512/512
|
512/512 |
Ассоциативность
кэша
второго
уровня (данные/инструкции) |
4/4 |
4/4 |
4/4 |
Процесс
производства |
.13-микрон
кремний на
диэлектрике |
.13-микрон
кремний на
диэлектрике |
.13-микрон
кремний на
диэлектрике |
Место
производства |
Fab
30, Дрезден
Германия |