4. Технология AMD64

    4.1. Архитектура

       4.2. Режимы исполнения кода

          4.3. Технология HyperTransport™

             4.4. Нумерация моделей и позиционирование

 

44.     Технология AMD64

Восьмое поколение  процессоров   AMD   основано   на   совершенно   новой   технологии AMD64, которая существенно расширяет традиционную архитектуру x86. В результате достигается не только увеличение общей производительности, но и обеспечивается масштабируемость и гибкость системы. Переход на 64-разрядные вычисления дает индустрии новые возможности для роста. Преимуществами новой архитектуры смогут воспользоваться в первую очередь приложения, требовательные к скорости обработки больших массивов данных: высокопроизводительные серверы, САПР, системы управления базами данных, мощные вычислительные комплексы.

 

4.1.    Архитектура

Стратегический подход AMD к переходу на 64-битные вычисления основывается на обеспечении совместимости с существующими 32-разрядными приложениями и операционными системами и одновременно, возможности использовать 64-разрядные приложения, там, где это необходимо.

Микроархитектура процессора AMD Opteron™ обеспечивает уникальную гибкость, позволяя использовать новые 64-битные операционные системы и программы, при этом оставаясь совместимой со всем существующим 32-битным программным обеспечением. Новая микроархитектура оперирует 64-битными адресными регистрами и регистрами данных, что позволяет расширить адресуемое пространство оперативной памяти и избавиться от существующего ограничения в 4 Гб, которое создает ощутимые трудности при построении систем обработки информации.

Усовершенствованное ядро процессора позволит получить новый уровень быстродействия как для 64 - разрядных, так и для 32-разрядных систем.

Сравнительные характеристики архитектуры AMD64 и других 64-битных решений, присутствующих в настоящее время на рынке, приведены в таблице.

 

Архитектура AMD64

Другие 64-битные решения

Полная совместимость с существующей архитектурой x86

Набор инструкций НЕСОВМЕСТИМ с существующей x86 архитектурой

Высокая производительность в 32-битном и в 64-битном режиме

Низкая производительность в 32-битном режиме. Будущее развитие сосредоточено только на увеличении производительности в 64-битном режиме.

Обеспечивает плавный переход к новой архитектуре по мере необходимости

Вынуждают переходить на 64-битные вычисления, даже когда это не требуется.

Позволяет сохранить инвестиции в существующие 32-битные приложения, средства и базы данных

Требует удвоенных инвестиций: 2 набора инструкций, 2 операционных среды, 2 набора прикладных приложений, 2 команды разработчиков и поддержки

Полная поддержка 16-, 32- и 64-разрядных приложений, работающих одновременно

Поддержка 16- и 32-разрядных приложений только в режиме программной или аппаратной эмуляции

32-битный код работает без изменений. Возможность работы старых приложений с 64-разрядным адресным пространством

Необходимо перерабатывать 32-разрядный код для получения максимальной производительности. В течении времени перехода необходимо управлять двумя версиями программного кода.

Архитектура AMD64 расширяет существующую x86 архитектуру, вводя несколько режимов исполнения кода в зависимости от выполняемой задачи.

4.2.    Режимы исполнения кода

Режим “Long mode” реализует главное преимущество новой технологии. Он имеет два подрежима: 64-битный режим и режим совместимости.

Режим “Long mode” имеет следующие особенности:

·            64-разрядное виртуальное адресное пространство и 52-разрядное физическое адресное пространство (первые версии процессора AMD Opteron™ будут ограничены меньшими значениями);

·            страничное управление памятью;

·            ограниченная поддержка сегментации;

·            механизм переключения задач архитектуры x86 не поддерживается;

·            устаревший реальный режим и режим Virtual-8086 не поддерживаются, поддерживаются только 64-битные приложения и 16- и 32-битные приложения защищённого режима.

64-битный режим поддерживает все новые возможности процессора:

·            64-разрядная виртуальная адресация;

·            расширения регистров, доступные с помощью нового префикса (REX):

·             8 новых регистров общего назначения (R8 - R15);

·             расширение всех регистров общего назначения до 64 бит;

·             8 новых 128-битных регистров SSE (XMM8 - XMM15);

·            64-разрядный указатель команд (RIP);

·            новый режим адресации относительно RIP;

·            плоское адресное пространство, единое для кода, данных и стека.

Режим совместимости позволяет 64-разрядным операционным системам сохранить полную совместимость с существующими 16- и 32-разрядными приложениями, т.е. возможность исполнять любые приложения без перекомпиляции в 64-разрядной операционной системе. В режиме совместимости приложения имеют доступ к первым 4 гигабайтам виртуального адресного пространства. С точки зрения исполняющегося приложения, режим совместимости выглядит как защищённый режим x86. С точки зрения операционной системы, трансляция адресов, обработка прерываний и исключений, а также системные структуры данных используют механизмы режима “Long mode”.

Режим “Legacy mode”. В дополнение к режиму “Long mode” архитектура поддерживает режим “Legacy mode”, который сохраняет полную двоичную совместимость с существующими 16- и 32-разрядными приложениями и операционными системами. Режим “Legacy mode” полностью совместим с существующей 32-разрядной реализацией архитектуры x86.

Архитектура режима “Long mode” предоставляет приложениям 64-разрядное виртуальное адресное пространство и 52-разрядное физическое адресное пространство. Однако в первой реализации процессоры AMD Opteron™ будут поддерживать трансляцию 48-разрядных (256 терабайт) виртуальных адресов в 40-разрядные физические (1 терабайт).

Кроме того, технология AMD64 открывает новые возможности по оптимизации программного кода для разработчиков программ.

Классическая архитектура x86 имеет достаточно малое количество регистров общего назначения, что сдерживает возможность распараллеливания вычислений. Частый обмен данными между регистрами и кэшем процессора уменьшает производительность и усложняет программный код. В архитектуру AMD64 добавлено 8 новых регистров, что открывает новые перспективы для совершенствования вычислительной обработки.

Полная аппаратная поддержка классической системы команд x86 (включая расширенные наборы команд SSE, SSE2, MMX, 3DNow!) позволяет начать эксплуатацию AMD64 систем, не дожидаясь появления 64-битных версий всего используемого программного обеспечения. Отсутствие необходимости приобретать новые версии приложений, которым не нужна 64-битная технология, сохраняет средства, вложенные в программное обеспечение.

4.3.    Технология HyperTransport

Технология HyperTransport™ – это еще одна составляющая новой архитектуры AMD, представляющая собой высокопроизводительный интерфейс типа “точка-точка” предназначенный для связи интегральных микросхем и спроектированный для обеспечения необходимой пропускной способности для будущих вычислительных и коммуникационных платформ. Обеспечивая пиковую производительность до 12,8 Гб/c, технология HyperTransport™ предлагает идеальное решение для большинства требовательных к полосе пропускания системных приложений.

Применение HyperTransport™ в вычислительных системах способствует увеличению общей производительности за счет устранения узких мест при передаче данных, увеличения пропускной способности и уменьшения задержек доступа.

Основные технические характеристики технологии HyperTransport™ приведены в таблице:

Тип шины

“Точка-точка”, ненаправленная

Ширина

2, 4, 8,16 или 32 бита

Протокол

Пакетная пересылка данных, с множественными пакетами по четыре байта (32 бита)

Полоса пропускания (в каждом направлении)

От 100 до 6500 Мб/c

Пиковая производительность

До 12,8 Гб/c

Сигналы

1,2 В – низковольтные дифференциальные сигналы (LVDS) c дифференциальным импедансом 100 Ом

Поддержка многопроцессорности

Да

Модель памяти

Когерентная и некогерентная


На рисунке  показаны узкие места классической архитектуры построения систем, которые отсутствуют при использовании технологии HyperTransport™.

1 – системная шина процессора
2 – интерфейс памяти
3 – межчиповое соединение
4 – интерфейсы ввода-вывода для высокоскоростных индустриальных шин

Таким образом, шина HyperTransport™ позволяет обеспечить высокоскоростные связи между компонентами системы для их эффективного взаимодействия.

Основные особенности технологии HyperTransport™:

·                       Может объединять до 32 устройств;

·             Требует небольшое количество сигнальных проводников, что значительно упрощает разработку системы;

·             Использование низковольтных дифференциальных сигналов помогает решить проблемы перекрестных помех и электромагнитной совместимости;

·             Продлевает жизненный цикл PCI, обеспечивая полную обратную совместимость с программной моделью PCI, драйверами и операционными системами при устранении узких мест и обеспечении пропускной способности необходимой для будущих быстродействующих чипов;

·             Использование низковольтных дифференциальных сигналов позволяет проектировщикам эффективно использовать технологии энергосбережения и разрабатывать простые и дешевые платы;

·             Поддержка ассиметричных связей и масштабируемость в скорости, ширине шины, частоте и направлении, позволяет разработчикам выбирать решение, соответствующее их задачам;

·             Обеспечивает широкую полосу пропускания, что позволяет легко добавлять новые высокопроизводительные части;

·             Сокращает время разработки проекта, поскольку добавление новых чипов может быть выполнено без полного перепроектирования системы.

4.4.         Нумерация моделей и позиционирование

С выходом нового поколения процессоров корпорация AMD меняет принцип их маркировки. Процессоры AMD Opteron™ маркируются номером модели, который не связан с какой-либо частотой и служит только для сравнения производительности в пределах одной линейки. Подобный принцип давно используется в других отраслях IT-индустрии и помогает легко определить общую производительность и позиционирование относительно других продуктов. Такая интегральная методика учитывает не только тактовую частоту процессора, но и другие факторы, влияющие на производительность системы, такие как размер кэша, количество каналов памяти, число соединений шины HyperTransport™, полосу пропускания шины HyperTransport™ и т.п.

Процессор AMD Opteron™ выпускается тремя сериями: 800 – для построения 4-х и 8-ми процессорных конфигураций, 200 – для двухпроцессорных и 100 – для однопроцессорных конфигураций. Номер модели состоит из трех цифр, первая из которых обозначает номер серии, а вторая и третья – производительность относительно других процессоров AMD Opteron™. Например, модель AMD Opteron™ 242 означает процессор, предназначенный для построения двухпроцессорных систем с тактовой частотой 1.6 ГГц. Производительность новых 64-битных процессоров AMD определяется на наборе индустриальных тестов в число которых входят TPC-C (сервер баз данных), SPECWeb (Web-сервер), MMB2 (сервер сообщений), Linpack (HPC), SPECJBB (Java-сервер), SPECCPU2000 (производительность процессора) и SPECWeb SSL (Web-сервер). Процессоры AMD Opteron™ 800-ой и 200-ой серии позиционируются главным образом против семейства Xeon и Xeon MP, имея при этом 64-битную архитектуру.

AMD Opteron™ 100-ой серии предназначены в основном для построения графических рабочих станций.

Нижеприведённая таблица объясняет различия между сериями и номерами моделей процессора AMD Opteron.

Серия

100 Серия

200 Серия

800 Серия

Маштабируемость

1

до 2

до 8

Частота

Номера моделей

1.4ГГц

Модель 140

Модель 240

Модель 840

1.6ГГц

Модель 142

Модель 242

Модель 842

1.8ГГц

Модель 144

Модель 244

Модель 844

Интегрированный контроллер памяти DDR

Да

Да

Да

Разрядность контроллера памяти

128-бит

128-бит

128-бит

Защита ECC DRAM

Да

Да

Да

Технология HyperTransport™

Да

Да

Да

Число каналов HyperTransport (всего/когерентных)

3/0

3/1

3/3

Пропускная способность канала HyperTransport

16 бит x
16 бит

16 бит x
16 бит

16 бит x
16 бит

Частота шины HyperTransport

800МГц

800МГц

800МГц

AMD64

Да

Да

Да

Одновременная работа в 32 и 64-разрядной вычислительной среде

Да

Да

Да

Размер кэша первого уровня (L1) (данные/инструкции)

64Кбайт/
64Кбайт

64Кбайт/
64Кбайт

64Кбайт/
64Кбайт

Размер кэша второго уровня (L2)

1Мб

1Мб

1Мб

Количество ступеней в целочисленном блоке/блоке плавающей точки

12/17

12/17

12/17

Защита данных кэша второго и первого уровня

ECC

ECC

ECC

Защита инструкций кэша второго и первого уровня

Parity

Parity

Parity

Объём реестра выполняемых операций

16Кбайт

16Кбайт

16Кбайт

Объём буфера быстрого преобразования (TLB) адреса кэша первого уровня (данные/инструкции)

40/40

40/40

40/40

Ассоциативность кэша первого уровня (данные/инструкции)

Полная/Полная

Полная/Полная

Полная/Полная

Объём буфера быстрого преобразования адреса кэша второго уровня (данные/инструкции)

512/512

512/512

512/512

Ассоциативность кэша второго уровня (данные/инструкции)

4/4

4/4

4/4

Процесс производства

.13-микрон кремний на диэлектрике

.13-микрон кремний на диэлектрике

.13-микрон кремний на диэлектрике

Место производства

Fab 30, Дрезден Германия

 

 

 

                                                                     

Hosted by uCoz