4

Стратегический подход AMD к переходу на 64-битные вычисления основывается на обеспечении совместимости с существующими 32-разрядными приложениями и операционными системами и одновременно, возможности использовать 64-разрядные приложения, там, где это необходимо.

Микроархитектура процессора AMD Opteron™ обеспечивает уникальную гибкость, позволяя использовать новые 64-битные операционные системы и программы, при этом оставаясь совместимой со всем существующим 32-битным программным обеспечением. Новая микроархитектура оперирует 64-битными адресными регистрами и регистрами данных, что позволяет расширить адресуемое пространство оперативной памяти и избавиться от существующего ограничения в 4 Гб, которое создает ощутимые трудности при построении систем обработки информации.

Усовершенствованное ядро процессора позволит получить новый уровень быстродействия как для 64 - разрядных, так и для 32-разрядных систем.

Сравнительные характеристики архитектуры AMD64 и других 64-битных решений, присутствующих в настоящее время на рынке, приведены в таблице.

Архитектура AMD64 расширяет существующую x86 архитектуру, вводя несколько режимов исполнения кода в зависимости от выполняемой задачи.

Режим “Long mode” реализует главное преимущество новой технологии. Он имеет два подрежима: 64-битный режим и режим совместимости.

Режим “Long mode” имеет следующие особенности:

· 64-разрядное виртуальное адресное пространство и 52-разрядное физическое адресное пространство (первые версии процессора AMD Opteron™ будут ограничены меньшими значениями);

· механизм переключения задач архитектуры x86 не поддерживается;

· устаревший реальный режим и режим Virtual-8086 не поддерживаются, поддерживаются только 64-битные приложения и 16- и 32-битные приложения защищённого режима.

64-битный режим поддерживает все новые возможности процессора:

· расширения регистров, доступные с помощью нового префикса (REX):

· 8 новых регистров общего назначения (R8 - R15);

· расширение всех регистров общего назначения до 64 бит;

· плоское адресное пространство, единое для кода, данных и стека.

Режим совместимости позволяет 64-разрядным операционным системам сохранить полную совместимость с существующими 16- и 32-разрядными приложениями, т.е. возможность исполнять любые приложения без перекомпиляции в 64-разрядной операционной системе. В режиме совместимости приложения имеют доступ к первым 4 гигабайтам виртуального адресного пространства. С точки зрения исполняющегося приложения, режим совместимости выглядит как защищённый режим x86. С точки зрения операционной системы, трансляция адресов, обработка прерываний и исключений, а также системные структуры данных используют механизмы режима “Long mode”.

Режим “Legacy mode”. В дополнение к режиму “Long mode” архитектура поддерживает режим “Legacy mode”, который сохраняет полную двоичную совместимость с существующими 16- и 32-разрядными приложениями и операционными системами. Режим “Legacy mode” полностью совместим с существующей 32-разрядной реализацией архитектуры x86.

Архитектура режима “Long mode” предоставляет приложениям 64-разрядное виртуальное адресное пространство и 52-разрядное физическое адресное пространство. Однако в первой реализации процессоры AMD Opteron™ будут поддерживать трансляцию 48-разрядных (256 терабайт) виртуальных адресов в 40-разрядные физические (1 терабайт).

Кроме того, технология AMD64 открывает новые возможности по оптимизации программного кода для разработчиков программ.

Классическая архитектура x86 имеет достаточно малое количество регистров общего назначения, что сдерживает возможность распараллеливания вычислений. Частый обмен данными между регистрами и кэшем процессора уменьшает производительность и усложняет программный код. В архитектуру AMD64 добавлено 8 новых регистров, что открывает новые перспективы для совершенствования вычислительной обработки.

Полная аппаратная поддержка классической системы команд x86 (включая расширенные наборы команд SSE, SSE2, MMX, 3DNow!) позволяет начать эксплуатацию AMD64 систем, не дожидаясь появления 64-битных версий всего используемого программного обеспечения. Отсутствие необходимости приобретать новые версии приложений, которым не нужна 64-битная технология, сохраняет средства, вложенные в программное обеспечение.

Технология HyperTransport™ – это еще одна составляющая новой архитектуры AMD, представляющая собой высокопроизводительный интерфейс типа “точка-точка” предназначенный для связи интегральных микросхем и спроектированный для обеспечения необходимой пропускной способности для будущих вычислительных и коммуникационных платформ. Обеспечивая пиковую производительность до 12,8 Гб/c, технология HyperTransport™ предлагает идеальное решение для большинства требовательных к полосе пропускания системных приложений.

Применение HyperTransport™ в вычислительных системах способствует увеличению общей производительности за счет устранения узких мест при передаче данных, увеличения пропускной способности и уменьшения задержек доступа.

Основные технические характеристики технологии HyperTransport™ приведены в таблице:

На рисунке показаны узкие места классической архитектуры построения систем, которые отсутствуют при использовании технологии HyperTransport™.

1 – системная шина процессора
2 – интерфейс памяти
3 – межчиповое соединение
4 – интерфейсы ввода-вывода для высокоскоростных индустриальных шин

Таким образом, шина HyperTransport™ позволяет обеспечить высокоскоростные связи между компонентами системы для их эффективного взаимодействия.

Основные особенности технологии HyperTransport™:

· Требует небольшое количество сигнальных проводников, что значительно упрощает разработку системы;

· Использование низковольтных дифференциальных сигналов помогает решить проблемы перекрестных помех и электромагнитной совместимости;

· Продлевает жизненный цикл PCI, обеспечивая полную обратную совместимость с программной моделью PCI, драйверами и операционными системами при устранении узких мест и обеспечении пропускной способности необходимой для будущих быстродействующих чипов;

· Использование низковольтных дифференциальных сигналов позволяет проектировщикам эффективно использовать технологии энергосбережения и разрабатывать простые и дешевые платы;

· Поддержка ассиметричных связей и масштабируемость в скорости, ширине шины, частоте и направлении, позволяет разработчикам выбирать решение, соответствующее их задачам;

· Обеспечивает широкую полосу пропускания, что позволяет легко добавлять новые высокопроизводительные части;

· Сокращает время разработки проекта, поскольку добавление новых чипов может быть выполнено без полного перепроектирования системы.

С выходом нового поколения процессоров корпорация AMD меняет принцип их маркировки. Процессоры AMD Opteron™ маркируются номером модели, который не связан с какой-либо частотой и служит только для сравнения производительности в пределах одной линейки. Подобный принцип давно используется в других отраслях IT-индустрии и помогает легко определить общую производительность и позиционирование относительно других продуктов. Такая интегральная методика учитывает не только тактовую частоту процессора, но и другие факторы, влияющие на производительность системы, такие как размер кэша, количество каналов памяти, число соединений шины HyperTransport™, полосу пропускания шины HyperTransport™ и т.п.

Процессор AMD Opteron™ выпускается тремя сериями: 800 – для построения 4-х и 8-ми процессорных конфигураций, 200 – для двухпроцессорных и 100 – для однопроцессорных конфигураций. Номер модели состоит из трех цифр, первая из которых обозначает номер серии, а вторая и третья – производительность относительно других процессоров AMD Opteron™. Например, модель AMD Opteron™ 242 означает процессор, предназначенный для построения двухпроцессорных систем с тактовой частотой 1.6 ГГц. Производительность новых 64-битных процессоров AMD определяется на наборе индустриальных тестов в число которых входят TPC-C (сервер баз данных), SPECWeb (Web-сервер), MMB2 (сервер сообщений), Linpack (HPC), SPECJBB (Java-сервер), SPECCPU2000 (производительность процессора) и SPECWeb SSL (Web-сервер). Процессоры AMD Opteron™ 800-ой и 200-ой серии позиционируются главным образом против семейства Xeon и Xeon MP, имея при этом 64-битную архитектуру.

AMD Opteron™ 100-ой серии предназначены в основном для построения графических рабочих станций.

Нижеприведённая таблица объясняет различия между сериями и номерами моделей процессора AMD Opteron.

Серия	100 Серия	200 Серия	800 Серия
Маштабируемость	1	до 2	до 8
Частота	Номера моделей
1.4ГГц	Модель 140	Модель 240	Модель 840
1.6ГГц	Модель 142	Модель 242	Модель 842
1.8ГГц	Модель 144	Модель 244	Модель 844
Интегрированный контроллер памяти DDR	Да	Да	Да
Разрядность контроллера памяти	128-бит	128-бит	128-бит
Защита ECC DRAM	Да	Да	Да
Технология HyperTransport™	Да	Да	Да
Число каналов HyperTransport (всего/когерентных)	3/0	3/1	3/3
Пропускная способность канала HyperTransport	16 бит x 16 бит	16 бит x 16 бит	16 бит x 16 бит
Частота шины HyperTransport	800МГц	800МГц	800МГц
AMD64	Да	Да	Да
Одновременная работа в 32 и 64-разрядной вычислительной среде	Да	Да	Да
Размер кэша первого уровня (L1) (данные/инструкции)	64Кбайт/ 64Кбайт	64Кбайт/ 64Кбайт	64Кбайт/ 64Кбайт
Размер кэша второго уровня (L2)	1Мб	1Мб	1Мб
Количество ступеней в целочисленном блоке/блоке плавающей точки	12/17	12/17	12/17
Защита данных кэша второго и первого уровня	ECC	ECC	ECC
Защита инструкций кэша второго и первого уровня	Parity	Parity	Parity
Объём реестра выполняемых операций	16Кбайт	16Кбайт	16Кбайт
Объём буфера быстрого преобразования (TLB) адреса кэша первого уровня (данные/инструкции)	40/40	40/40	40/40
Ассоциативность кэша первого уровня (данные/инструкции)	Полная/Полная	Полная/Полная	Полная/Полная
Объём буфера быстрого преобразования адреса кэша второго уровня (данные/инструкции)	512/512	512/512	512/512
Ассоциативность кэша второго уровня (данные/инструкции)	4/4	4/4	4/4
Процесс производства	.13-микрон кремний на диэлектрике	.13-микрон кремний на диэлектрике	.13-микрон кремний на диэлектрике
Место производства	Fab 30, Дрезден Германия

Архитектура AMD64	Другие 64-битные решения
Полная совместимость с существующей архитектурой x86	Набор инструкций НЕСОВМЕСТИМ с существующей x86 архитектурой
Высокая производительность в 32-битном и в 64-битном режиме	Низкая производительность в 32-битном режиме. Будущее развитие сосредоточено только на увеличении производительности в 64-битном режиме.
Обеспечивает плавный переход к новой архитектуре по мере необходимости	Вынуждают переходить на 64-битные вычисления, даже когда это не требуется.
Позволяет сохранить инвестиции в существующие 32-битные приложения, средства и базы данных	Требует удвоенных инвестиций: 2 набора инструкций, 2 операционных среды, 2 набора прикладных приложений, 2 команды разработчиков и поддержки
Полная поддержка 16-, 32- и 64-разрядных приложений, работающих одновременно	Поддержка 16- и 32-разрядных приложений только в режиме программной или аппаратной эмуляции
32-битный код работает без изменений. Возможность работы старых приложений с 64-разрядным адресным пространством	Необходимо перерабатывать 32-разрядный код для получения максимальной производительности. В течении времени перехода необходимо управлять двумя версиями программного кода.

Тип шины	“Точка-точка”, ненаправленная
Ширина	2, 4, 8,16 или 32 бита
Протокол	Пакетная пересылка данных, с множественными пакетами по четыре байта (32 бита)
Полоса пропускания (в каждом направлении)	От 100 до 6500 Мб/c
Пиковая производительность	До 12,8 Гб/c
Сигналы	1,2 В – низковольтные дифференциальные сигналы (LVDS) c дифференциальным импедансом 100 Ом
Поддержка многопроцессорности	Да
Модель памяти	Когерентная и некогерентная

4. Технология AMD64

4.1. Архитектура

4.2. Режимы исполнения кода

4.3. Технология HyperTransport™

4.4. Нумерация моделей и позиционирование