ИСТОРИЯ РАЗВИТИЯ ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ
8.2. Суперкомпьютеры, дальнейшее развитие



Общие тенденции развития архитектур суперкомпьютеров:
Неизбежен закат векторно-конвейерной архитектуры суперкомпьютеров. Крупнейшие производители таких систем в США уже свернули их производство (например корпорация Convex) или планируют это сделать (Cray Research, вошедшая в состав SGI, переходит к единой общей с SGI аппаратно-программной платформе, что, вероятно, означает построение систем массового параллелизма).
Системы массового параллелизма выходят на первые позиции, в том числе по производительности. МРР-системы создаются на базе высокопроизводительных стандартных микропроцессоров RISC-архитектуры - тех же, что используются в рабочих станциях и серверах.
Фирмой IBM был разработан суперкомпьютер Deep Blue, как система массового параллелизма. Это, был первый компьютер, победивший чемпиона мира по шахматам. Компьютер Deep Blue разрабатывался первоначально в университете Carnegie Mellon студентами Фенг-хсиунгом Хсу и Марри Кампбеллом на чипсете, использовавшемся в компьютере Sun 3/160. Проект был принят к исполнению фирмой IBM в 1989, когда Кампбелл пришел работать в фирму. В этом году впервые против чемпиона мира Гарри Каспарова играл компьютер Deep Though. Каспаров легко обыграл компьютер в двух партиях. Следующее состязание Каспарова состоялось в феврале 1996 с компьютером Deep Blue. Компьютер был собран на 32-х восьмипроцессорных кластерах RS/6000. Каспаров выиграл снова.
К февралю 1997 года была разработана новая шахматная программа и значительно увеличена скорость вычислений компьютера, и тогда "Голубому гиганту" удалось победить Каспарова со счетом 3.5:2.5.

Широкое применение находят в настоящее время системы с физически распределенной, но логически разделяемой оперативной памятью (одна из таких архитектур сс-NUMA) - это часть общей тенденции использовать логически общую оперативную память.
Развитие архитектур суперкомпьютеров показало, что путь от симметричных многопроцессорных систем (SMP) к системам массового параллелизма (МРР системам) путем кластеризации SMP систем - оказался мало эффективным. Поэтому в "SMP-частях" современных систем массового параллелизма (как и в самих SMP-компьютерах) отказываются от применения системной шины для ликвидации проблемы "узкого горлышка" в пользу коммутатора. В качестве примера можно назвать серверы SUN Ultra Enterprise, серверы S-класса фирмы HP и т. д.
Наблюдается общая ориентация на применение стандартных шин ввода-вывода, ориентация на применение периферийных устройств современных индустриальных стандартов и отказ от специальных периферийных устройств собственной разработки (что было характерно ранее для суперкомпьютеров типа Cray Research и мэйнфреймов).

Несмотря на постоянный поиск новых технологий, современная технологическая база пока не исчерпала всех своих возможностей, хотя технологически все труднее уменьшать размеры отдельных элементов. К 2000 году преодолен предел в 1мкм. Быстродействие приближается к верхнему достижимому уровню, энергопотребление к нижнему пределу. Диапазон от 0,1 до 0,01мкм. еще можно отнести к кристаллической электронике, но сочетающейся с квантовой неопределенностью поведения элементов. Элементы становятся сравнимы с размерами атомов и простейших молекул.
Включая свою персональную ЭВМ, усаживаясь за экран рабочей станции или за терминал суперкомпьютера, профессиональный пользователь рано или поздно приходит к выводу, что вычислительные возможности его электронного помощника ограничены. Физики и астрофизики, генетики и метеорологи, военные все чаще сталкиваются с задачами, для решения которых требуется больше ресурсов, чем имеется в наличии на всем земном шаре.
Как панацея от неотвратимо надвигающегося мрака вычислительной беспомощности, на пороге XXI века появилось слово "petaflop" (петафлоп или 1015) - миллион миллиардов операций с плавающей запятой в секунду.
Задачи, эффективное решение которых под силу исключительно суперкомпьютеру с производительностью порядка одного петафлопа, распадаются на два класса: задачи с преобладанием целочисленных вычислений и задачи с преобладанием вычислений с плавающей точкой. В каждом классе, в свою очередь, легко выделить подклассы военно-прикладных и научно-практических приложений.
К первому классу относятся криптография (например взламывание кодов) и создание полноценного искусственного интеллекта, ко второму - моделирование ядерных взрывов, долгосрочный прогноз погоды и вычислительные задачи гидродинамики.
Противоречивые требования, предъявляемые заказчиками к суперкомпьютеру, приводят к необходимости проектирования компьютера общего назначения, хотя специализированные архитектуры могли бы быть более эффективными для тех или иных приложений.
В настоящее время становится очевидным, что классические суперкомпьютеры достигли максимума производительности либо близки к нему. Использование глубокосубмикронных полупроводниковых технологий позволит увеличить тактовую частоту не более чем до 1-2 ГигаГерц. Так же очевидно, что путь к петафлопному суперкомпьютеру лежит через массированное распараллеливание вычислений.
Идея создания мощного компьютера на базе стандартных компонентов, попросту говоря, объединение их под управлением единой оперционной системы не нова.
Одним из наиболее успешных шагов в этом направлении стало создание в Калифорнийском Технологическом Институте (CalTech, США) распределённого вычислительного комплекса "Беовульф", состоящего из кластеров (персональных ЭВМ), соединенных высокоскоростной специализированной сетью и оснащенных операционной системой Линукс. Первые работы были проведены в 1994 году. Томас Стерлинг и Джон Беккер построили кластерную систему, состоящую из шестнадцати процессоров класса i486DX4, соединенных посредством сети Ethernet. Этот проект и получил название Beowulf.


Первый кластер Beowulf

(Проект возник в научно-космическом центре NASA - Goddard Space Flight Center (GSFC), точнее в созданном на его основе CESDIS (Center of Excellence in Space Data and Information Sciences).
Проект начинался летом 1994 года сборкой 16-ти процессорного кластера (на процессорах 486DX4/100MHz, 16MB памяти и 3 сетевых адаптера на каждом узле, 3 "параллельных" Ethernet-кабеля по 10Mбит/с.). Данный кластер, который и был назван "Beowulf", создавался как вычислительный ресурс проекта Earth and Space Sciences Project (ESS).
У компьютеров архитектуры SMP, MPP, параллельных векторных есть один большой недостаток - цена, подчас недоступная для многих образовательных и научно-исследовательских организаций.
Производительность персональных компьютеров на базе процессоров Intel в последние годы значительно выросла. Такие компьютеры стали создавать серьезную ко
уренцию рабочим станциям на базе RISC, особенно по показателю цена/производительность. Идея создавать параллельные вычислительные системы (кластеры) из общедоступных компьютеров на базе Intel и недорогих Ethernet-сетей, устанавливая на эти компьютеры бесплатную операционную систему Linux и одну из бесплатно распространяемых коммуникационных библиотек оказалась плодотворной. При решении большого класса задач и при достаточном числе узлов такие системы дают производительность, сравнимую с суперкомпьютерной.
По сообщениям газет, итальянская компания Quadrics Supercomputers World SpA подписала с корпорацией Digital Equipment соглашение о создании к 2000 году одного из наиболее мощных суперкомпьютеров в мире. Quadrics представляет собой совместное предприятие, образованное государственной технологической группой Finmeccanica и компанией Meiko. Вкладом Quadrics в проект станет технология скоростного соединения, а Digital предоставит вычислительные модули и иные аппаратные компоненты.
Предполагается, что при использовании нового суперкомпьютера стоимость 1 млрд. операций в секунду составит 15 тыс. долл. (сейчас этот показатель в среднем вдвое выше). Суперкомпьютер предназначен для использования в военных, исследовательских и коммерческих целях.
Агенство по Атомной Энергии (СEA) Франции выбрало корпорацию Compaq Computer в качестве поставщика новой суперкомпьютерной системы, которая, как они полагают, должна стать самой крупной на европейском континенте. Система будет представлять собой кластер из нескольких серверов AlphaServer SC и будет объединять в общей сложности более 2500 процессоров Alpha, суммарная пиковая производительность которых составит более 5 TFLOPS. Будет использоваться высокоскоростная сеть передачи данных, разработанная итальянской компанией Quadrics Supercomputers World. Агенство по Атомной Энергии планирует использовать новый суперкомпьютер для поддержки программ моделирования, в целях обеспечения безопасности ядерного боезапаса Франции. Предполагается, что система вступит в строй в конце 2001 года.


Кластер суперкомпьютера типа Беовульф,
изготовленный фирмой Compag
(Compag Alpha Beowulf Claster)

США занимают место лидера на ры
е суперкомпьютеров, хотя эту позицию они уступали Японии в 1990 году. В 1997 году 16 из 20 самых быстpых суперкомпьютеров были произведены в Соединенных Штатах, 4 - в Японии. Ни один из суперкомпьютеров, которые были введены в строй в 1997 году, не был создан в европейской стране.



Кластер суперкомпьютера типа Беовульф,
изготовленный фирмой Intel

Российский Институт Высокопроизводительных Вычислений и Баз Данных является одним из крупнейших суперкомпьютерных центров в Восточной Европе.
1 апреля 1998 года проект компьютера класса Beowulf "Паритет" был одобрен Министерством Науки и Технологий РФ. "Паритет" включал в себя 4 узла, состоящих из 2 x процессоров Intel Pentium II (450 МГц), жесткого диска емкостью 9,1 Гбайт, быстрой памяти RAM (512 Мб).
Фирма Диадема (Новосибирск) осуществила сборку и тестирование кластера, состоящего из девяти компьютеров высокого класса, объединенных высокоскоростной сетью в один компьютер под управлением операционной системы Linux RedHat. Даже предварительные данные говорят о том, что подобная система обладает потрясающей вычислительной мощью.

а
Кластер, состоящий из девяти компьютеров,
объединенных высокоскоростной сетью

Скорость вычислений, показанная кластером, оказалась одного порядка с такими всемирно известными суперкомпьютерами, как CRAY. Система подходит для обсчитывания таких глобальных объемов данных, которые необходимы, например, при геологических, метеорологических и ародинамических расчетах.

Вычислительный кластер, способный ко
урировать по производительности с отдельными представителями семейства суперкомпьютеров Cray, 20 марта 2000 года введен в эксплуатацию в Научно-исследовательском вычислительном центре Московского государственного университета. В январе 2001 года кластер был значительно расширен.



Кластер суперкомпьютера Московского
государственного университета

Компания Inel поставила и настроила сетевое оборудование и программное обеспечение и изготовила 12 двухпроцессорных серверов, составляющих кластер.
Эти серверы на базе процессоров Pentium III с тактовой частотой 500 МГц и оперативной памятью 256 Мбайт каждый, объединены в двухмерный тор. Максимальная пропускная способность сети SCI составляет 80 Мбайт/с, а производительность всего кластера достигает 12 GFLOPS (миллиардов операций с плавающей точкой в секунду). По результатам тестов NPB производительность кластера НИВЦ МГУ сравнима с аналогичным показателем для суперкомпьютеров семейства Cray T3E с таким же числом процессоров.

Триумфальный успех, а также сравнительная дешевизна и простота изготовления вычислительного комплекса высокой производительности привели к возникновению "синдрома Беовульфа". В самом деле, комплекс с производительностью, достаточной для военных и криптографических приложений, может быть собран из общедоступных компонент в любой стране мира, включая государства с репутацией "очагов международного терроризма" (Ирак, Ливия, Иран). Ситуация усугубляется тем, что комплектующие для персональных ЭВМ, используемые для сборки "Беовульфа", не попадают под экспортные ограничения правительства США, а также могут быть легко приобретены в третьих странах.
При всей своей привлекательности, у "Беовульфа" есть как минимум один серьезный недостаток. Простые оце
и, основанные на анализе энерговыделения современных персональных компьютеров и рабочих станций, показывают, что суперкомпьютер с производительностью 1 петафлоп (1015) собранный на основе БИС микропроцесоров, будет потреблять мощность в 10 мегаватт. Учитывая, что для уменьшения времени распространения сигналов между процессорами и оперативной памятью суперкомпьютер должен быть плотно упакован в несколько кубометров пространства, легко предсказать, что через несколько минут работы он просто расплавится. Жидкостная система охлаждения могла бы обеспечить теплоотвод, однако ее геометрические размеры приводят к существенному увеличению задержек и увеличению количества параллельных процессов, необходимых для компенсации этих задержек. Это, в свою очередь, увеличивает мощность, потребляемую микропроцессорами и суперкомпьютером в целом. Казалось бы, что этот фундаментальный замкнутый круг ставит крест на возможности создания петафлопного суперкомпьютера.
Противовесом "Беовульфу" мог бы стать только суперкомпьютер, основанный на радикально иных принципах.
Решение проблемы было предложено учеными Томасом Стерлингом и Полом Мессиной из Калифорнийского Технологического Института (Tomas Sterling, Paul Messina, Caltech, США), Гуаном Гао из университета Мак-Гилл (Guang Gao, McGill, Канада) и Константином Лихоревым из университета штата Нью-Йорк (Konstantin Likharev, SUNY, США). Ими была разработана принципиально новая архитектура будущего суперкомпьютера - Гибридно-технологическая Многопоточная Архитектура (ГТМПА; Hybrid Technology Multithreaded Architecture, HTMT). В основе ГТМПА лежит использование нетрадиционных технологий (гибридность) и расщепление параллельных процессов на более мелкие независимые фрагменты: потоки и нити (многопоточность). Более подробно о петафлопном компьютере см. в разделе "Квантовые компьютеры"
За новым петафлопным суперкомпьютером закрепился термин "гиперкомпьютер", выделяющий его из семейства "младших братьев" (Cray, IBM и Silicon Graphics).

Источники информации:
1.http//spb.parallel.ru/computers/reviews/beowulf.htm
Что такое Beowulf? (Лаборатория Параллельных
Информационных Технологий, НИВЦ МГУ)


Previous First Previous Next
 
Hosted by uCoz