Хорошо налаженная машина разработки и производства новых, все более быстродействующих микропроцессоров Alpha работает без сбоев и наращивает обороты. В этом году Digital Equipment Corporation объявила о начале выпуска микропроцессоров Alpha c тактовыми частотами 366 и 400 МГц и планах выпуска чипов с частотами 433 МГц (в середине года) и 500 МГц ( в конце года). Представляется, что эти планы также будут успешно реализованы.
Уже одного этого достаточно для появления на рынке новых моделей рабочих станций и серверов фирмы DEC, поскольку для перехода на новую модель часто нужно лишь заменить процессор. Однако DEC еще и успевает вносить в них архитектурные усовершенствования. А лидерство по производительности микропроцессоров означает, что по производительности передовые позиции занимают и собственно компьютеры DEC.
Так, в этом году Digital объявила о модификациях младших моделей - AlphaStation 255 (см. таблицу 1) с возможностью модернизации до AlphaStation 500. Последние станции относятся к среднему классу и базируются уже на микропроцессорах Alpha 21164, которые имеют теперь тактовые частоты 266 и 333 МГц (с июня текущего года начнутся поставки AlphaStation уже с 400 МГц-версиями процессора). Для этих, а также других рабочих станций DEC, использующих шину PCI, компания выпустила новую версию графических подсистем PowerStorm. Существует целый ряд моделей этого семейства, имеющих различную производительность и соответственно различающихся в цене.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Оценки производительности рабочих станций от DEC на тестах SPEC-95.
Сочетание высокой производительности вычислений с хорошими графическими возможностями и составляло цель DEC. Так, по данным компании, на приложении ProENGINEER от Parametric Technologies AlphaStation 500/266 имеет производительность на 33% больше, чем Sun UltraSPARC 140, на 61% больше, чем HP C100 и на 78% больше, чем SGI Indigo2 R4400/250.
В свою очередь, AlphaStation 500/333 на этом же приложении на 85% быстрее, чем Sun UltraSPARC 170E и HP J210 и на 117% быстрее Indigo2 R4400/250.
В конфигурацию AlphaStation 500, кроме микропроцессора, входит внешний кэш 3-го уровня объемом 2 Мбайт, до 512 Мбайт оперативной памяти, до 4 слотов PCI. Обеспечена поддержка каналов F&W SCSI-2, а в корпусе могут размещаться до 5 внутренних устройств. В AlphaStation 500 используется 256-разрядная шина памяти, что позволяет поддерживать высокий темп обмена данными. AlphaStation 255 имеет несколько более скромные характеристики. Так, шина памяти является 128-разрядной, внутренних устройств может быть до 4, внешний кэш 2-го уровня имеет объем 1 Мбайт. AlphaStation 255 может иметь 2 слота PCI и 1 слот ISA.
Хотя эти компьютеры и относятся к младшему и среднему классам, специалисты наверняка оценят хорошие возможности расширения конфигурации и поддержку современных протоколов шин ввода/вывода.
В этом же году появились и новые модификации серверов. Так, AlphaServer 1000A на базе Alpha 21064 (модели 1000A 4/233 и 4/266) имеют теперь до 7 слотов шины PCI и 2 - шины EISA. Появились и усовершенствованные модели серверов среднего класса AlphaServer 2100A (см.ниже). Очевидно, что DEC стремится к гегемонии по параметрам производительность и стоимость/производительность во всем диапазоне компьютерных систем: от младших рабочих станций до самых мощных (AlphaStation 600) и от серверов уровня рабочей группы до суперкомпьютерных серверов (AlphaServer 8400). В настоящей публикации мы познакомим читателя с архитектурой AlphaStation 600 и серверов серии 2100.
AlphaStation 600 5/XXX
В этом обозначении 5 означает поколение микропроцессоров Alpha (EV5); ххх - тактовую частоту (ххх=266, 300 или 333). Микропроцессоры Alpha 21164, используемые в этих рабочих станциях, имеют кэш-память L1 - по 8 Кбайт для данных и команд, 3-кратную частично ассоциативную кэш-память 2-го уровня с обратной записью емкостью 96 Кбайт (для команд и данных) и внешний кэш 3-го уровня емкостью 2 или 4 Мбайт. Этот кэш работает в режиме обратной записи при объеме блока кэш-памяти в 64 байта. Теоретически емкость кэша 3-го уровня может быть увеличена до 16 Мбайт. Время доступа в кэш кратно времени цикла процессора и составляет обычно 7-8 тактов процессора для первой порции данных, а следующие данные передаются уже быстрее. При типовом времени такта SRAM в кэше 12 нс это дает время доступа 24 нс для первых 128 бит данных. Системная плата использует 256-разрядный путь данных в оперативную память объемом от 32 Мбайт до 1 Гбайт. Контроллер памяти, интегрированный в управляющий чип (см. ниже), может поддерживать до 8 банков DRAM, однако конструктивные ограничения позволяют иметь на сегодняшний день не более 4 банков (1 Гбайт). Интересная особенность контроллера памяти, реализуемая использованием специальных программируемых регистров, дает возможность поддерживать широкий диапазон объемов и "скоростей" DRAM (от 50 до 80 нс).
В AlphaStation 600 две транзакции на чтение блоков кэша из оперативной памяти могут быть объединены в одну на чтение 128 байт данных, если обращение идет к одной странице памяти. Это позволяет достигнуть пропускной способности чтения данных из памяти в 284 Мбайт/с. В знаменитой своей высокой пропускной способностью рабочей станции IBM RS/6000 mdl 590 применяется кэш с размером блока 256 байт. Подход DEC является более гибким, т.к. при очень большой длине передаваемого блока данных в RS/6000 mdl 590 возможна передача "лишних данных", что вызывает повышенную нагрузку на тракт процессор-память.
Величина задержки при обращении к памяти в AlphaStation 600 составляет 180 нс. Здесь интересно отметить, что EDO DRAM, которая становится популярной на ПК, используется и в AlphaStation 600, что не приводит к революционному повышению производительности тракта "процессор-память". Дело в том, что узким местом обычно является как раз задержка (при обращении к памяти), которая в EDO DRAM существенно не изменилась.
В максимальной конфигурации рабочая станция может содержать 4 слота PCI (3 слота - 64-разрядного PCI, и один - PCI-32), 3 слота EISA и 1 - PCI/EISA. Стандартно поддерживаются каналы F&W SCSI-2. Вследствие синхронного взаимодействия основных блоков времена циклов RAM, кэш-памяти и PCI кратны времени цикла процессора.
Пожалуй, основной архитектурной особенностью этих рабочих станций является то, что для обеспечения высокой пропускной способности и низких величин задержек при передаче данных между процессором, оперативной памятью и шиной PCI используется специальный набор микросхем DEC 21171. Точнее говоря, этот набор микросхем содержит срез данных (data slice); интерфейс PCI; чип управления памятью (управляющий чип); мост с EISA-шиной на базе наборов чипов Intel 82374, 82375 и др.
128-разрядная шина SysData, защищенная от ошибок кодами ECC, передает данные между процессором, внешним кэшем и срезом данных, а уже последний имеет 256-разрядный тракт в оперативную память. Срез данных взаимодействует с управляющим чипом через 64-разрядную шину, защищенную кодами ECC. В передачу данных между PCI и процессором, а также внешним кэшем и оперативной памятью вовлечен управляющий чип и срез данных.
На самом деле срез данных представляет собой 4 микросхемы, которые вместе и составляют логически 256-разрядную шину к оперативной памяти, 128-разрядную шину к процессору и 64-разрядную шину к управляющему чипу, а затем - к шине PCI. Эти микросхемы содержат внутренние буферы, в которых временно запоминаются данные процессорного трафика, DMA и ввода/вывода.
Управляющий чип осуществляет контроль над оперативной памятью и срезом данных и обеспечивает интерфейс с 64-разрядной локальной шиной PCI. Такое сложное архитектурное строение AlphaStation 600 позволило добиться высокой пропускной способности при доступе процессора в оперативную память и при операциях ввода/вывода, в том числе в режиме DMA. Соответствующие оценки производительности приведены в таблице 2.
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
Пропускная способность AlphaStation 600 при обработке различных транзакций (Мбайт/с).
Эти характеристики производительности можно дополнить "традиционными" - SPECint92/SPECfp92 =331/503 и оценками LINPACK (144 MFLOPS при N=100, 380 MFLOPS при N=1000) для 300 МГц AlphaStation 600 c 4 мегабайтным кэшем 3-го уровня ( на 12 нс SRAM). Все приведенные здесь данные - убедительное свидетельство того, что на сегодня эта рабочая станция является самой "мощной" в мире. Что касается графических возможностей, то в этой станции они могут поддерживаться специальной графической платой DEC ZLXp-E1, работающей с шиной PCI.
AlphaServer 2100
SMP-серверы серии 2100 могут содержать до 4 процессоров и относятся к классу серверов масштаба крупного подразделения. Выпускаемые модели 4/275, 5/250 и 5/300 используют микропроцессоры Alpha 21064 и 21164 (система обозначения различных моделей серверов совпадает с описанной выше для AlphaStation). Усовершенствованные модели этих серверов (серия 2100А) имеют до 8 слотов PCI и 3 слотов EISA, в то время как AlphaServer 2100 мог содержать до 3 слотов PCI. Максимально допустиммая емкость оперативной памяти составляет 2 Гбайт.
С новыми моделями сервера на базе микропроцессоров Alpha 21164 стал поставляться и новый процессорный модуль второго поколения KN470 (вместо модуля KN460 на базе Alpha 21064). KN470 может заменять старый модуль в том же корпусе, т.к. он имеет ту же форму и размеры и работает от того же источника питания. Вместе с тем в KN470 было внесено много усовершенствований, вызванных переходом на чип 21164. Это связано, в частности, с изменением организации кэш-памяти в Alpha 21164 по сравнению с 21064. В новом модуле стал применяться и новый протокол обеспечения когерентности кэша (invalidate-on-write) и, соответственно, в системной шине были добавлены новые типы транзакций.
С переходом на Аlpha 21164 появились и другие аппаратные доработки, например, специальная память - дублирующие теги для блоков кэш-памяти третьего уровня (уменьшают задержки при работе протокола поддержки когерентности кэша), усовершенствование арбитра системной шины (уменьшает задержки арбитрирования).
Эти и другие модификации позволили добиться существенного улучшения производительности AlphaServer 2100 5/250 с модулями KN470 по сравнению с 2100 4/275 (с модулями KN460), что иллюстрируется данными таблицы 3.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Сравнение производительности AlphaServer 2100 5/250 и 4/275.
В ней, кроме хорошо знакомых читателям тестов, приведены также данные ставших ныне общеизвестными в суперкомпьютерном мире тестов пропускной способности оперативной памяти МакКалпина (J.D.McCalpin). В нашей рубрике мы приводили результаты этих тестов для ряда суперкомпьютерных систем (CWR, #8, 1995). Напомним, что операции copy, scale, sum и triad означают циклы с телами a(i)=b(i), a(i)=3.0*b(i), c(i)=a(i)+b(i) и c(i)=a(i)+3.0*b(i) соответственно. Приведенные данные показывают, что пропускная способность подсистемы памяти в серверах 2100 5/250 также возросла по сравнению с 2100 4/275.
Все приведенные в настоящей статье данные свидетельствуют о том, что DEC по-прежнему остается лидером в области производительности компьютеров самых разных классов.
Михаил Кузьминский - зав. отделом Института органической химии РАН. С ним можно связаться по телефону (095) 135-6388.