AlphaStation 600 5/XXX
AlphaServer 2100

Хорошо налаженная машина разработки и производства новых, все более быстродействующих микропроцессоров Alpha работает без сбоев и наращивает обороты. В этом году Digital Equipment Corporation объявила о начале выпуска микропроцессоров Alpha c тактовыми частотами 366 и 400 МГц и планах выпуска чипов с частотами 433 МГц (в середине года) и 500 МГц ( в конце года). Представляется, что эти планы также будут успешно реализованы.

Уже одного этого достаточно для появления на рынке новых моделей рабочих станций и серверов фирмы DEC, поскольку для перехода на новую модель часто нужно лишь заменить процессор. Однако DEC еще и успевает вносить в них архитектурные усовершенствования. А лидерство по производительности микропроцессоров означает, что по производительности передовые позиции занимают и собственно компьютеры DEC.

Так, в этом году Digital объявила о модификациях младших моделей - AlphaStation 255 (см. таблицу 1) с возможностью модернизации до AlphaStation 500. Последние станции относятся к среднему классу и базируются уже на микропроцессорах Alpha 21164, которые имеют теперь тактовые частоты 266 и 333 МГц (с июня текущего года начнутся поставки AlphaStation уже с 400 МГц-версиями процессора). Для этих, а также других рабочих станций DEC, использующих шину PCI, компания выпустила новую версию графических подсистем PowerStorm. Существует целый ряд моделей этого семейства, имеющих различную производительность и соответственно различающихся в цене.

Компьютер
Частота
SPECint95
SPECfp95
AlphaStation 255
233
3.8
5.1
300
4.5
5.7
AlphaStation 500
266
7.3
10.1
333
8.8
11.6
400
11
14
Таблица 1.
Оценки производительности рабочих станций от DEC на тестах SPEC-95.

Сочетание высокой производительности вычислений с хорошими графическими возможностями и составляло цель DEC. Так, по данным компании, на приложении ProENGINEER от Parametric Technologies AlphaStation 500/266 имеет производительность на 33% больше, чем Sun UltraSPARC 140, на 61% больше, чем HP C100 и на 78% больше, чем SGI Indigo2 R4400/250.

В свою очередь, AlphaStation 500/333 на этом же приложении на 85% быстрее, чем Sun UltraSPARC 170E и HP J210 и на 117% быстрее Indigo2 R4400/250.

В конфигурацию AlphaStation 500, кроме микропроцессора, входит внешний кэш 3-го уровня объемом 2 Мбайт, до 512 Мбайт оперативной памяти, до 4 слотов PCI. Обеспечена поддержка каналов F&W SCSI-2, а в корпусе могут размещаться до 5 внутренних устройств. В AlphaStation 500 используется 256-разрядная шина памяти, что позволяет поддерживать высокий темп обмена данными. AlphaStation 255 имеет несколько более скромные характеристики. Так, шина памяти является 128-разрядной, внутренних устройств может быть до 4, внешний кэш 2-го уровня имеет объем 1 Мбайт. AlphaStation 255 может иметь 2 слота PCI и 1 слот ISA.

Хотя эти компьютеры и относятся к младшему и среднему классам, специалисты наверняка оценят хорошие возможности расширения конфигурации и поддержку современных протоколов шин ввода/вывода.

В этом же году появились и новые модификации серверов. Так, AlphaServer 1000A на базе Alpha 21064 (модели 1000A 4/233 и 4/266) имеют теперь до 7 слотов шины PCI и 2 - шины EISA. Появились и усовершенствованные модели серверов среднего класса AlphaServer 2100A (см.ниже). Очевидно, что DEC стремится к гегемонии по параметрам производительность и стоимость/производительность во всем диапазоне компьютерных систем: от младших рабочих станций до самых мощных (AlphaStation 600) и от серверов уровня рабочей группы до суперкомпьютерных серверов (AlphaServer 8400). В настоящей публикации мы познакомим читателя с архитектурой AlphaStation 600 и серверов серии 2100.

AlphaStation 600 5/XXX

В этом обозначении 5 означает поколение микропроцессоров Alpha (EV5); ххх - тактовую частоту (ххх=266, 300 или 333). Микропроцессоры Alpha 21164, используемые в этих рабочих станциях, имеют кэш-память L1 - по 8 Кбайт для данных и команд, 3-кратную частично ассоциативную кэш-память 2-го уровня с обратной записью емкостью 96 Кбайт (для команд и данных) и внешний кэш 3-го уровня емкостью 2 или 4 Мбайт. Этот кэш работает в режиме обратной записи при объеме блока кэш-памяти в 64 байта. Теоретически емкость кэша 3-го уровня может быть увеличена до 16 Мбайт. Время доступа в кэш кратно времени цикла процессора и составляет обычно 7-8 тактов процессора для первой порции данных, а следующие данные передаются уже быстрее. При типовом времени такта SRAM в кэше 12 нс это дает время доступа 24 нс для первых 128 бит данных. Системная плата использует 256-разрядный путь данных в оперативную память объемом от 32 Мбайт до 1 Гбайт. Контроллер памяти, интегрированный в управляющий чип (см. ниже), может поддерживать до 8 банков DRAM, однако конструктивные ограничения позволяют иметь на сегодняшний день не более 4 банков (1 Гбайт). Интересная особенность контроллера памяти, реализуемая использованием специальных программируемых регистров, дает возможность поддерживать широкий диапазон объемов и "скоростей" DRAM (от 50 до 80 нс).

В AlphaStation 600 две транзакции на чтение блоков кэша из оперативной памяти могут быть объединены в одну на чтение 128 байт данных, если обращение идет к одной странице памяти. Это позволяет достигнуть пропускной способности чтения данных из памяти в 284 Мбайт/с. В знаменитой своей высокой пропускной способностью рабочей станции IBM RS/6000 mdl 590 применяется кэш с размером блока 256 байт. Подход DEC является более гибким, т.к. при очень большой длине передаваемого блока данных в RS/6000 mdl 590 возможна передача "лишних данных", что вызывает повышенную нагрузку на тракт процессор-память.

Величина задержки при обращении к памяти в AlphaStation 600 составляет 180 нс. Здесь интересно отметить, что EDO DRAM, которая становится популярной на ПК, используется и в AlphaStation 600, что не приводит к революционному повышению производительности тракта "процессор-память". Дело в том, что узким местом обычно является как раз задержка (при обращении к памяти), которая в EDO DRAM существенно не изменилась.

В максимальной конфигурации рабочая станция может содержать 4 слота PCI (3 слота - 64-разрядного PCI, и один - PCI-32), 3 слота EISA и 1 - PCI/EISA. Стандартно поддерживаются каналы F&W SCSI-2. Вследствие синхронного взаимодействия основных блоков времена циклов RAM, кэш-памяти и PCI кратны времени цикла процессора.

Пожалуй, основной архитектурной особенностью этих рабочих станций является то, что для обеспечения высокой пропускной способности и низких величин задержек при передаче данных между процессором, оперативной памятью и шиной PCI используется специальный набор микросхем DEC 21171. Точнее говоря, этот набор микросхем содержит срез данных (data slice); интерфейс PCI; чип управления памятью (управляющий чип); мост с EISA-шиной на базе наборов чипов Intel 82374, 82375 и др.

128-разрядная шина SysData, защищенная от ошибок кодами ECC, передает данные между процессором, внешним кэшем и срезом данных, а уже последний имеет 256-разрядный тракт в оперативную память. Срез данных взаимодействует с управляющим чипом через 64-разрядную шину, защищенную кодами ECC. В передачу данных между PCI и процессором, а также внешним кэшем и оперативной памятью вовлечен управляющий чип и срез данных.

На самом деле срез данных представляет собой 4 микросхемы, которые вместе и составляют логически 256-разрядную шину к оперативной памяти, 128-разрядную шину к процессору и 64-разрядную шину к управляющему чипу, а затем - к шине PCI. Эти микросхемы содержат внутренние буферы, в которых временно запоминаются данные процессорного трафика, DMA и ввода/вывода.

Управляющий чип осуществляет контроль над оперативной памятью и срезом данных и обеспечивает интерфейс с 64-разрядной локальной шиной PCI. Такое сложное архитектурное строение AlphaStation 600 позволило добиться высокой пропускной способности при доступе процессора в оперативную память и при операциях ввода/вывода, в том числе в режиме DMA. Соответствующие оценки производительности приведены в таблице 2.

Транзакция
Пропускная способность
PCI-32
PCI-64
Чтение процессором из памяти
284
284
I/O (запись):
- непрерывная запись 32 байта
119
213
- случайная запись 4 байта
44
44
I/O (чтение):
- 4 байта
12
12
-32 байта
56
56
DMA, чтение:
- 64 байта
79
112
- 8 Кбайт
132
263
- DMA, запись (64 байта)
97
102
Таблица 2.
Пропускная способность AlphaStation 600 при обработке различных транзакций (Мбайт/с).

Эти характеристики производительности можно дополнить "традиционными" - SPECint92/SPECfp92 =331/503 и оценками LINPACK (144 MFLOPS при N=100, 380 MFLOPS при N=1000) для 300 МГц AlphaStation 600 c 4 мегабайтным кэшем 3-го уровня ( на 12 нс SRAM). Все приведенные здесь данные - убедительное свидетельство того, что на сегодня эта рабочая станция является самой "мощной" в мире. Что касается графических возможностей, то в этой станции они могут поддерживаться специальной графической платой DEC ZLXp-E1, работающей с шиной PCI.

AlphaServer 2100

SMP-серверы серии 2100 могут содержать до 4 процессоров и относятся к классу серверов масштаба крупного подразделения. Выпускаемые модели 4/275, 5/250 и 5/300 используют микропроцессоры Alpha 21064 и 21164 (система обозначения различных моделей серверов совпадает с описанной выше для AlphaStation). Усовершенствованные модели этих серверов (серия 2100А) имеют до 8 слотов PCI и 3 слотов EISA, в то время как AlphaServer 2100 мог содержать до 3 слотов PCI. Максимально допустиммая емкость оперативной памяти составляет 2 Гбайт.

С новыми моделями сервера на базе микропроцессоров Alpha 21164 стал поставляться и новый процессорный модуль второго поколения KN470 (вместо модуля KN460 на базе Alpha 21064). KN470 может заменять старый модуль в том же корпусе, т.к. он имеет ту же форму и размеры и работает от того же источника питания. Вместе с тем в KN470 было внесено много усовершенствований, вызванных переходом на чип 21164. Это связано, в частности, с изменением организации кэш-памяти в Alpha 21164 по сравнению с 21064. В новом модуле стал применяться и новый протокол обеспечения когерентности кэша (invalidate-on-write) и, соответственно, в системной шине были добавлены новые типы транзакций.

С переходом на Аlpha 21164 появились и другие аппаратные доработки, например, специальная память - дублирующие теги для блоков кэш-памяти третьего уровня (уменьшают задержки при работе протокола поддержки когерентности кэша), усовершенствование арбитра системной шины (уменьшает задержки арбитрирования).

Эти и другие модификации позволили добиться существенного улучшения производительности AlphaServer 2100 5/250 с модулями KN470 по сравнению с 2100 4/275 (с модулями KN460), что иллюстрируется данными таблицы 3.

Тест
n CPU
2100 5/250
Коэффициент ускорения относительно 2100 4/275
SPECint92
1
277
1.4
SPECrate_int92
4
24996
1.4
SPECfp92
1
410
1.4
SPECrate_fp92
4
37926
1.4
LINPACK, N=1000
4
1022
1.6
copy
2
171
1.28
scale
2
169
1.27
sum
2
162
1.25
triad
2
162
1.27
Таблица 3.
Сравнение производительности AlphaServer 2100 5/250 и 4/275.

В ней, кроме хорошо знакомых читателям тестов, приведены также данные ставших ныне общеизвестными в суперкомпьютерном мире тестов пропускной способности оперативной памяти МакКалпина (J.D.McCalpin). В нашей рубрике мы приводили результаты этих тестов для ряда суперкомпьютерных систем (CWR, #8, 1995). Напомним, что операции copy, scale, sum и triad означают циклы с телами a(i)=b(i), a(i)=3.0*b(i), c(i)=a(i)+b(i) и c(i)=a(i)+3.0*b(i) соответственно. Приведенные данные показывают, что пропускная способность подсистемы памяти в серверах 2100 5/250 также возросла по сравнению с 2100 4/275.

Все приведенные в настоящей статье данные свидетельствуют о том, что DEC по-прежнему остается лидером в области производительности компьютеров самых разных классов.


Михаил Кузьминский - зав. отделом Института органической химии РАН. С ним можно связаться по телефону (095) 135-6388.