Революция, о которой так долго говорили в Intel, свершилась. Микропроцессоры архитектур IA-32 и IA-64 обогнали по производительности конкурентов из лагеря RISC. Даже суперкомпьютерные системы, включая кластеры, и те все чаще создаются на базе процессоров IA-32/IA-64.

При современной высокой производительности микропроцессоров архитектур IA-32 и IA-64 пользователи все чаще могут обойтись недорогими серверами на базе Pentium 4, даже однопроцессорными (их при необходимости можно объединить в кластер). (Подобные однопроцессорные системы недавно рассматривались нами; см. Computerworld Россия, 2002, № 44). Следующий уровень — двухпроцессорные SMP-системы (symmetrical multiprocessing — «симметричная многопроцессорная обработка»).

Надо сказать сразу: по сравнению с однопроцессорными системами такие компьютеры куда дороже. Во-первых, сами процессоры Xeon гораздо дороже «обыкновенных» Pentium 4 (применение Xeon с ядром Pentium III, по-моему, сегодня в большинстве случаев не обосновано). Во-вторых, существенно больше денег уходит и на соответствующие системные платы. Другими словами, насчет соотношения «цена/производительность» еще надо подумать. Очевидные преимущества SMP-платформы — экономия пространства и упрощение обслуживания, а также упрощение распараллеливания. Для лучшего понимания ситуации полезно обратиться к характеристикам двухпроцессорных серверов с Xeon.

Еще раз про Xeon

«Обычные» процессоры Xeon/Pentium 4 (Foster MP) имеют эффективную частоту системной шины 400 МГц, чему отвечает пиковая пропускная способность оперативной памяти (ОЗУ), равная 3,2 Гбайт/с. Однако можно предположить, что существует немало серверных приложений, в которых производительность процессоров Xeon с высокой частотой и очень длинным конвейером ограничивается пропускной способностью памяти.

Поэтому для достижения наивысшей производительности в SMP-системах желательно иметь быструю системную шину или большой кэш. В ноябре Intel анонсировала о новые процессоры Galatin (Xeon MP), имеющих дополнительный кэш третьего уровня емкостью 1 или 2 Мбайт при частотах 1,5/1,9/2 ГГц. Кэш третьего уровня гораздо медленнее, чем кэш второго уровня; его основная задача — разгрузка системной шины SMP-компьютеров с целью уменьшения конфликтов на шине. Впечатляет число транзисторов этого «микропроцессорного монстра» — 240 миллионов! Однако и стоят такие процессоры в партиях по 1 тыс. штук соответственно — от 1177 долл. до 3692 долл. Для сравнения, однопроцессорная станция HP zx6000 на базе Itanium 2 в стандартной конфигурации обойдется покупателю примерно в 4,5 тыс. долл. Другой путь, отвечающий увеличению частоты системной шины до 533 МГц, будет реализован в процессорах Xeon Prestonia с тактовыми частотами 2/2,4/2,66/2,8 ГГц, которые смогут работать в двухпроцессорных серверах.

Обратимся теперь к серверным наборам микросхем, поскольку они определяют основные архитектурные черты рассматриваемых SMP-систем.

Решения от Intel

Для Xeon с 400-мегагерцевой шиной сегодня можно применять набор микросхем i860 с памятью RDRAM типичной емкостью в 2-4 Гбайт. Он поддерживает 64-разрядные шины PCI/66 МГц наряду с традиционным вариантом PCI-32/33 МГц; их применение позволяет эффективно использовать высокоскоростные PCI-платы, например Gigabit Ethernet. (К сожалению, в южном мосте i860 обнаружились технические проблемы, препятствующие достижению максимальной пропускной способности ввода-вывода.)

Пожалуй, более популярным набором микросхем стал сегодня E7500. Он активно применяется при работе с процессорами Xeon с кэшем второго уровня емкостью 512 Кбайт. Платы на основе E7500 предлагают не только традиционные «серверные» компании наподобие SuperMicro и Tyan, но и ведущие производители плат для ПК (в том числе, Gigabyte, MSI и др.). На рис. «Набор микросхем от Intel» показаны основные компоненты набора E7500, обеспечивающего применение двухканальной «регистровой» DDR-памяти (PC1600 и PC2100), по четыре модуля на канал, всего до 16 Гбайт; это позволяет выбрать всю теоретическую пропускную способность системной шины Xeon. В оперативной памяти поддерживаются не только коды ECC, но и новейшая технология Chipkill.

Принципиально важно, что наиболее высокоскоростные внешние устройства подсоединяются не через южный мост ICH-3 (он используется традиционными для ПК внешними устройствами и шинами PCI 2.2), а через специализированные мосты-«концентраторы». Каждый из них поддерживает две 64-разрядные шины PCI-X/133 МГц с возможностью горячей замены, обладая собственным 16-разрядным каналом HI 2.0 к северному мосту MCH с пропускной способностью 1,066 Гбайт/с. Таких концентраторов может быть до трех; к ним может также подсоединяться встроенный контроллер Gigabit Ethernet или специализированный процессор ввода-вывода. Конечно, реальные платы могут иметь не все эти прелести, например, поддерживают память меньшей емкости (скажем, 8-12 Гбайт) или не умеют работать с PCI-X. Традиционный южный мост (для E7500 это ICH3-S) подсоединяется к северному мосту 8-разрядной шиной HI 1.5 с пропускной способностью 266 Мбайт/с.

Для работы с процессорами Xeon, имеющими 533-мегагерцевую шину, можно будет применять наборы микросхем E7501 (кодовое название Plumas) и E7505 (Placer). Это «родные братья» E7500; их особенность — поддержка двухканальной памяти DDR266, чему отвечает пиковая пропускная способность, равная 4,266 Гбайт/с, совпадающая с теоретической пропускной способностью 533-мегагерцевой шины. Микросхемы этих наборов совместимы даже по выводам.

В отличие от E7501, E7505 ориентирован не столько на серверы, сколько на рабочие станции: он поддерживает порт AGP8X, за что пользователю приходится расплачиваться отказом от двух из трех мостов-«концентраторов». В E750x к такому мосту можно подсоединить также новые версии плат Gigabit Ethernet от Intel или встроенный адаптер UltraSCSI.

Альтернатива

Компания ServerWorks является, как известно, основным производителем серверных наборов микросхем для платформы x86. Довольно длительный срок она была на этом рынке почти монополистом: Intel лишь в последнее время стала активно продвигать на него свою продукцию. Ограничимся теми наборами микросхем, на базе которых уже выпускаются системные платы, т.е. для Pentium 4 Xeon с частотой шины 400 МГц. ServerWorks предлагает, в частности, наборы микросхем серии Grand Champion («Великий чемпион»): GC-LE и GC-SL для двухпроцессорных серверов, GC-WS для рабочих станций (только в этом наборе поддерживается графический порт AGP4x) и GC-HE для четырехпроцессорных SMP-серверов.

На рис. «Великий чемпион» представлена организация типичного набора микросхем, GC-LE, который наиболее близок к E7500. Во всех наборах микросхем GC используется память DDR200, но с разным числом каналов (степень расслоения оперативной памяти). В памяти применяются коды ECC и технология Chipkill, позволяющая сохранить работоспособность даже при выходе из строя целой микросхемы памяти.

Для связи серверного моста (Host Bridge в терминологии ServerWorks) с мостами ввода-вывода, обеспечивающими интерфейсы 64-разрядных шин PCI-X, используется шина IMB (Inter-Module Bus); как правило, это IMB2 с пиковой пропускной способностью, равной 3,2 Гбайт/с. Это больше, чем у аналогичных шин в E7500, что способствует увеличению реальной пропускной способности подсистемы ввода-вывода.

У GC-WS, GC-LE таких шин IMB — по две, и соответственно по два моста CIOB (в GC-WS один из мостов, CIOB-G, обеспечивает вместо шин PCI-X порт AGP-4x). В GC-SL, самой дешевой серверной платформе этой серии, всего одна микросхема CIOB-X2, одна шина IMB и лишь один канал в памяти. Шина PCI-X с частотой до 133 МГц обеспечивает возможность горячей замены. К таким шинам могут быть подсоединены адаптеры Gigabit Ethernet.

В качестве канала между северным и южным мостом (CSB), обеспечивающим примерно те же интерфейсы, что и традиционные для ПК южные мосты (в частности, два канала ATA100 и 32-разрядные PCI-шины), используется более медленная, так называемая «тонкая» разновидность шины IMB. Что касается собственно южного моста, то с моей точки зрения, он не обладает какими-либо выдающимися особенностями (впрочем, разработчики к этому и не стремились).

Набор микросхем от Intel
Платы на основе набора микросхем E7500 предлагают не только традиционные «серверные» компании наподобие SuperMicro и Tyan, но и ведущие производители плат для ПК (в том числе, Gigabyte, MSI и др.). На рисунке показаны основные компоненты набора E7500, обеспечивающего применение двухканальной «регистровой» DDR-памяти (PC1600 и PC2100), по четыре модуля на канал, всего до 16 Гбайт; это позволяет выбрать всю теоретическую пропускную способность системной шины Xeon
«Великий чемпион»
Компания ServerWorks предлагает наборы микросхем серии Grand Champion («Великий чемпион»): GC-LE и GC-SL для двухпроцессорных серверов, GC-WS для рабочих станций (только в этом наборе поддерживается графический порт AGP4x) и GC-HE для четырехпроцессорных SMP-серверов