Особенности системной архитектуры однопроцессорных серверов с Pentium 4

Сегодня целесообразно приобретение Pentium 4 с кэшем второго уровня емкостью 512 Кбайт и частотой системной шины 533 МГц
Стремительно растущая производительность х86-совместимых микропроцессоров Intel и AMD, обогнавших уже большинство RISC-архитектур, расширяет круг серверных приложений, с которыми можно эффективно работать на данной платформе. Одно- и двухпроцессорные серверы используются при этом наиболее широко. Главные требования к подобным системам — производительность, масштабируемость и надежность, достигаемые весьма скромной ценой.

Рассмотрим те «архитектурные» особенности однопроцессорных ПК-серверов на базе Pentium 4 (по ряду показателей этот процессор является абсолютным лидером производительности), которые задаются наборами микросхем. Речь пойдет не о специализированных серверных наборах микросхем, а о тех, которые используются и в настольных компьютерах. Остановимся в основном на наборах микросхем, которые должны появиться в ближайшее время: именно они в наибольшей степени отвечают возможностям новых версий Pentium 4 с повышенной частотой системной шины. За исключением 850E, эти наборы микросхем официально Intel еще не представлены, поэтому к моменту их выхода в свет может оказаться, что отдельные характеристики будут отличаться от имеющихся «неофициальных» параметров.

Зачем, зачем, я не знаю...

Сконцентрируемся на трех компонентах серверов — процессор, память и ввод/вывод. Нас интересует быстрый процессор, высокая пропускная способность оперативной памяти большой емкости (желательна поддержка ECC), разнообразие типов поддерживаемых шин ввода/вывода и большое число их слотов, наличие встроенных контролеров дисковых каналов и т.п.

Оговоримся: за большую производительность, за более высокую пропускную способность приходится платить больше. Если мне этого не надо, я куплю попроще и подешевле; но предположим, что мне необходимо все по максимуму.

Однако зачем нам быстрый процессор, если его высокая производительность недостижима при медленной памяти (такое сочетание предлагает пара Pentium 4/PC133)? Или наоборот, зачем покупать быструю память, если ее пропускная способность превышает возможности системной шины процессора? Зачем нужна плата с поддержкой Serial ATA в южном мосте, если нет соответствующих жестких дисков, а если такой и найдется, то производительность все равно будет сдерживаться внутренними характеристиками дисков, а не скоростью дискового канала? Список риторических вопросов «зачем» можно продолжить.

Все это иллюстрирует проблему сбалансированности. В реальной жизни ситуация, конечно, еще сложнее. Например, не мешает позаботиться о том, чтобы пропускная способность оперативной памяти была больше, чем в состоянии «съесть» процессор, так как часть трафика памяти связана с вводом/выводом. Но, пожалуй, главное соображение состоит в том, что приобретение «на вырост» позволяет облегчить дальнейшую модернизацию сервера.

Конечно, можно исходить из того, что ПК-сервер достаточно дешев, чтобы в любом случае приплатить за какую-нибудь новую возможность. Но представьте, что вы приобретаете целый кластер серверов. Тут уже деньги придется считать, поэтому среди основных критериев выбора будет не только производительность, но и отношение стоимость/производительность.

Я хочу сегодня

Итак, Pentium 4 является лидером по производительности не только среди всех х86-совместимых процессоров (иллюстрацией этого может служить приведенная таблица). Скажем, на тестах Linpack (n=100) Pentium 4/2,53 ГГц опередил не только все RISC-процессоры, но и Itanium 2, и процессоры векторных суперкомпьютеров. Что касается выбора собственно процессора, то здесь рекомендация очевидна: сегодня целесообразно приобретение Pentium 4 с кэшем второго уровня емкостью 512 Кбайт и частотой системной шины 533 МГц. Последнее дает возможность в перспективе перейти на процессор с большей частотой, не столкнувшись с ограничением роста производительности со стороны памяти.

Общая стратегия также достаточно очевидна: желательно приобретать Pentium 4 с максимальной частотой системной шины (по имеющимся данным, ожидается выход процессоров, имеющих шины с частотой 667 МГц, а затем 800 МГц). Причина особого внимания к частоте системной шины проста. Для достижения высокой производительности с ростом тактовой частоты (именно этот путь увеличения производительности закладывался в качестве основного при разработке микроархитектуры Pentium 4) данному процессору необходима высокая пропускная способность памяти. В противном случае он может не показать всего, на что способен.

Пропускная способность оперативной памяти сдерживает производительность уже сегодня; в дальнейшем желательно иметь линейный рост пропускной способности с ростом частоты процессора. Соответственно, необходимо иметь набор микросхем, обеспечивающий максимально возможную пропускную способность памяти. Вообще говоря (по крайней мере, с точки зрения архитектуры), все это лучше сделать на базе памяти RDRAM, но стоимостные и иные рыночные соображения часто заставляют предпочесть DDR.

533-мегагерцевая шина способна доставить в процессор данные со скоростью 4,2 Гбайт/с. Среди наборов микросхем, системные платы на основе которых доступны сегодня, такую пропускную способность памяти обеспечивает только i850E, который официально поддерживает до четырех модулей RIMM с двухканальной памятью RDRAM PC800 при суммарной пропускной способности 3,2 Гбайт/с. Однако недавно Intel объявила о поддержке PC1066.

Наиболее массовые наборы микросхем серии i845 могут работать лишь с памятью PC2700/DDR333. Память PC3200 (иначе говоря, DDR400) не является стандартом JEDEC и официально не поддерживается; компании VIA и SiS от этой разновидности оперативной памяти недавно отказались, при том что имеющиеся «неофициальные» реализации демонстрируют нестабильность работы.

То, что северный мост i850E способен работать с памятью RDRAM PC1066 с пропускной способностью, равной 4,2 Гбайт/с, было известно еще до официального анонса поддержки RDRAM компанией Intel. Пожалуй, первыми платами, для которых их производитель заявил о поддержке PC1066, стали системные платы ASUS P4T533-C. В них всего два слота RIMM, поэтому главная проблема заключена в самой памяти PC1066. Она очень дорога, найти ее в продаже крайне сложно, к тому же желательно иметь модули большой емкости, а сейчас их емкость ограничена 256 Мбайт (ожидается, что массовое производство памяти PC1066 будет налажено до конца года; вот-вот представит результаты собственного тестирования этой памяти Intel). Кроме того, микросхемы памяти PC1066 при работе сильно греются и потому требуют хорошего охлаждения. ASUS рекомендует модули производства Samsung и Kingston. Со своей стороны, Intel предлагает с этим набором микросхем платы D850EMV/D850EMV2/ D850EMD2; для них уже сертифицирована память PC1066 от Samsung.

Южный мост этого набора микросхем — это ICH2, который поддерживает ATA100 и связан с северным мостом каналом HubLink 1.0 с пиковой пропускной способностью 266 Мбайт/с. ICH2 поддерживает только стандарт PCI 2.2 с 32-разрядными шинами PCI. Этого недостаточно для эффективной работы с высокопроизводительными сетевыми платами Gigabit Ethernet.

Если судить по известным планам Intel относительно выпуска наборов микросхем, то похоже, что i850E — последний, работающий с RDRAM. Компания SiS недавно анонсировала собственный набор микросхем для RDRAM PC1066; в будущем году возможна поддержка PC1333. Однако в случае ухода Intel с рынка RDRAM нельзя исключить, что и SiS пересмотрит свои планы.

Альтернативный вариант — применение наборов микросхем, поддерживающих двухканальную память DDR PC2100. О перспективном наборе, носящем кодовое название Granite Bay, рассказал на последнем форуме разработчиков Intel вице-президент корпорации Майк Фистер. Этот набор микросхем E7205 также обеспечит пропускную способность оперативной памяти на уровне 4,2 Гбайт/с. Представляется, что 850E и E7205 в ближайшее время могут стать основными платформами для однопроцессорных серверов. E7205 может оказаться привлекательнее, если Intel действительно перестанет поддерживать RDRAM для архитектуры х86; к тому же решение на базе DDR может оказаться дешевле, хотя для получения необходимой пропускной способности DDR-модули нужно устанавливать парами.

Там, за поворотом

Ясно, что и другие производители наборов микросхем предложат свои разработки, позволяющие эффективно использовать возможности повышенной частоты системной шины Pentium 4. По некоторым данным, VIA готовит набор микросхем P4X800, рассчитывая представить его в начале 2003 года. Появилась альтернативная двухканальной архитектуре памяти технология QBM (Quad Band Memory) компании Kentron Technologies, позволяющая удвоить пропускную способность памяти за счет перехода на модули DIMM нового типа, использующие те же микросхемы памяти, что и DDR.

Возможно, наиболее выгодным было бы приобретение серверов на базе i850E или E7205, как только все компоненты соответствующей аппаратной платформы, включая оперативную память, будут доступными. Учитывая консерватизм серверного рынка, где пользователи имеют дело с жизненно важными бизнес-приложениями, разумнее будет дождаться, когда сама Intel объявит, что PC1066 будет работать на материнских платах, — это будет гарантировать стабильную работу сервера. Что же касается более отдаленных планов, следует отметить перспективный процессор Prescott с тактовой частотой не менее 4 ГГц и 667-мегагерцевой системной шиной, поддерживающий технологию Hyper Threading, которая в настоящее время доступна в разновидностях Pеntium 4 с частотами от 3 ГГц и в серверных вариантах Pentium 4 Xeon. Применение Hyper Threading, как известно, способно увеличить производительность работы на сочетании приложений, не слишком сильно загружающих ресурсы процессора.

Для работы с этим процессором предназначен набор микросхем с кодовым названием Springdale, который может появиться в первой половине следующего года. Он обладает рядом замечательных черт, делающих его в серверных приложениях еще более привлекательным, чем i850E и E7205. Он поддерживает двухканальную память DDR333 с суммарной пропускной способностью 5,3 Гбайт/с и ориентирован на работу с 667-мегагерцевой шиной между процессором и северным мостом. По некоторым данным, в Intel планируют называть ее не Frontal-Side Bus, а Processor-Side Bus. Северный мост будет иметь интерфейс специализированной шины CSA (Сommunication Streaming Architecture) с пропускной способностью 2 Гбит/с, на которой может располагаться, например, контроллер Gigabit Ethernet. Это позволит разгрузить от сетевого трафика не только шины PCI, но и канал между южным и серверным мостами. Южный мост ICH5 будет поддерживать новый стандарт Serial ATA.

В ряде случаев для однопроцессорных серверов системные платы на основе наборов микросхем Intel часто обладают большим «запасом» по характеристикам (пример — i850E) и могут иметь лучшие внутренние архитектурные решения (скажем, северный мост в i440BX по достигаемому уровню пропускной способности превосходил ряд конкурентов даже с более быстрым типом памяти).

Автор постарался поделиться имеющейся (подчеркнем, во многом неофициальной) информацией о ближайших перспективах архитектур для Pentium 4. Конечно, в таких случаях у пользователя «слюнки текут», — хочется и того, и этого. Но повседневные задачи нужно решать уже сегодня, и если ждать еще более светлого будущего, можно и опоздать. Поэтому решайте: возможно, вы вполне будете счастливы прямо сегодня, используя уже доступные системные платы, например, на базе i850E.


Что имеем на сегодня?

Некоторые характеристики производительности современных микропроцессоров