Потрясающе быстрый рост тактовой частоты Intel Pentium 4 и AMD Athlon, появление долгожданного 64-разрядного процессора Itanium придало особую актуальность вопросу: вытеснят ли с рынка компьютеры на базе этих процессоров своих давних соперников RISC-архитектуры?

Выбирая рабочую станцию (как, впрочем, и любой иной компьютер), целесообразно руководствоваться, вообще говоря, целым комплексом характеристик. Это и наличие необходимых прикладных программ, и «качество» операционной системы, и производительность центральных процессоров, графической подсистемы и подсистемы ввода/вывода, и возможность построения нужных конфигураций, и стоимость, и т.д. А вот применяем ли мы подобный подход на практике — уже другой вопрос.

Если использовать столь комплексный подход, то популярность рабочих станций корпорации Sun Microsystems становится вполне естественной. Выдергивание из этого комплекса в качестве решающих показателей, скажем, производительности процессоров и/или графической подсистемы в большинстве случаев, вообще говоря, некорректно.

Однако на практике потрясающе быстрый рост тактовой частоты Intel Pentium 4 и AMD Athlon, появление долгожданного 64-разрядного процессора Itanium («в девичестве» Merced) — в сочетании с общим прогрессом в архитектуре персональных компьютеров — придало особую актуальность вопросу: вытеснят ли с рынка компьютеры на базе этих процессоров своих давних соперников RISC-архитектуры? (Таблица позволяет сравнить характеристики производительности современных микропроцессорных архитектур.)

Да простят меня разработчики графических станций, но архитектурные новинки в этой области более редки, чем среди серверов, — хотя бы потому, что последние охватывают больший диапазон вычислительных мощностей. Поэтому интерес к последнему поколению рабочих станций Sun Blade 1000 (blade — «клинок», «лезвие»), использующих новые процессоры UltraSPARC III, очевиден. Прежде всего эти процессоры достигли наивысших на сегодня тактовых частот среди RISC-архитектур — 900 МГц. Во-вторых, в соответствии с высокой частотой они обошли по производительности все другие RISC-процессоры, кроме Alpha 21264. Вкупе с операционной системой Sun Solaris и всеми положительными следствиями ее применения получается весьма привлекательная компьютерная платформа.

Прежде чем рассказать об архитектуре и технических параметрах станций Blade 1000, дадим краткую характеристику 64-разрядных процессоров UltraSPARC III.

Архитектурная схема рабочей станции Sun Blade

Частота — залог успеха

Изучая технологические параметры UltraSPARC III, следует обратить внимание на то, что этот процессор изготавливается по шестислойной 0,25-микронной КМОП-технологии и содержит «всего» 16 млн. транзисторов.

Современные высокопроизводительные х86-совместимые микропроцессоры обычно содержат больше транзисторов и изготавливаются по технологии 0,18 мкм.

С одной стороны, это означает, что при переходе на 0,18-микронную технологию у Sun могут открыться дополнительные ресурсы роста тактовой частоты и соответственно производительности процессоров. С другой стороны, микроархитектура UltraSPARC III с точки зрения своей сложности не является самой продвинутой среди современных микропроцессоров. Пример Pentium 4 показывает, что рост производительности за счет тактовой частоты — путь вполне перспективный.

Теперь о характеристиках микроархитектуры. Данные процессоры являются суперскалярными и могут выполнять одновременно до шести команд (на выполнение выдается до четырех команд за такт) благодаря наличию четырех целочисленных исполнительных устройств и двух устройств с плавающей запятой. Несмотря на высокую тактовую частоту, главный конвейер включает всего 14 стадий. Кэши команд и данных первого уровня являются четырехканальными наборно-ассоциативными и имеют емкость соответственно 64 и 32 Кбайт. В микропроцессор интегрирован контроллер внешнего кэша второго уровня, который имеет емкость до 8 Мбайт и обеспечивает пропускную способность 3,2 Гбайт/с, работая на выделенной шине шириной 32 байт. В системе команд предусмотрены команды предварительной выборки в кэш.

Интегрированный контроллер DRAM поддерживает оперативную память емкостью до 8 Гбайт с пропускной способностью до 2,4 Гбайт/с (это больше, чем у Itanium, хотя и уступает возможностям Pentium 4). Обеспечивается расщепленная обработка транзакций в памяти. UltraSPARC III имеет также интерфейс с системной шиной, который обладает пиковой пропускной способностью около 2,4 Гбайт/с.

Из других особенностей я хотел бы отметить управление электропитанием, что для высокопроизводительных RISC-процессоров редкость, а также поддержку мультимедийного поднабора команд VIS и традиционную для архитектуры SPARC высокоэффективную реализацию переключения контекстов.

Главное — «Сафари»

На рисунке представлена упрощенная архитектурная схема рабочих станций Blade 1000. Точнее говоря, Blade 1000 — целая линейка станций, отличающихся числом и частотами процессоров, а также емкостью кэш-памяти второго уровня. Линейка включает в себя три однопроцессорные модели — 1600 (600 МГц, кэш 4 Мбайт), 1750 (750 МГц, кэш 8 Мбайт) и 1900 (900 МГц, кэш 8 Мбайт), а также одну двухпроцессорную модель 2750 (750 МГц, кэш 8 Мбайт). Это стандартные конфигурации, к которым можно добавлять дополнительные процессоры, в том числе и другой тактовой частоты.

Известно, что общие характеристики компьютера во многом предопределяются системной шиной. Шина Safari (впрочем, в Sun предпочитают использовать термин «межсоединение») работает на частоте 150 МГц при ширине 32 байт (с учетом кодов ECC ширина составляет 144 бит), что дает пропускную способность порта 2,4 Гбайт/с. В этой шине предусмотрены раздельные линии для управления/адресов и данных, поддерживается расщепленная обработка транзакций. Safari представляет собой коммутирующую структуру; такой тип межсоединения позволяет добиваться поддерживаемой пропускной способности на уровне, близком к теоретическому пиковому значению. Подобные шины применяются также в старших моделях серверов Sun.

В Blade 1000 используется традиционная оперативная память SDRAM емкостью от 512 Мбайт до 8 Гбайт в зависимости от устанавливаемых модулей DIMM (возможно применение модулей на 128, 256, 512 или 1024 Мбайт). Всего имеется 8 слотов памяти, которые разбиты на две группы. Поэтому добавляться могут сразу четыре модуля, которые отвечают четырем логическим банкам с чередованием (расслоением) адресов. Внутри четверки все модули памяти должны иметь одинаковую емкость, однако в разных четверках это может быть и не так. Ширина шины данных оперативной памяти составляет 64 байт, а достигаемая пропускная способность — 4,8 Гбайт/с.

Устройства ввода/вывода, в том числе графические ускорители, подсоединяются посредством моста ввода/вывода, который обеспечивает работу шин PCI, а также двух портов интерфейса UPA64S. Данный интерфейс представляет собой, с одной стороны, «упрощенную версию», а с другой — развитие известного интерфейса UPA. В отличие от своего предшественника он позволяет процессору UltraSPARC III выполнять одну транзакцию за такт (UPA требовал два такта).

Интерфейсные коннекторы UPA64S работают на частоте 120 МГц и позволяют подсоединять графические акселераторы и два монитора.

В графической подсистеме Sun Blade 1000 могут использоваться как акселераторы на базе UPA64S, так и графические платы на базе PCI. Это дает необходимую гибкость в конфигурировании станций с учетом конкретных особенностей используемых приложений.

Мост ввода/вывода обеспечивает работу сразу двух 64-разрядных шин PCI. Одна из них, с одним слотом, работает на частоте 66 МГц; к ней подсоединен интегрированный порт Fibre Channel. Вторая — 33-мегагерцевая с тремя слотами, которые могут использоваться и 32-разрядными платами PCI.

Ко второй шине может подсоединяться простейший графический акселератор PGX32. Кроме того, имеется PCI-версия мощного акселератора Expert3D.

Другие ускорители используют UPA64S. Акселератор Sun Creator3D представляет собой более развитую графическую подсистему, с помощью которой хорошо ускоряется выполнение примитивов двухмерной графики, обработка мультимедийной информации и др. Такие особенности Creator3D, как двойная буферизация, наличие Z-буфера и др., обеспечивают ускорение задач трехмерной графики. Sun Elite3D m6, в котором имеется шесть собственных графических устройств с плавающей запятой, буфер кадров и другие усовершенствования, намного быстрее выполняет такие виды обработки, как трехмерный рендеринг. Для решения наиболее трудоемких графических задач предлагается акселератор Sun Expert3D с 64 Мбайт выделенной памяти текстур и другими высокоуровневыми функциями. Наконец, кроме FC-AL, станции Blade 1000 обладают встроенной поддержкой UltraSCSI (внутренняя и внешняя шина).

Перечень периферии, с одной стороны, говорит о естественной конвергенции с миром х86-совместимых компьютеров. С другой стороны, представляется, что Blade 1000 по совокупности характеристик немного впереди.

Новые рабочие станции Blade 1000 корпорации Sun Microsystems

Приложения

Среди приложений, на которые производитель ориентирует данные станции, — задачи моделирования, сейсмологии, медицины, анимации, сложные приложения CAD/ CAE и др.

На мой взгляд, конкуренцию Sun Blade 1000 могут составить не только рабочие станции RISC-архитектуры (такие, например, как SGI Octane2 или HP Visualize), но и компьютеры на базе Pentium 4. Представляется, что преимущество Blade 1000 перед системами Intel-архитектуры обеспечивают в первую очередь высокая надежность платформы в самом общем с мысле, возможность работы с операционной системой Sun Solaris, наличие эффективных приложений и сбалансированная подсистема ввода/вывода.


Оценки производительности микропроцессоров на тестах SpecCPU2000
Микро-

процессор
Тактовая частота (МГц)SPECfp2000*SPECint2000*
Sun UltraSPARC III600302/339293/313
Sun UltraSPARC III740373/421370/395
Sun UltraSPARC III900427/482438/467
SGI R14000500436/463410/427
IBM Power3350356/409286/316
HP PA-8600552400/433417/441
Compaq Alpha 21264833590/658518/544
Intel Pentium 41700591/607574/591
Intel/HP Itanium800715/715-
AMD Athlon1400426/458482/539
* В таблице приведены базовое/пиковое значения.

Источник: сервер www.specbench.org