В нашей рубрике уже была публикация о продукции этой фирмы (CW-R, 1996, № 46). За последнее время компьютерная продукция Parsytec почти полностью обновилась; за прошедший год фирма поставила в Россию несколько новых МРР-компьютеров. У любого подобного успеха могут быть две составляющие: эффективное аппаратно-программное обеспечение и эффективные действия фирмы.
Рассмотрим сначала архитектурные и технические особенности новых МРР-cистем Parsytec. В настоящее время компания предлагает следующие многопроцессорные компьютеры: Parsytec IPC, Parsytec PowerMouse и Parsytec CC (серии ССe и СС/ipp). Все они относятся к системам с распределенной (физически и логически) оперативной памятью. Это означает, что каждый процессорный узел имеет один-два микропроцессора и собственную оперативную память. Сами же процессорные узлы связаны между собой посредством некоторой системы коммуникаций (межсоединением). В качестве микропроцессоров в компьютерах Parsytec применяются PowerPC и - в последнее время - Intel x86.
Parsytec IPC
Системы Parsytec IPC (Image Processing Computer) ориентированы, как явствует из названия, на обработку изображений. В процессорных модулях Parsytec IPC применяются процессоры PowerPC 604e c тактовой частотой 300 МГц. Основу процессорных модулей составляют материнские платы Motorola MTX, на которых установлены один или процессора. Однако возможно и применение материнских плат Intel.
Процессоры PowerPC 604e способны выполнять две операции с плавающей запятой за такт и имеют пиковую производительность 600 MFLOPS. Их оценки SPECint95/fp95 = 12,5/10,5 уступают современным показателям для процессоров Intel, однако с точки зрения пиковой производительности с плавающей запятой PowerPC 604e/300 МГц впереди.
Максимальная емкость оперативной памяти узла равна 1 Гбайт. Для организации ввода/вывода применяется шина PCI.
Кроме слота 32-разрядной PCI-шины могут использоваться расположенные на дочерних PCI-платах слоты 64-разрядных PCI-шин, работающих на частоте 33 МГц. Для обмена данными с жесткими дисками используется Fast & Wide UltraSCSI.
Всего в Parsytec IPC может быть до четырех процессорных модулей (до 8 процессоров с пиковой производительностью, достигающей 4,8 GFLOPS). Эти модули, как и модуль концентраторов, помещаются в 19-дюймовую стойку. Модуль концентраторов содержит два концентратора Fast Ethernet, но возможно применение вместо них коммутаторов. Этот модуль служит для организации межузловых коммуникаций. Такое построение позволяет относительно легко реализовать и применение «собственной» шины данных для связи между процессорными модулями, базируясь на использовании дочерних PCI-плат. Кроме того, в стойке размещается модуль операторской панели, к которому подключается консоль системы.
Очевидным потенциальным конкурентом Parsytec IPC могут служить кластеры ПК, построенные, например, по технологии Beowulf c применением ОС Linux. В узлах же Parsytec IPC применяется ОС AIX 4.2.
Применение таких кластеров может дать лучшее соотношение стоимость/производительность. Преимущество IPC - наличие готовых приложений, в первую очередь в области промышленной обработки изображений (например, для автоматической инспекции поверхности материалов, в частности, в металлургии), для компьютерной томографии и др.
Parsytec PowerMouse
Другими системами на базе PowerPC, предлагаемыми Parsytec, являются PowerMouse. Они пришли на смену более ранним системам Parsytec PowerXplorer, которые успешно работают в России.
В PowerMouse используются процессоры PowerPC 604e, работающие на частоте 200 МГц. Соответственно пиковая производительность этих микропроцессоров составляет 400 МFLOPS, а оценка SPECint95/fp95=8.5/8.2. Понятно, что они уступают по производительности старшим моделям Pentium II.
Однако основная идея построения компьютеров PowerMouse - обеспечение своеобразного многопроцессорного «ускорителя» для хоста, в качестве которого Parsytec предлагает станцию на базе SPARC, оснащенную ОС Solaris. В качестве узлов такого ускорителя выступают процессоры PowerPC, к которым через внутреннюю шину с пропускной способностью 422 Мбайт/с подсоединяется оперативная память SDRAM емкостью 64 Мбайт и коммуникационный контроллер.
К этому коммуникационному контроллеру подсоединяются четыре двунаправленных канала с суммарной пропускной способностью 160 Мбит/с. Топология, по которой происходит подсоединение процессорных узлов в этом ускорителе, - плоская решетка, которая наращивается «квадратными» элементами, состоящими из четырех узлов. Масштабирование ввода/вывода в этом случае осуществляется в пределах, доступных для рабочей станции. Однако возможно и образование кластеров из рабочих станций с подсоединенными к ним «ускорителями» PowerMouse; при этом обеспечивается и масштабирование ввода/вывода.
Очевидным недостатком такого подхода, как и для многих иных процессорных ускорителей, является определенная ограниченность класса эффективно решаемых задач. Это вызвано не очень высокой скоростью обмена данными между узлами PowerMouse и небольшой емкостью оперативной памяти узла.
Однако этот подход позволяет относительно дешевым способом построить компьютер с хорошим уровнем пиковой производительности. Например, 16-процессорная конфигурация PowerMouse имеет производительность 6,4 GFLOPS и память емкостью 1 Гбайт. В этой топологии наращивать число процессороа формально можно без ограничения, но с ростом их числа межсоединение может стать узким местом.
Для распараллеливания задач Parsytec предлагает стандартные средства PVM, MPI, компиляторы Fortran 77/90, Си, С++ и инструментарий PARIX/PowerTools. По утверждению фирмы, PowerMouse - cамые быстрые в мире масштабируемые системы на базе PowerPC.
Parsytec CC
Формально единственными компьютерами фирмы, которые «остались в строю поставляемых» со времени нашей предыдущей публикации об этих системах, являются Parsytec CC. Пожалуй, это наиболее универсальные многопроцессорные системы, выпускаемые Parsytec. Сейчас фирма предлагает две серии этих компьютеров: Parsytec ССe (на базе процессоров PowerPC) и Parsytec CC/ipp (на базе процессоров Intel). Рассмотрим сначала модели CCe.
Для объединения узлов в единую систему в моделях CCe применяется внутренняя cеть, в которой узлы связаны друг с другом двунаправленными каналами HS-Link с пиковой пропускной способностью 1 Гбит/с (75 Мбайт/с). Эти каналы соответствуют стандарту IEEE 1335 и поддерживают соединения типа «точка-точка». Для мониторинга состояния аппаратуры используется другая специализированная сеть C-Net.
Каждый узел имеет хотя бы одно соединение с HS-Link через PCI-адаптер. При построении сети применяются маршрутизаторы (см. рис.). Они используют механизм wormhole (что можно перевести на русский язык как «червоточина»), обеспечивающий высокую пропускную способность. Маршрутизаторы могут каскадироваться, обеспечивая различные топологии и высокий уровень масштабирования системы. Две возможные топологии представлены, в частности, на рисунке.
Как и в любом ином межсоединении, производительность его работы определяется двумя параметрами - пропускной способностью и задержками. Из этих данных следует, что основными конкурентами Parsytec CC являются не большие суперкомпьютеры МРР-архитектуры (они имеют более высокую пропускную способность и более низкие величины задержек), а более дешевые кластерные системы, использующие для межсоединения Gigabit Ethernet или ATM. Последние, в свою очередь, уступают по задержкам Parsytec.
В процессорных узлах Parsytec ССe применяются PowerPC 604е/200 МГц. Узлы комплектуются оперативной памятью емкостью до 512 Мбайт с пропускной способностью 130 Мбайт/с. Производительность процессоров в этих системах составляет SPECint95/fp95=7,18 и 6,00.
В качестве средств распараллеливания предлагается MPI, PVM, пакет SCALAPACK, а также специализированный API-интерфейс, называемый EPX, который образует «среду» Embedded PARIX (Parallel Extension to Unix - EPX). Благодаря этому API-интерфейсу можно создавать виртуальные каналы между пользовательскими нитями.
Кроме Parsytec CCe компания предлагает серию Parsytec CC/ipp на платформе Pentium Pro/200 МГц и NT 4.0. Оценки производительности SPECint95/fp95 этих процессоров составляют соответственно 8,1 и 15,9.
Эти системы снабжаются специальными графическими средствами и аппаратурой, предназначенной для работы с изображениями. Есть прецеденты, когда вместо NT применялась ОС Linux. Кроме того, компьютеры CC/ipp могут поставляться и с ОС AIX на базе PowerPC 604e.
Не продажи, а сотрудничество
Хотя компьютеры Parsytec можно найти в самых разных точках земного шара, особо упомянем их инсталляции в Германии, в частности на знаменитых металлургических заводах Круппа.
В России их поставки осуществляет фирма Parsytec Petersburg. Если посмотреть на количество инсталляций (около полутора десятков), можно сказать, что Parsytec в нашей стране «процветает», обгоняя по числу инсталляций всех других производителей суперкомпьютеров.
Причин этому, на наш взгляд, несколько. Во-первых, эти системы относительно дешевы, и хотя их процессоры отнюдь не лидируют по производительности, компьютеры Parsytec позволяют осуществлять разработку параллельных приложений. Во-вторых, Parsytec предлагает приложения в ряде областей, в первую очередь для обработки изображений.
Еще одной важной причиной успеха Parsytec является организация сотрудничества фирмы с российскими потребителями. Совместно с российскими партнерами Parsytec выполняет различные проекты в рамках Евросоюза (в том числе в программах ESPRIT, ACTS и др.). Можно упомянуть, например, проект SIGMA-EAST с Государственным историческим музеем России.
Крупнейшими вычислительными центрами в стране, имеющими сразу по несколько установленных компьютеров Parsytec, являются ИВВиБД (Санкт-Петербург) и ИММ РАН (Москва). В последнем недавно прошла презентация 32-процессорной системы Parsytec CC на базе PowerPC 604.
Михаил Кузьминский - старший научный сотрудник Центра компьютерного обеспечения Института химических исследований РАН. С ним можно связаться по телефону (095) 135-6388.
Характеристики «быстродействия» межсоединения Parsytec CC
Адаптеры PCI/HS-Link: | |
Пиковая ПС | 66 Мбайт/с |
Поддерживаемая ПС, двунаправленная передача | 42 Мбайт/с |
Поддерживаемая ПС, однонаправленная передача | 30 Мбайт/с |
Аппаратная задержка | 20 мкс |
Задержка на уровне виртуального канала в ОС AIX | 260 мкс |
Маршрутизаторы: | |
Тип | Коммутатор 8х8 |
Пропускная способность | 8х2х40 Мбайт/с |
Задержка | 50 нс |
Время установки | 150 нс |