Законодатель мод транспьютерных систем, английская фирма Inmos, не смогла выдержать конкуренции с американскими и японскими компьютерными монстрами, и транспьютеры были отодвинуты на задний план.
Многие из игроков рынка МРР-систем в середине 90-х годов вообще ушли из сектора суперкомпьютерных систем. Meiko оказалась в этом смысле более удачливой: весной 1996 года она вошла в состав совместного предприятия, созданного при участии итальянской фирмы Alenia Aerospazio/Finmeccanica, которой принадлежит около 70% капитала новой компании - Quadrics Supercomputer World (QSW). Итальянская сторона имела к этому времени за плечами проект APE100 - машины с архитектурой SIMD (Single Instruction Multiple Data - "одиночный поток команд, множественный поток данных"), обладающей в максимальной конфигурации пиковой производительностью 100 GFLOPS. Надежды Европы противостоять американскому и японскому суперкомпьютерному нашествию теперь связаны в основном с тремя компаниями - SNI, Parsytec и Quadrics. Последняя среди них самая молодая и уже поэтому заслуживает особого внимания.
QM-1
Cегодня QSW представляет на рынок суперкомпьютеры нескольких архитектурных типов, что уже само по себе вызывает удивление, особенно, если учесть относительно небольшие масштабы этой компании. Мы начнем с рассмотрения систем QM-1, которые являются наиболее типичными для сегодняшнего рынка МРР. Они имеют архитектуру MIMD (Multiple Instruction Multiple Data - "множественный поток команд, множественный поток данных") и базируются на RISC-процессорах UltraSPARC II. Компания Quadrics недавно объявила о разработке систем на базе Alpha 21164/600 МГц, но информации об этом направлении работ пока еще очень мало.
С точки зрения автора, важнейшей особенностью QM-1 является объединение в МРР-cистему вычислительных узлов, каждый из которых в свою очеpедь является SMP-компьютером. Это означает, что в узле может использоваться распараллеливание в модели общего поля памяти, а более сложные задачи, требующие распараллеливания на большее число процессоров, должны распараллеливаться в модели обмена сообщениями.
Сами же сотрудники QSW полагают, что основной отличительной особенностью QM-1 является прозрачность для приложений сети, соединяющей узлы QM-1, что достигается, в частности, благодаря применению библиотеки Elan Widget Library.
Узлы, представляющие собой процессорные элементы, в QM-1 включают от одного до четырех микропроцессоров, разделяемую ими оперативную память и две шины PCI. Все это хозяйство соединяется в единое целое коммутатором.
В качестве микропроцессоров могут использоваться UltraSPARC II с тактовой частотой 250 МГц и внешней кэш-памятью емкостью 1 Мбайт, либо с тактовой частотой 300 МГц и внешней кэш-памятью емкостью 2 Мбайт. Связь с микропроцессорами осуществляется как обычно, через 128-разрядную (плюс 16 разрядов ECC) шину UPA, которая работает на частоте 83,3 или 100 МГц соответственно для 250- и 300-мегагерцовых микропроцессоров UltraSPARC II. Каждая пара процессоров использует свою шину UPA.
Каждая шина UPA соединена с коммутатором, обеспечивающим интерфейс с подсистемой оперативной памяти с пиковой пропускной способностью 1,8 Гбайт/с. Емкость оперативной памяти узла - от 128 Мбайт до 4 Гбайт, защищена кодами ЕСС и состоит из 4 банков. Оперативная память построена на базе стандартных модулей DIMM 60 нс емкостью 32, 64, 128 или (в будущем) 256 Мбайт.
Для организации ввода-вывода используются две шины PCI. Одна из них - 64-разрядная, работающая на тактовой частоте 66 МГц. К ней подключается микросхема Elan3 собственной разработки QSW, отвечающая за взаимодействие с межсоединением. Вторая, 32-разрядная PCI-шина, работающая на частоте 33 МГц, используется для организации ввода-вывода со "стандартной" для современного рынка периферией (SCSI, UltraSCSI в однопроводном и дифференциальном исполнениях; cетевые соединения Ethernet/FastEthernet/FDDI/ATM и др.). Образно говоря, узел напоминает собой небольшую SMP-систему - что-то вроде Sun Ultra Enterprise 450. В нем работают все внешние аппаратные средства, операционная система Solaris и соответствующие прикладные программы. Суммарная пропускная способность узла по вводу-выводу составляет 800 Мбайт/с.
Сетевое межсоединение в QM-1 включает два основных компонента. Во-первых, это коммуникационные процессоры, позволяющие любому процессорному элементу системы передавать данные по сети с применением "удаленных" операций прямого чтения/записи виртуальной памяти. Во-вторых, это сетевые коммутаторы (4х4), которые дают возможность конструировать многоступенчатую систему каналов, связывающих процессорные элементы.
Масштабируемое межсоединение позволяет подсоединять свыше 4000 процессорных узлов. Каждый узел может передавать и принимать данные с пропускной способностью 250 Мбайт/с. Аппаратная задержка при передаче составляет 2 мкс. На уровне средства MPI удается при этом иметь задержки порядка 7 мкс.
Для обеспечения отказоустойчивости QM-1 используется целый ряд особенностей. В каналах связи применяются коды CRC. В случае сбоя в передаче данных по межсоединению они будут отправлены другим путем. Есть и общеупотребительные средства повышения надежности - коды ЕСС в оперативной памяти, избыточность вентиляторов, источников питания и др.
Не имея возможности подробнее остановиться на программном обеспечении QM-1, отметим только, что все механизмы взаимодействия параллельных процессов (ТСP/IP, MPI, PVM и проч.) работают, используя возможности высокоэффективной библиотеки Elan Widget Library. Следует указать и на средства Resource Management System, позволяющей системному администратору образовать так называемые разделы - поднаборы узлов, ориентирующиеся, скажем, на выполнение определенной группы задач.
Как "Тарзан" управляет "Джейн"
Классическим примером архитектуры SIMD является, как известно, однопроцессорный векторный компьютер. Но все современные компьютеры этого класса выпускаются в многопроцессорном исполнении, и поэтому имеют архитектуру MIMD (множественный поток команд - множественный поток данных). Quadrics продолжает развивать семейство APE (Array Processor Experiment), зародившееся в итальянском Национальном институте ядерной физики и предназначавшееся в первую очередь для решения соответствующих физических задач. Последняя разработка Quadrics в этом семействе - компьютер APEmille. Все компьютеры cемейства APE имеют архитектуру SIMD.
Вычислительные узлы в этой системе оптимизированы под выполнение операций типа x=a*b+c, где операндами могут быть числа с плавающей запятой одинарной и двойной точности, а также целые числа. Процессор вычислительного узла выполняет восемь операций с плавающей запятой за такт и при тактовой частоте 66 МГц имеет пиковую производительность 528 MFLOPS. Процессорная плата включает 8 таких процессоров, именуемых Jane, которыми управляет контроллер с кодовым названием Tarzan. Кроме того, процессорная плата имеет локальную оперативную память емкостью 40 Мбайт с пропускной способностью, равной 518 Мбайт/с.
Все вычислительные узлы связаны между собой в МРР-cистему с топологией трехмерной решетки, имеющей периодические граничные условия. Пропускная способность при обращении к оперативной памяти соседнего узла составляет 132 Мбайт/с. Для связи с соседями служат специальные коммуникационные процессоры. Средства организации ввода-вывода (compact PCI) также локализованы на процессорной плате. Суммарная пропускная способность ввода-вывода в максимальной конфигурации системы составляет 8,5 Гбайт/с.
Конструктивные элементы APEmille используют классическую "заднюю плату" backplane, на которой располагаются процессорные платы.
Вычислительные узлы в этой MultiSIMD-архитектуре разделены на независимые группы, каждая из которых имеет свой контроллер. Это дает возможность одновременно выполнять независимые расчеты в "модели" распараллеливания SPMD.
APEmille для своей работы применяет внешний хост-компьютер. В прототипе системы в качестве хост-компьютера использовался ПК на базе Intel Pentium, работающий с ОС Linux. Quadrics пошла еще дальше: она предложила интеграцию своих MultiSIMD-систем с MIMD-компьютером QM-1 как хостом! В результате образуется суперкомпьютер гибридной архитектуры, имеющий очень интересные особенности, в частности, благодаря возможности разбиения его составных частей на своеобразные "разделы". Такая система носит название PQE2000.
"Мы выбираем, нас выбирают..."
Из сказанного выше становится ясно, что QSW имеет ряд интересных разработок суперкомпьютерных архитектур, которые могут найти применение в различных областях. Среди потребителей продукции Quadrics можно упомянуть, например, такие исследовательские центры, как СERN (Швейцария), DESY (Германия), Imperial College of London (Великобритания) и др. Сейчас Quadrics начала присматриваться к Китаю; то же самое можно сказать и о нашей стране.
Что такое объектная СУБД
Конструктив | Число узлов | Топология | Пиковая производительность, GFLOPS |
Узел | 1 | 0,5 | |
PB | 8 | 2x2x2 | 4,2 |
APEunit | 32 | 2x8x8 | 16,8 |
Крейт | 128 | 2x8x8 | 67 |
Cтойка | 256 | 4x8x8 | 134 |
Башня | 512 | 8x8x8 | 268 |
Макс. конфигурация | 2048 | 32x8x8 | 1000 |