В области мощных вычислительных систем (High Performance Computing, HPC) параллелизм укоренился уже давно. HPC-приложения в последние годы быстро развиваются. Это проявилось и в открытии Центра параллельных приложений, созданного компаниями Intel и SGI
Компьютерный мир становится параллельным стремительными темпами. Речь идет уже не о многопроцессорных вычислительных системах: теперь параллелизм — основное понятие на уровне микросхем. К примеру, процессоры Intel Pentium 4 поддерживают технологию HyperThreading, образуя два «логических» процессора на базе одного реального микропроцессора.
Поддержка многопоточности, микропроцессоры с несколькими ядрами на одной микросхеме становятся реальностью. Многоядерные процессоры от Intel ожидаются уже скоро. Дело идет к тому, что всякий пользователь ПК фактически будет работать с многопроцессорной системой. Однако разработчики программ для ПК, похоже, к этому еще не готовы.
Зато в области мощных вычислительных систем (High Performance Computing, HPC) параллелизм укоренился уже давно. HPC-приложения в последние годы быстро развиваются. Это проявилось и в открытии Центра параллельных приложений (Parallel Application Center), созданного компаниями Intel и SGI.
Центр расположился на территории представительства Intel в английском городе Свиндон. Intel предоставила не только помещение, но и сетевую инфраструктуру, а также обслуживающий персонал. SGI — 32-процессорный сервер Altix 3000 архитектуры ccNUMA на базе процессоров Itanium 2/1,5 ГГц с кэшем третьего уровня на 6 Мбайт. Емкость оперативной памяти системы равна 128 Гбайт, дискового пространства — 2,3 Тбайт.
То, что центр использует вычислительную систему на базе Itanium 2, а не с архитектурой х86, объяснимо. Для Itanium 2 имеется уже около 3 тыс. приложений, однако наивысшей производительности эти процессоры достигают именно на задачах с плавающей точкой. Кроме того, первоначально они стали активно использоваться именно в HPC-приложениях. В свежем списке Top 500 крупнейших суперкомпьютеров мира представлены 84 системы на базе Itanium 2.
По словам Ника Напфера, PR-менеджера английского отделения Intel, в перспективе Intel планирует создать единую аппаратную платформу для IA-64 и IA-32, в которой пользователь за одну и ту же цену сможет выбирать — применять ли процессоры х86 или Itanium/IA-64.
Центр создан Intel совместно с SGI, и это вполне понятно. Linux-серверы SGI Altix не имеют себе равных по масштабируемости как среди систем на базе Itanium 2 за исключением «чистых» кластеров, так и в целом среди систем с общим полем памяти. В новейших конфигурациях Altix максимальное число процессоров увеличилось с 512 до 2048, а в 2005 году этот параметр, возможно, еще возрастет. Соответственно одно приложение может использовать и оперативную память астрономической емкости; уже сейчас имеется много систем с памятью емкостью не менее 1 Тбайт.
Не стоит объяснять, как это важно для баз данных сверхбольшого размера. Показательно, что на презентации центра в Свиндоне выступили и представители компании Objectivity, разработчика объектно-ориентированной СУБД Objectibity/DB, которая обеспечивает на SGI Altix высокую масштабируемость при работе с гигантскими базами данных.
Приложений, хорошо масштабируемых до 100 и более процессоров, довольно мало. Известно также, что распараллеливание в модели общего поля памяти с использованием OpenMP масштабируется хуже, чем в распределенной модели памяти, которая опирается на средства наподобие MPI. Тем фантастичнее выглядит обнародованный в ходе презентации центра результат — достижение эффективности в 88% (доля от максимального ускорения, линейно растущего с числом процессоров) для 500-процессорной системы Altix с использованием механизма OpenMP на программе Cart3D (задача вычислительной динамики жидкости).
В одном здании с Центром параллельных приложений Intel расположен и Центр оценки персональных компьютеров и материнских плат, построенных на процессорах Intel x86. Этот центр осуществляет всестороннее тестирование аппаратуры производителей из стран региона EMEA (Европа, Ближний Восток и Африка), причем тестирование это бесплатно. Информация о том, какие отечественные фирмы прошли подобное тестирование, считается конфиденциальной. Между тем факт успешного прохождения такого тестирования должен был бы способствовать продажам соответствующей аппаратуры.
Тестирование осуществляется в конвейерном режиме и занимает примерно две недели. Проверка включает измерение электромагнитных и акустических характеристик, применение аппаратных эмуляторов процессоров для контроля сигналов на контактах разъема, использование анализаторов протоколов с тестированием всех разъемов (в том числе новых шин PCI-Express), обработку в термотроне и т. д. Возможно тестирование серверов. Наконец, отдельно можно провести и тестирование производительности.
Задача Центра параллельных приложений достаточно традиционна и напоминает ту, что стоит перед уже известными отечественным специалистам центрами компетенции, — помощь разработчикам программных продуктов для данной программно-аппаратной платформы.
Ресурсы центра будут доступны как локально, так и в удаленном режиме. Центр будет использоваться для переноса, отладки, оптимизации и тестирования приложений. Выигрыш разработчика состоит, во-первых, в уменьшении финансовых затрат (это дешевле, чем покупать собственный компьютер Altix); во-вторых, здесь можно получить высококвалифицированную помощь.
Предусмотрено два типичных режима доступа. Стандартный, «разделяемый доступ», при котором ресурсы Altix разделяются между разными разработчиками. В случае, если имеются уникальные требования (скажем, по времени расчета или по конфигурации), возможен режим «исключительного доступа», когда Altix предоставляется в монопольное использование сроком от одного до пяти дней.
Процессорные планы Intel
Intel разделяет свои микропроцессоры, которые могут быть использованы в многопроцессорных серверах, на две группы. Первые (DP) предназначены для двухпроцессорных серверов, вторые (MP) — для серверов с числом процессоров больше двух. Эта классификация действует как для Itanium 2, так и для семейства Xeon. Скажем, на 2005 год намечен выпуск Xeon DP с кодовым названием Irwindale, который будет работать с наборами микросхем i7520 и i7320. Нынешние Xeon MP в 2005-м и 2006 году сменят процессоры Cranford, Potomac и Tulsa, рассчитанные на набор микросхем TwinCastle. В более отдаленной перспективе ожидается процессор Whitefield, который будет иметь «общую архитектурную платформу» с Tukwilla, будущим процессором семейства Itanium.
К 2006 году это семейство мигрирует от Itanium 2/1,6 ГГц с кэшем третьего уровня емкостью 9 Мбайт (он только что представлен и будет основным в наступившем году) к двуядерным процессорам Montecito, а затем к Montvale, которые по-прежнему будут работать с набором микросхем i8870.
Смена чипсета ожидается лишь в более отдаленном будущем, когда появится Tukwilla. Заметим, что и Montecito, и Montvale присутствуют и в перспективных планах развития серверов SGI Altix.
Если переход от Itanium 2 с кэшем 6 Мбайт к Itanium 2/9M дает увеличение производительности до 25%, то переход к двухъядерным процессорам Montecito даст более существенный вклад: увеличение производительности до полутора раз на задачах с плавающей точкой, и в 1,7 раза — на задачах оперативной аналитической обработки.
Емкость кэша третьего уровня будет увеличена при этом до 24 Мбайт. В Montecito будет поддерживаться многопоточная архитектура (до четырех потоков на микропроцессор) и технология Foxton с динамическим управлением потребления энергии. Можно предположить, что еще большему росту производительности Montecito будут препятствовать возможные конфликты при обращении в память, что становится характерным для современных многоядерных процессоров.
В области DP-процессоров вслед за Fanwood в семействе Itanium появятся процессоры Millington, а затем Montvale, работающие все с тем же набором микросхем i8870. Естественно, DP-процессоры будут выпускаться также и в вариантах с пониженным энергопотреблением (Low Voltage, LV). DP-аналог Tukwilla с кодовым названием Dimona ожидается позднее 2006 года. Если процессоры 2005 и 2006 годов будут двухъядерными, то Tukwilla и Dimona ожидаются уже многоядерными. С их появлением возникнет и усовершенствованная технология виртуализации. Можно предположить, что исследовательский центр Intel в Москве, научным руководителем которого является Борис Бабаян, также будет работать над процессорами семейства Itanium, однако результаты скорее увидят свет в Tukwilla.