Представив первый коммерческий сервер с процессором Power9, корпорация IBM рассчитывает укрепить свои позиции в области приложений искусственного интеллекта для ЦОД и веб-сервисов.
Чипы Power9 пока не дотягивают до максимальных скоростей семейства Intel Xeon Scalable Processor, но при этом демонстрируют потрясающую пропускную способность, которая дает им преимущество в области машинного обучения и на приложениях, требующих ускорения работы с базами данных.
Корпорация IBM представила первый сервер на Power9 — Power System AC922. Процессоры Power9, настроенные для работы с Linux и поддерживающие многопоточную технологию SMT4 с четырьмя потоками, могут иметь до 24 ядер, но в серверах AC922 число ядер не превышает 22. Самые быстрые процессоры Power9 в AC922 работают на тактовой частоте 3,3 ГГц.
Модель AC922 8335-GTG с воздушным охлаждением уже готова к выпуску, в то время как поставки двух других моделей (одна с воздушным, а другая с жидкостным охлаждением) планируется начать спустя несколько месяцев. В каждой из них будет установлено два чипа Power9, и они будут работать под управлением Red Hat и Ubuntu Linux.
В 2018 году IBM планирует выпустить серверы, в которых установлена версия Power9, настроенная для работы в среде AIX/System i и поддерживающая многопоточный режим SMT8 с восемью потоками, а также средства виртуализации PowerVM. Процессоры эти имеют до 12 ядер, но могут работать на более высокой тактовой частоте.
На протяжении четырех лет корпорация IBM разрабатывала процессоры Power нового поколения, однако информация об их спецификациях начала публиковаться только в прошлом году. История процессоров Power тесно связана с усилиями IBM по разработке систем искусственного интеллекта и, в частности, облачного сервиса искусственного интеллекта Watson. В 2011 году система Watson, оснащенная процессорами Power7, одержала победу над человеком в телевикторине Jeopardy.
Семейство Power9 поддерживает ряд новых технологий ввода-вывода, включая PCI-Express 4.0 и NVLink 2.0, интерфейсную архитектуру OpenCAPI для систем искусственного интеллекта, требующих высокой пропускной способности, а также микросхемы ASIC и FPGA, обеспечивающие ускорение работы с базами данных.
Эти технологии позволяют процессорам взаимодействовать с различными сопроцессорами для машинного обучения, высокопроизводительных, визуальных вычислений и гипермасштабной обработки веб-страниц.
В IBM ожидают, что системы AC922 с процессорами Power9 помогут корпорации занять лидирующее положение в области обработки задач искусственного интеллекта, упрочив ее позиции. «В системах искусственного интеллекта, по сути, все сводится к работе с данными. Требуется ответить на вопрос, как получить данные, выполнить необходимые вычисления и выдать результаты таким образом, чтобы модель машинного обучения на большей части данных функционировала максимально быстро и точно», — пояснила вице-президент IBM Power Systems Стефани Чирас.
Шина PCIe 4 обеспечивает пропускную способность до 16 гигатрансферов в секунду — в два раза больше, чем используемая Intel шина PCIe 3. Интерфейс NVLink 2.0 предлагает графическим процессорам Nvidia пропускную способность до 25 Гбит/с. Именно сопроцессоры Nvidia наиболее широко используются в системах искусственного интеллекта и для так называемых ускоренных рабочих нагрузок, например в распределенных системах управления базами данных в оперативной памяти, применяемых в современных аналитических приложениях, в частности в системе, разработанной компанией Kinetica.
В Kinetica утверждают, что при использовании процессоров Power9 их СУБД работает в 1,8 раза быстрее, чем на серверах с чипами Power8. Система AC922 на основе Power9 проектировалась для увеличения производительности на платформах искусственного интеллекта Chainer, TensorFlow и Caffe.
«Наиболее впечатляющей при использовании Power9 выглядит подсистема ввода-вывода, — указал глава компании Moor Insights & Strategy Патрик Мурхед. — Процессоры Power9 используются и в системах, выпускаемых независимыми производителями. Google и Rackspace, к примеру, проектируют систему Zaius на основе Power9 и OpenCAPI. Ее коммерческую эксплуатацию планируется начать в следующем году».
«Мы не просто занимаемся совершенствованием оборудования, но стремимся придать системам новый уровень ценности, который позволил бы другим выстраивать инновационные решения на их основе», — заявила Чирас.
Система IBM AC922 представлена двумя моделями с воздушным охлаждением, в каждой из которых установлено два процессора Power9 с 16 и 20 ядрами, работающие на тактовой частоте от 2,25 до 3,12 ГГц. Их дополняют от двух до четырех графических процессоров Nvidia Volta V100. В версии с жидкостным охлаждением, которая должна появиться во втором квартале 2018 года, будут присутствовать чипы Power9, имеющие от 18 до 22 ядер с тактовой частотой от 2,55 до 3,3 ГГц, и от двух до четырех процессоров Nvidia V100.
Процессоры Power9 в системе AC922 по тактовой частоте уступают чипам уровня Platinum семейства Intel Xeon Processor Scalable Family, которые работают на частоте до 3,6 ГГц. Но несмотря на то что у Xeon имеется до 28 ядер, поддерживающих 56 потоков, 22-ядерный чип Power9 AC922 с поддержкой SMT4 обрабатывает 88 потоков. Увеличенная плотность потоков позволяет эффективно использовать процессорные ресурсы и увеличивать пропускную способность, что в сочетании с возможностями ввода-вывода Power9 обещает существенный прирост производительности при решении задач машинного обучения.
Все модели AC922 имеют 512 Кбайт кэш-памяти второго уровня на ядро, 10 Мбайт разделяемой кэш-памяти третьего уровня на каждые два ядра и поддерживают до восьми модулей DIMM на процессор. При этом в каждом модуле DIMM находится от 8 до 128 Гбайт памяти DDR4 с тактовой частотой 2666 МГц. Системы оснащены двумя портами USB 3.0, двумя портами Ethernet 16GB и четырьмя слотами PCIe Gen4. Общий объем дискового пространства составляет 7,68 Тбайт. Габариты моделей: ширина 445,1 мм, высота 86 мм и глубина 822 мм. Информация о ценах появится непосредственно перед началом поставок.
Инструментарий PowerAI для Power9
Программные инструменты PowerAI для приложений машинного обучения, адаптированные к особенностям систем Power9, должны появиться в начале 2018 года. PowerAI поддерживает в том числе и Distributed Deep Learning — распределенные между множеством физических серверов работы по глубинному обучению.
«Я убежден в том, что IBM занимает лидирующие позиции в части подготовки этих инструментов, — заявил Мурхед. — И сохраняет лидерство в области машинного обучения».
До сих пор фактическая монополия на серверные процессоры принадлежала компании Intel, контролировавшей 90% рынка. Но с Power9 в IBM рассчитывают к 2020 году отвоевать себе 20%.
Для рынка серверных процессоров этот год выдался богатым на события. В июле Intel представила семейство Xeon Scalable — крупнейшее за последние десять лет обновление процессоров для больших систем. Но у нее имеются конкуренты и помимо IBM. В июне компания AMD продемонстрировала процессорное семейство Epyc, предложив весьма конкурентоспособную производительность в пересчете на ватт, и однопроцессорные серверы для достижения максимальной эффективности.
Приложения, работающие на Xeon, не придется переписывать для Epyc, поскольку эти чипы также имеют архитектуру X86. А вот для систем с процессорами Power9 все придется переписывать, но масштабы облачных сервисов и спрос на приложения машинного обучения свидетельствуют о том, что адаптация программного обеспечения к оборудованию, эффективно справляющемуся с рабочей нагрузкой, может принести немалую экономию. Однако для определения того, насколько это эффективно, нужны сравнительные реальные ориентиры.