Catapult

Повышение эффективности и производительности поисковых алгоритмов, которые сулит Katapult, несомненно, обрадует каждого

Обе компании представили свои доклады на конференции Hot Chips в Купертино, посвященной последним достижениям в области создания микропроцессоров и сопутствующих технологий.

Сегодня в ПК и игровых консолях широко применяются графические процессоры. Несколько лет назад не меньшей популярностью пользовались и звуковые платы. И те и другие чипы эффективно справлялись с порученными им специализированными функциями. В отличие от них Intel Core, AMD A-серии и ARM Cortex представляют собой программируемые процессоры общего назначения, которые служат для решения самого широкого спектра задач.

Программируемые логические матрицы (field-programmable gate array, FPGA) занимают в этой классификации промежуточное положение. Они обладают ограниченными возможностями программирования, но их производительность ниже, чем у специализированных чипов с фиксированным функционалом. «У нас возникла идея использовать микросхемы FPGA, чтобы продлить жизнь старым системам и добавить им гибкости, – отметил старший инженер-исследователь Microsoft Эндрю Путнэм. – А если вы приобретаете машину для ЦОД, она, как правило, остается там надолго».

Дополнительная гибкость очень значима для ускорения программных алгоритмов (в частности поиска), которые постоянно адаптируются и совершенствуются. Со временем ускоритель с фиксированным набором функций становится все менее и менее эффективным, продолжая занимать ценное пространство и потреблять электроэнергию.

По итогам испытаний команда Путнэма решила отказаться от специализированной платы, в которой использовалось шесть микросхем Xilinx, крупнейшего производителя FPGA. Эти платы заметно усложняли конструкцию серверов, становились дополнительным источником ошибок и выделяли слишком много тепла, что не могло не беспокоить администраторов ЦОД, поддерживавших функционирование Bing и других облачных сервисов Microsoft. Зато плата Catapult, на которой размещались микросхема Altera Stratix V G5 D5, 8 Гбайт оперативной памяти, 32 Гбайт флэш-памяти и восемь разъемов PCI 3, проявила себя самым лучшим образом.

Она прекрасно умещалась в серверах Microsoft Open Compute, чья конструкция стала популярной благодаря Facebook и не требовала специальных доработок со стороны производителей готового оборудования (HP или Dell). В серверах Microsoft установлены два восьмиядерных процессора Xeon с тактовой частотой 2,1 ГГц, 64 Гбайт оперативной памяти, четыре жестких диска объемом 2 Тбайт и два твердотельных накопителя емкостью 512 Гбайт. В половине стойки умещается 48 таких серверов, и в каждый была установлена плата FPGA. Посредством кабелей платы объединили в матрицу 6x8, имеющую тороидальную топологию.

В производственных испытаниях было задействовано 1632 сервера ЦОД. Выяснилось, что платы FPGA ускоряют поиск документов, отвечающих параметрам, задаваемым пользователями. Скорость поисковых операций выросла в два раза, а время задержки сократилось на 29%. Достигнутая экономия позволила Microsoft наполовину уменьшить число требуемых серверов.

Результаты испытаний оказались настолько успешными, что в 2015 году планируется оснастить новыми платами все серверы Bing. Соответственно возникает вопрос, где еще технология FPGA могла бы найти применение?

Компания Baidu, которой принадлежат десятки тысяч серверов в Китае, применяет микросхемы FPGA для ускорения работы нейронных сетей и реализации самых разных алгоритмов — от традиционного поиска до распознавания речи и поиска и распознавания изображений. Плату FPGA Xilinx K7 480t-2l, используемую Baidu, можно устанавливать в любые типы серверов высотой 1U или 2U. Испытания при различной рабочей нагрузке показали, что платы FPGA в несколько раз эффективнее центральных и графических процессоров.

Улучшение качества поисковых операций Bing и Baidu ощутят на себе все пользователи без исключения. Повышение эффективности и производительности поисковых алгоритмов, несомненно, обрадует каждого.