Биотехнологическая компания BIOCAD запускает собственный центр обработки данных. Новые вычислительные мощности составят к концу 2016 года 268 TFLOPS. Это очень высокий показатель среди компаний, занимающихся биотехнологическими исследованиями не только в России, но и в мире. Новый ЦОД, прежде всего, необходим для ускорения работы над созданием 30 революционных препаратов в рамках проекта MabNext. Это лекарства нового поколения против тяжелых форм рака, аутоиммунных и других заболеваний. Инвестиции в проект до конца года составят порядка 100 млн руб.
Новый ЦОД модульный, в чем его большое преимущество: сборка на площадке занимает всего около недели. Сами модули производятся на заводе-партнере, а сборка происходит на территории BIOCAD. К концу года компания планирует увеличить кластер неспециализированных вычислений в два раза до 16 узлов и 48 графических ускорителей. Сейчас — 8 узлов и 24 графических ускорителя. В ожидании такой нагрузки BIOCAD приняла решение о создании собственного ЦОД.
За 15 лет в компании накоплен большой объем данных, например, разнообразная информация об антителах более 1000 людей, а также лам — животных, которые никогда не болеют раком. Все эти огромные массивы информации необходимо упорядочить и сделать доступными для легкой и быстрой компьютерной аналитики. При таком объеме простых алгоритмов не достаточно, нужны современные методы машинного обучения или другими словами элементы «искусственного интеллекта». И BIOCAD сейчас активно их внедряет.
Всего год назад, когда компания разработала собственную интеллектуальную платформу, соединившую технологии математического моделирования и нового уровня синтеза генов, еще только планировалось развить платформу до уровня искусственного интеллекта. Сейчас видно как эти планы постепенно претворяются в жизнь. И запуск нового ЦОДа — шаг на пути к созданию такой системы.
Безусловно, новые вычислительные мощности направлены, прежде всего, на проведение сложного структурного анализа молекул. Ведь чтобы создать лекарство, необходимо перебрать более 1 млн природных молекул. Более того свойства искомой молекулы могут быть искусственно доработаны или усовершенствованы, чтоб лекарство стало эффективнее и безопаснее. Сначала анализ проводится на компьютере и лишь потом уходит в лаборатории, что экономит много времени.
«Как обычно происходит поиск молекулы для лекарства? Из огромных природных библиотек, содержащих миллиарды антител, выбирается всего 1-2. Но точно до конца неизвестно, будет ли эффективно лекарство на основе этой молекулы или нет, — объяснил генеральный директор BIOCAD Дмитрий Морозов. — Мы заходим с другого конца — с помощью математического моделирования предсказываем, какими свойствами должна обладать молекула, чтобы превзойти существующие лекарства по показателям эффективности и безопасности. А только потом создаем ее в лаборатории. Чтобы делать такой анализ быстро, необходимы большие вычислительные мощности, которые мы и создаем, открывая собственный ЦОД».
Новые вычислительные мощности позволят в разы ускорить процессы аналитики. Так, если раньше время на сбор информации и краткое описание аминокислотной последовательности целевых антител для лечения заболеваний уходило более двух недель, то теперь с помощью новых вычислительных мощностей будет тратится всего несколько десятков минут. Время сократилось в сотни тысяч раз. Значит гораздо быстрее можно будет создать новые препараты, и россияне первыми в мире получат лекарства нового поколения.
Также BIOCAD модернизировала архитектуру. Сейчас она строится на основе Open Compute Project, которую изначально разрабатывал Facebook для собственных нужд. Ее отличают высокая плотность оборудования, энергоэффективность и низкая стоимость в сравнении с классическими решениями.