При создании новых лекарств используются не только Ggrid-технологии, суперкомпьютеры, графические ускорители и MPP-системы (Massively Parallel Processing). . Профессор Владимир Поройков, доктор биологических наук, кандидат физико-математических наук, возглавляет лабораторию структурно-функционального конструирования лекарств НИИ биомедицинской химии им. В. Н. Ореховича РАМН, где путем компьютерного скрининга проводят идентификацию низкомолекулярных органических соединений, потенциально пригодных для терапии различных заболеваний. Программированием заняты около 40% сотрудников лаборатории, которые разработали три приложения: PASS (Prediction of Activity Spectra for Substances), PharmaExpert и GUSAR (General Unrestricted Structure-Activity Relationships), а также веб-сервисы на их основе, дающие пользователям возможность получить прогноз биологической активности для своих соединений. О деятельности лаборатории Владимир Поройков рассказал Ирине Шеян, руководителю проекта Computerworld Россия/MedIT.
Владимир Поройков: «Главный тормоз для нас — доступ к информации и его оплата» |
В чем состоит суть вашей работы?
Созданию лекарств предшествует обработка большого объема информации, ведь в организме человека несколько тысяч белков — биологических мишеней, еще больше разнообразие лигандов — химических соединений с известной биологической активностью, они потенциально могут использоваться в качестве фармакологических веществ. Уже синтезированных веществ, образцы которых можно приобрести, — около 100 млн, а виртуальных — около 100 млрд.
По статистике, на создание лекарственного препарата и получение разрешения на медицинское применение требуется затратить примерно 12 лет, вложить 1 млрд долл. и изучить 10 тыс соединений. При случайном поиске вещества вероятность найти его в биологическом эксперименте ниже 0,1%, а при предварительном виртуальном отборе молекул — от 10 до 30%. Скрининг значительно сокращает время на перебор пар мишень-лиганд, а также затраты на синтез и тестирование. Библиотеки, доступные для скрининга, включают около 100 млн веществ. Например, компания ChemNavigator собирает коллекцию веществ для тестирования биологической активности от более чем 200 поставщиков и предоставляет к ней доступ через Интернет или локальные инсталляции с обновлениями.
Чтобы отобрать молекулы для синтеза будущих лекарств, используются два типа компьютерных оценок. Первый — молекулярное моделирование, применяемое, когда известна трехмерная структура макромолекулы-мишени и надо понять, какой лиганд будет взаимодействовать с ней оптимальным образом.
Мы в основном занимаемся вторым типом компьютерного дизайна, когда большая коллекция известных лигандов используется в качестве обучающей выборки, строятся модели взаимосвязи молекулярной структуры и биологической активности, и на их основе проводится виртуальный скрининг. В частности, c помощью программы PASS можно прогнозировать свыше 4 тыс. видов биологической активности. При этом можно оценивать воздействие одного лиганда на многие мишени или искать вещества, потенциально обладающие комбинацией фармакологических эффектов (например, проявляющие антиаритмическое и антигипертензивное действие одновременно). В оцениваемый спектр активности входят также побочные эффекты, токсичность, взаимодействие с ферментами, метаболизирующими лекарства в организме, и с транспортирующими их к мишени.
Каков механизм коммерциализации ваших разработок?
В основном это продажа лицензий на программное обеспечение и участие в исследовательских проектах, направленных на поиск соединений с требуемыми видами активности — фактически это сервис для фармацевтических и биотехнологических компаний.
То есть вашим продуктом является софт?
Да. Нередко потенциальные заказчики сначала используют наш бесплатный веб-сервис pharmaexpert.ru/passonline, проверяя, обладают ли конкретные химические соединения свойствами, которые программа прогнозирует. Затем, если результат их удовлетворяет, они приобретают лицензию на профессиональную версию программы, которая позволяет провести обучение с использованием внутрифирменных баз данных. Таким путем фирма получает эксклюзивный продукт, позволяющий проводить виртуальный скрининг больших библиотек химических соединений и находить оригинальные «кандидаты в препараты».
Но о полученных на базе фармкомпании результатах вы уже не узнаете?
Как правило, нет. Косвенным свидетельством результативности становится продление лицензионного договора — значит, программа приносит пользу компании.
Для чего предназначены ваши приложения?
В PASS вводится структурная формула вещества и в результате получается оценка вероятного спектра его биологической активности. PharmaExpert обеспечивает возможность отбора химических соединений с требуемыми профилями активности, а GUSAR дает количественную оценку биоактивности.
GUSAR требует наличия обучающей выборки по известным биологически активным соединениям. Использование в GUSAR в качестве зависимых параметров, наряду с химическими дескрипторами также и прогнозируемых PASS спектров биологической активности, позволяет дать биологическую интерпретацию результатам прогноза (например, определить перечень потенциальных мишеней, взаимодействие с которыми обусловливает токсичность вещества). Известно множество программ-конкурентов для анализа количественных соотношений «структура-активность», но такую интерпретацию позволяет делать только GUSAR.
В свободном доступе находятся веб-сервисы прогнозирования спектра биологической активности, острой токсичности веществ для крыс, предсказания возникновения побочных эффектов, а также токсичности химикатов для водных организмов, используемые при оценке опасности для окружающей среды.
Какова конкуренция в этой области?
Лет восемь назад у нас практически не было конкурентов в мире, так как мы создавали обучающую выборку вручную из специальной литературы в течение многих лет. Сейчас ситуация усложнилась: появились открытые базы данных, такие как PubChem, где есть информация о химической формуле и биологической активности, и началась разработка методов анализа и прогнозирования, причем некоторые инструменты предоставляются бесплатно.
Профили биологической активности предсказывают такие веб-сервисы, как ChemSpider, SuperPred, CPI-DRAR и SEA, но у PASS Online самая высокая чувствительность прогноза (отношение числа истинно-положительных прогнозов к числу активных соединений в выборке). У ближайших по этому показателю конкурентов расчет занимает на порядок больше времени. За десять лет существования нашего сервиса им воспользовались 8,3 тыс. исследователей из 89 стран, из них 2,7 тыс. — российских.
Откуда приходят клиенты?
Мы активно участвуем в международных конференциях, нас знают по публикациям, многие сначала пробуют ПО через веб-сайт, а потом покупают лицензию. Отечественных фармкомпаний, которые создают инновационные препараты, до недавнего времени не было. Российским организациям мы продали только две лицензии, хотя интерес есть у многих. Некоторым академическим организациям и университетам мы предоставляли лицензии бесплатно — денег у них нет и будут не скоро.
Веб-доступ к программе с ограниченной функциональностью работает как продукт для академических пользователей. Фармкомпания не будет посылать в Интернет структурную формулу вещества, которое ее действительно интересует. Поэтому мы не боимся, что из-за бесплатности веб-сервиса у нас не будут покупать лицензии. А открытый доступ обеспечивает независимую валидацию нашего софта — есть уже более 40 публикаций о синтезированных веществах, испытания которых подтвердили свойства, спрогнозированные нашей программой.
А с чем могут быть связаны неподтвердившиеся прогнозы?
C упрощенным описанием химической структуры или с тем, что свойства некоторых молекул и виды активности совсем не изучены, и в обучающей выборке нет ничего похожего. Если число новых (по отношению к соединениям обучающей выборки) дескрипторов (элементов структурной формулы вещества) более трех, то оценка получается более грубой.
Большие вычислительные ресурсы, суперкомпьютеры вам не нужны?
Они нужны для трехмерного моделирования с использованием методов молекулярной динамики, а нам — пока нет. При этом наши методы дают результаты не хуже. Когда в рамках Европейского проекта мы анализировали всю базу ChemNavigator в поисках вещества для лечения рака молочной железы (и в результате оно было найдено), на десктопе это считалось два дня. Но такой расчет делается однократно. Вычислительные ресурсы в институте приличные (серверы, кластеры), а суперкомпьютер зачастую невыгоден для наших задач, потребляемая им электроэнергия несоизмерима с полученными на нем результатами.
PASS создана в среде Delphi и может работать на обычном ноутбуке. Из баз данных структурные формулы экспортируются в виде sdf-файлов. Интерфейс достаточно простой, и можно освоить все возможности программы за полчаса. В основном пользователи PASS работают на платформе Microsoft, но у нас есть также Linux- и платформенно-независимая версии.
Вы можете по результатам анализа генома человека спрогнозировать, как на него подействуют лекарства?
В идеале — да, правда, практические результаты пока скромные. Могу привести только один пример, имеющий отношение к персонализированной медицине. Клинические фармакологи попросили сделать прогноз метаболизма для одного из известных коагулянтов, препаратов, действующих на свертываемость крови. Результаты позволили объяснить клинические данные об отсутствии влияния полиморфизма у одного из ферментов, метаболизирующих лекарства, на скорость метаболизма этого препарата: согласно прогнозу, этот препарат метаболизируется другим ферментом.
Расшифровка генома — полдела, геномы людей различаются на 1%, гораздо больше люди различаются экспрессией белков — качественной и количественной. Настала пора постгеномных исследований, еще очень многое неизвестно, и до глобальных прогнозов — длинная дистанция. Перспективы есть, но клинический материал только набирается, а прогнозированием можно будет серьезно заниматься по мере его накопления.
Один из ваших проектов выиграл конкурс «Авангард знаний» компании «АстраЗенека», в чем он заключался?
Нужно собрать достаточно большую коллекцию веществ, воздействующих на мишени, важные для терапии атеросклероза, построить модели взаимосвязи «структура-активность» и применить разработанный нами метод для поиска новых лигандов в библиотеке ChemNavigator: найти соединения, представляющие интерес для «АстраЗенека», чтобы специалисты компании смогли их протестировать.
Важная особенность нашего подхода — мы пытаемся искать вещества, которые действуют одновременно на несколько мишеней. Во многих случаях это обеспечивает преодоление лекарственной устойчивости; кроме того, слабое воздействие на многие мишени часто приводит к лучшим результатам, чем сильное на одну, так как побочные эффекты ниже.
На какой стадии находится этот проект?
В этом году мы его закончим. Мы составили перечень перспективных мишеней для терапии атеросклероза и собираем обучающую выборку. Новые лиганды появляются каждый день, но к осени мы наберем критическую массу для завершения составления выборки, проведем обучение программы и поиск новых веществ.
Есть ли примеры использования ваших прогнозов при создании конкретных препаратов?
Фармкомпании перед нами не отчитываются, а мы не ставим целью непосредственное создание препаратов. Некоторые российские компании, изначально специализирующиеся на создании подобного софта, пытаются построить полный цикл разработки лекарства при поддержке Сколково и «Роснано». Продажа программ и сервисов не приносит им средств, достаточных для развития, поэтому они пришли к таким проектам. Имеется достаточно много примеров успешного доведения до клинических испытаний препаратов, разрабатываемых университетскими центрами в США, которые изначально специализировались на создании ПО.
Где могут быть применены ваши разработки, помимо фармацевтики?
У нас есть опыт сотрудничества с международной компанией, выпускающей пищевые добавки: по ее заказу мы искали вещества со сладким вкусом. Из отобранного нами десятка она приобрела пять, два из них оказались с подходящими свойствами, это очень хороший результат. В качестве эксперимента мы делали прогноз для гербицидов, результаты были обнадеживающие. Сейчас в рамках совместного проекта, поддержанного Российским фондом фундаментальных исследований и департаментом науки и технологий Индии, мы делаем прогноз для химических компонентов, входящих в состав лекарственных растений из Аюрведы. Интересная, но очень сложная задача: в каждом растении множество компонентов, которые друг с другом взаимодействуют, но данные для построения обучающих выборок весьма ограниченны. Мы готовы также делать прогнозы токсичности веществ.
Вопрос только, кто будет за это платить.
Cовершенно верно.
Что мешает вашей работе?
Главный тормоз для нас — доступ к информации и его оплата. Например, доступ к порталу Integrity компании Thomson Reuters стоит около 15 тыс долл. в год. А наш основной источник средств — гранты, доля бюджетного финансирования в зарплате сотрудников составляет только 20%.
Как вы относитесь к использованию облачных технологий?
В целом – положительно. Правда, есть одно «но». Я бы не хотел держать данные в хранилище, которое не контролирую. Для меня важна безопасность данных, за эту безопасность я отвечаю перед заказчиками.