Время протеомики

Как на основе информации о структуре белков человека получить необходимые лекарства?

В 1994 году молодой австралийский биолог Марк Уилкинс попытался в простых терминах описать полный набор протеинов, закодированных в геноме. Прошел не один год, прежде чем его работы получили признание. И вот сегодня «протеомика» — легко запоминающийся двойник «геномики» — наконец заняла прочное место в статьях, посвященных биотехнологии, в пресс-релизах и бизнес-планах. По мере того как акценты всей отрасли (и средств массовой информации), которые сначала были направлены на изучение индивидуальных генов, а затем целостного генома, начинают смещаться в направлении этой новой области исследований — «введения в биологию будущего» (Introducing the biology of the future), как ее характеризуют в одной из последних публикаций, — возникает вопрос, действительно ли научный потенциал соответствует возлагаемым на него ожиданиям и окупит стремительно растущие затраты. Судя по обилию отчетов, появившихся недавно в журналах Nature, Science и Current Biology, цель на самом деле оправдывает средства.

Термин этот считается относительно новым, но основные предпосылки для зарождения протеомики существуют вот уже несколько десятилетий. Двухмерный электрофорез в геле, позволяющий выделять сложные белковые структуры, становится сегодня обыденной, даже скучной операцией, а многолетнее наполнение баз данных последовательностями и структурами долгое время являлось неотъемлемой частью исследования белков. Благодаря последним достижениям в области масс-спектрометрии и в изучении последовательности генома ученые наконец получили средства систематического анализа протеомов различных молекулярных аппаратов, тканей и организмов. На первом месте по важности стоит полная каталогизация белков, находящихся в определенных клетках и тканях, поэтому особый интерес для ученых представляет создание сложных сетей физических партнеров для каждого белка. Логика проста: если два белка прочно ассоциируются с возникновением каких-то физиологических условий, скорее всего, это обусловлено функциональными причинами.

Цель компаний, занимающихся протеомикой, заключается в том, чтобы на основе информации о структуре белков человека получить необходимые лекарства, поэтому многие группы заняты моделированием организмов с более простыми белковыми соединениями. Не случайно руководство компании Celera решило сначала изучить последовательность ДНК плодовой мушки дрозофилы — меланогастер, и лишь затем перейти к геному человека. Но если при изучении генома была выбрана плодовая мушка, несущая в себе около 14 тыс. генов, то компромиссным решением при определении предмета начальных исследований протеомики стал выбор хлебопекарных дрожжей Saccharomyces cerevisiae, геном которых был полностью описан еще в 1996 году. Дрожжи содержат около 6 тыс. генов, что составляет лишь небольшую часть человеческого генома (30-40 тыс. генов).

Введение в интерактом

В журнале Nature два научно-производственных консорциума — исследователи из датско-канадской ассоциации MDS Proteomics и немецкой компании Cellzome — представили результаты своего исследования структуры протеома дрожжей. Достижение ученых производит сильное впечатление. «Основная задача постгеномной биологии заключается в том, чтобы понять, какое влияние генетическая информация оказывает во времени и пространстве на функции генных продуктов», — пояснили Анна-Клод Гавен, Джулио Суперти-Фурга и их коллеги из Cellzome. Первым шагом на пути решения должно стать описание примерно 30 тыс. видов взаимодействия между белками — «интерактома» (interactome). Предполагается, что каждый белок дрожжей имеет в среднем около пяти партнеров. Подход, выбранный Cellzome, получил название очистки путем последовательного выделения сходства (tandem-affinity purification, TAP). В целом оба метода похожи: сначала надо подготовить белок-«наживку» путем придания ему определенных химических свойств. Затем ввести код ДНК приманки в клетку дрожжей. После этого извлечь белки приманки вместе с присоединившимися к ним партнерами, пропустив очищенную белковую смесь через сходный столбец. Полученные в результате белковые объединения регистрируются с использованием масс-спектрометрии (MS) и идентифицируются методами биоинформатики.

В результате совместных опытов сотрудники компании Cellzome и Европейской лаборатории молекулярной биологии, расположенной в немецком городе Хайдельберге, описали более 1700 генов дрожжей и идентифицировали 589 очищенных протеинов, 80% которых связаны с другими белками. Использование методов масс-спектрометрии в отношении этих белков (некоторые из них присутствуют в клетке в количестве, не превышающем 15 копий) и последующее исключение дублирования средствами биоинформатики позволило группе Гавен оставить 232 совокупности белков, называемых «молекулярными аппаратами». 98 таких совокупностей уже были каталогизированы ранее и находились в базе данных белков дрожжей, остальные же 130 относились к разряду доселе неизвестных, причем 91% из них содержал по крайней мере один белок с неопознанной функцией. В некоторых опытах авторы отчета обнаружили большие объединения, причем они оказались фактически одинаковыми как в дрожжах, так и в человеческих клетках, — неудивительно, что 40% дрожжевых белков сохранились в процессе эволюции в неизменном виде.

На первый взгляд описание в данном исследовании огромного многообразия видов межбелкового взаимодействия напоминает абстрактные произведения современного искусства, однако Суперти-Фурга считает, что наилучшей аналогией этому является живопись пуантиллистов. «Если вы находитесь слишком близко, то видите лишь набор разноцветных точек, — пояснил он. — А перед зрителем, который отойдет подальше, предстает связное и гармоничное изображение».

Похожий подход, названный идентификацией совокупностей белков методом масс-спектрометрии с высокой пропускной способностью (high-throughput mass spectrometric protein complex identification, HMS-PCI), был предложен Юэном Хо и его коллегами из университета Торонто и компании MDS Proteomics. Используя 600 приманок, им удалось идентифицировать более 1,5 тыс. похожих взаимодействующих белков, то есть, фактически четверть протеома дрожжей. Информация о найденных совокупностях была введена в базу данных Biomolecular Interaction Network Database (BIND), созданную Гэри Бейдером и специалистом в области биоинформатики Кристофером Хогом. В этой БД хранятся сведения о межбелковом взаимодействии. База данных включает в свой состав инструментальное средство PreBIND, которое можно использовать для поиска в научной литературе рефератов, посвященных белковым связям. (Более подробная информация об этом проекте находится на сайте www.binddb.org. Полное описание схемы протеома дрожжей можно получить по адресу yeast.cellzome.com и www.mdsproteomics.com/yeast).

Объединенные усилия

Еще одна попытка проведения распределенного анализа протеома дрожжей была построена на основе сочетания «традиционного» и компьютерного подхода при идентификации белков. В результате ученым удалось отбросить ряд ложных позитивных результатов. Четыре группы, возглавляемые Чарлзом Буном, Хогом (университет Торонто), Стэнли Филдсом (Вашингтонский университет) и Джанни Чезарени (Римский университет), использовали два дополнительных метода для выявления белков, имеющих отношение к хорошо известному домену связывания протеинов SH3. Первый из них предусматривал компьютерный поиск лигандов, которые потенциально могли поддерживать связь с одним или несколькими из 24 белков дрожжей, содержащихся в домене SH3. Во втором использовался классический метод двух гибридов, разработанный Филдсом для идентификации генных продуктов, связанных с доменом SH3. Объединение двух наборов данных позволило выявить 59 общих видов взаимодействия.

Эти важные исследования стали первым шагом в попытке описания функциональности протеома дрожжей, но, учитывая, что человеческий геном содержит всего лишь в пять раз больше генов по сравнению с дрожжами, группа Cellzome пришла к выводу, что существующая технология «позволяет реализовать программу поиска лекарств на молекулярном уровне и осуществить выбор и оценку объектов действия этих лекарств».

Результаты, опубликованные недавно в журнале Current Biology, показывают, что первый шаг по направлению к цели действительно был сделан. Если же говорить о самом масштабном исследовании единичных человеческих органелл, то его проводила группа под руководством Ангуса Ламонда из Эдинбургского университета и датчанина Матиаса Манна. Они объединились для обработки каталога компонентов ядрышек человека. Ядрышко, впервые описанное Рудольфом Вагнером более чем 150 лет тому назад, представляет собой динамическую ячейку без мембраны в клеточном ядре. Именно здесь производятся многие компоненты рибосомы — механизма синтеза клеточного белка. Используя при анализе очищенных компонентов наноэлектроспрей и масс-спектрометрию, группа Ламонда — Манна идентифицировала 271 ядрышковый протеин, 30% из которых были абсолютно новыми. Многие открытия оказались совершенно неожиданными, в том числе и факторы, относящиеся к синтезу протеинов и цитоскелетона. Авторы описали также неизвестные динамические ядерные ячейки — параспеклы, которые, по их мнению, принимают участие в выработке РНК.