Процесс записи данных на препарат ДНКтребует продолжительного времени, поэтому, по мнению ученых, такой носитель сейчас пригоден только для создания архивов данных |
Статья об этом была опубликована недавно в рецензируемом экспертами журнале Science.
«Всю информацию, так или иначе накопленную в мире до этого момента, можно записать на ДНК-носителе весом около 4 грамм», — заявил Шрирам Косури, старший исследователь института.
Ученые создали двоичный код, применяя ДНК-маркеры, и с его помощью записали текст книги Regenesis: How Synthetic Biology Will Reinvent Nature and Ourselves in DNA («Регенезис: синтетическая биология как способ заново открыть природу и нас самих через ДНК»). Книгу написал один из участников исследования Джордж Черч.
«Мы хотели, чтобы тестовая информация имела актуальный вид, поэтому использовали версию текста книги в формате HTML, — отметил Черч. — HTML, который, немного упрощая, можно назвать веб-форматом, предполагает использование цифровых изображений и Java-скриптов, что придает ему интерактивность. Полученный набор данных был закодирован в двоичном исчислении и записан с помощью ДНК».
Черч занимает должность профессора генетики в Гарвардском медицинском колледже. Он участвовал в разработке первого прямого метода создания цепочек ДНК в 1984 году. Он также входил в число ученых, ставших инициаторами Проекта генома человека. В то время он работал исследователем в компании Biogen.
Исследователи смогли записать 5,5 петабайт, что соответствует миллиону гигабит данных на кубическом миллиметре носителя — препарата ДНК. Процесс записи данных требует продолжительного времени, поэтому, по мнению ученых, такой носитель сейчас пригоден только для создания архивов данных.
«По плотности записи информации и возможным объемам хранения наш метод превосходит все другие экспериментальные методы хранения, основанные на тех или иных биологических и физических законах», — отметил Косури.
Ученые уже давно изучали ДНК как многообещающую потенциальную среду хранения данных, размеры элементов которой сравнимы с атомными, которая отличается стабильностью и имеет срок жизни, достигающий тысячи лет. В недавнем эксперименте ученым из Гарварда удалось повысить плотность хранения в 1000 раз по сравнению с показателями, достигавшимися в предшествовавших попытках.
«Большинство методов хранения данных, в которых не используется ДНК, предполагают запись данных на плоский носитель, в то время как ДНК позволяет хранить информацию в объемной среде (лабораторный стакан). Плотность исключительно высока — один бит на нуклеиновое основание, и одно нуклеиновое основание — на кубический нанометр. Объем грамма ДНК не превышает кубического миллиметра, следовательно, достаточно одного грамма, чтобы записать около сикстибайта», — пояснил Черч.
В прошлом году два японских университета сообщили, что использовали искусственную ДНК для записи более 100 бит данных в цепочке генома.
Японским ученым удалось закодировать текст «e= mc2 1905!» (основополагающая формула теории относительности Эйнштейна и год ее создания) в бактерии, которая распространена в обычной почве, — сенной палочке.
Гарвардские исследователи использовали четыре нуклеиновых основания ДНК — аденин (A), цитозин (C), гуанин (G) и тимин (T) в качестве двоичных маркеров. Как пояснил Косури, здесь A и C принимаются за ноль, T и G — за единицу,.
Если для поддержания стабильности некоторых экспериментальных носителей, например, используемых в квантовой голографии, требуются сверхнизкие температуры, приближающиеся к абсолютному нулю (-273 градуса по шкале Цельсия) и огромные энергозатраты, то ДНК стабильна при комнатной температуре. «Такой носитель можно бросить где угодно — в пустыне или в вашем заднем дворе, и найденный через 400 тысяч лет он будет хранить информацию», — отметил Черч.
В отличие от других групп, экспериментировавших с ДНК ранее, специалисты Гарвардского университета готовы использовать коммерческие ДНК-микрочипы для создания автономных ДНК.
«Мы принципиально не пользовались живыми клетками, — подчеркнул Черч. — В живом организме информация составляет крошечный фрагмент целой клетки, то есть большая часть носителя пропадает зря. Но, что более важно, практически сразу же, как только ДНК попадает в клетку, если данная ДНК не имеет возможности обеспечивать свою жизнеспособность и не имеет эволюционных преимуществ, начинается процесс мутации, и, в конечном итоге, она полностью уничтожается».
В более ранних исследованиях эта группа отказалась и от так называемого «разбиения цепочек», предполагавшего разбор цепочек ДНК путем выявления наложений в коротких цепочках.
Вместо этого ученые решили опираться на достижения информационных технологий и закодировали свою книгу 96-битными блоками. С изображениями, книга в формате HTML потребовала 54898 таких блоков, каждый из которых представлял собой уникальную цепочку ДНК.
«Мы хотели показать, что современный мир наполнен нулями и единицами, не только от а до я», — пошутил Косури.