На протяжении тысячелетий ДНК является основным хранилищем данных человечества. Прочная и компактная, она настолько информационно насыщена, что всего один ее грамм может вместить достаточно данных для 10 миллионов часов видео высокого разрешения.
Но нет предела совершенствованию. Инновационный метод позволяет ДНК хранить информацию в виде двоичного кода - тех самых строк из 0 и 1, которые используются в обычных компьютерах. В один прекрасный день это может оказаться дешевле и быстрее, чем кодирование информации в последовательности строительных блоков, из которых состоит ДНК, - метод, используемый в клетках и в большинстве попыток использовать ДНК для хранения искусственно созданных данных.
Метод настолько прост, что 60 добровольцев с разным уровнем подготовки смогли использовать его для хранения текста по своему выбору. По словам Лонги Цянь, специалиста по вычислительной синтетической биологии из Пекинского университета и одного из авторов исследования, описывающего этот метод, многие из них поначалу не верили, что он сработает. «Когда они увидели последовательность и получили в ответ правильный текст, тогда они начали верить, что действительно могут это сделать», - говорит она. Исследование было опубликовано на прошлой неделе в журнале Nature.
Эта методика - лишь одна из многих попыток превратить ДНК в надежную замену стандартным электронным системам хранения данных, которые не успевают за растущим объемом данных в мире. «Мы достигаем физических пределов», - говорит Николас Гуиз, физик из Исследовательского института Джорджия Тек в Атланте. «А ведь мы постоянно генерируем все больше и больше данных». Огромная емкость ДНК делает ее привлекательной альтернативой. Более того, защищенная от влаги и ультрафиолетового излучения, ДНК может храниться сотни тысяч лет. В отличие от этого, электронные жесткие диски необходимо заменять каждые несколько лет, иначе данные могут испортиться.
Самый очевидный способ хранения информации в ДНК - это включение данных в последовательность ДНК, для чего необходимо синтезировать нить ДНК с нуля. По мнению Альберта Кьюнга, биолога-синтетика из Университета штата Северная Каролина, этот способ медленный и на много порядков дороже, чем хранение данных в электронном виде. Чтобы разработать более дешевый и быстрый способ, Цянь и ее коллеги обратились к «эпигеному» - множеству молекул, которые клетки используют для контроля активности генов, не изменяя саму последовательность ДНК. Например, молекулы, называемые метильными группами, могут быть добавлены или удалены из ДНК, чтобы изменить ее функцию.
Цянь и ее сотрудники разработали систему, в которой ряд коротких готовых «кирпичиков» ДНК - с метильными группами или без них - можно добавлять в реакционную пробирку, чтобы сформировать растущую нить ДНК с правильным двоичным кодом. Чтобы получить данные, исследователи использовали метод секвенирования ДНК, который позволяет обнаружить метильные группы вдоль нити ДНК. Полученные результаты можно интерпретировать как двоичный код: наличие метильной группы соответствует 1, а отсутствие - 0.
Поскольку в этой методике используются готовые фрагменты ДНК, ее можно оптимизировать для массового производства, утверждает Кьюнг. Это будет намного дешевле, чем синтезировать индивидуальную нить ДНК для каждого бита информации, которую нужно сохранить. Следующим препятствием, по его словам, будет проверка того, насколько хорошо система масштабируется для хранения больших массивов данных.
В качестве шага к этой цели Цянь и ее коллеги закодировали, а затем считали инструкции для создания изображения тигра времен династии Хань в древнем Китае и цветного изображения панды в пышном зеленом окружении. Изображения были закодированы почти в 270 000 единиц и нулей, или «битов». По мнению Гуиза, пока что необходимо снизить стоимость хранения данных, прежде чем оно сможет конкурировать с электронным хранением данных.
«Хранилищам ДНК предстоит пройти долгий путь, прежде чем они станут коммерчески выгодными», - говорит он. «Но потребность в революционных технологиях существует».