В связи с экспоненциальным ростом емкости генерируемой информации и появлением потребности в хранении данных в течение длительного периода, у человечества возникла потребность в носителе с высокой емкостью, плотностью хранения и возможностью противостоять экстремальным условиям окружающей среды. ДНК становится привлекательной перспективой для тысячелетнего хранения данных. Чтобы понять перспективу хранения информации на естественной живительной кислоте, нужно кратко углубиться в историю хранения цифровых данных [6, 7].
Экскурсия по фиксированию данных начинается с костей, камней и бумаги, затем переходит к перфокартам, магнитным лентам, граммофонным пластинкам, дискетам. С развитием технологий в эксплуатацию вошли оптические диски, включая компакт-диски, DVD, Blu-ray и флэш-накопители. Но эти хранилища, будучи не биоразлагаемыми материалами, наносят вред окружающей среде, а также выделяют огромное количество тепловой энергии [7, 8].
Сегодня все цифровые данные хранятся при помощи технологий с ограниченным сроком годности. Карты памяти и чипы недолговечны — 5-7 лет, и информация на них рискует быть поврежденной. Жесткие диски повреждаются под действием высоких температур, влаги, магнитных полей и механических повреждений.
Если флэшка с вашими семейными фотографиями затеряется в песке и будет откопана через тысячи лет, — вся информация на ней будет стерта. Если кости закопать в глубоко в Землю, и откопать через ту же тысячу лет - она сохранит генетический материал, способный хранить в себе информацию.
Именно тут и можно учесть принцип комплементарности для создания искусственной двоичной системы. Предположим, мы использовали связи A-T как «0» и C-G как «1». Согласно подсчетам ученых, всю информацию, которую мир производит за год, можно уместить в 4 граммах одноцепочечной ДНК. Молекула представляет собой читаемое и надежное хранилище информации на протяжении тысячи лет, которое можно увеличить почти до бесконечности, высушивая молекулу и защищая от кислорода и воды [6-9].
Мало преимуществ ДНК как хранилища информации? Вот ещё несколько:
- ДНК выдерживает диапазон температур от -800 C° до +800 C°;
- Позволяет считывать информацию в обоих направлениях;
- Безопасна и не может быть повреждена живыми организмами;
- Возможность использовать не двоичный, а четверичный код, или же считывать информацию по рядом стоящим дуплетам, триплетам одной цепи и так далее.
Уже сейчас мы можем получать синтетические фрагменты ДНК, или же
олигонуклеотиды, но этот процесс довольно трудоемкий и за раз можно получить фрагмент максимум из 50-100 нуклеотидов, в среднем — 19-21, аккурат под длину праймера для ПЦР или секвенирования. Также можно использовать гибридизацию ДНК — процесс соединения комплементарных одноцепочечных ДНК в одну молекулу.
Можно вырезать нужные последовательности из генома различных организмов, чей генетический код может соответствовать потенциально хранимой информации. Точечные замены в случае небольших несоответствий могут вноситься или вырезаться технологией редактирования генов Crispr/Cas9 [8-9].