НАЙДЕН НОВЫЙ МЕТОД ХРАНЕНИЯ ДАННЫХ В ДНК

25 октября 2024

Автор: Михаил Кароли

хранение днк

Биологические молекулы давно уже привлекали ученых в качестве потенциального источника хранения цифровых данных, и ученые из Китая нашли метод записи и считывания информации с ДНК. Но для считывания информации компьютер понимает только двоичный код, а не язык нуклеотидов, но новый способ позволяет хранить информацию в символах языка, понятного вычислительным системам - 0 и 1 двоичного кода. Рассказываем, как ученые научили компьютеры понимать язык генетических символов, и как это можно использовать.

Введение

ДНК – биологическая молекула, отвечающая за хранение и передачу генетической информации. Основная функция ДНК — кодирование инструкций для синтеза белков, необходимых для жизни. Помимо этого, ДНК обладает исключительными свойствами, которые делают её перспективной не только для биологических процессов, но и для хранения данных: прочность, высокая плотность хранения, долговечность и стабильность информации.

Одна из самых привлекательных свойств ДНК — информационная плотность. Всего один грамм ДНК может хранить примерно 215 петабайт данных*. Это эквивалентно более 10 млн часов видео в формате HD или всем данным, которые хранятся в крупнейших мировых дата-центрах. Если сравнить с современными носителями, такими как жесткие диски или флеш-накопители, плотность ДНК превышает их в миллионы раз. В отличие от кремниевых носителей, где данные хранятся на электронных компонентах, ДНК компактно и устойчиво хранит информацию в своей молекулярной структуре.

*- 1 петабайт = 1024 терабайтам, 1 терабайт = 1024 гигабайтам.

Более того, ДНК — стабильна. Учёные смогли извлечь и расшифровать ДНК из останков древних животных возрастом в десятки тысяч лет. В лабораторных условиях, если ДНК хранится в сухом и холодном месте, она может сохранять свою структуру сотни тысяч лет, что значительно превосходит срок службы любых современных электронных носителей. Например, жесткие диски и флеш-накопители могут выходить из строя через несколько лет или десятилетий, а восстановление данных с повреждённых носителей часто невозможно. ДНК устойчива к радиации и температурным перепадам, особенно при правильном хранении, что делает её идеальной для архивирования данных на длительные периоды. В отличие от электронных систем, которые требуют постоянного охлаждения и защиты от перегрева, системы на основе ДНК могут существовать в гораздо менее требовательных условиях.

Почему ДНК лучше флешки?

Новый разработанный метод предлагает гораздо более быстрый и экономичный путь к созданию систем хранения данных на основе ДНК при помощи эпигенетические модификации. В отличие от классического синтеза цепочек ДНК, учёные используют уже готовые короткие сегменты ДНК, которые можно модифицировать с помощью ферментов для записи информации.

Один из таких подходов использует процесс метилирования — добавления метильных групп CH₃ к нуклеотидам, что изменяет функциональность ДНК, но не её основную структуру. Метильные группы, добавляемые или удаляемые с ДНК, становятся носителями двоичного кода — тех самых нулей и единиц, которые используют обычные компьютеры. Если метильная группа присутствует в данном участке, это соответствует «1», её отсутствие — «0». Этот процесс значительно быстрее и дешевле, поскольку не требует синтеза новых молекул ДНК для записи информации. Ранее мы писали о том, что хранить информацию ДНК на основе двоичного кода не совсем корректно, однако, ученые смогли придумать свою собственную, работающую схему.

Основное преимущество нового подхода заключается в возможности параллельной записи данных, что ускоряет процесс и делает его более масштабируемым. Вместо того, чтобы создавать каждую цепочку ДНК с нуля, исследователи используют заранее подготовленные фрагменты, которые автоматически собираются в требуемую конфигурацию с помощью метилирования. Каждый шаг процесса можно автоматизировать и масштабировать для работы с большими объёмами данных. Например, ученые успешно записали и извлекли изображение панды (рисунок 1) и древнего тигра (рисунок 2), использовав в общей сложности около 275 000 бит данных, что является значительным достижением в сфере молекулярного хранения.

Эпигенетический двоичный код

Рисунок 1. Детализированное изображение панды, закодированное в молекулах
Рисунок 2. Пошаговое восстановление изображения древнего тигра с молекул ДНК
В природе ДНК может хранить гигантское количество генетической информации в крошечных объёмах. Геном человека содержит около 3 млрд пар оснований ДНК, которые умещаются в ядре клетки. Такая наглядность демонстрирует перспективы для создания компактных и энергоэффективных систем хранения, которые не требуют огромных физических ресурсов, таких как дата-центры. Ранее компьютер занимал целую комнату. А в будущем – поместится в клетку?

Чтобы минимизировать вероятность потери или изменения информации, можно подглядеть, как эволюция справилась с такой проблемой: в живой клетке стабильность передачи информации обеспечивается за счет репаративных механизмов. Во время репарации молекулы ДНК организм использует специальные ферменты для проверки и исправления ошибок, что позволяет минимизировать вероятность потери и порчи информации. Эти естественные механизмы защиты данных вдохновляют учёных на разработку алгоритмов коррекции ошибок в искусственных системах хранения на основе ДНК, что делает её ещё более надёжным носителем по сравнению с традиционными устройствами, где данные могут быть безвозвратно утрачены при повреждении физических компонентов.

Как хранение данных на ДНК изменит мир?

ПОДЕЛИТЕСЬ В СОЦСЕТЯХ!
Мессенджеры
Отправляйте нам! Узнайте подробнее в мессенджерах или напишите нам на сайте
Задать вопрос на сайте

У ВАС ЕСТЬ МАТЕРИАЛЫ, КОТОРЫМИ ВЫ ХОТЕЛИ БЫ ПОДЕЛИТЬСЯ?

Made on
Tilda