Мы запустили программу поддержки талантливых студентов. Внесите свой вклад в науку прямо сейчас!
Используя сайт, вы предоставляете согласие на обработку ваших персональных данных с помощью сервисов веб-аналитики.

ALPHAGENOME: ИИ ОТ DEEPMIND ПРОЛИВАЕТ СВЕТ НА «ТЕМНУЮ МАТЕРИЮ» ГЕНОМА

27 июня 2025

Автор: Мария Молодова

геном

До сих пор ученые не могли объяснить, как работает большая часть генома — особенно те 98% ДНК, что не кодируют белки, но управляют генами. Теперь исследователи из Google DeepMind разработали ИИ-модель AlphaGenome, способную заглянуть в эту «тёмную материю» генома. Она анализирует миллионы букв ДНК, предсказывая активность генов и возможные последствия мутаций. Технология может помочь в поиске причин рака и даже в создании синтетической ДНК с нуля. Работа опубликована 25 июня в виде препринта.

Введение

Источник изображения: NOBEASTSOFIERCE/Science Source

Что скрывает «тёмная материя» генома

С момента расшифровки генома человека прошло почти 25 лет — но большая его часть до сих пор остаётся загадкой. Особенно это касается 98% ДНК, которые не кодируют белки, но играют важную роль в регуляции генов. Учёные десятилетиями пытались понять, что означает каждая из трёх миллиардов «букв» ДНК, но провести такой анализ вручную слишком трудоемко и сложно. Теперь на помощь пришёл искусственный интеллект.

Исследователи из Google DeepMind представили ИИ-модель AlphaGenome, которая помогает заглянуть в «тёмную материю» генома и разобраться, как некодирующие участки ДНК влияют на работу генов и клеток в целом, а также развитие болезней. Модель анализирует длинные фрагменты ДНК и предсказывает уровень активности содержащихся в них генов, а также то, как на него влияют мутации. Работа опубликована 25 июня в виде препринта и пока не прошла рецензирование.

Вторая Нобелевская премия? Всё и сразу

DeepMind уже прославился в научном мире: в 2020 году компания представила AlphaFold 2 — ИИ-модель, которая с высокой точностью предсказывает трёхмерную структуру белков. Технология стала сенсацией и в 2024 году принесла своим создателям Нобелевскую премию по химии.

Но с ДНК всё гораздо сложнее. Один и тот же участок может:
  • привлекать белковые комплексы, запускающие работу гена;
  • связывать регуляторные белки — транскрипционные факторы;
  • менять «форму» хромосомы и тем самым усиливать или ослаблять доступ регуляторных белков к нужным участкам.

Все эти механизмы определяют, когда, где и насколько активно работает каждый ген. Поэтому даже одна точечная мутация способна запустить сложный каскад изменений — и предсказать последствия бывает крайне трудно.

До сих пор разработчики ИИ-моделей подходили к этой задаче по частям: создавали алгоритмы для предсказания активности генов или того, как экзоны — «модули» внутри гена — комбинируются в разные белки.

AlphaGenome впервые объединяет их в одной системе и, в отличие от других моделей, работает не только с 2% кодирующей ДНК, а со всем геномом. Модель способна обрабатывать до миллиона «букв» ДНК за раз и выдаёт тысячи биологических прогнозов. Причём она чувствительна даже к точечным мутациям — то есть способна предсказать, как замена одной буквы повлияет на работу целого гена.

В одном из тестов команда DeepMind использовала модель для анализа мутаций, ранее обнаруженных у пациентов с лейкемией. AlphaGenome точно предсказал, что мутации в некодирующих участках опосредованно активировали соседний ген, известный своей ролью в развитии болезни.

От изучения рака до синтетической биологии

AlphaGenome уже показал впечатляющие результаты: по данным DeepMind, модель превзошла 22 из 24 аналогов в определении важных участков ДНК и 24 из 26 — в предсказании последствий мутаций. Ученые надеются применять её в медицине и биотехнологиях.

Например, в изучении рака AlphaGenome поможет быстро отсеивать тысячи мутаций, чтобы сфокусироваться на тех, что действительно могут вызывать рак.

«Это cэкономит кучу времени. Вместо сотен мутаций я могу проверить только самые важные», — говорит Кэлеб Ларо.

А синтетические биологи с помощью модели смогут проектировать новые регуляторные участки ДНК, которые позволят точно управлять тем, где и когда активируется ген. Или запускать виртуальные эксперименты, чтобы моделировать поведение клеток при различных генетических изменениях.

Начало пути

Однако у модели есть и слабые места. Она обучалась только на данных человека и мыши — не факт, что её прогнозы так же точны для других видов. Пока она не предназначена для анализа индивидуального генома и не даёт полного ответа на вопрос, как именно генетические варианты вызывают сложные болезни.

Точность предсказаний пока тоже ограничена. Например, AlphaGenome хуже справляется, если регуляторный участок расположен на расстоянии более 100 тыс. пар нуклеотидов от гена. А все предсказания делаются в «замороженных» условиях: модель не учитывает, что в живой клетке постоянно меняются уровни белков, химические метки и другие факторы, влияющие на работу ДНК. Несмотря на ограничения, учёные из DeepMind уверены — это только начало прорыва.

Пока доступ к AlphaGenome открыт через API для исследователей, занятых некоммерческими проектами. К моменту публикации статьи ученые планируют полноценный релиз — с открытым кодом и возможностью доработки. Тогда другие ученые смогут адаптировать модель под свои конкретные задачи в биомедицине, генетике и синтетической биологии.
ПОДЕЛИТЕСЬ В СОЦСЕТЯХ!
ЭТА НОВОСТЬ В НАШЕМ ТЕЛЕГРАМ-КАНАЛЕ
Мессенджеры
Отправляйте нам! Узнайте подробнее в мессенджерах или напишите нам на сайте
Задать вопрос на сайте

У ВАС ЕСТЬ МАТЕРИАЛЫ, КОТОРЫМИ ВЫ ХОТЕЛИ БЫ ПОДЕЛИТЬСЯ?