DeepMind уже прославился в научном мире: в 2020 году компания
представила AlphaFold 2 — ИИ-модель, которая с высокой точностью предсказывает трёхмерную структуру белков. Технология стала сенсацией и в 2024 году принесла своим создателям Нобелевскую премию по химии.
Но с ДНК всё гораздо сложнее. Один и тот же участок может:
- привлекать белковые комплексы, запускающие работу гена;
- связывать регуляторные белки — транскрипционные факторы;
- менять «форму» хромосомы и тем самым усиливать или ослаблять доступ регуляторных белков к нужным участкам.
Все эти механизмы определяют, когда, где и насколько активно работает каждый ген. Поэтому даже одна точечная мутация способна запустить сложный каскад изменений — и предсказать последствия бывает крайне трудно.
До сих пор разработчики ИИ-моделей подходили к этой задаче по частям: создавали алгоритмы для предсказания активности генов или того, как экзоны — «модули» внутри гена — комбинируются в разные белки.
AlphaGenome впервые объединяет их в одной системе и, в отличие от других моделей, работает не только с 2% кодирующей ДНК, а со всем геномом. Модель способна обрабатывать до миллиона «букв» ДНК за раз и выдаёт тысячи биологических прогнозов. Причём она чувствительна даже к точечным мутациям — то есть способна предсказать, как замена одной буквы повлияет на работу целого гена.
В одном из тестов команда DeepMind использовала модель для анализа мутаций, ранее обнаруженных у пациентов с лейкемией. AlphaGenome точно предсказал, что мутации в некодирующих участках опосредованно активировали соседний ген, известный своей ролью в развитии болезни.