НЕЙРОСЕТЬ СОЗДАЛА РЕДАКТОР ГЕНОМА ТОЧНЕЕ, ЧЕМ CRISPR-CAS9

10 сентября 2024

Автор: Мария Молодова

Редактирование генома

Впервые геном человека отредактировали с помощью CRISPR-Cas, разработанной нейросетью. Новая технология геномного редактирования, OpenCRISPR-1, оказалась на 95% точнее по сравнению с CRISPR-Cas9. Ученые выложили ее в открытый доступ, а само исследование доступно в виде препринта. В будущем ИИ поможет ученым создавать «улучшенные» редакторы генома, предназначенные для конкретных задач, и в разы ускорит разработку генотерапевтических препаратов.

Введение

Источник: [1]
Система CRISPR-Cas возникла как защитный механизм бактерий против вирусов и изначально «не приспособлена» работать в клетках человека. Даже после того как исследователи модифицировали исходную систему и превратили ее в инструмент для редактирования генов, эта технология далеко не совершенна. Часто CRISPR-Cas «ошибается», то есть редактирует не только намеченный участок генома, но и похожие по последовательности участки ДНК. Кроме этого, она способна редактировать только ограниченный набор последовательностей-«мишеней», а белки Cas с высокой молекулярной массой с трудом проникают в клетки.

Поэтому ученые продолжают оптимизировать технологии редактирования генома, создавая белки Cas с улучшенными свойствами, например, с помощью метода направленной эволюции. Этот подход позволяет последовательно моделировать различные мутации в белке, на каждом этапе выбирая лучшие варианты, — подобно тому, как это происходит в природе. Однако создать «идеальный» белок остается непростой задачей: весь набор возможных мутаций не переберешь, а повышение одной характеристики часто приводит к снижению другой. Например, увеличение стабильности белка может привести к потере его активности.

Чтобы создать «идеальную» систему CRISPR-Cas, сотрудники американской компании Profluent Bio решили использовать нейросети, а именно большие языковые модели, или LLM, — те самые, которые лежат в основе ChatGPT.

В поисках «идеальной» CRISPR-Cas

Оказывается, последовательность любого белка представляет собой своеобразный текст, где каждая аминокислота выступает в роли слова. И подобно тому как LLM-модели для генерации текста анализируют очередность слов и другие закономерности, чтобы впоследствии «самим научиться» понимать язык, модель в новом исследовании «изучает» последовательности аминокислот, чтобы расшифровать «язык» белков.

Чтобы с помощью нейросети «вычленить» сложные взаимосвязи между последовательностью белка и его свойствами и сгенерировать новые, более точные варианты CRISPR-Cas, исследователи использовали языковую модель ProGen2, ранее созданную компанией Profluent, и обучили ее на массиве данных о CRISPR-системах всех типов. Этот самый полный на данный момент «атлас CRISPR-Cas» исследователи составили на основе миллионов последовательностей микробных геномов и метагеномов. После этого ученые сгенерировали с помощью модели 4 млн новых последовательностей Cas-белков, которые охватывали все семейства и были гораздо разнообразнее природных.

По словам главы компании Profluent Bio Али Мадани, их исследование показывает, как LLM генерируют разнообразные по последовательностям, и при этом функциональные, CRISPR-Cas системы, минуя эволюционные ограничения. Это «поможет создавать высокоспецифичные редакторы генома» с желаемыми характеристиками «под каждую отдельную задачу».

Далее исследователи сосредоточились на системе CRISPR-Cas II типа, или CRISPR-Cas9, которая лучше всего подходит для редактирования генома человека. Из сгенерированных последовательностей отобрали 209 наиболее перспективных Cas9-подобных белков и каждым из них отредактировали искусственно «выращенные» в лаборатории клетки человека. При этом оценивали как эффективность редактирования, то есть процент успешного изменения целевых участков ДНК, так и число «ошибочно» внесенных в геном изменений. Белок с самыми высокими показателями исследователи назвали OpenCRISPR-1 — при эффективности, как у природного Cas9, он вносил на 95% меньше ошибок! Команда выложила последовательность OpenCRISPR-1 в открытый доступ, чтобы другие ученые смогли ее протестировать и поделиться результатами.

Может ли ИИ «обойти» природу?

Рис. 1. Структура OpenCRISPR-1 — первого в мире редактора генома, созданного искусственным интеллектом и находящегося в открытом доступе. Источник: [2].
Исследование Али Мадани и коллег — первый пример редактирования генома человека с помощью технологии, созданной нейросетью. Ученые надеются, что в будущем ИИ сделает разработку «генетических лекарств» более целенаправленной и доступной. Как отметил профессор Мануэль Каулих из Франкфуртского университета им. Гете, «Большие языковые модели превосходят традиционные методы по эффективности, масштабируемости и автоматизации. Они не только ускорят разработку лекарств от генетических заболеваний, но и расширят возможности исследований в области синтетической биологии, откроют новые подходы к терапии». Однако перед внедрением в терапию важно оценить долгосрочные эффекты, в том числе способность новых белков вызывать иммунный ответ.
ПОДЕЛИТЕСЬ В СОЦСЕТЯХ!
Мессенджеры
Отправляйте нам! Узнайте подробнее в мессенджерах или напишите нам на сайте
Задать вопрос на сайте

У ВАС ЕСТЬ МАТЕРИАЛЫ, КОТОРЫМИ ВЫ ХОТЕЛИ БЫ ПОДЕЛИТЬСЯ?

Made on
Tilda