ChatGPT для CRISPR создает новые инструменты для редактирования генов

Авторы/авторы:
ChatGPT для CRISPR создает новые инструменты для редактирования генов
3D-модель комплекса для редактирования генов CRISPR-Cas9 из Streptococcus pyogenes. Иллюстрация: Indigo Molecular Images/Science Photo Library
7 мая 2024
78
0

Некоторые из генных редакторов, разработанных искусственным интеллектом, могут быть более универсальными, чем те, которые встречаются в природе.

   В бесконечном стремлении обнаружить ранее неизвестные системы редактирования генов CRISPR исследователи изучили микробы, обитающие в самых разных местах - от горячих источников и торфяников до фекалий и йогурта. Теперь, благодаря достижениям в области генеративного искусственного интеллекта (ИИ), они, возможно, смогут создавать такие системы одним нажатием кнопки. На прошедшей неделе исследователи опубликовали подробные сведения о том, как они использовали генеративный инструмент ИИ под названием "модель белкового языка" - нейронную сеть, обученную на миллионах белковых последовательностей, - для разработки белков для редактирования генов CRISPR, а затем смогли показать, что некоторые из этих систем работают так, как ожидалось в лабораторных условиях.

   А ранее в феврале другая исследовательская группа объявила, что разработала модель, обученную на геномах микроорганизмов, и использовала ее для проектирования новых систем CRISPR, которые состоят из фермента, разрезающего ДНК или РНК, и молекул РНК, указывающих молекулярным ножницам, где резать. "На самом деле это только первые шаги. Это показывает, что можно проектировать такие сложные системы с помощью моделей машинного обучения", - считает Али Мадани, ученый в области машинного обучения и руководитель биотехнологической компании Profluent. Группа Мадани сообщила о "первом успешном редактировании генома человека белками, полностью разработанными с помощью машинного обучения" в препринте от 22 апреля на сайте bioRxiv.org.

   Алан Вонг, биолог-синтетик из Университета Гонконга, чья группа использовала машинное обучение для оптимизации CRISPR, говорит, что естественные системы редактирования генов имеют ограничения в отношении последовательностей, на которые они могут нацелиться, и типов изменений, которые они могут внести. Поэтому для некоторых применений найти подходящий CRISPR может оказаться непростой задачей. "Расширение репертуара редакторов с помощью искусственного интеллекта может помочь", - говорит он.

   В то время как чат-боты, такие как ChatGPT, предназначены для работы с языком после обучения на существующем тексте, ИИ, разрабатывающий CRISPR, был обучен на огромных массивах биологических данных в виде последовательностей белков или геномов. Цель такого "предварительного обучения" - привить моделям понимание естественных генетических последовательностей, например, того, какие аминокислоты обычно сочетаются друг с другом. Затем эту информацию можно применить для решения таких задач, как создание совершенно новых последовательностей.

   Ранее группа Мадани использовала разработанную ими модель белкового языка под названием ProGen, чтобы придумать новые антибактериальные белки. Чтобы разработать новые CRISPR, его сотрудники обучили обновленную версию ProGen на примерах миллионов разнообразных CRISPR-систем, которые бактерии и археи, используют для борьбы с вирусами. Поскольку системы редактирования генов CRISPR состоят не только из белков, но и из молекул РНК, которые указывают на цель, группа Мадани разработала еще одну модель искусственного интеллекта для проектирования этих "направляющих РНК".

   Затем они использовали нейронную сеть для проектирования миллионов новых белковых последовательностей CRISPR, которые принадлежат к десяткам различных семейств таких белков, встречающихся в природе. Чтобы проверить, являются ли CRISPR, разработанные искусственным интеллектом, настоящими редакторами генов, группа Мадани синтезировала последовательности ДНК, соответствующие более чем 200 белковым конструкциям, принадлежащим к системе CRISPR-Cas9, которая сегодня широко используется в лабораториях. Когда они вставили эти последовательности - инструкции для белка Cas9 и "направляющей РНК" - в человеческие клетки, многие из редакторов генов смогли точно разрезать намеченные цели в геноме.

   Наиболее перспективный белок Cas9 - молекула, которую они назвали OpenCRISPR-1, - так же эффективно разрезал целевые последовательности ДНК, как и широко используемый бактериальный фермент CRISPR-Cas9, и делал гораздо меньше разрезов в неправильных местах. Исследователи также использовали конструкцию OpenCRISPR-1 для создания редактора оснований - точного инструмента для редактирования генов, который изменяет отдельные "буквы" ДНК, - и обнаружили, что он тоже не уступает по эффективности другим системам редактирования оснований, а также менее склонен к ошибкам.

   Другая исследовательская группа под руководством Брайана Хи, биолога-компьютерщика из Стэнфордского университета, и биоинженера Патрика Хсу из Института Арк, Калифорния, использовала модель искусственного интеллекта, способную генерировать последовательности как белков, так и РНК. Модель, получившая название EVO, была обучена на 80 000 геномов бактерий и архей, а также других последовательностей микроорганизмов, что составляет 300 миллиардов букв ДНК. Группа Хие и Хсу еще не проверила свои разработки в лаборатории. Но предсказанные структуры некоторых сконструированных ими систем CRISPR-Cas9 напоминают структуры природных белков. Их работа также была описана в препринте, размещенном на сайте bioRxiv.org.

   "Это потрясающе", - комментирует Ноэлия Ферруз Капапей, специалист по вычислительной биологии из Института молекулярной биологии Барселоны. Ее впечатляет тот факт, что исследователи могут использовать молекулу OpenCRISPR-1 без ограничений, в отличие от некоторых запатентованных инструментов редактирования генов. Модель ProGen2 и "атлас" последовательностей CRISPR, используемых для ее точной настройки, также находятся в свободном доступе.

   Мадани надеется, что инструменты для редактирования генов, разработанные искусственным интеллектом, будут лучше подходить для применения в медицине, чем существующие CRISPR. По его словам, компания Profluent надеется наладить партнерские отношения с компаниями, разрабатывающими методы редактирования генов, чтобы протестировать CRISPR, созданные ИИ. "Это действительно требует точности и индивидуального дизайна. И я думаю, что это просто невозможно сделать путем копирования и вставки из встречающихся в природе систем CRISPR", - утверждает он.

Источник:

Nature news, 29 Apr.,2024

Комментариев: 0
Узнайте о новостях и событиях микробиологии

Первыми получайте новости и информацию о событиях