Компьютерный биолог Цзюэ Ванг уже пытался разработать искусственный интеллект (ИИ) для создания лекарств-кандидатов, когда ему пришлось срочно доставить своего 2-летнего сына в клинику с потенциально смертельной респираторной инфекцией.
После того, как его сын быстро выздоровел от респираторно-синцитиального вируса (RSV), Ванг, постдокторант Университета Вашингтона (UW) и его коллеги удвоили свои усилия и 21 июля представили в журнале Science новое программное обеспечение ИИ, которое может "рисовать" или "галлюцинировать" структуры для белков, которых еще не существует в природе. Программное обеспечение уже создало оригинальные соединения для потенциального использования в промышленной химии, лечении рака и даже вакцины, направленной на предотвращение RSV-инфекций.
"Это идеальное применение искусственного интеллекта", - говорит Ян Чжан, дизайнер белков из Мичиганского университета, который не принимал участия в работе. Хотя исследователи используют компьютеры и другие средства для конструирования новых белков уже несколько десятилетий, подходы ИИ, подобные этому, вероятно, увеличат число успешных проектов, говорит Чжан.
ИИ, разработанный Вангом и его коллегами, основывается на ряде недавних достижений в использовании компьютеров для предсказания трехмерной структуры природных белков на основе их базовой последовательности аминокислот. В прошлом году программа ИИ под названием AlphaFold, разработанная DeepMind, дочерней компанией Google, выдала предсказания структур для сотен тысяч человеческих белков. AlphaFold и аналогичный пакет программ ИИ под названием RoseTTAFold также предложили тысячи вероятных структур различных белков, каждый из которых ассоциирован с агентом, с которым он взаимодействует внутри клеток. В прошлом году за такие подвиги программное обеспечение для предсказания структуры белков получило звание "Прорыв года 2021" по версии Science.
Одно дело - предсказать, как могут складываться природные белки, другое - разработать новые с нуля. Например, в 2017 году исследователи под руководством руководителя Ванга, Дэвида Бейкера, дизайнера белков в UW, показали, что они могут использовать разработанную ими ранее программу предсказания структуры белка (без использования искусственного интеллекта), которая называется Rosetta, для разработки потенциальных препаратов на основе белков, которые связываются и инактивируют молекулярные мишени вируса гриппа и бактериального токсина. Члены команды начали с того, что передали программе уже известный фрагмент того, что им нужно - небольшой фрагмент структуры белка, называемый мотивом связывания, который способен связываться с их мишенью. Затем Rosetta просканировала базу данных ранее созданных белковых структур и нашла существующий каркас, который мог бы удерживать активный сайт в правильной форме. Затем программа соединила эти две части вместе и настроила комбинацию для внесения необходимых уточнений.
Проблема в том, что этот подход срабатывал только тогда, когда Rosetta находила подходящие каркасы. "Приходилось надеяться на удачное совпадение", - говорит Бейкер. Теперь это не так. Ванг, Бейкер и их коллеги теперь адаптировали свою программу RoseTTAfold, управляемую искусственным интеллектом, к созданию собственных белков с нуля, используя две различные стратегии.
Первая, называемая "inpainting" (рисование), начинается, как и предыдущая, с предоставления ИИ отправной точки, например, активного сайта или другой ключевой особенности желаемого белка. Подобно тому, как функция автозаполнения текстового процессора пытается завершить слово после ввода нескольких символов, ИИ, опираясь на свое понимание того, как сворачиваются белки, заполняет дополнительные части белка вокруг центральной функции.
Второй подход, известный как "сдерживаемая галлюцинация" (constrained hallucination), является более открытым. В нем программа задает цель для белка, например, связывание с металлом. Затем программа генерирует виртуальный белок, состоящий из случайной последовательности аминокислот, и мутирует последовательность снова и снова, оценивая влияние каждого изменения на вероятную форму белка и, следовательно, его функцию. ИИ сохраняет те части, которые считает эффективными, и мутирует остальные, неуклонно развиваясь в направлении достижения цели.
В обоих случаях окончательные предсказанные белки могут быть изготовлены в лаборатории и протестированы. И обе стратегии сработали. Бейкер и его коллеги создали новые белки, способные связываться с рецепторами на раковых клетках, захватывать металлы в растворе и связывать углекислый газ для возможного использования при извлечении его из атмосферы. Наконец, чтобы найти потенциальные вакцины против RSV, искусственный интеллект команды создал 37 белков, нацеленных на то, чтобы представить иммунной системе ключевой фрагмент вируса, называемый F белковый сайт V. Было обнаружено, что три из 37 связываются с известным нейтрализующим антителом RSV, что указывает на их вероятную эффективность.
Результаты не всегда идеальны. В нескольких случаях активность новых белков, например, тех, которые предназначены для связывания металлов, изначально не соответствовала природным аналогам, отмечает Джо Уотсон, постдок в лаборатории Бейкера. Но, придумывая различные белки, программное обеспечение приходит к структурам, которые до сих пор не встречались в природе. Исследователи могут использовать их в качестве отправных точек для других проверенных методов эволюции усовершенствованных белков в лаборатории, говорит Уотсон. "Это дает нам много новых отправных точек".