Исследователи используют программы машинного обучения для прогнозирования эволюции вирусов и разработки вакцин.
На третьем году пандемии COVID-19 исследователи сообщили о еще одном тревожном вирусе. Выявленный с 2018 года у 35 человек в восточном Китае, хенипавирус Лангья вызывает проблемы с дыханием, лихорадку и другие тревожные симптомы. Вирус Лангья пока не привел ни к одному смертельному случаю. Но он является родственником некоторых опасных вирусов, поэтому исследователи стремятся разработать вакцины заранее. Есть только одна проблема: вирусные белки, которые могли бы стать основой для вакцины, оказалось невозможно создать в лаборатории. "Если мы даже не можем изучить белок, как мы сможем понять, как он работает, и как мы сможем создать вакцину?" - рассуждает Дэвид Вислер, вирусолог-структуролог из Университета Вашингтона.
И вот теперь, благодаря искусственному интеллекту (ИИ), биологам удалось раскусить орешек Лангьи. В работе, опубликованной в августе на сервере препринтов bioRxiv, группа Вислера описывает использование инструмента прогнозирования AlphaFold для картирования структуры белка, с помощью которого Лангья вторгается в клетки. Другой инструмент искусственного интеллекта выявил мутации, которые превратили непокорную молекулу в подходящего кандидата на вакцину.
Исследование, еще не прошедшее рецензирование, является частью начинающейся работы по использованию революционных достижений в области ИИ, таких как AlphaFold и большие языковые модели, для подготовки к будущим пандемиям. Финансирующие организации вкладывают деньги в этот подход, который уже приносит свои плоды. В статье, опубликованной 11 октября в журнале Nature, исследователи сообщают о создании инструмента машинного обучения, который позволяет предсказывать эволюцию вирусов, способных вызвать пандемию. Эта информация может повысить эффективность вакцин, в том числе против COVID-19, и дать миру преимущество при возникновении следующей пандемической угрозы. "Приносит ли машинное обучение новые стрелы в наш колчан? Да, безусловно", - утверждает Нил Кинг, биохимик из Университета Южной Калифорнии. "Но это еще только начало".
Во время пандемии COVID-19, благодаря удачному стечению обстоятельств, исследователи были хорошо подготовлены к разработке вакцин. Предыдущие исследования других коронавирусов, включая тот, который вызывает ближневосточный респираторный синдром (MERS), дали им хорошее представление о том, как превратить генетическую последовательность SARS-CoV-2 в вакцину. "Нам очень повезло, просто невероятно повезло, - считает Кинг. Но для многих других вирусов, обладающих пандемическим потенциалом, таких идей нет. Именно здесь все большую роль играет машинное обучение.
Вирус Лангья относится к семейству хенипавирусов. К ним относятся крайне смертоносный вирус Нипах и вирус Хендра, вызывающий смертельные вспышки среди лошадей и способный привести к летальному исходу у людей. Однако Лангья достаточно сильно отличается генетически, поэтому меры борьбы с его родственниками, включая вакцину против вируса Хендра, одобренную для лошадей и опробованную на людях, вряд ли сработают, считает Вислер. Его группа занялась изучением структуры версии G-белка Лангьи, который является мишенью антител, блокирующих инфекцию у других хенипавирусов, и основой вакцины против Хендры.
Первые попытки заставить человеческие клетки вырабатывать G-белок Лангьи для изучения не увенчались успехом, поэтому исследователи использовали AlphaFold для предсказания того, как выглядит этот белок. Другой инструмент искусственного интеллекта определил мутации, которые сделали белок достаточно стабильным для изучения в лаборатории. По словам Вислера, вирусные белки, измененные с помощью ИИ, теперь являются основой прототипа вакцины против Лангьи. Машинное обучение, по его словам, "позволило сделать то, что иначе было бы невозможно".
Джейсон Маклеллан, структурный биолог из Техасского университет, начал использовать некоторые из тех же инструментов искусственного интеллекта для изучения вирусных белков и их модификации для создания вакцин. В некоторых случаях они выявили изменения, которые в противном случае он бы не заметил. "Эти новые методы меняют нашу повседневную жизнь, делая все намного быстрее", - говорит Клара Шёдер, занимающаяся вычислительным проектированием терапевтических средств в Лейпцигском университете (Германия). Она участвует в проекте, финансируемом Коалицией по инновациям в области обеспечения готовности к эпидемиям (CEPI) в Осло, по использованию инструментов машинного обучения для создания библиотеки потенциальных вакцин против ряда опасных вирусов. Ранее в этом году Национальный институт аллергии и инфекционных заболеваний США объявил о выделении 100 млн. долл. на аналогичную работу по созданию библиотек вакцин.
Шёдер и ее коллеги изучают возможность использования нейронных сетей при разработке вакцин. Эти сети, созданные на основе больших языковых моделей, таких как ChatGPT, обучаются на огромных массивах белковых последовательностей. По словам Брайана Хи, вычислительного биолога из Стэнфордского университета, это может помочь сетям выявлять эволюционно правдоподобные изменения, которые могут быть использованы для создания более совершенных вакцин. "Это очень перспективная область", - утверждает он.
Другие исследователи используют искусственный интеллект для создания вакцин на основе дизайнерских белков. Группа Кинга в значительной степени опирается на инструменты машинного обучения, основанные на ИИ, генерирующем изображения, такие как Midjourney. Одна из разработок, которую группа еще не опубликовала, - это дизайнерский белок, который удерживает фрагмент молекулы возбудителя малярии, придавая ей форму, вызывающую мощный ответ антител. "Эти методы полностью изменили ситуацию в плане того, что можно проектировать", - отмечает Кинг.
Исследователи также начинают использовать машинное обучение для разработки вакцин, которые на один или два шага опережают наиболее опасные вирусы. Вакцины против вируса COVID-19 поначалу с огромным успехом защищали от этого заболевания. Но появление ослабляющего иммунитет варианта Омикрон и его потомков подорвало прочность и долговечность вакцин. Обновленные вакцины - самые последние, основанные на линии XBB.1.5, появившиеся в конце 2022 года, - все еще отстают от эволюции вируса на несколько месяцев.
Дебора Маркс из Гарвардской медицинской школы в Бостоне, штат Массачусетс, применяет искусственный интеллект для решения биологических проблем. В недавней статье, опубликованной в журнале Nature, она и ее коллеги описывают разработку сети глубинного обучения, способной предсказывать мутации, которые помогают вирусу SARS-CoV-2 распространяться и преодолевать иммунитет. Модель, получившая название EVEscape, была обучена на последовательностях коронавирусов, полученных до января 2020 года, когда SARS-CoV-2 был впервые идентифицирован в Ухани (Китай).
EVEscape - впечатляющий предсказатель SARS-CoV-2. Половина предсказанных моделью мутаций в наиболее подверженной изменениям области клеточного белка спайка уже наблюдалась в реальных вариантах SARS-CoV-2, и эта цифра должна расти по мере дальнейшей эволюции вируса. В работе, опубликованной на прошлой неделе на сайте bioRxiv , группа исследователей использовала модель для создания набора потенциальных последовательностей для спайкового белка SARS-CoV-2, некоторые из которых содержат до 46 мутаций от предкового штамма, в надежде предугадать дальнейшую эволюцию вируса и внести свой вклад в разработку экспериментальных вакцин.
Модель не ограничивается SARS-CoV-2. Маркс и ее коллеги обнаружили, что с ее помощью можно также предсказать эволюцию ВИЧ, гриппа, вируса Нипах и вируса, вызывающего геморрагическую лихорадку Ласса. Когда появится новый вирус с пандемическим потенциалом, команда надеется быть готовой к предсказанию его эволюции и, возможно, даже к созданию вакцин на основе этих предсказаний.
Мелани Сэвилл, исполнительный директор CEPI по исследованиям и разработке вакцин, считает, что машинное обучение способно значительно увеличить количество вакцинных разработок, которые могут быть быстро использованы для выявления наиболее перспективных кандидатов. "Нам просто нужно быть осторожными и не говорить, что этот вычислительный метод станет решением всех проблем", - говорит она. "Но это отличная отправная точка".