Искусственный интеллект может использоваться для создания новых белков

Авторы/авторы:
Искусственный интеллект может использоваться для создания новых белков
Иллюстрация: the-scientist.com
6 марта 2023
80
0

Алгоритмы искусственного интеллекта оказали огромное влияние на изучение структуры белков, например, AlphaFold компании DeepMind предсказал структуру 200 миллионов белков. 

   И вот недавно Дэвид Бейкер и его коллектив биохимиков из Университета Вашингтона продвинули искусственный интеллект в области изменения структуры белков еще на один шаг вперед. В публикации в журнале Nature от 22 февраля они рассказали о том, как они использовали ИИ для разработки индивидуальных функциональных белков, которые они могли бы воспроизводить и синтезировать в живых клетках, создавая новые возможности для белковой инженерии. Али Мадани, основатель и генеральный директор компании Profluent, которая использует другие технологии ИИ для проектирования белков, говорит, что это исследование "зашло далеко вперед" в проектировании белков, и отмечает, что сейчас мы наблюдаем "зарождение новой области".

   Белки состоят из различных комбинаций аминокислот, соединенных в свернутые цепочки, что создает безграничное разнообразие трехмерных форм. Предсказать трехмерную структуру белка на основе одной лишь его последовательности - задача, непосильная для человеческого разума, поскольку сворачивание (фолдинг) белка зависит от множества факторов, таких как последовательность и длина аминокислот биомолекулы, ее взаимодействие с другими молекулами и сахара, добавленные на ее поверхность.

   Вместо этого ученые десятилетиями определяли структуру белка с помощью экспериментальных методов, таких как рентгеновская кристаллография, которая позволяет рассмотреть структуру белка в атомных деталях путем дифракции рентгеновских лучей через кристаллизованный белок. Но такие методы дороги, требуют много времени и зависят от мастерства исполнения. Тем не менее, ученые, использующие эти методы, сумели определить тысячи белковых структур, создав огромное количество данных, которые затем можно использовать для обучения алгоритмов искусственного интеллекта определению структур других белков.

   Компания DeepMind продемонстрировала, что машинное обучение может предсказывать структуру белка по его аминокислотной последовательности с помощью системы AlphaFold, а затем повысила ее точность, обучив AlphaFold на 170 000 белковых структурах. В тот же день, когда была опубликована работа AlphaFold, Бейкер и его коллеги выпустили независимую, свободно доступную альтернативу, которая предсказывает структуру белка с такой же точностью, как AlphaFold, известную как RoseTTAFold.

   С тех пор Бейкер и его коллеги исследовали, может ли машинное обучение, используемое в обратном направлении, создать аминокислотную последовательность для воображаемого белка с промышленным или медицинским потенциалом. Белковая инженерия в основном опирается на эксперименты, в которых вносятся постепенные изменения в белки и изучаются их последствия, например, путем внесения случайных мутаций в соответствующий ген, экспрессирующий белок, и скрининга полученных белков на предмет желаемой адаптации. Бейкер считает, что с помощью ИИ "мы сможем создавать еще более совершенные конструкции" таких белков "быстрее, чем раньше".

   Чтобы проверить свою стратегию создания белков, они обратились к группе светопродуцирующих ферментов, называемых люциферазами (люцифер в переводе с латинского означает "светоносец"). При связывании с небольшими молекулами, называемыми люциферинами, эти ферменты светятся в темноте и встречаются во многих организмах, включая светлячков и обитателей водных глубин океана.

   В отличие от флуоресцентных белков, люциферазы не нуждаются в источнике возбуждающего света и могут применяться для глубокой визуализации внутри тканей животных. Однако в природе найдено очень мало люцифераз; большинство из них нестабильны и склонны связывать природные люциферины лучше, чем синтетические, созданные с благоприятными свойствами. Эти факторы препятствовали усилиям по использованию люцифераз в научных приложениях и созданию искусственных версий этих ферментов.

   Работая с комбинацией систем искусственного интеллекта, включая AlphaFold, Protein MPNN и trRosetta, исследователи задались целью придумать аминокислотную последовательность для люциферазы, которая могла бы связывать синтетический люциферин и оставаться стабильной. Поскольку природные люциферазы не очень хорошо связываются с синтетическим люциферином, они использовали машинное обучение, чтобы предсказать, насколько хорошо 4 000 других белков, известных как белки, связывающие малые молекулы, подходят для сравнения. 

   Выделилась одна группа белков: суперсемейство ядерных транспортных факторов 2 (NTF2)-подобных белков. Алгоритм показал, что члены этого суперсемейства имеют общий карман, который может удерживать синтетический люциферин. Получив структуру, способную связываться с синтетическим люциферином, команда сосредоточилась на стабильности. К сожалению, NTF2-подобные белки содержат длинные петли аминокислот, которые в синтетическом гибридном белке могут быть склонны к неправильному сворачиванию. Однако эти петли не являются неотъемлемой частью активности люциферазы, поэтому исследователи использовали алгоритмы машинного обучения, чтобы заменить их другими, более стабильными комбинациями аминокислот.

   В итоге сочетание методов искусственного интеллекта позволило исследователям создать 7 648 конструкций белков, которые не существуют в природе, но могут быть способны делать то, что нужно исследователям. Затем ученым пришлось сократить их число до нескольких лучших, определив, какие из них продуцируют свет в клетках, обработанных синтетическим люциферином. Исследователи ввели каждую из этих конструкций в бактерии E. coli и обнаружили, что только три (0,04 %) из них работают.

   Мадани рассказывает, что разработка ферментов - невероятно сложная задача, поскольку для ее выполнения требуется предельная точность, и "любой успех очень впечатляет". В компании Profluent Мадани работает над ProGen, отдельным рабочим процессом ИИ для проектирования белков, который, по его словам, имеет "процент попадания выше 50%". Но, добавляет он, сравнивать эти подходы было бы все равно, что сравнивать яблоки и апельсины, поскольку они идеально подходят для создания разных типов белков.

   Решив оптимизировать свой рабочий процесс, команда применила знания, полученные в результате первого опыта, для конструирования других люцифераз на основе синтетического люциферина другой формы и увеличила выход до 4% из всех 46 предполагаемых конструкций. Энди Хсиен-Вей Йех, исследователь в лаборатории Бейкера, говорит, что первый раунд помог понять, "какие геометрии дадут вам люциферазу", и это помогло сократить число последовательностей-кандидатов, которые алгоритм должен был рассмотреть. Теперь Бейкер и Йех создали компанию по производству диагностических биосенсоров под названием Monod Bio, которая лицензировала их синтетические люциферазы.

   Проектирование белков еще не полностью автоматизировано. Бейкер говорит, что "еще есть возможности для совершенствования", так как для создания активного сайта фермента люциферазы все еще требовались некоторые изменения последовательности вручную. Однако он надеется, что однажды ИИ сможет синтезировать белки "прямиком из коробки". Он также отмечает, что реакцию фермента люциферазы относительно просто имитировать: "Нам предстоит работа, чтобы увидеть, насколько хорошо этот подход работает для более сложных химических реакций".

   В дальнейшем Бейкер и его коллеги разрабатывают другую систему искусственного интеллекта под названием RFdiffusion для оптимизации проектирования белков и намерены использовать ее для изобретения синтетического белка для назального спрея, который блокирует вирусы гриппа от прикрепления к клеткам хозяина. Поскольку ожидается, что алгоритм будет генерировать очень стабильные белки, Бейкер надеется, что назальный спрей будет иметь длительный срок хранения и может регулярно использоваться для профилактики инфекций в течение всей зимы. Бейкер говорит, что помимо блокирования респираторных вирусов, в будущем алгоритм может быть использован для разработки новых биоматериалов, стабильных ферментов, разлагающих пластик, и белков, улавливающих солнечную энергию.

Источник:
The Scientist, 3 March 2023
Комментариев: 0
Узнайте о новостях и событиях микробиологии

Первыми получайте новости и информацию о событиях