Ученые объединили возможности геномных скринингов и машинного обучения, чтобы раскрыть секреты транскриптомной инженерии с помощью Cas13.
Редактирование генома с помощью технологий CRISPR быстро развивается, начиная с фундаментальных биологических исследований и заканчивая клиническими применениями. По мере того как генная терапия на основе Cas9 для лечения таких заболеваний, как серповидно-клеточная анемия, проходит путь к одобрению, многие ученые ищут методы, позволяющие вывести геномную инженерию на новый уровень. В частности, исследователи обращают внимание на инструменты для редактирования РНК, а не ДНК, что позволяет более точно контролировать экспрессию генов и напрямую воздействовать на некодирующие транскрипты ДНК.
Традиционные методы CRISPR-Cas9 основаны на использовании нуклеазы Cas9 и компонента направляющей РНК (gRNA), которая указывает нуклеазе путь к разрезанию комплементарных участков ДНК. К числу потенциальных препятствий, мешающих применению этой технологии, относятся такие факторы, как ненаправленное взаимодействие нуклеазы с нецелевой ДНК и ограниченное редактирование нужных целевых участков. Ученые проводят крупномасштабные скрининги на наличие целевых и нецелевых участков с помощью секвенирования следующего поколения, что помогает им создать более точные и эффективные технологии CRISPR.
"Десять лет назад было очень трудно думать о нацеливании на отдельные гены. А теперь, благодаря таким CRISPR-скринингам, мы можем делать это регулярно", - рассказывает Невилл Санджана, генетик из Нью-Йоркского университета, чья лаборатория разрабатывает технологии для изучения основ генетики заболеваний. Недавно исследовательская группа Санджаны изучала возможности нуклеазы Cas13, которая является РНК-редактирующей родственницей Cas9.
В работе, опубликованной в журнале Nature Biotechnology, Санджана и его коллеги из Колумбийского университета объединили возможности CRISPR-скрининга и глубинного обучения, чтобы определить правила, регулирующие Cas13-опосредованную транскриптомную инженерию. Исследователи разработали и протестировали около 200 000 Cas13 gRNA, нацеленных на основные гены в клетках человека. Они изучили как различные типы мутаций gRNA влияют на редактирование и создали обширный массив данных для обучения конволюционной нейронной сети, которую они назвали "Целевое ингибирование экспрессии генов с помощью дизайна gRNA" (TIGER). Исследователи использовали TIGER для прогнозирования эффективности и точности Cas13 gRNA.
TIGER позволил выявить, какие факторы необходимо учитывать при разработке жестко контролируемых систем РНК-редактирования, например, типы несовпадений мишеней и gRNA, которые оказывают наибольшее влияние на активность Cas13. Эти результаты открывают дорогу к следующему рубежу CRISPR-стратегий, позволяя исследователям модулировать степень редактирования, а не использовать редактирование генов как простое включение/выключение.
"Модуляция функции гена на 20%, 50% и 100% во многих случаях может дать разные результаты. Но одно из главных препятствий заключается в том, что сейчас у нас нет инструмента для точного управления снижением экспрессии генов", - пояснил Вей Ли, специалист по вычислительной биологии из Университета Джорджа Вашингтона, который не принимал участия в исследовании. "Если вы подумаете о регулировке громкости ваших колонок, то в большинстве случаев вы хотите точно отрегулировать ее так, чтобы вам было наиболее комфортно. Именно это они и сделали; я думаю, это действительно интересно".
Общая цель Санджаны в отношении TIGER и Cas13 выходит за рамки генной терапии и позволяет ответить на фундаментальный вопрос: как работает геном? Для достижения этой цели Cas13 обеспечивает дополнительный уровень контроля, которого лишены технологии Cas9; редактирование РНК позволяет исследователям напрямую изменять некодирующие РНК (нкРНК).
Для ученых, стремящихся раскрыть секреты генома, транскрипты нкРНК представляют собой большой фрагмент головоломки, потенциально играющий важнейшую роль в различных биологических процессах и заболеваниях. Хотя эта головоломка остается не до конца решенной, Санджана надеется восполнить пробелы с помощью технологии Cas13. "Когда мы разрабатывали эти CRISPR-скрининги, нацеленные на все гены в геноме, я все время думал: " А как насчет этих транскриптов", - рассказал он. "Было бы здорово, если бы мы могли сделать то же самое, воспользоваться преимуществами программируемости CRISPR, которая очень схожа между Cas13 и Cas9, и использовать ее для создания таких объединенных скринингов, где мы могли бы нацелиться не на тысячи генов, а на тысячи некодирующих РНК, чтобы действительно понять эту часть генома".