Геномы 500 000 человек, хранящиеся в Биобанке Великобритании, помогут исследователям найти связь между генетическим кодом и заболеваниями. Крупнейшая в мире коллекция полных геномов человека только что стала доступной.
Британский биобанк (UK Biobank) - хранилище медицинских, геномных и других биологических данных опубликовал на днях полные геномные последовательности каждого из 500 000 британских добровольцев, включенных в базу данных. Исследователи со всего мира могут подать заявку на доступ к этим данным, которые не содержат идентифицирующей информации, и использовать их для изучения генетических основ здоровья и болезней. "Ученые смотрят на это, как на карты Google", - говорит Рори Коллинз, исполнительный директор Биобанка Великобритании. "Когда они хотят узнать, каковы взаимосвязи между образом жизни, окружающей средой, генетикой и заболеванием, они обращаются не к Google, а к UK Biobank".
Публикация полной последовательности геномов объемом 3 миллиарда букв для каждого участника Биобанка Великобритании последовало за публикацией в 2021 году полных геномов 200 000 участников Биобанка. Работа стоимостью 200 миллионов фунтов стерлингов (250 миллионов долларов США) была профинансирована фондом биомедицинских исследований Wellcome, правительством Великобритании и несколькими фармацевтическими компаниями, которые в свою очередь получили доступ к данным за 9 месяцев до их более широкого обнародования.
Ранее генетическая информация UK Biobank включала целые "экзомы" - 2% генома, которые кодируют белки, - а до этого - 850 000 распространенных однобуквенных вариантов ДНК, которые были разбросаны по всему геному. Последняя информация позволяет проводить широкогеномные исследования ассоциаций (GWAS), связывающие здоровье и генетику. Но когда исследователи ищут ассоциации между генетикой и болезнями или другими признаками, большинство таких "хитов" оказывается в некодирующих областях генома, которые отсутствуют в экзомных последовательностях и лишь с низким разрешением охватываются существующими данными о геноме. По словам Майкла Уидона, генетика человека из Эксетерского университета (Великобритания), полные геномы также позволяют исследователям выявить очень редкие мутации, которые, как правило, оказывают более сильное влияние на тот или иной признак, чем распространенные вариации, включенные в данные по всему геному. "Мы надеемся, что редкие варианты позволят нам лучше понять биологию".
Это уже доказано. В препринте от 20 ноября ученые под руководством Гарета Хоукса, генетика человека из Эксетера, проанализировали первые 200 000 полных геномов из Биобанка Великобритании и обнаружили 29 редких вариантов ДНК, которые ассоциируются с разницей в росте до 7 сантиметров; эти варианты не были замечены в предыдущих генетических исследованиях. Это исследование было пилотным для анализа всех 500 000 геномов. В конечном итоге исследователям потребуется гораздо больше, чем полмиллиона полных геномов, чтобы всесторонне изучить ассоциации между редкими вариантами генов и состоянием здоровья, говорит Уидон. "Я бы рассматривал это как хороший очередной шаг к получению миллионов образцов, которые нам, вероятно, понадобятся".
Эти цифры уже не за горами. Исследование All of Us (Все мы), финансируемое правительством США, планирует в конечном итоге опубликовать данные о геноме и здоровье одного или более миллиона жителей Соединенных Штатов. В рамках исследования было обнародовано 250 000 геномов, но заявки на изучение данных от исследователей из других стран начали приниматься только в августе. Такие базы данных, как All of Us, также будут полезны для подтверждения связей, обнаруженных в Биобанке Великобритании, говорят исследователи.
Андреа Ганна, статистический генетик из Университета Хельсинки, пока не уверена в том, что первые 200 000 геномов из Биобанка Великобритании принесут много пользы. Многие некодирующие варианты, обнаруженные в ходе полногеномных исследований, таких как исследование Уидона и Хоукса, близки к тем, которые уже были найдены с помощью GWAS. Тем не менее, полные геномные последовательности могут помочь исследователям более точно определить связь заболеваний со структурными вариациями - недостающими, лишними или перевернутыми участками ДНК, - говорит Ганна.
По словам Коллинза, британский биобанк уже стал источником более 9000 публикаций, и истинное влияние последнего выпуска может быть ясно только через некоторое время. "Я думаю, мы будем удивлены тем, сколько всего появится, о чем мы даже не подозревали".