Исследование «темного протеома» выявило тысячи новых человеческих генов

Авторы/авторы:
Исследование «темного протеома» выявило тысячи новых человеческих генов
Вероятные структуры трех новых предполагаемых минипротеинов, предсказанные искусственным интеллектом AlphaFold3, демонстрируют их простоту. Иллюстрация: Leron Kok
28 ноября 2024
30
0

Одним из самых больших сюрпризов, открывшихся после первого секвенирования генома человека более 20 лет назад, стало то, как мало генов в нем содержится - меньше трети от того количества, которое предсказывали некоторые ученые. 

   Оказалось, что для создания и функционирования человеческого организма достаточно менее 30 000 генов и кодируемых ими белков; в последнее время эта цифра стала еще меньше - около 20 000. Но новый систематический анализ того, что некоторые называют «темным протеомом», показывает, что ученые упустили тысячи нетрадиционных генов, которые скрываются в ранее не замеченных участках генома и производят белки размером меньше среднего. Новые описанные гены и их продукты могут перевернуть представление о биологии человека и ускорить медицинские открытия. Например, один из найденных генов производит миниатюрный белок, который, как оказалось, является ключевым для развития у детей медуллобластомы.

   «Если мы не будем знать, что представляют собой белки в „темном протеоме“ и какой вклад они вносят, наши возможности по лечению заболеваний будут ограничены», - считает Алан Сагателян, химик-биолог из Института биологических исследований Салка, который не принимал участия в новом исследовании, описанном в препринте, опубликованном в прошлом месяце на сайте bioRxiv.
Один из руководителей анализа, Джон Пренснер, начал изучать темный протеом, потому что многие его поиски среди известных генов, связанных с раком, оказались безрезультатными. «Мне стало интересно, что может предложить остальная часть генома», - вспоминает Пренснер, детский нейроонколог, работающий сейчас в Медицинской школе Мичиганского университета.

   Он и его коллеги расширили стандартное определение гена: обычно считается, что он состоит из длинной последовательности ДНК, кодирующей белок, известной как открытая рамка считывания (ORF), в которой есть сигналы, указывающие клетке, где начинать и прекращать считывание. Клетка транскрибирует последовательность ORF в мессенджерную РНК, которая отправляется на клеточные фабрики - рибосомы, собирающие аминокислотные последовательности в белки. Типичному ORF также предшествует фрагмент ДНК, который притягивает белки, необходимые для считывания гена. Для большинства исследователей ORF считался геном, если он кодировал белок, содержащий 100 или более аминокислот.

   Но биологи, изучающие все - от дрожжей до змей и человека, - недавно обнаружили множество так называемых неканонических ORF, в которых нет этих предисловий и которые короче среднего. Однако они часто транскрибируются в РНК, и метод, известный как рибосомальное профилирование, или Ribo-Seq, показал, что многие из транскрибированных РНК присоединяются к рибосомам, где они могут транслироваться в короткие цепочки аминокислот - даже в белки, содержащие менее дюжины анимокислот.

   Но даже тогда многие ученые отвергали получающиеся минипротеины как неважные, считая их «мусором», который быстро разрушается. Было очень сложно убедить специалистов, что на эти ORF стоит обратить серьезное внимание, говорит Джи-Юнг Юн, биохимик из Детской клинической больницы в Торонто. Но около 3 лет назад Пренснер и его коллеги продемонстрировали, что раковые клетки содержат около 550 таких микропротеинов. Двумя годами ранее Себастиан ван Хиш, системный биолог из Центра детской онкологии при Oncode Institute, обнаружил такое же количество крошечных белков в тканях сердца. «Мы с Себастианом находили эти гены, которые были очень, очень крутыми, и мы решили, что мир должен знать о них», - рассказывает Пренснер.

   Поэтому они объединились со специалистом по аннотированию генов Джонатаном Маджем из GENCODE, базы данных официально признанных генов, и в итоге привлекли несколько десятков других исследователей из 20 учреждений на четырех континентах, чтобы помочь оценить, сколько неканонических ORF существует у человека. Это «стало своего рода суперконсорциумом для наведения порядка в относительно новой области», - говорит Фергал Мартин, биолог-вычислитель из Европейского института биоинформатики Европейской лаборатории молекулярной биологии.

   Эта группа не проводила собственных экспериментов, а изучала то, что было сделано другими, сначала прочесывая документы по профилированию рибосом. К 2022 году ученые отследили 7264 неканонических ORF в геноме человека. С помощью Human Proteome Organization, которая стремится каталогизировать все человеческие белки, и PeptideAtlas, где собраны данные масс-спектрометрии по белкам, они решили доказать, что эти ORF создают белки.

   Это было «большой проблемой», отмечает Юн. Консорциум изучил архив масс-спектрометрических данных PeptideAtlas в поисках небольших белков, соответствующих последовательностям ORF, и проанализировал опубликованные эксперименты, в которых каталогизировались белковые фрагменты, обнаруженные иммунной системой человека, - эта область получила название иммунопептидомики. В итоге они подтвердили, что четверть из 7264 неканонических ORF, которые они насчитали, производят белки - всего около 3000. (Один ORF может быть прочитан несколькими способами, в результате чего образуется более одного белка).

   Вновь открытые минипротеины «помогают составить более полное представление о кодирующей части генома [человека]», - говорит генетик из Стэнфордского университета Ами Бхатт, чьи собственные исследования изучали темный протеом микробов. Они также дают ученым новые биомедицинские мишени для изучения. Пренснер и ван Хиш уже начали отслеживать ORF и его минипротеины, которые они выявили в самом начале своих исследований темного протеома. Используя генный редактор CRISPR для внесения мутаций в ORF, они смогли изучить значение этого белка в раковых клетках. Продукт ORF, хотя и небольшой, необходим для выживания опухолей медуллобластомы - рака мозга, поражающего детей, - сообщили они 18 января в журнале Molecular Cell.

Не каждый день удается открыть направление исследований и сказать: «Возможно, у нас есть совершенно новый класс мишеней для лекарственных препаратов для пациентов»,

   - говорит Пренснер. Этот минипротеин не был включен в первоначальный анализ генома человека, однако «он играет важнейшую роль в патогенезе медуллобластомы», - соглашается Сагателян. Пренснер также консультирует компанию из Массачусетса под названием ProFound Therapeutics, которая сотрудничает с фармацевтическим гигантом Pfizer в разработке методов лечения ожирения на основе микропротеиновых мишеней. Другой соавтор препринта, Томас Мартинес, биохимик белков из Калифорнийского университета, и его сотрудники занимаются поиском крошечных белков, участвующих в развитии рака поджелудочной железы и метаболических заболеваний. «Меня больше всего волнует возможность использования микропротеинов в терапевтических целях, надеюсь, в качестве биомаркеров и мишеней для лекарств», - говорит Мартинес. «Как только этот барьер будет преодолен, я думаю, интерес к этой области резко возрастет».

   Хотя Мартинес доволен тем, как много темного протеома было раскрыто, Юн считает, что многое еще предстоит найти. По ее словам, работа, проделанная ее группой и другими исследователями, лишь «слабое освещение» невидимой популяции минипротеинов. Ее коллектив совершенствует методы масс-спектрометрии для обнаружения все более мелких молекул и надеется с их помощью найти минипротеины, играющие роль в развитии мозга.

   Как же все это влияет на количество человеческих генов? Темный протеом явно увеличил их общее количество, но никто не знает истинного числа. «По моим ощущениям, оно, вероятно, не дотягивает до 100 000, - говорит Мартинес, - но 50 000 вполне возможно».

Источник:
Science news, 25 Nov.,2024
Комментариев: 0
Узнайте о новостях и событиях микробиологии

Первыми получайте новости и информацию о событиях