Относительно небольшая вселенная человеческих генов может увеличиться на одну треть, если совместные усилия по поиску новых генов, кодирующих короткие белки, увенчаются успехом.
Уже доказано, что многие известные минипротеины играют ключевую роль в клеточном метаболизме и развитии заболеваний, поэтому международные усилия по каталогизации новых и определению их функций, о которых было сообщено на прошлой неделе в журнале Nature Biotechnology, могут пролить свет на огромное количество биохимических процессов и найти мишени для новых препаратов.
"Микропротеом - это потенциальная золотая жила неизученной биологии", - говорит Эрик Олсон, молекулярный биолог Техасского университета, который не участвует в работе нового консорциума. Энн О'Доннелл-Лурия, эксперт по генетике редких заболеваний в Бостонской детской больнице, добавляет, что расширенный каталог может стать богатым источником сведений о генетических связях с заболеваниями. "Каждый сможет использовать эту базу данных для достижения прогресса в своей области".
Известно всего 19 370 человеческих генов, которые кодируют белки. Но в существующие каталоги включены только гены белков, содержащих не менее 100 аминокислот каждый, что было выбрано отчасти потому, что более длинные последовательности ДНК облегчают генетикам поиск общих черт между видами. О существовании многих белков меньшего размера известно, но они в основном оставались вне поля зрения, хотя было показано, что некоторые из них играют важнейшую роль в регулировании иммунной системы, блокировании других белков и уничтожении ошибочных РНК. "Тот факт, что они были исключены, представляет собой большую брешь в генетике и биологии развития", - говорит член консорциума Джон Пренснер, детский онколог из Бостонской детской больницы.
Когда гены превращаются в белки, они сначала транскрибируются в фрагменты мессенджерной РНК (мРНК). Затем рибосомы считывают эти последовательности мРНК и, следуя их указаниям, соединяют аминокислоты в белки. Когда ученые ищут гены, они обычно ищут характерные последовательности ДНК, фланкированные сигналами начала и остановки процесса сборки белка, так называемые открытые рамки считывания (ORFs).
В последние годы исследователи придумали другие способы выявления сиквенсов, кодирующих белки. Один из них, называемый Ribo-seq, использует технологию высокопроизводительного секвенирования для каталогизации всех РНК в образце, которые связаны с рибосомой в определенное время. Эти РНК сиквенсы указывают на вероятные гены, хотя этот метод не может доказать, что какая-то одна последовательность создает стабильный, функциональный белок. Базы данных Ribo-seq сегодня содержат тысячи ORFs, многие из которых не кодируют известные белки и поэтому могут создавать принципиально новые.
На первом этапе члены консорциума просканировали семь баз данных Ribo-seq в поисках ORF-кандидатов, которые могут соответствовать небольшим белкам. После отсеивания лишних записей они получили 7264 кандидата. Далее группа попытается определить, какие из них производят белки с реальными клеточными функциями. Такие методы, как масс-спектрометрия, помогут определить, транслируются ли конкретные РНК в стабильные белки. С помощью других методов, таких как маркировка эпитопов, антитела отслеживают помеченные белки, определяя их местоположение и количество в клетках и давая представление об их функциях.
На данный момент 35 исследователей финансируют эту работу из собственных бюджетов лабораторий и не планируют в ближайшее время искать специальное финансирование. "Там так много возможностей, что это просто необходимо сделать", - говорит член консорциума Себастьян ван Хиш, системный биолог из Центра детской онкологии принцессы Максимы в Нидерландах.