Обнаружены "серьезные ошибки" в фундаментальном исследовании о роли микроорганизмов в раковых заболеваниях

Авторы/авторы:
Обнаружены "серьезные ошибки" в фундаментальном исследовании о роли микроорганизмов в раковых заболеваниях
Иллюстрация: technologynetworks.com
9 августа 2023
63
0

Контаминация и вычислительные ошибки сводят на нет выводы работы о микробиомах рака, утверждается в препринте. Авторы оригинальной статьи с этим не согласны.

   Несколько лет назад, когда в журнале Nature ученые сообщили, что различные виды рака устойчиво ассоциируются с различными сообществами микроорганизмов, клинические возможности выглядели заманчиво. В работе, опубликованной в 2020 г., использовался искусственный интеллект для выявления ДНК микроорганизмов, указывающих на конкретные виды рака, и был предложен "новый класс инструментов диагностики рака на основе микробиома". С тех пор эта работа получила сотни цитирований, в ней были представлены данные для более чем 10 других исследований, и она помогла обосновать, по крайней мере, одно коммерческое предприятие, целью которого является определение наличия рака с помощью сиквенсов ДНК микроорганизмов в крови человека.

   Однако теперь эти перспективы подвергаются тщательному анализу, поскольку группа исследователей утверждает, что обнаружила "серьезные ошибки в анализе данных", которые подрывают выводы, сделанные в работе. Согласно статье, опубликованной критиками на прошлой неделе на сервере препринтов bioRxiv, авторы той статьи в Nature не смогли должным образом отфильтровать человеческую ДНК из базы данных секвенированных раковых тканей. Это привело к тому, что миллионы человеческих последовательностей были ошибочно классифицированы как микробные, что, возможно, объясняет, почему в исследовании были обнаружены такие невероятные микробы, как, например, бактерия морских водорослей, связанная с раком мочевого пузыря.

   В препринте также утверждается, что отдельная компьютерная ошибка, связанная с проведенным группой анализом, привела к появлению специфических для рака паттернов там, где их не было. По словам одного из авторов препринта, специалиста по вычислительной биологии Университета Джонса Хопкинса Стивена Зальцберга, "основные выводы работы совершенно неверны".

   Роб Найт, микробиолог из Калифорнийского университета и старший автор статьи в Nature, отвергает критику, отмечая, что его лаборатория уже опровергла ее в ответе на более ранний препринт, подготовленный теми же учеными. "В новом препринте нет ничего такого, что не было бы уже открыто обсуждено", - говорит Найт, который в 2019 г. стал одним из основателей компании Micronoma, занимающейся разработкой микробиомных методов диагностики рака. Он также обращает внимание на работу своей группы, опубликованную в 2022 году в журнале Cell, в которой использовались обновленные методы анализа грибков и бактерий в опухолях и были сделаны выводы, схожие с выводами статьи в Nature.

   Однако исследователи, наблюдающие за происходящим со стороны, говорят, что новый препринт значительно превосходит предыдущие обвинения, и его аргументы убедительны. "Это практически криминалистическая деконструкция тех мест, где в оригинальную рукопись вкрались ошибки, - считает Джулиан Паркхилл, бактериальный генетик из Кембриджского университета.

   Микробиомная наука, несомненно, имеет биомедицинские перспективы, и многие другие группы исследователей связывают микробы с определенными видами рака, однако, по словам Лесли Хойлса, микробиолога и специалиста по биоинформатике из Университета Ноттингема, эта дискуссия является предостережением для исследований микробиома, в значительной степени опирающихся на вычислительные подходы. "Не хватает критики того, что публикуется", - говорит она. "Нам нужны люди, занимающиеся подобными анализами".

Бактерии в неожиданных местах

   В статье, опубликованной в Nature, использовался репозиторий, известный как Атлас генома рака (TCGA), в котором хранятся массивы последовательностей ДНК из образцов рака человека. Последовательности классифицируются в базе данных как человеческие или нечеловеческие в зависимости от того, соответствуют ли они так называемому эталонному геному человека, хотя эта классификация, как известно, несовершенна.

   Авторы исследования в Nature сравнили "нечеловеческие" последовательности TCGA, а также последовательности нескольких десятков людей без рака и 100 людей с раком с базой данных ДНК бактерий, вирусов и других микроорганизмов. Это позволило выявить, что различные типы рака имеют специфическое сообщество микробов-резидентов. Обработка полученных данных с помощью алгоритмов машинного обучения позволила исследователям достоверно предсказать - иногда с точностью, приближающейся к 100%, - тип рака или его отсутствие по микробному составу образца.

   Эти корреляции, по мнению исследователей, могут быть использованы для разработки тестов, позволяющих выявлять раковые заболевания по образцу крови человека. (Многие другие группы разрабатывают анализы крови на рак, которые выявляют ДНК человека или белки, выделяемые опухолями). Группа Найта опубликовала подробные результаты на общедоступном сайте.

   Однако некоторые читатели заметили, что результаты исследования вызывают недоумение. Хотя в работе было обнаружено множество человеческих бактерий в раковых тканях, помимо загадочной бактерии из морских водорослей, там была обнаружена бактерия из морских гидротермальных источников, связанная с раком простаты, и коралловая бактерия, ассоциирующаяся с меланомой. В препринте, опубликованном в январе, ученые из Университета Восточной Англии высказали предположение, что это может свидетельствовать о проблемах в методологии исследования. В частности, они отметили, что присутствие неожиданных микроорганизмов в раковых тканях может быть результатом ошибок в базе данных, когда последовательности одного вида ошибочно принимаются за последовательности другого.

   Паркхилл объясняет, что человеческая ДНК часто случайно попадает в базы данных микроорганизмов, где она ошибочно указывается под названиями видов микроорганизмов. Это означает, что если исследователи не отфильтруют человеческую ДНК из данных секвенирования тканей человека перед сравнением с базой данных микроорганизмов, то они рискуют обнаружить организмы, которых на самом деле в ткани нет. Именно это, предлагаемое в первом препринте, и произошло в исследовании Nature.

   В 27-страничном ответе Найт и его коллеги оспаривают важность этих наблюдений, добавляя, что их работа в журнале Cell, в которой использовались обновленные методы, воспроизвела выводы, сделанные в статье Nature. Однако этот ответ не убедил Зальцберга, который сам разработал некоторые компьютерные технологии, использованные в статье Nature.

   В сотрудничестве с исследователями из Восточной Англии (которые сами подали патентную заявку на использование бактерий в качестве биомаркеров рака простаты) Зальцберг загрузил и повторно проанализировал часть данных, полученных в исследовании Nature. По словам Зальцберга, когда они включили дополнительные фильтры на человеческую ДНК - одного фильтра редко бывает достаточно, - их анализ показал, что миллионы последовательностей, которые авторы Nature приняли за микробные, на самом деле являются человеческими. Многие из микробов, выявленных в ходе исследования, утверждается в новом препринте, вообще не присутствовали в образцах рака TCGA.

   По словам Найта, точная идентичность последовательностей, обнаруженных в конкретных раковых опухолях, не меняет выводов его группы. Для диагностических целей, "если вы пытаетесь отличить ... случаи рака от контрольной группы или один рак от другого, гораздо важнее, что эти отличительные последовательности существуют, а не то, как вы их называете". Анализ "может быть уточнен с помощью новых методов и источников данных", - добавляет он, отмечая, что другие исследования - а также мини-анализ, проведенный им и его коллегами, - показывают, что микробные различия сохраняются даже при более строгом исключении человеческих последовательностей.

Спорные закономерности

   В новом препринте Зальцберга и его коллег также рассматривается впечатляющая способность компьютерных моделей, использованных в статье Nature, предсказывать тип рака на основе микробиома образца. Поскольку образцы тканей были получены из разных медицинских центров и в разное время, Найт и его коллеги использовали метод, называемый нормализацией, чтобы попытаться устранить некоторую вариабельность. Однако этот процесс оказался проблематичным, утверждается в новом препринте: он привносил отдельную электронную метку в данные по каждому типу рака. Это означало, что когда группа вводила нормализованные данные в свои алгоритмы, компьютер мог незаметно использовать метку, а не микробные данные, чтобы определить, от какого типа рака был получен образец.

   Найт утверждает, что его группа не согласна с анализом, приведенным в препринте, и подчеркивает, что в статье в Cell, где данные обрабатывались иначе, были сделаны те же выводы. Он добавляет, что у его группы нет "особой мотивации" прочесывать пространный анализ препринта или обсуждать его в социальных сетях, где он уже вызвал большой резонанс. "Если бы они опубликовали это в рецензируемом журнале, мы бы обратились к ним, ... что, на мой взгляд, является правильным способом ведения научной деятельности, как это было на протяжении последних нескольких столетий".

   В своем заявлении генеральный директор Micronoma Сандрин Миллер-Монтгомери отмечает, что разрабатываемые компанией продукты не опираются на статью в Nature. "Мы разработали дополнительные методы фильтрации и контроля качества, которые минимизировали контаминацию геномной ДНК человека, и обнаружили, что это не мешает диагностике наличия или типов рака", - заявила она. Для своего анализа крови на рак легких, самого продвинутого в разработке, Micronoma создала независимую и запатентованную базу данных микроорганизмов, основанную на сборке метагенома из нечеловеческих прочтений.

   Последствия для исследований других научных групп, использовавших данные Nature, пока не ясны. "Сейчас еще очень рано, и это довольно сложный вопрос", - комментирует Эйтан Руппин из Национального института рака, который использовал эти данные в своей работе, опубликованной в 2022 году. "Сейчас необходимо заслушать авторов оригинальной статьи в Nature, если они решат ответить, чтобы получить, возможно, более сбалансированную и объективную точку зрения на эту важную тему".

   Иван Вуйкович-Цвиджин, специалист по микробиомам из Медицинского центра Седарс-Синай, считает, что существует отсутствие стандартов в использовании машинного обучения в микробиомной науке. "Я думаю, что эти научные разногласия подчеркивают необходимость их разработки". Другие надеются, что развернувшаяся дискуссия поможет устранить все проблемы в оригинальной статье. "Как ученые, мы должны быть открыты для вызовов", - подчеркивает Паркхилл. "Мы должны быть способны объективно разобраться с ними и при необходимости исправить ситуацию. Надеюсь, что именно это и произойдет".

Источник:
Science, 2 Aug., 2023
Комментариев: 0
Узнайте о новостях и событиях микробиологии

Первыми получайте новости и информацию о событиях