Обширная база данных КОВИД, финансируемая Гуглом, будет отслеживать варианты и иммунитет

Авторы/авторы:
Обширная база данных КОВИД, финансируемая Гуглом, будет отслеживать варианты и иммунитет
На веб-сайте Global.health есть визуализация данных, например эта карта, которая показывает распределение заболеваемости КОВИД-19. Пользователи могут нажать на кнопку "вариант", чтобы увидеть, где именно эти варианты были обнаружены. Темно-синий цвет указывает на большее количество случаев, светло-голубой - на меньшее. Фото: Global.health
27 февраля 2021
91
0

Открытый репозиторий предоставит свободный доступ к более чем 160 миллионам данных с подробной информацией об отдельных инфекциях.

   Огромная международная база данных, появившаяся на днях, поможет эпидемиологам ответить на такие насущные вопросы о коронавирусе SARS-CoV-2, как скорость распространения новых вариантов среди людей, защищают ли от них вакцины и как долго длится иммунитет к КОВИД-19.

   В отличие от глобального "дисплея" COVID-19, который создан Университетом Джона Хопкинса в Балтиморе и других популярных трекеров, которые фиксируют общее количество инфекций и смертей, связанных с COVID-19, в новом репозитории научных данных под названием Global.health собрано беспрецедентное количество анонимизированной информации об индивидуальных случаях заболевания. Для каждого человека база данных включает до 40 взаимосвязанных переменных, таких как дата первого появления симптомов КОВИД-19, дата получения положительного результата теста, история перемещений и других.

   Индивидуальные данные, подобные этим, дают подсказки, необходимые эпидемиологам для определения того, как распространяются инфекции, говорит Кейтлин Риверс, эпидемиолог Университета Джона Хопкинса, которая участвует в проекте. "Когда мы начинаем понимать серьезность вспышки, часто бывает уже слишком поздно", - говорит она. "Данные могут закрыть этот пробел и сделать процесс более быстрым".

   Исследователи надеются, что база данных поможет им отслеживать варианты коронавирусов и вакцинации в ближайшие месяцы, а также предоставит модель отслеживания данных в режиме реального времени при будущих эпидемиях.

Репозиторий был создан 21 исследователем в 7 академических институтах США и Европы при технической и финансовой поддержке Google и Фонда Рокфеллера. К настоящему времени группа собрала информацию о 24 миллионах случаев заболевания в 150 странах.

   Риверс добавляет, что такая база данных была бы полезна на ранней стадии пандемии SARS-CoV-2. Эпидемиологи, возможно, смогли бы изучить, как коронавирус распространялся от человека к человеку в Китае еще до того, как ВОЗ взяла его под контроль 23 января прошлого года, что помогло бы быстрее обуздать пандемию.

   Некоторые ученые утверждают, что появление всеобъемлющего, международного и общедоступного хранилища послужит толчком для исследований по нескольким направлениям. "Ничего подобного не существовало до сих пор, потому что это невероятно трудно сделать", - говорит Роберт Гарри, вирусолог из Университета Тулейна в Новом Орлеане, Луизиана.

Коллективные усилия

   Всякий раз, когда происходит вспышка, эпидемиологи собирают и систематизируют кусочки информации, взятой из газетных статей и медицинских учреждений, в самодельные электронные таблицы. Подробные сведения о симптомах человека, его возрасте, способах инфицирования и т.д. помогают исследователям определить причину заболевания, оценить его контагиозность и уровень летальности.

   К середине января 2020 года эпидемиологи делали это для SARS-CoV-2, но не пришли к единому мнению по поводу результатов. Сэм Скарпино, эпидемиолог, возглавляющий лабораторию Emergent Epidemics Lab в Северо-Восточном университете в Бостоне, штат Массачусетс, написал в твиттере, что имеющиеся данные не подтверждают устойчивую передачу вируса от человека к человеку. И он помнит, как Риверс ответила ему прямым сообщением: "Она сказала: "Чувак, я думаю, ты ошибаешься."

   Данные все еще были неясными. Но другой эпидемиолог, Мориц Кремер из Оксфордского университета, создал и поделился с сообществом собственной электронной таблицей. Скарпино проанализировал цифры и признал, что Риверс права.

   Вскоре десятки эпидемиологов добавили в эту таблицу информацию о случаях заболевания по всему миру. В то же время они анализировали ее. Например, Адам Кухарский, эпидемиолог Лондонской школы гигиены и тропической медицины, и его коллеги использовали данные для подсчета того, что в январе в Ухане (Китай) было примерно в десять раз больше людей с симптомами COVID-19, чем было подтверждено официальными представителями здравоохранения, что частично основывалось на количестве людей, выезжавших за пределы страны и имевших подтвержденную инфекцию.

   После примерно 100 000 случаев первоначальная электронная таблица была перегружена. В апреле команда получила помощь инженеров и разработчиков Google. Вместе они написали компьютерные коды, которые автоматически загружали ежедневные данные о коронавирусах от примерно 60 правительств в стандартизированном формате. Коды удаляли дубликаты записей и был создан алгоритм объединения информации, добавляемой со всего мира, в единый облачный репозиторий.

Приоритет конфиденциальности

   Любой желающий может зарегистрироваться для получения доступа к анонимным данным объемом до 8 гигабайт в последней версии базы данных Global.health. Половина из 24 миллионов собранных случаев имеют данные по дюжине переменных, и около 10% имеют больше, говорит Скарпино. На данный момент визуализация данных на сайте ограничивается картами, на которых отображены данные, собранные коллективом. 

   Скарпино отмечает, что инфографика не была в центре внимания, потому что приоритетом была стандартизация сбора данных и вопросы конфиденциальности. Архитекторы проекта проконсультировались со специалистами по правовым и этическим вопросам о том, как безопасно обращаться и обмениваться анонимными данными об отдельных лицах, которые часто находятся под пристальным вниманием государственных учреждений, университетов и больниц.

   Жюльен Риу, эпидемиолог из Бернского университета в Швейцарии, с нетерпением ждет изучения базы данных. Пока он основывает большую часть своей работы по COVID-19 на данных швейцарской когорты, но он говорит, что обширная международная база данных могла бы дать лучшие ответы на фундаментальные вопросы, такие как истинный уровень инфицирования в странах по всему миру. "Больше данных означает, что мы можем приблизиться к истине", - говорит он. Другие исследователи согласны с этим, добавляя, что информация о вакцинировании человека или о том, инфицирован ли он коронавирусным вариантом, могла бы помочь ответить на насущные научные вопросы об иммунитете в ближайшие месяцы.

   Кухарский приветствует финансирование проекта. "Многие из таких баз данных являются краудсорсинговыми, но если полагаться только на волонтеров, то зачастую это не является надежным", - говорит он.
   Скарпино надеется, что в конечном итоге база данных COVID-19 будет расширена на адаптируемую платформу для изучения других заболеваний - особенно следующей зарождающейся эпидемии.

Источник:
NATURE, 24 FEBRUARY 2021
Комментариев: 0
Узнайте о новостях и событиях микробиологии

Первыми получайте новости и информацию о событиях