Прогнозирование угроз биологического характера с помощью Loginom. Кейс РосНИПЧИ «Микроб»

12 декабря 2022
0 комментариев

Практика использования аналитической low-code платформы Loginom для анализа больших медицинских данных с целью прогнозирования угроз развития эпидемий смертельно опасных заболеваний.

РосНИПЧИ «Микроб» — научно-исследовательский институт, созданный с целью снижения заболеваемости населения опасными инфекционными болезнями и предотвращения развития эпидемий. Ключевая сфера интересов — изучение таких заболеваний как чума, холера, клещевой вирусный энцефалит и другие зоонозные инфекции.

Основные направления деятельности РосНИПЧИ «Микроб»:

  1. Диагностика, профилактика и лечение особо опасных инфекционных (ООИ) болезней, эпидемиологический надзор.
  2. Разработка биомедицинских аспектов ООИ: микробиология, иммунопатогенез, способы лабораторной диагностики.
  3. Биологическая безопасность и противодействие биотерроризму.

Ситуация до старта проекта

Современная научно-прикладная деятельность в сфере эпидемиологии неразрывно связана с обработкой больших наборов статистической информации. В этой области медицины все большее значение приобретает data driven подход — принятие решений, основанное на анализе данных.

Для успешной реализации data driven подхода необходим инструмент, который позволяет:

  1. Извлекать, хранить, интерпретировать и визуализировать данные.
  2. Очищать исходные данные с целью повышения их качества.
  3. Анализировать данные, строить модели, оперативно тестировать научные гипотезы.

Проблема

Проблемой №1 в сфере анализа эпидемиологической информации является централизованный сбор данных достаточного объема для тестирования гипотез.

Проблемой №2 является организация хранения и очистка данных, придание им надлежащего качества для построения информативных прогнозов.

Структура трудозатрат при проведении анализа данных

Как видно из диаграммы, 80% времени научного работника занимает сбор, организация и очистка данных.

Для решения проблемы сбора первичной эпидемиологической информации в РосНИПЧИ «Микроб» было разработано мобильное приложение «ЭпиТрекер», которое осуществляет онлайн мониторинг природных очагов опасных инфекционных болезней.

Исследователь в полевых условиях вносит собранные данные в приложение, а дата, время и координаты очага фиксируются автоматически. Система позволяет отмечать штрих-кодом каждую единицу материала, благодаря чему лаборатория заранее видит доставляемые образцы. Электронная карта в приложении показывает состояние природного очага в режиме реального времени. «ЭпиТрекер» предназначен для работы без использования сети интернет, в полевых условиях.

Решение

Для решения проблемы очистки и повышения качества эпидемиологических данных «Микроб» использует аналитическую low-code платформу Loginom. С ее помощью осуществляется извлечение и консолидация данных из распределенных источников: файлы, базы, хранилища. Производится очистка, предобработка, связывание и систематизация данных. Реализуются сложные расчеты, строятся модели прогнозирования, в том числе, с помощью машинного обучения.

Например, в Loginom была разработана модель прогноза клещевого вирусного энцефалита на основе анализа данных, накопленных в период с 1956 по 2019 годы. Прогнозирование осуществлялось с помощью ARIMA — модели авторегрессии скользящего среднего, которая применяется для построения прогнозов величины на основании исторических данных. Коэффициент детерминации, который определяет, насколько модель регрессии соответствует данным на которых она построена, составил 0.94. Сотрудниками РосНИПЧИ «Микроб» также был составлен ретро-прогноз клещевого вирусного энцефалита, который отразил динамику заболевания до 1956 года.

В Loginom также была разработана аналогичная модель прогноза для такого заболевания, как лихорадка Западного Нила.

Еще один кейс использования Loginom в РосНИПЧИ «Микроб» — вычисление индикаторов заболеваемости, в частности Сovid-19, на популяционном уровне. Для этого в качестве исходной информации используются постоянно обновляющиеся большие данные из открытых источников, например:

  • по социальной активности (ежедневный индекс самоизоляции Яндекс);
  • траты населения по видам медицинских товаров и услуг (статистика СБЕРА);
  • отслеживание симптомов болезней (приложение ZOE Health Study);
  • мониторинг клинических показателей.

Анализ открытых данных в Loginom позволил создать промежуточные синтетические прогнозы для раннего обнаружения вспышек заболеваемости Covid-19.

Результаты

В качестве преимуществ Loginom как решения для анализа научных данных специалисты РосНИПЧИ «Микроб» выделяют следующее:

  1. Low-code архитектуру — позволяет минимально использовать написание кода при проектировании сценариев анализа, что крайне важно для сотрудников с медицинским, а не ИТ-образованием.
  2. Визуальный конструктор — дает возможность применять более 60-и готовых компонентов обработки данных, а не «изобретать велосипед».
  3. Интеграцию c различными источниками — предоставляет возможность быстро консолидировать разрозненные научные данные.
  4. Повторное использование наработок — позволяет многократно применять единожды настроенные сценарии на обновленных либо абсолютно новых данных.
  5. Обработку больших наборов данных — предоставляет возможность оперативно проводить вычисления над статистическими данными в миллионы строк, что недоступно в Excel.
  6. Наличие методов углубленного анализа данных — позволяет научным сотрудникам применять в сценариях алгоритмы машинного обучения без необходимости осваивать программирование.
  7. Высокую скорость работы — дает возможность обрабатывать данные почти в режиме real-time, что важно для оперативного прогнозирования заболеваемости.

Подробнее о прогнозировании угроз биологического характера с помощью Loginom в выступлении Валентина Сафронова, кандидата медицинских наук, ведущего научного сотрудника РосНИПЧИ «Микроб» на конференции объединенных Съездов к 100-летию Госсанэпидслужбы:

Если вы хотите применять аналитическую low-code платформу Loginom для обработки и анализа больших массивов научных данных, свяжитесь с нами.

Другие материалы по теме:

Нейросетевые технологии обработки больших геологических данных. Кейс компании Норильскгеология

Low-code съедает рынок разработки

#loginom#low-code#data driven#Big Data#прогнозирование#кейс#клиенты

Смотрите также