Масленников Е.М., Евдокимова М.А., Затейщиков Д.А., Носиков В.В., Сулимов В.Б. Прогностическая модель на основе байесовской сети: факторы, определяющие риск развития неблагоприятного исхода у больных, перенесших инфаркт миокарда или нестабильную стенокардию // Российский Национальный Конгресс Кардиологов "Интеграция Знаний в Кардиологии", Москва, 3-5 октября 2012 г., устный доклад
В настоящей работе обсуждается возможность использования аппарата байесовских сетей (БС) в системах персонифицированной медицины и, в частности, для предсказания у пациентов риска повторного возникновения ОКС. Предлагается алгоритм оптимизации БС по числу узлов для наивной топологии, в которой каждый узел (параметр пациента) напрямую связан с узлом, представляющим предсказываемое событие. Такая оптимизация позволяет выявить наиболее значимые переменные с учетом полноты и состава имеющейся базы данных (БД) по пациентам. Разработана программа, реализующая данный алгоритм. Программа может выполняться параллельно на нескольких вычислительных ядрах, и в ходе исследований была показана высокая эффективность такого распараллеливания. В работе использовалась база данных, содержащая большой объем разнородной информации о приблизительно 1100 пациентах, в том числе их физические характеристики (рост, вес), генетические предрасположенности, наличие наследственных заболеваний, вредных привычек, информацию об их родственниках. При обработке базы данных использовались только те переменные, количество заполненных данных в которых превышало 40%. Полученная на ее основе наивная БС содержала 204 переменные (не считая целевой переменной предсказания - риска повторного возникновения ОКС). Исследования проводились для предсказаний повторного возникновения ОКС в течение полугода и полутора лет. С помощью разработанной программы существенно повышено качество предсказания сетей: величина AUC (числовая характеристика качества предсказания сети) выросла с 0.6080 (для исходной большой БС) до 0.8031 для оптимизированной БС при предсказании повторного возникновения ОКС в течение полугода, и с 0.6479 до 0.7614 - в течение полутора лет. Число переменных в сетях в результате оптимизации снизилось до 48 и 54 для полугода и полутора лет соответственно. Причина столь заметного улучшения предсказательной способности сети после оптимизации связана, по-видимому, со значительным случайным разбросом параметров пациентов (с шумом) в используемой базе данных. Для выяснения наиболее значимых факторов, определяющих риск повторного возникновения ОКС, из обеих сетей (после оптимизации) были убраны все переменные, кроме тех, исключение которых снижает AUC более чем на 0.003. В результате число переменных в сетях снизилось до 17 и 16 для полугода и полутора лет соответственно. По результатам сравнения оставшихся переменных в обеих сетях было показано, что наиболее значимым фактором, определяющим риск повторного возникновения ОКС, является генетический полиморфизм фактора некроза опухоли альфа. Также значимым фактором является: (параметр "инфарктмиокарда_безпропуска", можете описать что означает данный параметр). Полученные результаты показывают перспективность применения БС в качестве предсказательного инструмента персонифицированной медицины, позволяющего, в том числе, выявлять наиболее значимые факторы, влияющие на исход конкретного заболевания. Показана важная роль оптимизации сети, а характеристики разработанной программы позволяют применять представленную методику для анализа больших баз данных пациентов и проводить вычисления на суперкомпьютерах.
Ключевые слова:
Персонифицированная медицина, предсказания, острый коронарный синдром, байесовские сети
|