КАРТОЧКА
ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер 22-25-20231
НазваниеМетодология создания эталонных наборов данных для интеллектуальных алгоритмов, направленных на автоматизированную диагностику кровоизлияний на компьютерной томографии головного мозга
РуководительКремнева Елена Игоревна, Доктор медицинских наук
Организация финансирования, регион Государственное бюджетное учреждение здравоохранения города Москвы «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы», г Москва
Период выполнения при поддержке РНФ | 2022 г. - 2023 г. |
Конкурс№65 - Конкурс 2022 года «Проведение фундаментальных научных исследований и поисковых научных исследований малыми отдельными научными группами» (региональный конкурс).
Область знания, основной код классификатора 05 - Фундаментальные исследования для медицины, 05-602 - Физические методы медицинской диагностики. Томография
Ключевые словаЛучевая диагностика, искусственный интеллект, компьютерная томография, внутричерепные кровоизлияния, черепно-мозговая травма, геморрагический инсульт, базы данных
Код ГРНТИ76.13.25
СтатусУспешно завершен
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Острые нарушения мозгового кровообращения (ОНМК) остаются второй по частоте причиной смерти взрослого населения как в мире, так и в России. В мировом масштабе инсульт уносит жизни 6,5 миллионов человек в год. По данным Федеральной службы государственной статистики РФ, в России за 2020 год инсульт был диагностирован у более чем 216 тысяч человек, около 60% из которых попали в ту или иную инвалидную группу, причем, треть из них находилась в трудоспособном возрасте. Причем геморрагический инсульт или геморрагическая трансформация ишемического инсульта увеличивают риск инвалидизации в три раза, а смертельного исхода – в полтора раза. В контексте высокой смертности выступают также травматические поражения мозга с развитием внутричерепного кровоизлияния, занимающее второе место по частоте встречаемости среди всех травм в Российской Федерации.
Доказанными факторами, которые предопределяют исход пациентов с внутричерепными кровоизлияниями, являются неотложная госпитализация больных в стационары с сосудистыми и хирургическими отделениями и безотлагательное проведение им при отсутствии противопоказаний и наличии показаний специализированного лечения (дренирование, удаление гематомы; при верификации ишемического инсульта в отсутствие признаков геморрагического пропитывания - системный тромболизис или механическая тромбэкстракция). Первым объективным, простым и быстрым диагностическим методом, который позволяет лечащему врачу принять решение о возможности проведения специализированной терапии и ее типе, является бесконтрастная компьютерная томография (КТ) головы.
Маршрутизация пациентов данного профиля регламентируется Приказом Минздрава РФ от 15 ноября 2012 года №928н и Приказом ДЗМ от 10 февраля 2017 года №79.
В стационарах Москвы ежемесячно проводится около 2500 КТ головы (в 2020 году 54 885 компьютерных томографий), диагностируется более 300 кровоизлияний. По данным литературы, врачи-рентгенологи разного уровня могут пропускать небольшие кровоизлияния, особенно субарахноидальной локализации, а также небольшие зоны ушибов, расположенные близко к костям черепа или мелкие субдуральные гематомы, что влечет дополнительные риски негативных исходов. И наоборот, возможна ложноположительная диагностика субарахноидальных или субдуральных гематом, за которые принимаются артефакты от костей черепа. Автоматизация диагностики ОНМК и травматических кровоизлияний с помощью сервисов, работающих на основе алгоритмов искусственного интеллекта, включая автоматическое определение объема кровоизлияний, может ускорить процесс постановки диагноза и сделать его более точным, что обеспечит пациента необходимой помощью в кратчайшие сроки и снизит вероятность неблагоприятных исходов.
По этой причине качеству работы подобных сервисов необходимо уделять особое внимание. В первую очередь оно зависит от качества данных, на которых алгоритм искусственного интеллекта обучается, данных, которые предназначены для его тестирования и ввода в эксплуатацию, а также специфики технического оснащения городской системы здравоохранения. На данный момент методологии создания датасетов для дообучения и тестирования интеллектуальных алгоритмов, направленных на анализ диагностических изображений различного типа, только разрабатываются. И пока не существует научного обоснования важности включения в обучающие и тестировочные базы данных тех или иных клинических и технических параметров (например, типа кровоизлияний, их количества, сочетанности с другими патологиями, а также параметров сканирования и силы тока рентгеновской трубки, реконструкции изображений и других), которые бы в конечном итоге могли повлиять на результат работы интеллектуальных алгоритмов.
Поэтому цель нашей работы – разработать методологию создания баз данных для дообучения и тестирования интеллектуальных алгоритмов, направленных на диагностику интракраниальных кровоизлияний на компьютерной томографии головного мозга, с оптимальным набором характеристик и параметров, достаточных для корректной проверки качества работы интеллектуальных систем и их доработки.
Ожидаемые результаты
В рамках данной работы будет сформулирована методология формирования баз данных медицинских изображений, содержащих компьютерные томограммы головного мозга с признаками кровоизлияния, для наиболее эффективного тестирования и дообучения интеллектуальных алгоритмов. Впоследствии данный подход можно будет использовать для создания баз данных с медицинскими компьютерно-томографическими изображениями головного мозга, на которых присутствуют иные патологии.
Будет разработан модуль анализа компьютерной томографии головного с признаками внутричерепных кровоизлияний для программы предварительной разметки текстовых протоколов Medlabel, предназначенной для упрощения набора исследований с отсутствием и присутствием целевой патологии. С применением этой программы будет сформирована база данных из более чем 500 ретроспективно полученных анонимизированных изображений КТ головного мозга с признаками внутричерепных кровоизлияний и без признаков кровоизлияний (но с иными патологиями, либо норма), а также с дополнительными клиническими данными, включающими: возраст, пол, тип кровоизлияния, число кровоизлияний, прорыв в ликворные пространства, осложнения в виде переломов черепа или сочетанной патологии. Кроме того, в базе данных будут учитываться технические особенности томографа, в частности толщины сканирования и реконструкции, размер матрицы (DFOV), вольтаж (kVp), сила тока (mA), использованные фильтры реконструкции и фирмы-производители томографов.
С помощью статистических методов будет оценено влияние этих дополнительных клинических и технических характеристик на точность работы интеллектуальных алгоритмов, и будут сформулированы выводы о необходимости внесения их в тестировочные и дообучающие базы данных.
Разработанный научно обоснованный подход к созданию подобных баз данных и учет дополнительных параметров, которые могут оказывать влияние на точность интеллектуальных алгоритмов для анализа медицинских изображений, позволит повысить эффективность работы программного обеспечения на основе этих алгоритмов. Все это будет способствовать внедрению систем принятия врачебных решений в повседневную практику оказания медицинской помощи и обеспечит реализацию пациентоориентированного подхода, который позволит ослабить “бремя кровоизлияний” и снизить затраты государства на длительную госпитализацию, а также на обеспечение пациентов, потерявших трудоспособность вследствие неблагоприятного исхода кровоизлияний, пожизненной поддержкой.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Аннотация результатов, полученных в 2022 году
Проанализированы литературные данные (59 источников) относительно методологии формирования обучающих и тестировочных наборов данных для интеллектуальных систем, применяемых для анализа медицинских изображений.
Несмотря на наличие в литературе большого количества работ с описанием процессов обучения и/или апробации рентгенологических сервисов с использованием искусственного интеллекта, далеко не все авторы описывают процесс сбора и оформления наборов данных достаточно подробно. Но и в тех работах, где методология представлена в довольно подробной форме, были обнаружены большие различия в подходах. Отчасти это объясняется вариациями в постановке клинических задач, которые для диагностических интеллектуальных систем могут разниться.
Во-первых, разнятся подходы к анонимизации, и не всегда берется в отчет часть персональных данных, которая может быть закодирована непосредственно в пикселях изображений. Для их удаления создан тэг с «прожигаемыми» персональными данными, но он не всегда заполняется, и данные могут оставаться. Удаление приватной информации, внедренной в изображение, опирается на методы оптического распознавания текста (Optical character recognition, OCR).
Мы исследовали вспомогательные изображения компьютерной томографии «Dose report» («Дозовый отчет») на устройствах Toshiba, наиболее распространенных в медицинских учреждениях России. Данные типы изображений генерируются программно-аппаратным комплексом на основе первичных данных о пациенте и хранят набор тэгов, общий для всего исследования в модальности КТ (DICOM тэги). Перед нами встала задача выделить на этих изображениях области, где есть текст с персональными данными. Для этого мы разработали свой подход обнаружения областей текста с приватными данными на реальных медицинских диагностических изображениях при помощи метрики модифицированного расстояния Левенштейна.
Во-вторых, при изучении подходов к созданию наборов данных КТ исследований в области нейровизуализации, а именно - с признаками внутричерепного кровоизлияния (ВЧК), мы столкнулись с проблемой подбора соответствующих ключевых слов для более быстрого обнаружения протоколов КТ-исследований с искомыми патологическими признаками. Например, присутствие в протоколе описания таких на первый взгляд логичных ключевых слов, как «гематома», «геморрагия» или «кровоизлияние» не всегда означало наличие в исследовании признаков целевой патологии, так как зачастую эти слова используются врачами-рентгенологами для обозначения обратного (например, фраза «признаков кровоизлияния не выявлено»). По этой причине при дальнейшем отборе большее внимание уделялось более специфичным терминам («эпидуральный», «субдуральный», «субарахноидальный», «паренхиматозный»), которые объединялись в поиске вместе с более общими «геморрагия» или «кровоизлияние» в ключевые конструкции.
Эту проблему решает применение алгоритмов для автоматизированного анализа текстовых медицинских протоколов, который был нами разработан. Для его обучения и тестирования потребовалось создание набора текстовых протоколов диагностических описаний КТ исследований головного мозга. Мы сделали выгрузку 34 188 протоколов с подобными описаниями из Единого радиологического информационного сервиса Единой медицинской информационно-аналитической системы (ЕРИС ЕМИАС) Департамента здравоохранения Москвы.
В итоге был составлен набор текстовых описаний диагностических исследований, содержащий 500 описаний без патологии и 500 описаний с наличием ВЧК.
Анализ данных, а также их предварительная обработка осуществлялись с использованием NLTK (Natural Language Toolkit, version 3.6.5.) – библиотеки для символьной и статистической обработки естественного языка, и Scikitlearn – библиотеки для машинного обучения, содержащей инструменты для задач классификации. Используемые библиотеки, а также последующий алгоритм написаны на языке программирования Python (версия 3.9.7). В качестве модели, с помощью которой решалась задача бинарной классификации, был первично выбран алгоритм решающего дерева как наиболее подходящий для задач бинарной классификации. Дерево решений (DecisionTreeClassifier) является одним из методов классификации в машинном обучении с помощью библиотеки scikit-learn. Максимальная глубина дерева решений была подобрана эмпирически и составила 15 уровней. Оценка качества работы алгоритма проводилась при помощи функции classification_report.
По результатам тестирования чувствительность обученного алгоритма при бинарной классификации исследований «с признаками ВЧК» и «без признаков ВЧК» составила 0.94 (95% ДИ 0.942-0.939), специфичность – 0.88 (95% ДИ 0.841-0.919). Положительная прогностическая значимость составила 0.96, что означает, что с вероятностью 96% выбранное алгоритмом КТ исследование с меткой «патология» будет иметь признаки таковой. В свою очередь отрицательная прогностическая значимость оказалась равна 0.81, что говорит о том, что с вероятностью 81% алгоритм даст верный ответ насчет отсутствия признаков патологии в тексте, где она действительно не описана. F-мера, представляющая собой гармоническое среднее полноты и точности алгоритма, при этом составила 0,83.
Кроме того, дополнительно мы разработали инструмент обнаружения областей текста с приватными данными на реальных медицинских диагностических изображениях при помощи метрики модифицированного расстояния Левенштейна. Для этого инструмента определена точность локализации областей с личными данными на наборе из 1131 медицинских изображений по сравнению с экспертной разметкой, которая составляет 99.86%.
Публикации
1. Новик В.П., Кульберг Н.С., Арзамасов К.М., Четвериков С.Ф., Хоружая А.Н., Козлов Д.В., Кремнева Е.И. Распознавание областей текста с персональными данными на диагностических изображениях Медицинская Визуализация, 2023; 27 (4): 150–158 (год публикации - 2023) https://doi.org/10.24835/1607-0763-1263
2. Хоружая А.Н., Козлов Д.В., Арзамасов К.М., Кремнева Е.И. Анализ текстов описаний КТ-исследований головного мозга с признаками внутричерепных кровоизлияний с помощью алгоритма дерева решений Современные технологии в медицине, 2022, том 14, номер 6, стр. 34 (год публикации - 2022) https://doi.org/10.17691/stm2022.14.6.04
3. Козлов Д.В., Хоружая А.Н., Кремнева Е.И. Программа для отбора целевых исследований по текстовым протоколам описаний -, 2022681196 (год публикации - )
4. Хоружая А.Н., Козлов Д.В., Кремнева Е.И. MosMedData: набор текстовых протоколов описаний компьютерных томограмм головного мозга с наличием и отсутствием признаков внутричерепного кровоизлияния -, 2022622757 (год публикации - )
Аннотация результатов, полученных в 2023 году
Обработка естественного языка (Natural Language Processing, NLP) включает в себя различные методы анализа текста для компьютерного использования. Одним из таких методов является глубокое обучение, которое использует искусственные нейронные сети для анализа данных. В области обработки медицинских текстов ансамбли алгоритмов машинного обучения, объединяющие лучшие качества различных моделей, демонстрируют более высокую точность в сравнении с одиночными алгоритмами для задач анализа медицинской информации. Кроме того, используются и модели-трансформеры BERT (Bidirectional Encoder Representations from Transformers). Предварительно обучаясь на больших объемах данных, они позволяют достичь высокой точности в задачах обработки естественного языка, даже на низкоструктурированных текстах, которые преобладают в протоколах описаний компьютерных томограмм головного мозга (КТ ГМ). В задаче бинарной классификации протоколов КТ ГМ при внутричерепных кровоизлияниях (ВЧК) было решено использовать ансамбли алгоритмов, таких как случайный лес или градиентный бустинг, для повышения сложности классификатора и улучшения качества работы моделей. Для векторизации текста были использованы методы Bag of words, TF-IDF и Word2vec. Применение этих методов было оценено и проверено статистически.
Были собраны два набора данных текстовых протоколов заключений КТ ГМ для обучения и тестирования алгоритмов машинного обучения в задаче анализа текстов описаний на предмет наличия внутричерепных кровоизлияний. Набор данных 1 содержал 3980 текстовых протоколов, разделенных на два класса - с описанием внутричерепных кровоизлияний и без них. Семь выбранных алгоритмов машинного обучения в рамках второго года реализации проекта были обучены и протестированы на текстах, обработанных с использованием различных методов векторизации. В результате были выявлены самые эффективные алгоритмы с наиболее высокими метриками: CatBoost, логистическая регрессия и k-nearest neighbours, из которых методом стекинга создан ансамбль. Он продемонстрировал достаточно высокие результаты по чувствительности (0,93) и специфичности (0,9). Но поскольку показатель специфичности не достиг целевых значений (не менее 0,93), следует сделать вывод о том, что нельзя полностью отказаться от ручного пересмотра и контроля качества работы ансамбля.
Для дальнейшего улучшения анализа текстов была использована предварительно обученная на корпусе русских медицинских текстов модель BERT MedRuBertTiny2. Также был создан новый набор данных – набор данных 2, который содержал больше текстов (9393) и был использован для дообучения как ансамбля алгоритмов, так и модели BERT. Показатели чувствительности и специфичности ансамбля алгоритмов достоверно не улучшились по сравнению с показателями до дообучения, а вот модель BERT показала значимо более высокие показатели относительно чувствительности (0.97), при этом специфичность значимо не отличалась (0.9).
В итоге для создания эффективного инструмента анализа текстовых протоколов было принято решение использовать комбинацию из ансамбля алгоритмов машинного обучения и модели BERT. Ансамбль применяется для бинарной классификации, а модель BERT - для глубокого семантического анализа текста и поиска специфических признаков. Данный подход был реализован в модуле анализа описаний КТ головного мозга для программы Medlabel.
С помощью данного модуля проведен анализ выгрузки КТ исследований головного мозга из Единого радиологического информационного сервиса Единой медико-информационной аналитической системы Москвы (ЕРИС ЕМИАС) за период с 2017 по 2023 год. Изначально было отобрано 14 334 протокола описания, которые были проанализированы двумя рентгенологами с опытом работы от 3 лет и более. В результате была создана база данных с 10 125 верифицированными текстовыми протоколами диагностических заключений КТ головного мозга, содержащими информацию о внутричерепных кровоизлияниях различного генеза и их характеристиках, а также описаниях головного мозга без кровоизлияний. В базе данных также имеется разметка 1504 случаев по типу внутричерепного кровоизлияния, а также случаи с различной патологией, сочетающейся с кровоизлиянием, фактом хирургического вмешательства или наличия переломов костей черепа.
Затем из этой базы данных было отобрано, верифицировано и выгружено в формате DICOM 400 КТ исследований с признаками внутричерепного кровоизлияния и 400 исследований без таковых. Верификация проводилась методом экспертной оценки двумя экспертами в нейрорентгенологии, при разногласиях привлекался эксперт с опытом работы в данной области более 15 лет. В конечный набор данных вошли 338 женщин и 459 мужчин, 3 без тэга по полу, анонимизация данных была осуществлена путем удаления персональной информации и замены идентификатора исследования.
В результате реализации Проекта была сформулирована Методология создания эталонных наборов данных для ИИ, направленных на поиск внутричерепных кровоизлияний при КТ ГМ, включающая в себя первичный отбор исследований по ключевым словам в описании ( наиболее эффективен с помощью нейронных сетей), включение широкого спектра информации в набор данных (изображения, описание, заключение, сведения о томографе, протокол сканирования, дополнительную киническую информацию (локализация ВЧК, сопутствующие переломы костей черепа, результаты анализов и пр.), возможность применения как полного набора данных, так и его части/частей в различной сочетании, а также важность периодического мониторинга работы ИИ для выявления и оценки технологических и клинических дефектов с последующим улучшением качества работы алгоритма. Также был подготовлен итоговый набор данных, который составили 800 КТ исследований в формате DICOM и маркированной таблицы. В нем содержится информация о типах кровоизлияний, наличии сочетанной патологии, переломах костей черепа, фактах прорыва в ликворные пространства, технических характеристиках КТ-исследований и текстовых заключениях радиологов. База данных предназначена для обучения систем автоматического анализа КТ головного мозга и определения наличия или отсутствия внутричерепных кровоизлияний, а также оценки их типа и характеристик.
Публикации
1. Анна Хоружая, Татьяна Бобровская, Дмитрий Козлов, Дмитрий Кулиговский, Владимир Новик, Кирилл Арзамасов, Елена Кремнева Expanded Brain CT Dataset for the Development of AI Systems for Intracranial Hemorrhage Detection and Classification Data, 9(2):30 (год публикации - 2024) https://doi.org/10.3390/data9020030
2. Зинченко В.В., Арзамасов К.М., Кремнева Е.И., Владзимирский А.В., Васильев Ю.А. Технологические дефекты программного обеспечения с искусственным интеллектом Digital Diagnostics, Т. 4, № 4 С. ХХ–ХХ, CC BY-NC-ND 4.0 International (год публикации - 2023) https://doi.org/10.17816/DD501759
3. Кремнева Е.И., Сморчкова А.К., Хоружая А.Н., Семенов Д.С., Мальцев А.В., Шарова Д.Е., Зинченко В.В., Владзимирский А.В. Особенности формирования наборов данных для сервисов с искусственным интеллектом в нейровизуализации на примере создания набора данных с КТ-изображениями головного мозга с признаками кровоизлияния Врач и информационные технологии, - (год публикации - 2023)
4. Хоружая А.Н., Козлов Д.В., Арзамасов К.М., Кремнева Е.И. Сравнение ансамбля алгоритмов машинного обучения и BERT для анализа текстовых описаний КТ головного мозга на предмет наличия внутричерепных кровоизлияний Современные технологии в медицине, - (год публикации - 2024)
5. Хоружая А.Н., Козлов Д.В., Кремнева Е.И, Новик В.П., Арзамасов К.М. MosMedData: расширенный набор компьютерных томограмм головного мозга с наличием и отсутствием признаков внутричерепного кровоизлияния (дополненный клиническими и техническими параметрами) -, 2023624126 (год публикации - )
6. Хоружая А.Н., Козлов Д.В., Кремнева Е.И., Артюкова З. Р., Сморчкова А.К., Панкратов А.В., Шихмурадов Д.У. MosMedData: расширенный набор 10 000 текстовых протоколов описаний компьютерных томограмм головного мозга с наличием и отсутствием признаков внутричерепного кровоизлияния -, 2023623804 (год публикации - )
Возможность практического использования результатов
Продукты, полученные в ходе реализации проекта (наборы данных и автоматический модуль анализа текстовых описаний КТ головного мозга), могут напрямую использоваться как для создания эталонных наборов данных по другим клиническим направлениям, так и для обучения, тестирования и дообучения программного обеспечения на основе искусственного интеллекта, которое предназначено для анализа КТ головного мозга на предмет кровоизлияний. Сформулированная методология создания подобных наборов данных универсальна – она подходит не только под рассмотренную клиническую ситуацию, но и реализуема в иных клинических направлениях (подготовка наборов данных КТ органов грудной клетки, брюшной полости и пр). Она поможет стандартизировать процесс создания наборов данных и облегчить его. Также мы обосновали важность включения в обучающие и тестировочные наборы данных тех или иных клинических и технических параметров, которые в конечном итоге влияют на результат работы
интеллектуальных алгоритмов и которые необходимо учитывать при их разработке. Это позволит повысить эффективность работы диагностического ИИ, его клиническую пользу и будет способствовать более масштабному внедрению данных технологий в здравоохранение РФ.