Новости

25 декабря, 2020 21:04

Базу русскоязычных твитов предложили использовать для анализа побочных эффектов лекарств

Источник: ТАСС
Российские ученые составили базу русскоязычных твитов с упоминанием побочных действий лекарств для участия в международных соревнованиях SMM4H Shared Task 2020. Благодаря полученных данным можно будет анализировать побочные эффекты от приема лекарственных препаратов и другую важную для медицины информацию, пишет пресс-служба Российского научного фонда.
Фото взято из открытых источников
Организаторы соревнования, представляющие Казанский федеральный университет (слева направо): Зульфат Мифтахутдинов, Елена Тутубалина (руководитель проекта) и Ильсеяр Алимова
3 / 4
Фото взято из открытых источников
Организаторы соревнования, представляющие Казанский федеральный университет (слева направо): Зульфат Мифтахутдинов, Елена Тутубалина (руководитель проекта) и Ильсеяр Алимова

Огромный объем текстовых данных в соцсетях можно использовать в разных сферах, в том числе и в здравоохранении. Через интернет люди могут обмениваться мнениями и получают почти неограниченный доступ к информации о фармацевтическом рынке и сведениях медицинской направленности. Кроме того, клинические испытания не всегда позволяют обнаружить полный перечень побочных эффектов, например, в случае длительного приема препарата или у определенной группы пациентов, не участвовавшую в клинических испытаниях.

Решать эти проблемы ученые предлагают с помощью интеллектуального анализа отзывов пользователей о лечении. Чтобы облегчить и ускорить разработку автоматических методов сбора, извлечения, представления и анализа данных социальных сетей по теме здоровья научная группа из Пенсильванского университета запустила инициативу #SMM4H. В этом году она проводилась в пятый раз и первый раз включала в себя данные на русском языке.

Ученые из Казанского федерального университета и Пенсильванского университета в этом году провели открытое соревнование по выявлению упоминаний о побочных эффектах от приема лекарств из текстов твитов на русском языке. Для этого были подобраны 9,5 тысяч русскоязычных твитов о 70 антидепрессантах, противовирусных, бронхорасширяющих и противодиарейных препаратах.

Твиты были разделены на две группы: одни содержали информацию о побочных эффектах лекарств, другие – названия заболеваний и симптомов, но не побочных эффектов. Командам необходимо было предложить, как лучше автоматизировать такую классификацию, используя современные языковые модели и методы машинного обучения. Эту задачу выполняли семь команд из России, Финляндии, США, Хорватии и Великобритании.

Полученные классифицированные данные – размеченные корпуса твитов на русском языке – в дальнейшем можно будет использовать для обучения моделей на основе машинного обучения. А эти модели можно будет применять для автоматической разметки текстов и других задач программистов и исследователей, что поможет анализировать побочные эффекты от приема лекарственных препаратов и другую важную для медицины информацию.

"Проведенные исследования позволяют сделать важный шаг для дальнейшей разработки автоматических систем для задачи извлечения побочных эффектов из текстов социальных медиа на русском языке. В будущем планируется продолжать проведение трека в рамках симпозиума SMM4H. В частности, в следующем году мы хотели бы рассмотреть твиты о лекарствах, применяемых при лечении коронавирусной инфекции", – прокомментировала Елена Тутубалина, один из организатор соревнования, старший научный сотрудник Казанского федерального университета. 


15 декабря, 2020
Без шока и боли: российские исследователи разработали щадящий метод лечения сердечных аритмий
Учёные из Института математики и механики им. Н.Н. Красовского УрО РАН (Екатеринбург) с помощью комп...
14 декабря, 2020
Нейросети научили лучше распознавать паралингвистические явления
Российские ученые совместно с голландскими и немецкими коллегами разработали новые технологии по обу...