КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 23-78-10073

НазваниеРазработка и апробация методики автоматизированного анализа текстов приговоров российских судов для социально-правовых исследований (на примере насильственных преступлений)

Руководитель Казун Антон Павлович, Кандидат социологических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" , г Москва

Конкурс №85 - Конкурс 2023 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Область знания, основной код классификатора 08 - Гуманитарные и социальные науки; 08-302 - Отраслевые социологии

Ключевые слова Автоматизированный анализ текстов, веб-скрейпинг, социология правоприменения, судебная статистика, судебные решения, насильственная преступность, уголовное право, экстралегальные факторы судебных решений

Код ГРНТИ04.51.35


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Нагрузка на российских судей в мировых судах и судах общей юрисдикции ежегодно растет. Эта проблема неоднократно озвучивалась на самом высоком уровне, в том числе необходимость ее решения была зафиксирована в Постановлении Х Всероссийского съезда судей от 1 декабря 2022 г. (https://base.garant.ru/405910965/). Постоянное увеличение нагрузки на судей может приводить к самым разным неблагоприятным последствиям, включая профессиональное выгорание, а также рост вероятности совершить ошибку. Нехватка времени на рассмотрение дела заставляет судей действовать в условиях “ограниченной рациональности”, что повышает важность экстралегальных обстоятельств дела, таких как социально-демографические характеристики обвиняемого и жертвы, их экономический статус, культурные нормы и ценности, доминирующие в стране или регионе. Учет судьями этих факторов, с одной стороны, может способствовать усилению такой функции системы правосудия как обеспечение справедливости. С другой стороны, экстралегальные факторы имеют высокую вариативность, что может приводить к вынесению очень отличающихся приговоров для дел, которые с юридической точки зрения имеют сходную фабулу. Имеющиеся данные официальной статистической отчетности сильно ограничивают анализ, поскольку делают доступными лишь немногие основные экстралегальные параметры обвиняемого. В свою очередь это ограничивает возможности исследователей, по комплексной оценке, того влияния на судебные решения, которое могут иметь различные комбинации этих факторов. В России действует закон от 22 декабря 2008 г. N 262-ФЗ "Об обеспечении доступа к информации о деятельности судов в Российской Федерации", обязывающий суды разных инстанций публиковать свои решения в открытом доступе на портале ГАС «Правосудие» (более 199 млн. документов). Однако сами по себе тексты приговоров по отдельным делам мало могут рассказать обществу о качестве правоприменения и юридическому сообществу о том, существуют ли в правосудии те или иные смещения. Ключевым препятствием для достижения этих задач является отсутствие инструментов, позволяющих выполнять автоматизированный анализ текстов судебных решений. В рамках настоящего исследовательского проекта мы не только разработаем и разместим в открытом доступе такой алгоритм, но и сопроводим его детальным описанием, а также протестируем его для анализа влияния различных экстралегальных факторов на исходы уголовных дел по насильственным преступлениям. Мы фокусируемся именно на уголовных кейсах, поскольку решения по ним лучше поддаются количественному измерению, чем исходы в гражданском и арбитражном процессе. Впервые в литературе о России, мы включим в анализ не только социально-демографические факторы, но и организационный контекст принятия решения, а также социо-культурный контекст на уровне регионов России. Уникальной особенностью России являются высокое культурное, этническое и социально-экономическое разнообразие регионов, что открывает возможности для анализа, которых нет у исследователей ни в одной стране мира. Прикладная ценность данного исследования состоит в возможности на его основе разработать высокоточные алгоритмы анализа консистентности судебных решений, которые впоследствии можно будет использовать для помощи судьям (см. подобные эксперименты в Китае: https://link.springer.com/article/10.1007/s43681-022-00202-3), что в том числе позволит снизить нагрузку. Также алгоритм может быть использован для анализа эффективности правоприменения со стороны государства, юридического сообщества или широкой общественности.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


 

Публикации

1. Луликян А. А., Жучкова С. В. Почему женщины убивают? Эмпирическая типология убийств, совершенных женщинами в России Мир России: Социология, этнология, Т. 33. № 2. С. 115-141. (год публикации - 2024)
10.17323/1811-038X-2024-33-2-115-141

2. Жучкова С.В., Девятников В.Ю., Казун А.П., Белов М.Д., Сидорова О.И. Тексты судебных приговоров как источник данных для эмпирических исследований права в России Мониторинг общественного мнения: экономические и социальные перемены, № 2, стр. 170–192 (год публикации - 2025)
https://doi.org/10.14515/monitoring.2025.2.2575

3. Казун А.П. Может ли искусственный интеллект прогнозировать решения суда? Системати­ческий обзор международных исследований Мониторинг общественного мнения: Экономические и социальные перемены, № 5. С. 100–122 (год публикации - 2024)
10.14515/monitoring.2024.5.2580

4. Белов М.Д., Казун А.П. Берегись его автомобиля: почему мужчины за рулем опаснее женщин? Социология власти, Т. 36. № 2. С. 142–163. (год публикации - 2024)
10.22394/2074-0492-2024-2-142-163


Аннотация результатов, полученных в 2025 году
На втором году трёхлетнего проекта работа шла по трём направлениям: мы усовершенствовали алгоритм сбора судебных решений с сайтов районных судов, существенно повысили качество «умных» алгоритмов извлечения фактов из текстов и начали серию эмпирических исследований о том, как на приговоры влияют пол, статус, этничность и другие внеправовые факторы. После ограничений на доступ к порталу ГАС «Правосудие» мы начали разработку собственного парсера для извлечения текстов дел напрямую с сайтов судов общей юрисдикции. Скрипт автоматически находит нужные страницы, сохраняет тексты приговоров и назначает каждому делу уникальный идентификатор. Важным шагом является добавление к судам географических координат. Благодаря этому массив судебных дел можно соединять с другими открытыми источниками — от муниципальной статистики и данных ГИБДД до опросов общественного мнения. Это открывает перед исследователями огромные возможности. Для заинтересованных коллег уже опубликована пробная выборка на 50 000 дел — без персональных данных, но со всеми извлечёнными признаками (https://github.com/vydevyatnikov/text_preparation_and_feature_extraction/releases/tag/data_sharing). Кроме того, авторы проекта выгрузили статистику ГИБДД за 2015–2023 гг. по всем регионам: дату, место, тип машины, число пострадавших. В результате собран первый в мире датасет, соединяющий дорожные аварии и судебные решения через географические координаты. Сырые тексты мало что говорят без обработки. В этом году участники проекта «научили» алгоритмы автоматически находить в документе всех участников процесса — судью, прокурора, подсудимого, потерпевших. Переход на модели искусственного интеллекта поднял точность распознавания имён и ролей до 99 % (ещё год назад было 95 %). Алгоритм также определяет, был ли человек организатором преступления или пособником и идёт ли речь о покушении на преступление или его реализации. Надёжность проверяли вручную: свыше 8 000 реальных дел разметили вручную участники проекта, показатели precision, recall и F1-мера оказались выше 0,98, что говорит о высоком качестве машинного анализа текста. Одновременно за счет оптимизации алгоритмов очень сильно выросла скорость обработки. Например, бережная работа с памятью и поточный режим сократили обработку крупного корпуса текстов о случаях ДТП с 12 часов до 20 минут. Немаловажно указать и на первые научные публикации. В новой публикации в журнале «Социология власти» мы показали, что мужчины за рулем, при прочих равных, совершают в 3.25 раза чаще женщин ДТП со смертельным исходом. Высокий уровень региональных различий по данному показателю позволяет предположить, что различия могут во многом зависеть от культурных и социально-экономических особенностей регионов. Кроме того, на основе опыта работы с текстами судебных дел авторы проекта подготовили комплексную методологическую статью для других исследователей о том, как пользоваться этим новым источником данных. Статья не только описывает возможности, которые открывает этот массив дел, но и дает практическое руководство по работе с этими данными. Таким образом, мы закладываем основу для широкого использования в отечественных исследованиях нового источника данных. В новых перспективных направлениях проекта, результаты по которым готовятся к публикации, мы раскрываем ряд других интересных аспектов. Мы показываем, что в делах о тяжком вреде здоровью (ст. 111 УК) женщины чаще соглашаются на «сделку с правосудием», но выгоды от неё для них меньше, чем для мужчин. Кроме того, предварительные результаты показывают, что совпадение этничности судьи и обвиняемого слегка повышает шансы на условный срок (на 1–2 %) и снижает вероятность более строгой меры пресечения. Анализ более 300 тыс. дел показал, что участие адвоката на стороне потерпевшего приводит к значимому ужесточению наказания, что очень важно для дискуссии о том, в какой степени жертва или ее представители могут и должны влиять на правосудие. Также, участники проекта впервые сопоставили тексты приговоров и глубинные интервью с женщинами, осуждёнными за убийство, выявив стратегии самообвинения и самооправдания последних.

 

Публикации

1. Луликян А. А., Жучкова С. В. Почему женщины убивают? Эмпирическая типология убийств, совершенных женщинами в России Мир России: Социология, этнология, Т. 33. № 2. С. 115-141. (год публикации - 2024)
10.17323/1811-038X-2024-33-2-115-141

2. Жучкова С.В., Девятников В.Ю., Казун А.П., Белов М.Д., Сидорова О.И. Тексты судебных приговоров как источник данных для эмпирических исследований права в России Мониторинг общественного мнения: экономические и социальные перемены, № 2, стр. 170–192 (год публикации - 2025)
https://doi.org/10.14515/monitoring.2025.2.2575

3. Казун А.П. Может ли искусственный интеллект прогнозировать решения суда? Системати­ческий обзор международных исследований Мониторинг общественного мнения: Экономические и социальные перемены, № 5. С. 100–122 (год публикации - 2024)
10.14515/monitoring.2024.5.2580

4. Белов М.Д., Казун А.П. Берегись его автомобиля: почему мужчины за рулем опаснее женщин? Социология власти, Т. 36. № 2. С. 142–163. (год публикации - 2024)
10.22394/2074-0492-2024-2-142-163