КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 23-78-10073

НазваниеРазработка и апробация методики автоматизированного анализа текстов приговоров российских судов для социально-правовых исследований (на примере насильственных преступлений)

РуководительКазун Антон Павлович, Кандидат социологических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики", г Москва

Период выполнения при поддержке РНФ 07.2023 - 06.2026 

Конкурс№85 - Конкурс 2023 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 08 - Гуманитарные и социальные науки, 08-302 - Отраслевые социологии

Ключевые словаАвтоматизированный анализ текстов, веб-скрейпинг, социология правоприменения, судебная статистика, судебные решения, насильственная преступность, уголовное право, экстралегальные факторы судебных решений

Код ГРНТИ04.51.35


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Нагрузка на российских судей в мировых судах и судах общей юрисдикции ежегодно растет. Эта проблема неоднократно озвучивалась на самом высоком уровне, в том числе необходимость ее решения была зафиксирована в Постановлении Х Всероссийского съезда судей от 1 декабря 2022 г. (https://base.garant.ru/405910965/). Постоянное увеличение нагрузки на судей может приводить к самым разным неблагоприятным последствиям, включая профессиональное выгорание, а также рост вероятности совершить ошибку. Нехватка времени на рассмотрение дела заставляет судей действовать в условиях “ограниченной рациональности”, что повышает важность экстралегальных обстоятельств дела, таких как социально-демографические характеристики обвиняемого и жертвы, их экономический статус, культурные нормы и ценности, доминирующие в стране или регионе. Учет судьями этих факторов, с одной стороны, может способствовать усилению такой функции системы правосудия как обеспечение справедливости. С другой стороны, экстралегальные факторы имеют высокую вариативность, что может приводить к вынесению очень отличающихся приговоров для дел, которые с юридической точки зрения имеют сходную фабулу. Имеющиеся данные официальной статистической отчетности сильно ограничивают анализ, поскольку делают доступными лишь немногие основные экстралегальные параметры обвиняемого. В свою очередь это ограничивает возможности исследователей, по комплексной оценке, того влияния на судебные решения, которое могут иметь различные комбинации этих факторов. В России действует закон от 22 декабря 2008 г. N 262-ФЗ "Об обеспечении доступа к информации о деятельности судов в Российской Федерации", обязывающий суды разных инстанций публиковать свои решения в открытом доступе на портале ГАС «Правосудие» (более 199 млн. документов). Однако сами по себе тексты приговоров по отдельным делам мало могут рассказать обществу о качестве правоприменения и юридическому сообществу о том, существуют ли в правосудии те или иные смещения. Ключевым препятствием для достижения этих задач является отсутствие инструментов, позволяющих выполнять автоматизированный анализ текстов судебных решений. В рамках настоящего исследовательского проекта мы не только разработаем и разместим в открытом доступе такой алгоритм, но и сопроводим его детальным описанием, а также протестируем его для анализа влияния различных экстралегальных факторов на исходы уголовных дел по насильственным преступлениям. Мы фокусируемся именно на уголовных кейсах, поскольку решения по ним лучше поддаются количественному измерению, чем исходы в гражданском и арбитражном процессе. Впервые в литературе о России, мы включим в анализ не только социально-демографические факторы, но и организационный контекст принятия решения, а также социо-культурный контекст на уровне регионов России. Уникальной особенностью России являются высокое культурное, этническое и социально-экономическое разнообразие регионов, что открывает возможности для анализа, которых нет у исследователей ни в одной стране мира. Прикладная ценность данного исследования состоит в возможности на его основе разработать высокоточные алгоритмы анализа консистентности судебных решений, которые впоследствии можно будет использовать для помощи судьям (см. подобные эксперименты в Китае: https://link.springer.com/article/10.1007/s43681-022-00202-3), что в том числе позволит снизить нагрузку. Также алгоритм может быть использован для анализа эффективности правоприменения со стороны государства, юридического сообщества или широкой общественности.

Ожидаемые результаты
По итогам работы над исследованием мы планируем получить следующие результаты: 1) программный код для выгрузки и автоматической предобработки текстов судебных приговоров, а также массив данных с извлеченными из текстов переменными для последующего анализа. На текущий момент эмпирические данные об уголовных делах в России представлены лишь в виде статистики, публикуемой на сайтах официальных ведомств (Судебного департамента при Верховном суде РФ, МВД и проч.). Агрегированный характер доступной статистики, т.е. представление ее в разрезе статей УК или групп статей, препятствует проведению анализа на индивидуальном уровне (на уровне отдельных дел, преступлений, обвиняемых и т.д.), сокращает варианты исследовательских вопросов, которые можно изучать на основе этих данных, и тем самым тормозит развитие в России эмпирических социально-правовых исследований. Разработанный нами в ходе исследования алгоритм позволит получить не только базовую информацию о судебных делах в дезагрегированном виде (социально-демографические признаки участников дела, назначенное наказание и т.п.), но и откроет доступ к таким характеристикам, которые не фиксируются в ведомствах (например, характер отношений между обвиняемым и потерпевшим). 2) оценка потенциала (возможностей и ограничений) использования текстов судебных приговоров в качестве источника данных для социально-правовых исследований. Ряд методологических задач, поставленных в исследовании, позволит оценить степень смещенности опубликованных приговоров и полноту представления в них данных, что, в свою очередь, позволит сделать вывод о том, насколько надежным источником данных являются судебные приговоры. Кроме того, подобные методологические наработки могут быть полезны и для более широкой области вычислительных социальных наук (computational social science), которая посвящена оценке возможностей использования различных нереактивных данных в социальных исследованиях и является одним из мейнстримов современных количественных исследований за рубежом. В своем исследовании мы оценим и продемонстрируем возможности и ограничения источника данных, который до сих пор не был представлен в этой области. 3) оценка роли экстралегальных факторов в принятии судьями мировых судов и судов общей юрисдикции решений по делам о насильственых преступлениях. Анализ будет произведен на трех различных уровнях: а) уровень кейсов (судебных дел) – значение характеристик обвиняемых и их жертв (пол, семейный статус и пр.) б) уровень суда – влияние на решения организационных факторов (рабочей нагрузки, опыта работы, количества судей и пр.) в) уровень региона – выделение региональных и внутрирегиональных различий в паттернах принятия судьями решений, в т.ч. учет культурных и этнических различий между регионами России. Изучение факторов принятия судебных решений (sentencing research) находится на фронтире зарубежных социально-правовых исследований, в которых на данный момент отечественные работы представлены слабо – в частности, по причине ограниченности доступных эмпирических данных, описанной ранее. В исследовательскую команду проекта включены студенты и аспиранты, которые смогут использовать результаты данного исследования для подготовки ВКР и диссертаций, что в дальнейшем будет способствовать развитию социально-правовых исследований в России.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2023 году
В рамках реализации проекта были подготовлены алгоритмы для автоматизированного сбора материалов судебных дел, предобработки текстов, а также извлечения из текстов судебных решений ключевой информации о легальных и экстралегальных обстоятельствах дела. К ключевым экстралегальным факторам относятся такие обстоятельства как пол обвиняемого и жертвы, характер отношений между ними (включая нахождение в браке, родство, степень знакомства), образование, экономический статус и пр. С использованием данных алгоритмов было извлечено и обработано более 566 тыс. материалов уголовных дел по насильственным преступлениям, относящимся к различным статьям и составам УК РФ. Авторы проекта подготовили подробное описание методики работы с текстами судебных дел как новым источником данных для эмпирических исследований права в России, проанализировав различные возможности и ограничения этих данных. Была подготовлена научная статья с описанием методики сбора и анализа текстов судебных решений, которая направлена на рецензирование в ведущий российский научный журнал. Дополнительно в рамках проекта был произведен систематический анализ корпуса научной литературы (более 100 эмпирических статей), посвященной возможностям использования искусственного интеллекта (ИИ) для предсказания судебных решений. Анализ показал, что алгоритмы предсказаний судебных решений стремительно совершенствуются в последние годы, но пока имеют множество ограничений как технического, так и этического характера. Однако использование ИИ-ассистентов в качестве помощников судей и адвокатов является актуальной перспективой, которая может быть рассмотрена. Кроме того, российские судебные данные ввиду их полноты и насыщенности обладают высоким конкурентным преимуществом по сравнению с большинством других источников, что позволяет эффективно обучать на них ИИ и добиваться более высокого качества моделей. При оценке влияния экстралегальных факторов на принятие судебных решений в рамках первого года проекта был сделан фокус на сравнение мужчин и женщин. Так, была предложена типология причин, по которым женщины в России совершают убийства. Статья “Почему женщины убивают?” (авторы Анна Луликян и Светлана Жучкова) была не только опубликована в ведущем научном журнале “Мир России”, но и успешно представлена в рамках студенческих “Научных боев” НИУ ВШЭ, заняв второе место. Кроме того, в рамках другого направления исследования было показано, что суды при вынесении наказаний за убийство женщины могут принимать во внимание факт злоупотребления алкоголем со стороны жертвы. В рамках третьего направления происходил анализ того, как часто мужчины и женщины соглашаются на сделку с правосудием (“особый порядок”) в делах о причинении вреда здоровью. Другое перспективное направление эмпирического анализа было связано с изучением влияния экономического статуса обвиняемого на вынесение приговора по уголовным делам о нарушениях правил дорожного движения, которые повлекли за собой нанесение тяжкого вреда здоровью или же смерть потерпевшего. Особенность данных дел состоит в том, что из текстов приговоров возможно извлечь информацию о марках машины, попавшей в ДТП, что является косвенным индикатором благосостояния обвиняемого. Предварительный анализ показал, что российские суды не только не относятся мягче к нарушителям на дорогих автомобилях, но в ряде случаев могут даже применять к ним более жесткую меру пресечения. На второй и третий год реализации проекта запланирован анализ еще большего количества обстоятельств, которые могут оказывать влияние на решения судей, включая их рабочую нагрузку, качество работы адвоката, а также особенности социального контекста региона, в котором рассматривается дело. В рамках первого года проекта была опубликована одна научная статья, еще три статьи находятся на стадии рецензирования в ведущих научных журналах. Опубликованы первые версии алгоритма извлечения и анализа текстов судебных решений. Результаты представлены на нескольких международных конференциях.

 

Публикации

1. Луликян А. А., Жучкова С. В. Почему женщины убивают? Эмпирическая типология убийств, совершенных женщинами в России Мир России: Социология, этнология, Т. 33. № 2. С. 115-141. (год публикации - 2024) https://doi.org/10.17323/1811-038X-2024-33-2-115-141