КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 16-18-02071

НазваниеПограничный русский: оценка сложности восприятия русского текста в теоретическом, экспериментальном и статистическом аспектах

РуководительСлюсарь Наталия Анатольевна, Доктор филологических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики", г Москва

Период выполнения при поддержке РНФ 2016 г. - 2018 г. 

Конкурс№14 - Конкурс 2016 года на получение грантов по приоритетному направлению деятельности РНФ «Проведение фундаментальных научных исследований и поисковых научных исследований по поручениям (указаниям) Президента Российской Федерации».

Область знания, основной код классификатора 08 - Гуманитарные и социальные науки, 08-453 - Языкознание

Ключевые словаоценка читабельности, лексическая сложность, грамматическая сложность, экспериментальная лингвистика, квантитативная лингвистика, русский как иностранный, наследственный русский

Код ГРНТИ16.01.00


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Описывая лексико-грамматическое разнообразие речи, исследователи обычно сосредоточиваются на характерных явлениях. В этом проекте мы, напротив, хотим осветить ряд пограничных явлений, которые вызывают трудности у говорящих по-русски. Пограничный статус языкового явления может быть связан с низкой частотностью, нетипичностью, с тем, что оно подверглось изменениям в истории языка, а также с разного рода вариативностью. Например, значения слов менялись на протяжении последних веков и даже десятилетий, многие слова вышли из употребления либо в силу того, что их сменили другие, либо в силу изменения окружающих реалий. В результате возникают трудности при чтении классических произведений XIX и даже XX века. В устной и письменной речи люди часто либо избегают этих слов, либо употребляют их неправильно. То же самое верно и для грамматических конструкций: ряд низкочастотных конструкций или конструкций, подверженных варьированию (в силу диахронических изменений или отличия разговорного узуса от литературной нормы), традиционно вызывает трудности у говорящих и пишущих. Самыми уязвимыми категориями носителей оказываются дети, люди, для которых русский не является первым языком, а также так называемые носители наследственного русского, или "эритажные" говорящие ( которые имеют русскоговорящих родственников и начали усваивать язык с детства, однако сами говорят на нем лишь частично, так как живут в нерусскоговорящей среде, преимущественно это дети эмигрантов). В силу геополитических и культурных причин число носителей второго типа огромно. Подавляющее большинство граждан Российской Федерации, у которых русский не является первым языком, овладевают им в той или иной степени и активно используют его в разных сферах жизни. Русский является вторым языком и для многих граждан сопредельных государств, кроме того, многие изучают язык из самых разных соображений. Носители наследственного русского также представляют собой заметную группу, изучению которой до последнего времени практически не уделялось внимания. Между тем, очень важно, чтобы у всех говорящих по-русски сформировалось как можно более полное представление о языке и о его литературной традиции. В рамках проекта планируется исследование выражений и конструкций, распределение которых в речи неочевидно и вызывает сложности у инофонов, эритажных говорящих и даже у некоторых групп носителей языка как родного. Предлагается выявить диагностические критерии для их идентификации, а также описать условия (прежде всего, стандартное лексическое окружение и типы синтаксических конструкций), предсказывающие выбор словарной или грамматической единицы из множества подобных (например, выбор между "вообще" и "вообще-то", "вообще" и "в общем"). Такое моделирование алгоритма корректного выбора служит профилактике распространенных нарушений речевых норм и облегчает понимание и порождение текста на недоминирующем языке. Полученные результаты впоследствии могут быть распространены на практику преподавания русского языка как родного в рамках дисциплин, предполагающих обучение редактированию текста. Полученные выводы планируется интегрировать в системы оценки "читабельности" текста (потенциала понимания этого текста воспринимающим). Под читабельностью или удобочитаемостью (англ. readability) понимаются различные характеристики текста, которые делают его более или менее трудным для понимания. В рамках разных подходов рассматриваются лексический состав текста, сложность использующихся в нем грамматических конструкций, общая организация и связность. Эта область лингвистики бурно развивается в последние годы, полученные результаты применяются как для оценки сложности художественных, учебных и других текстов, так и в целях их адаптации для тех или иных категорий говорящих. Особое внимание будет уделено сложностям, возникающим при чтении художественных текстов. Классические литературные произведения ХIX-XX вв. зачастую представляют сложность для современного читателя, поскольку одни высказывания потеряли прозрачность ("зычный", "казенная надобность", "кредитный билет", "дикий цвет"), а другие были вытеснены новейшими синонимами ("пришло на мысль", "опоясал кинжал", "косвенный взгляд", "жить на антресолях"). Из-за языковых преград замедляется и осложняется чтение, ослабляется эмпатия, читатель перестает воспринимать книгу как имеющую непосредственное отношение к его жизни, мировоззрению, культуре, повседневной и официальной речи, образу мыслей. Преодолеть этот разрыв с традицией поможет планируемый "Учебный корпус диахронической нормы: 19 век" (коллекция текстов, снабженных инструментарием поиска точек языкового сдвига - маркерами нетипичных для современного узуса слов и оборотов). Пилотный проект связан с разметкой текста фрагмента из романа М. Ю. Лермонтова "Герой нашего времени" ("Тамань").

Ожидаемые результаты
В рамках проекта будут использованы различные стратегии для определения и исследования пограничных явлений. Во-первых, будет описан ряд лексических единиц и грамматических конструкций, о которых есть основания думать, что они относятся к этой категории. Сформулированные гипотезы будут проверены с использованием корпусных и экспериментальных методов. Во-вторых, планируется идентифицировать такие явления, привлекая разнообразные источники (в том числе созданный в НИУ ВШЭ Корпус русских учебных текстов, Корпус эритажа, Корпус региональных вариантов языка, узус интернет-пространства). В частности, используя методы квантитативной лингвистики, планируется разработать ряд автоматизированных методов для выделения пограничных явлений.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2016 году
Основной задачей проекта было создать на материале русского языка ресурсы и методики для описания сложных для носителей пограничных явлений. Подобный статус явления может быть обусловлен различными причинами. Исследованиями в области исторических изменений занимались Е.В. Рахилина, М.А. Бобрик, Я.Э. Ахапкина, Ю.Л. Кузнецова, исследованиями пограничных и вариативных конструкций – А.Б. Летучий, Н.А. Зевахина, С.Ю. Пужаева, Н.А. Слюсарь и исследованиями в области языковых контактов – А.С. Выренкова и Н.Р. Добрушина. М.А. Бобрик провела часть работ по составлению представительного корпуса конструкций и слов, которые бы отражали круг вариативных и реликтовых явлений современного русского языка. Были выявлены участки вариативности, связанной с наследием языкового прошлого. Исследование проводилось на материале текстов разных хронологических срезов и разных функциональных/жанровых типов. Проблема интерпретации текстов XIX века стоит особенно остро в связи со школьной программой по литературе. Я.Э. Ахапкина поставила задачу обнаружить расхождения между актуальной речевой практикой читателя и традиционным образцом на материале экспериментов, проводимых с участием школьников. В ходе эксперимента первого года реализации проекта старшеклассникам 16-17 лет было предложено проанализировать фрагмент повести И.С. Тургенева «Ася», обратив внимание на слова и выражения, которые не характерны для современной русской речи в целом и для привычной информанту речи в частности. В задачи Е.В. Рахилиной входил поиск и описание в текстах XIX века устаревших конструкций, которые не были описаны или не ощущались таковыми в предшествующих исследованиях. Работа с конкретным материалом показала, что для того, чтобы понимать механизмы диахронических сдвигов в конструкциях, которые аккумулируют в себе языковую информацию всех без исключения уровней, нужно фиксировать все без исключения изменения: и в словоизменении, и в словообразовании, и в синтаксисе, и в лексике. У решения этой задачи есть прикладная миссия – помочь современному читателю лучше понимать тексты классической русской литературы. В современную эпоху регистрация и исследование языковых явлений требует специальных компьютерных инструментов. Поскольку нет готового хорошего ресурса, пригодного для решения поставленной задачи, в рамках проекта был создан специализированный корпус для исследования текстов XIX века с возможностью выделить особыми пометами все отклонения от современной нормы и производить поиск в текстах по этим признакам. В настоящее время основная исследовательская работа ведется с помощью этого Корпуса (http://web-corpora.net/19thcentury). Еще одна задача, которая осуществлялась под руководством Е.В. Рахилиной, – создание базы данных по материалам тех исследователей, которые занимались XIX веком раньше, в докорпусную эпоху и сделали большое количество выборочных наблюдений над широким набором разнообразных текстов этого времени. Ю.Л. Кузнецовой была разработана методика, позволяющая выделять устаревшие слова при помощи метода временных рядов, используя корпусные данные. Методика временных рядов позволяет анализировать данные, представляющие собой значения каких-либо параметров, собранные через равные промежутки времени. Временной ряд отличается от простой выборки данных тем, что при анализе временного ряда учитывается взаимосвязь измерений со временем, а не только статистическое распределение заданных параметров в выборке. При анализе корпусного материала частотность слова во временном промежутке может быть рассмотрена как временной ряд, характеризующий данное слово. Для выделения устаревающих слов необходимо выделить слова, для которых частотные значения во временном ряду будут равномерно уменьшаться. В рамках задачи проанализировать свойства периферийных явлений современного русского языка и сопоставить их со стандартными осуществлялись исследования А.Б. Летучего, Н.А. Зевахиной и С.Ю. Пужаевой и Н.А. Слюсарь. А.Б. Летучий составил анкету для работы с конструкциями, содержащими сентенциальные актанты. В частности, анкета включает список грамматических категорий матричного глагола, которые предполагается проверить на предмет того, насколько их изменение влияет на маркирование вложенного предиката или выбор союза. Их список включает время, вид, лицо, модальность, отрицание и залог. Кроме того, было проведено корпусное исследование русских конструкций с инфинитивными сентенциальными актантами. В частности, выяснилось, что инфинитивные конструкции постепенно становятся менее частотными, по сравнению с другими стратегиями. А.Б. Летучий также провёл исследование русских триклаузальных конструкций типа Маша хотела, чтобы я позвонил ей, когда приеду в Москву. Как выяснилось, свойства конструкций такого рода не полностью сводимы к хорошо изученным биклаузальным конструкциям. Особенно сильная вариативность наблюдается в оформлении третьей клаузы. Наконец, сфера исследований А.Б. Летучего включала изучение общих и различных свойств сентенциальных и именных актантов. В частности, изучались способы прономинализации сентенциальных составляющих. Н.А. Слюсарь решала задачу изучения периферийных явлений экспериментальными методами. Исследовались конструкции, в которых носители языка особенно часто допускают ошибки. В качестве примера частотных ошибок были выбраны ошибки при согласовании по роду, числу и падежу. Были проведены как эксперименты, исследующие восприятие таких конструкций в реальном времени, так и эксперименты, направленные на индуцирование такого рода ошибок при порождении речи. Кроме того, было проведено исследование, направленное на сравнение двух типов данных: экспериментальных и корпусных. Это было сделано на примере употребления частицы же. Результаты показали, что эти две методики, которые обычно противопоставляются, на самом деле не противоречат друг другу и даже дополняют друг друга. Сочетание экспериментального и корпусного методов было опробовано также Н.А. Зевахиной и С.Ю. Пужаевой. Н.А. Зевахиной был составлен список пограничных явлений в грамматике с помощью текстов, написанных русскоязычными студентами различных ВУЗов, а также с помощью данных Национального корпуса русского языка, Звукового корпуса русского языка и текстов, найденных в сети интернет. Среди установленных пограничных явлений в грамматике определены такие грамматические зоны, которые подвержены значительным изменениям. К ним, в частности, относятся деепричастные конструкции и металингвистические сравнительные конструкции. Н.А. Зевахиной и С.Ю. Пужаевой был проведен синтаксический анализ деепричастных конструкций, а также психолинвистический эксперимент с респондентами-носителями языка. Кроме того, под руководством Н.А. Зевахиной были исследованы металингвистические, или несобственно сравнительные конструкции. На материале Национального корпуса русского языка было установлено, что в русском имеются шесть металингвистических конструкций, три из которых являются нормативными и три пограничными. Значимая часть исследований была посвящена тем периферийным явлениям, которые возникают в языке вследствие языковых контактов. Этим явлениям посвящены исследования под руководством А.С. Выренковой и Н.Р. Добрушиной. В задачи А.С. Выренковой входило создание пилотной версии виртуального хранилища (репозитория) лингвистических данных, представляющих собой устные тексты на русском языке, порожденные носителями малых языков России (www.web-corpora.net/biling_reposit). В условиях активной дестандартизации вопрос о том, кто такие носители нестандартного русского, каковы их лингвистический статус и специфика, стал особенно актуальным. В то же время не исчезает и понятие языковой нормы (стандарта, «основного варианта»), в современной ситуации оно приобретает новый смысл и требует пристального изучения. Особый интерес в этой связи представляет собой соотношение русского и других языков в ситуации двуязычия. На данном этапе в репозиторий включены тексты, порожденные носителями нанайского языка, в дальнейшем планируется пополнить его текстами, порожденными носителями некоторых самодийских и тунгусо-маньчжурских языков. В исследовании заимствованных слов под руководством Н.Р. Добрушиной были выполнены следующие задачи. Во-первых, были выявлены факторы, которые могут замедлить или ускорить процесс адаптации заимствованных слов, на материале уже осуществленных исследований. Во-вторых, был создан максимально представительный список слов, в которых имеет место вариативность твердого / мягкого согласного перед Е/Э, после чего он был размечен в соответствии с выявленными факторами. Впоследствии этот размеченный список (далее – база данных) будет использоваться для подбора слов для проведения экспериментов, чтобы используемые в экспериментах слова различались не более чем одним фактором и тем самым стало бы возможным протестировать соответствующий фактор. Таким образом, за первый год были разработаны экспериментальные, корпусные и статистические методы работы с пограничными явлениями. В рамках различных частей проекта был начат сбор данных, в частности, проведены экспериментальные и корпусные исследования и создано несколько электронных ресурсов. Значительная часть собранных данных уже обработана и проанализирована, часть полученных результатов опубликована.

 

Публикации

1. Валова Е.А., Слюсарь Н.А. Сравнение корпусного и экспериментального метода на примере исследования синтаксических свойств энклитики же Компьютерная лингвистика и интеллектуальные технологии, Вып. 15. С. 792-802. (год публикации - 2016)

2. Перова Д.М., Бондаренко К.Е., Добрушина Н.Р. База данных для исследования вариативности твердых/мягких согласных перед е в заимствованных словах Компьютерная лингвистика и интеллектуальные технологии, Вып. 15. С. 528-539. (год публикации - 2016)

3. Рахилина Е.В., Резникова Т.И., Бородина М.А. «Тамань сегодня»: корпусное исследование русского языка XIX века Труды Института русского языка им. В. В. Виноградова, Вып. 11, с. 240-253. (год публикации - 2016)

4. Слюсарь Н.А., Малько А.А. Gender agreement attraction in Russian: production and comprehension evidence Frontiers in Psychology, 7,1651 (год публикации - 2016) https://doi.org/10.3389/fpsyg.2016.01651


Аннотация результатов, полученных в 2017 году
В 2017 г. было продолжено исследование выделенных на протяжении первого года работы явлений, которые вызывают трудности у говорящих по-русски. Пограничный статус языкового явления может быть связан с тем, что оно подверглось изменениям в истории языка, с последствиями языковых контактов, низкой частотностью, нетипичностью, а также с разного рода вариативностью. Примером пограничного русского являются тексты, которые современные носители в достаточной мере понимают, но уже не воспроизводят в своей обыденной речи. К ним относятся произведения классической русской литературы, поэтому в 2017 г. была продолжена работа по изучению русского языка XIX века. Я.Э. Ахапкина продолжала рассмотрение лексических и грамматических элементов речевой практики, подвергшихся трансформации в ХХ-ХХI веках. Ключевым текстом для анализа и основой коллекции прецедентных употреблений осталась повесть И.С. Тургенева «Ася». Эрратологическая разметка корпуса обеспечивает выявление лексических, морфологических, синтаксических несовпадений актуального узуса и узуса прошлого. Сопоставление обнаруженных разночтений выявляет, в частности, микро-синтаксические различия (архаичную аспектуальную асимметрию, смену глагольного управления и т.д.). В качестве дополнительного ресурса, демонстрирующего смену употреблений словоформ и конструкций на протяжении последних 200 лет, в истекшем году был создан прототип базы «Фразеодиахроникон». Кроме того, была начата работа над корпусом детской речи StartWrit, который демонстрирует расхождения в речевой практике начинающего носителя и актуальной рекомендательной нормы. Одной из задач ресурса является сопоставление исторических данных и данных речевого онтогенеза. Под руководством Е.В. Рахилиной в 2017 году был полностью размечен несколькими экспертами весь текст романа «Герой нашего времени» в разрабатываемом в рамках проекта Корпусе речи XIX века (http://web-corpora.net/19thcentury). В процессе была расширена и усовершенствована система тегов. По выработанной системе тэгов размечены случаи устаревшей нормы, отличной от современной. Ведутся работы по системной обработке корпуса и описанию всех имеющихся помет; продолжается оптимизация поиска и разработка визуализированного представления статистики. В результате исследования открылся целый пласт микродиахронических процессов, отражающих нюансы типологически релевантных переходов в лексике, грамматике, словообразовательных моделях и особенно лексико-грамматических конструкциях. Исследование этих процессов велось по нескольким направлениям. Во-первых, анализировался исторический аспект процесса грамматикализации конструкций. Здесь особенно интересны квазиграмматические дискурсивные маркеры и их динамика. Во-вторых, исследовалась градация контекстных изменений известных конструкций, таких, как родительный падеж с отрицанием. Здесь интересна последовательность утраты позиций генитива в конкретном лексическом окружении, которая подчиняется известным в русистике правилам. Исследования М.А. Бобрик также связаны с историческими изменениями русского языка, однако затрагивают не XIX век, а более поздний период, в случае которого речь идет о совсем небольших изменениях, а также более ранние периоды. Проведенное с опорой на принципы диахронно-лингвистического комментария исследование произведения О.Э. Мандельштама «Холодное лето» легло в основу монографии, которая была написана и подготовлена к печати в 2017 г. Лингвистический анализ на всех уровнях — морфологии, синтаксиса, семантики, орфографии и пунктуации — взаимодействует в таком комментарии с филологическим анализом истории текста, его редактирования и издания. Кроме того, продолжена работа над переводом древнерусского текста Первой Новгородской летописи по Синодальному списку XIII века. Продолжается исследование истории отдельных слов и понятий в истории русского языка Нового времени (сочетание бодрый народ в «Горе от ума» А.С. Грибоедова и его культурно-языковой контекст). Следующая группа участников проекта исследовала пограничные явления, связанные с вариативностью. Н.Р. Добрушина руководила проведением экспериментов, целью которых было установить факторы, влияющие на выбор твердого или мягкого согласного. Результаты экспериментального исследования подтвердили гипотезу о том, что твердый согласный чаще произносится в ударных слогах, чем в безударных, за исключением отдельных групп. Кроме того, была закончена и размещена онлайн база данных слов, имеющих вариативность твердых / мягких согласных. База размещена в открытом доступе на сайте https://vastry.ru/ (закладка «База «квэст»). Н.А. Зевахина совместно с С.Ю. Пужаевой продолжила работать над нарушением кореференции нулевого подлежащего деепричастной клаузы с подлежащим матричной клаузы в русском языке (ср. частотные в устной и письменной речи носителей русского языка примеры вроде «Проезжая под мостом, у меня слетела шляпа»). Совместно с Н.А. Слюсарь они провели психолингвистический эксперимент, в котором была использована методика ускоренного определения грамматической правильности предложений (speeded grammaticality judgment task), обработали и проинтерпретировали полученные данные. Кроме того, под руководством Н.А. Зевахиной было продолжено исследование металингвистических, или несобственно сравнительных конструкций с точки зрения их морфологии и синтаксиса (например, «X скорее создает правила, чем следует им»). Наконец, под ее руководством был проведен корпусной анализ письменной речи носителей русского языка на предмет нестандартных употреблений возвратных глаголов и нестандартных моделей управления. Работа, проделанная Ю.Л. Кузнецовой, посвящена явлениям, пограничный статус которых обусловлен их низкой частотностью. На материале существительных в современном подкорпусе Национального Корпуса Русского Языка она рассматривала лексемы, являющиеся пограничными с точки зрения статистического распределения словоформ одной лексемы в тексте. В ходе работы показано, что существует связь между количеством лексем, которые представлены в тексте только одной словоформой, и жанром, типом и тематикой текста. Порядок жанров демонстрирует, что жанры, которые характеризуются высоким уровнем формализации и частыми повторами, отличаются низким процентом лексем с уникальными словоформами. Также четко различаются тексты, посвященные математике, геологии и астрономии, и тексты, посвященные культуре и искусству. Ю.Л. Кузнецова делает вывод, что процент существительных с уникальными словоформами может быть использован как метрика креативности текста. В исследованиях, проведенных Н.Н. Буйловой, также затронута тема частотности и жанровой вариативности. Н.Н. Буйлова продолжила разработку системы, использующей в качестве параметров машинного обучения типологические признаки глаголов. В ходе исследований было установлено, что глаголы в различных жанрах имеют различные схемы заполнения валентностей, отличающиеся как качественно, так и количественно — для многих глаголов количество подчиненных варьируется от жанра к жанру. На основании этих данных было выведено значение конструкции заданного порога (construction at specific threshold, CST) — номера конструкции из списка, на которой количество употреблений глагола превысило 50% от общего количества. В данный момент проверяется возможность экстраполировать частотность конструкций на небольшие корпуса. В исследованиях, проведенных А.Б. Летучим, затронута как тема диахронических изменений, так и проблема вариативности в синхронии и частотности различных языковых явлений. А.Б. Летучий сконцентрировал свои усилия на сопоставлении свойств стандартных конструкций с периферийными. Проделанная работа делится на две части. Во-первых, была проведена проверка встречаемости инфинитивных оборотов от XVIII века до настоящего времени, во-вторых, были проанализированы синтаксические свойства инфинитивных оборотов в актантной позиции. Кроме того, было начато сопоставительное межъязыковое исследование конструкций с сентенциальными актантами: в фокусе внимания оказались сентенциальные актанты имен. Как выяснилось, в разных языках ограничения на такие актанты в разной степени строги. Наконец, исследовались связочные конструкции в языках мира, которые в различных языках попадают под различные синтаксические ограничения. Н.А. Слюсарь продолжила исследование периферийных явлений русского языка экспериментальными методами путем изучения конструкций, в которых носители русского языка особенно часто допускают ошибки. Во-первых, были проведены три эксперимента, посвященные аттракции или интерференции при согласовании по числу, один на порождение и два на восприятие. Была выявлена степень влияния различных факторов на эффект интерференции. Во-вторых, был поставлен новый исследовательский вопрос: влияет ли на согласование то, насколько типична форма того или иного слова для грамматической категории, к которой оно относится, и насколько непрототипичные варианты будут влиять на поведение взрослых носителей? Для разрешения этого вопроса был проведен эксперимент, в котором использовалась методика чтения с самостоятельной регулировкой скорости. В дальнейшем планируется проведение еще одного эксперимента. В-третьих, изучение согласования вывело Н.А. Слюсарь на проблему чтения близких по написанию слов. Подобных экспериментальных исследований на материале русского языка ранее не проводилось. Совместно с сотрудницей Лаборатории когнитивных исследований СПбГУ С.В. Алексеевой был проведен эксперимент, его результаты обработаны и опубликованы. Работа, проделанная А.С. Выренковой, также была посвящена изучению ошибок, но допускаемых не взрослыми носителями русского языка, а студентами, изучающими русский как иностранный. А.С. Выренкова руководила созданием корпуса учебных переводов на русский язык (Learner Translator Corpus of L2 Russian Speakers). Сравнение текстов, порожденных нестандартными носителями русского языка, с текстами стандартных носителей позволяет не только изучать особенности речевого поведения этой группы говорящих на русском, но и значительно уточнить описание стандартного русского. Кроме того, такое сравнение обнаруживает те области лексики и грамматики, которые являются наименее устойчивыми и в первую очередь подвержены языковой эволюции.

 

Публикации

1. Бобрик М.А., Калугин Д.Я. «Бодрый наш народ». Семантика бодрости в контексте русской национальной идеи Труды Института русского языка им. В.В. Виноградова. История русского языка и культуры. Памяти Виктора Марковича Живова, № 9. С. 340-357. (год публикации - 2016)

2. Валова Е.А., Слюсарь Н.А. Исследование синтаксических свойств энклитики же: корпусный и экспериментальный подход Вопросы языкознания, Вып. 2. С. 33-48. (год публикации - 2017)

3. Зевахина Н.А., Джакупова С., Вишенкова А. С. The Grammar of Russian Metalinguistic Comparative Scando-Slavica, Vol. 63. No. 2 (год публикации - 2017)

4. Кузнецова Ю.Л. The Ratio of Unique Word Forms as a Measure of Creativity Each Venture a New Beginning. Studies in Honor of Laura A. Janda. Bloomington, IN: Slavica, P. 85-98 (год публикации - 2017)

5. Летучий А.Б. ‘Tensed’ and ‘non-tensed’ predicatives in Russian Компьютерная лингвистика и интеллектуальные технологии, Вып. 16. Том 2. С. 259-270. (год публикации - 2017)

6. Рахилина Е.В. Говорю я, Карл... Компьютерная лингвистика и интеллектуальные технологии, 2017. Т.2. С.384-394 (год публикации - 2017)

7. Слюсарь Н.А., Алексеева С.В. Орфографические соседи 
с заменой буквы при изучении механизмов лексического доступа Компьютерная лингвистика и интеллектуальные технологии, Вып. 16. С. 407-418. (год публикации - 2017)

8. Бобрик М.А. Проза Осипа Мандельштама «Холодное лето» (1923): Языковой комментарий Проза Осипа Мандельштама «Холодное лето» (1923): Языковой комментарий. СПб.: Издательство Европейского университета в Санкт-Петербурге, 2018., - (год публикации - 2018)

9. Ахапкина Я. Э. «Перевод с русского на русский»: как старшеклассник читает И.С. Тургенева Культура русской речи (гротовские чтения), 02.2017 (год публикации - 2017)

10. Ахапкина Я. Э. Диахронические изменения в грамматической семантике глагола: как писали в ХIХ веке и как пишут сегодня Международная научная конференция «Русский глагол» (к 50-летию выхода в свет книги А. В. Бондарко и Л. Л. Буланина). СПб.: Нестор-История, 2017., С. 21-22. (год публикации - 2017)

11. Ахапкина Я. Э., Сосновцева Е. Г Корпус детской письменной речи StartWrit Проблемы онтолингвистики - 2017: освоение и функционирование языка в ситуации многоязычия. Иваново : ЛИСТОС, 2017., С. 171-175. (год публикации - 2017)

12. Рахилина Е.В., Фесенко В.П. Возможности использования корпуса текстов XIX века в лингвистическом исследовании. Труды международной конференции "Корпусная лингвистика - 2017". СПб: СПбГУ., - (год публикации - 2017)


Аннотация результатов, полученных в 2018 году
Под руководством Я.Э. Ахапкиной в рамках работы над базой «Фразеодиахроникон» и корпусом детской речи StartWrit оптимизированы системы разметки, сопоставлены современные эрративные данные и данные Корпуса текстов XIX века. Проведен сравнительный анализ индивидуальных и общих паттернов в нарративных стратегиях младших школьников. Опубликованы две статьи, еще одна находится на рецензировании. Под редакцией Е.Р. Добрушиной и Я.Э. Ахапкиной подготовлена коллективная монография, в которой Я.Э. Ахапкина выступила соавтором пяти глав. Монография сдана в печать. Е.В. Рахилиной в результате работы над Корпусом текстов XIX века разработана методика создания лингвистического комментария к таким текстам. Комментарий дается на трех уровнях: (i) «перевод» выделенной единицы; (ii) краткая справка; (iii) академический комментарий. Помимо лингвистического комментария дается исторический. Все историзмы описываются специалистом. Кроме того, были изучены системные изменения в области адъективной оценочной лексики. Причина выбора этой зоны в том, что прилагательные оказались едва ли не самыми частотными в плане диахронических изменений семантики. Начато исследование результативных значений глаголов, которые также подвержены диахроническим изменениям. М.А. Бобрик, во-первых, исследовано первое употребление сочетания ОБЩЕЕ ЛѢТО ‘невисокосный год’ в древнерусской (древненовгородской) надписи на кресте архиепископа Алексия (XIV в.) из Новгородского Софийского собора; подготовлена и принята к публикации статья. Во-вторых, впервые исследовано несколько примеров квазитекстов в древнерусской письменности. Поставлена задача изучения этой области письменности, постоянно вызывающей трудности понимания. Выработаны критерии разграничения квазитекстов и текстов на естественном языке в контексте древнерусской культуры. Подготовлена и принята к публикации статья. В-третьих, составлено теоретическое введение к переводу Новгородской первой летописи с древнерусского на современный русский язык. Под руководством Н.А. Зевахиной было проведено исследование деепричастных клауз на материале Основного корпуса НКРЯ. Было показано, что неканонические употребления (где нулевое подлежащее деепричастной клаузы не контролируется подлежащим основной клаузы в именительном падеже) очень редки; все найденные примеры были проанализированы. Среди них встречаются два типа неканонического контроля: дативно-субъектный контроль и косвенно-объектный контроль. Статистический анализ показал, что доля предложений с неканоническим контролем выше в случае препозиции деепричастной. Этот вывод согласуется с результатами проведенного ранее экспериментального исследования. При этом доля предложений с неканоническим контролем возросла с течением времени. Кроме того, были зафиксированы новые виды нестандартных употреблений возвратных глаголов в дополнение к установленным ранее, а именно: конкуренция страдательной формы на -м- и действительной формы на -щ-+-ся; двухместные глаголы с предложным управлением; переосмысление постфикса -ся как рефлексива и замена рефлексивным местоимением «себя». Н.Р. Добрушиной в рамках исследования вариативности в произнесении твердых-мягких согласных перед буквой «е» в заимствованиях был подготовлен и проведен новый эксперимент. Была поставлена задача разработать такой эксперимент, с помощью которого можно было бы собрать массовые данные: короткий, пригодный для респондентов из разных регионов, принадлежащих к разным культурным группам и с разными уровнями образования. Было решено использовать задачу называния картинок. Опрошены жители разных регионов. Данные были обработаны с помощью метода иерархической кластеризации и метода главных компонент. Иерархическая кластеризация показала, что говорящие из Дагестана значительно отличаются от говорящих из Москвы, Киржача и Иркутска. При этом среди дагестанских говорящих выделяется группа, которая больше похожа на говорящих из Москвы, Киржача и Иркутска, чем другие. Это люди разного возраста; их объединяет то, что они имеют значительный опыт жизни в городе: учатся в Махачкале или постоянно проживают в Ставрополе. Визуализация методом главных компонент показала, что если говорящие из Москвы, Киржача и Иркутска в целом похожи друг на друга, то среди говорящих из Дагестана наблюдается очень большой разброс в том, как они произносят экспериментальные слова. Это наблюдение находится в противоречии с социальными данными: все испытуемые живут в одном небольшом изолированном селе. Значительная вариативность объясняется тем, что русский является для жителей селения Кина вторым языком (хотя и выученным в совершенстве), они не используют его для общения друг с другом и потому в отношении русского языка не формируют единого языкового сообщества. А.Б. Летучим были выявлены факторы сохранения / потери производным именем ситуации сентенциального актанта. Выявлен набор конструкций, для которых ограничения на позицию зависимого связаны с его длиной, основные типы конструкций с номинализациями. Выяснены условия употребления анафорического местоимения «это» в контекстах, где оно реферирует к сентенциальным актантам. Н.А. Слюсарь опубликовала результаты экспериментов, проведенных в 2017 г., а также провела новые эксперименты, которые можно разделить на две группы. Первая связана с исследованием роли грамматического рода и прототипичности окончания существительного (для данного рода) при обработке согласования по роду между подлежащим и сказуемым при чтении. Эти эксперименты выявили психолингвистическую релевантность внешнего облика слова, того, на что оно похоже. Оказалось, что при чтении грамматически правильных предложений фактор рода или прототипичности не проявляется, однако в грамматически неправильных предложениях читающие позже замечают ошибку в согласовании и меньше на нее реагируют в тех случаях, когда у подлежащего непрототипическое окончание. Еще в одном эксперименте также изучались непрототипические существительные, но другого типа — названия профессий. В эксперимент были включены наименования профессий, не имеющие устоявшейся пары женского рода (педиатр, мясник). Во вторую группу вошли эксперименты, посвященные согласованию по падежу. Они показали, что морфологическая неоднозначность прилагательного не только влияет на число ошибок при порождении, но и затрудняет детекцию ошибок при восприятии. Были исследованы существительные в единственном и множественном числе, в разных падежных формах, при этом эффект остался неизменным. Под руководством А.С. Выренковой объем корпуса Learner Translator Corpus of L2 Russian Speakers увеличен с 60000 до 100000 словоупотреблений. Была продолжена работа по разметке корпуса, доработана введенная ранее схема разметки, в частности, для аннотирования диалогической речи и нестандартного употребления дискурсивных формул. Кроме того, значительно улучшен функционал корпуса, как в части обработки текстов, так и в части поиска. Был проведен количественный и качественный анализ материала корпуса. Так, например, для подкорпуса переводов с английского, в котором доступен вариант тьюторского перевода, предложенный студентам в качестве образца, для студенческих работ и сэмплового перевода был проанализирован индекс TTR и подсчитана средняя длина предложения. Оказалось, что средняя длина предложения в студенческих переводах превосходит среднюю длину предложения в переводах, представленных тьютором, в то время как показатель лексического разнообразия (type-token ratio, TTR), напротив, несколько ниже в учебных работах. Кроме того, были проведены пилотный анализ и сравнение дистрибутивных паттернов некоторых русских конструкций в корпусах стандартного русского и английского языков, параллельном русско-английском корпусе НКРЯ и корпусе учебных переводов. Качественный анализ данных касался стратегий подбора некомпозициональных переводных аналогов для конструкций в языке-источнике и влияющих на этот выбор факторов. Были проанализированы некоторые идиоматичные фразы, а также дискурсивные формулы, употребляемые в диалогической речи. Полученные данные сравнивались с данными Русского учебного корпуса (Russian Learner Corpus, RLC). Некоторые результаты этой работы опубликованы в статье (Власова, Выренкова 2018). Под руководством В.Д. Магомедовой была создана база несловарных слов «Антисловарь». В результате удалось выявить различные группы несловарных слов, включая частотные орфографические ошибки и опечатки, разного рода неологизмы (слова с заимствованными аффиксами, диминутивы и аугментативы, нестандартные феминитивы), слова с размноженными буквами (ср. ужжжас, оочень) и др. Сейчас ведется работа над пользовательским интерфейсом, чтобы сделать базу общедоступной в первой половине 2019 г. Также был проведен эксперимент, направленный на изучение вариации грамматического рода у существительных субъективной оценки: диминутивов и аугментативов (домина, мамусик и т.п.). Существительные для эксперимента были отобраны в словарях и на основании предварительного исследования в интернете (слова, которые употребляются достаточно часто, но не являются частью литературного русского языка). Были определены факторы, влияющие на выбор рода: класс склонения существительного субъективной оценки и род исходного существительного. Также тестировался фактор одушевленности, который оказался незначимым. Результаты исследования представлены на международных конференциях, готовится статья. Н.Н. Буйлова разработала и применила метод машинного обучения, основанный на синтаксических характеристиках текста; данный подход позволяет работать с близкими жанрами. Так, было показано, что различные функциональные стили (научный, официально-деловой, художественный), хорошо кластеризуются, однако при классификации бульварной литературы лучший результат дают разработанные Н.Н. Буйловой признаки (Буйлова 2018). Также интерес представляет анализ синтаксических конструкций в поэтическом подкорпусе НКРЯ, который, в перспективе, может быть применен для классификации текстов не только по жанрам, но и по стилям или авторам. По результатам экспериментов написана статья.

 

Публикации

1. Ахапкина Я. Э. Тактики представления двух последовательных ситуаций в детском нарративе (на материале сочинений по картинке учеников 2 класса) Проблемы онтолингвистики - 2018: Материалы международной научной конференции 20-23 марта 2018, - (год публикации - 2018)

2. Ахапкина Я. Э., Николенкова Н. В. Когда и орфографическое правило может быть бессильно (о постановке дефиса при приложении) Stephanos. Электронный проект филологического факультета МГУ им. М. В. Ломоносова. Мультиязычное научное издание., Вып. 2 (28). М.: Издательство МГУ, 2018. Гл. 2. С. 31-43. (год публикации - 2018) https://doi.org/http://stephanos.ru/izd/2018/2018-28-2.pdf

3. Бобрик М.А. Возвращаясь к надписи на Алексеевском кресте: что значит ОБЩЕЕ ЛѢТО? Русский язык в научном освещении., - (год публикации - 2018)

4. Бобрик М.А. Надпись на монете великого князя Василия Дмитриевича. Комментарий филолога Нумизматика и эпиграфика., - (год публикации - 2018)

5. Выренкова А. С., Рахилина Е. В. S. Montrul. The acquisition of heritage languages Вопросы языкознания, 2018. № 1. С. 148-154. (год публикации - 2018)

6. Выренкова А.С, Власова Е.А. Интересная находка: о перспективах использования учебного корпуса переводов ЕВРика! Сборник статей о поисках и находках к юбилею Е. В. Рахилиной / Под ред. Д. А. Рыжовой, Н. Р. Добрушиной, А. А. Бонч-Осмоловской, А. С. Выренковой, М. В. Кюсевой, Б. В. Орехова, Т. И. Резниковой, М.: Лабиринт, 2018. — 392 с. (год публикации - 2018)

7. Григорьева Н.А., Зевахина Н.А., Кувшинская Ю.М. Нестандартные стратегии употребления возвратных глаголов: причины и языковые механизмы Издательство Петрозаводский государственный университет, сборник статей Фортунатовские чтения в Карелии. Сборник докладов международной научной конференции (10—12 сентября 2018 года, г. Петрозаводск), Фортунатовские чтения в Карелии: сборник докладов международной научной конференции (10—12 сентября 2018 года, г. Петрозаводск): в 2 ч. / науч. ред. Н. В. Патроева; предисл. Н. В. Патроевой и О. В. Никитина. — Петрозаводск: Издательство ПетрГУ, 2018 (год публикации - 2018)

8. Добрушина Е. Р., Голосов Ф.В., Ахапкина Я. Э. Постольку-поскольку: от коррелятива с союзом к кванторному наречию. Как рождаются экспрессивные кванторные выражения? М., 2018., - (год публикации - 2018)

9. Добрушина Е. Р., Иванова В.В., Ахапкина Я. Э. Децл: от усеченного существительного к кванторному наречию. Как рождаются экспрессивные кванторные выражения? М., 2018., - (год публикации - 2018)

10. Добрушина Е. Р., Кондратьева А.А, Ахапкина Я. Э. На редкость: от предложно-падежной формы к кванторному наречному выражению. Как рождаются экспрессивные кванторные выражения? М., 2018., - (год публикации - 2018)

11. Добрушина Е. Р., Масуми Т.С., Ахапкина Я. Э. Как грязи: от библейского сравнения к сниженному кванторному предикативу. Как рождаются экспрессивные кванторные выражения? М., 2018., - (год публикации - 2018)

12. Добрушина Е. Р., Царева М.С., Ахапкина Я. Э. Малая толика: от указательного местоимения к кванторному существительному. Как рождаются экспрессивные кванторные выражения? М., 2018., - (год публикации - 2018)

13. Добрушина Н. Р., Стаферова Д. А., Белоконь А. А. Электронная база вариативных явлений Slovene, - (год публикации - 2018)

14. Зевахина Н.А., Джакупова С., Вишенкова А.М. The Grammar of Russian Metalinguistic Comparatives Taylor and Francis, журнал Scando-Slavica, Scando-Slavica Vol. 63 No. 2 P. 179-197 (год публикации - 2017) https://doi.org/10.1080/00806765.2017.1399589

15. Казкенова А.К,. Рахилина Е.В. Русская письменная речь студентов-казахов в зеркале русского учебного корпуса Przegląd Wschodnioeuropejski, - (год публикации - 2019)

16. Кор Шаин И, Плунгян В. А., Рахилина Е. В. Третий лишний Études de linguistique slave. Mélanges offerts à Robert Roudet, - (год публикации - 2019)

17. Летучий А.Б. On tense and irrealis marking in triclausal constructions (and what distinguishes them from biclausal constructions) Linguistics (журнал издательства «Mouton de Gryter»), Linguistics. 2018 Том 56 № 1 Стр. 163-206. (год публикации - 2018)

18. Пужаева С. Ю., Герасименко Е. А., Захарова Е. С., Рахилина Е. В. Автоматическое извлечение дискурсивных формул из текстов на русском языке Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация, N 2, том 16, выпуск 18. С. 5-19 (год публикации - 2018) https://doi.org/10.25205/1818-7935-2018-16-2-5-18

19. Пужаева С.Ю., Зевахина Н.А. Деепричастная клауза в русском: позиция и семантический субъект Издательство Институт языкознания РАН, сборник статей Проблемы языка: Сборник научных статей по материалам Пятой конференции-школы «Проблемы языка: взгляд молодых учёных», выпуск 5, Проблемы языка: Сборник научных статей по материалам Пятой конференции-школы «Проблемы языка: взгляд молодых учёных», выпуск 5 / Под ред. Е.М. Девяткиной, С.Ю. Бочавер, Д.В. Маховикова, А.Б. Шлуинского. М.: Институт языкознания РАН, 2017 С. 112-126. (год публикации - 2017)

20. Рахилина E. В., Слепак Е.А., Бычкова П.А. Дискурсивные формулы, полисемия и жестовое маркирование Труды Института русского языка им. В. В. Виноградова, - (год публикации - 2019)

21. Рахилина Е. В., Казкенова А. К/ Заметки о русском числе Вестник российского университета Дружбы народов Серия: Лингвистика, том 22 N 3 С. 581-605 (год публикации - 2018) https://doi.org/10.22363/2312-9182-2018-22-3-605-627

22. Рахилина Е. В., Рыжова Д. А. Славный корабль – омулевая бочка… К вопросу о микро-истории семантических переходов. Труды Института русского языка им. В. В. Виноградова, - (год публикации - 2019)

23. Рахилина Е. В., Ухлик М. Construction Grammar and Slavic. Encyclopedia of Slavic Languages and Linguistics. Leiden: Brill, - (год публикации - 2019)

24. Рахилина Е.В. Грамматикализация в сфере количества: русские идиомы Как рождаются экспрессивные кванторные выражения? / под ред. Е. Р. Добрушиной, Я. Э. Ахапкиной. Монография. М., 2018, - (год публикации - 2018)

25. Слюсарь Н.А. Forms and features: The role of syncretism in number agreement attraction Journal of Memory and Language, Vol. 101, pp. 51–63 (год публикации - 2018) https://doi.org/10.1016/j.jml.2018.03.006

26. Слюсарь Н.А. Gender, declension and stem-final consonants: an experimental study of gender agreement in Russian Компьютерная лингвистика и интеллектуальные технологии, Vol. 17, pp. 688-700 (год публикации - 2018)

27. Янда Л. А., Ляшевская О. Н., Нессет Т., Рахилина Е. В., Таерз Ф. М. A Constructicon for Russian: Filling in the Gaps Constructional Approaches to Language. Amsterdam: John Benjamins., - (год публикации - 2018)

28. Добрушина Е. Р. Ахапкина Я. Э. Как рождаются экспрессивные кванторные выражения? Как рождаются экспрессивные кванторные выражения? М., 2018., - (год публикации - 2018)


Возможность практического использования результатов
Одна из важнейших социальных задач российского общества — сохранение культурных ценностей и классических культурных ориентиров. К ним относятся памятники Золотого и Серебряного века русской литературы, в том числе произведения Лермонтова и Мандельштама. Выполнение проекта направлено на разработку новых технологий в школьном обучении литературе и русскому языку, позволяющих повысить интерес к великим образцам культуры и одновременно облегчить доступ к сложным фрагментам этих текстов. Результаты исследования текстов древнерусской эпиграфики могут быть использованы и уже используются в подписях к экспонатам, путеводителях и экскурсионных материалах. Для современного носителя русского языка важно понимать те тексты эпиграфики, которые он видит, посещая памятники древнерусских городов. Результаты проекта, связанные с исследованием вариативности твердых / мягких согласных перед Е и ненормативных употреблений синтаксических конструкций, а также с анализом несловарных слов и частотных ошибок, могут быть использованы при разработке рекомендаций для словарей, школьных учебников и программы Единого государственного экзамена. В частности, ЕГЭ содержит задания по орфоэпии, которые нередко опираются на архаичную норму, неактуальную для сегодняшних поколений не только учеников, но и учителей. База данных «Квэст» и сопутствующие ей исследования должны быть использованы как источник сведений о современных тенденциях произношения. Результаты, связанные с исследованием текстов на русском языке, порожденных нестандартными носителями (билингвами, студентами, изучающими русский как иностранный), позволяют нам получить представление о русском языке в России и в мире. Это очень важно, так как русский язык — один из самых больших по числу говорящих, и очень многие из них не являются монолингввами-носителями. Эти результаты также могут быть использованы в практических целях: в учебных курсах, при составлении пособий.