КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 24-28-01097

НазваниеИсследование вариативности билингвального и диалектного русского языка на материале устных корпусов

Руководитель Мороз Георгий Алексеевич, Кандидат филологических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" , г Москва

Конкурс №89 - Конкурс 2023 года «Проведение фундаментальных научных исследований и поисковых научных исследований малыми отдельными научными группами»

Область знания, основной код классификатора 08 - Гуманитарные и социальные науки; 08-453 - Языкознание

Ключевые слова корпусная лингвистика, вариативность, билингвизм, диалектология, русская устная речь, статистические методы в лингвистике, социолингвистика

Код ГРНТИ16.21.27, 16.21.21


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Цель проекта – исследовать вариативность в русском языке на базе 27 диалектных и билингвальных корпусов Международной лаборатории языковой конвергенции НИУ ВШЭ (общий объём – более 4 000 000 словоупотреблений, более 260 часов аудиозаписей). Задачи проекта: 1) выявление языковых феноменов, наиболее подверженных вариативности; 2) сравнение региональных разновидностей русского языка (более 20); 3) исследование взаимосвязи между вариативностью устной речи, географическими и социальными факторами; 4) исследование интерференции – влияния родного языка на второй (русский) язык; 5) проверка гипотез, объясняющих наблюдаемую вариативность, статистическими методами. Новизна проекта заключается в применении статистических методов к значительному объему данных устной речи. Кроме того, впервые в одном исследовании будут рассмотрены билингвальные и диалектные варианты русского языка. Среди билингвальных планируется учесть варианты русского языка, существующие в Дагестане, Карелии, Башкортостане, Удмуртии, Чувашии, Марий Эл, а также цыганском поселении на территории г. Перми; среди диалектных – севернорусские, среднерусские и южнорусские говоры, а также говоры территорий позднего заселения. Актуальность исследования включает несколько аспектов. Во-первых, актуален материал – записи устной речи, собранные по большей части за последнее десятилетие. Во-вторых, для России как многоязычной страны актуально изучение речи билингвов, выявление конвергентных процессов, в которые вовлечен русский язык. В-третьих, с научной точки зрения важен объяснительный подход к языковым явлениям, который обеспечивается применением квантитативных и корпусных методик, а также учётом социальных факторов, влияющих на речь. При этом диалектные разновидности русского языка связаны с его историей, а билингвальные – с процессом усвоения. Таким образом, исследование речевой вариативности может дать новые сведения о развитии языка и овладении им, а также его взаимосвязи с социальными характеристиками говорящих.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2024 году
Ключевыми для исследования понятиями являются «билингвальный» и «диалектный» русский. Под билингвальными корпусами/разновидностями далее понимается речь билингвов, владеющих одним из языков народов России наряду с русским языком, который чаще всего является вторым, т.е. усвоенным позже родного. Под диалектной понимается речь монолингвов, имеющая территориальные особенности, отличные от литературного языка. «Нестандартность» понимается как несовпадение с нормами литературного русского языка (в любой из рассматриваемых разновидностей). В течение 2024 г. из устных корпусов был собран значительный объём языкового материала, разрабатывались принципы его анализа. Исследовалось шесть вариативных признаков: 1. Опущение предлогов в речи бесермянских и марийских билингвов (5 005 контекстов). 2. Конструкции с числительными в 7 билингвальных корпусах (4 196 контекстов). 3. Количественно-именные словосочетания в говоре русско-белорусского пограничья (470 контекстов). 4. Использование формы «годов/лет» в 21 диалектном корпусе (2 133 контекста). 5. Использование ши-форм в одном смоленском и двух псковских говорах (306 контекстов). 6. Соотношение -л/-нт/-ши форм в 17 корпусах. Были сформулированы и проверены гипотезы были о влиянии на вариативность социолингвистических (год рождения, уровень образования) и лингвистических факторов (специфичны для каждой из выбранных тем исследования).В качестве основного метода проверки гипотез использовалась логистическая регрессия со смешанными эффектами. Как правило, значимым фактором, отличающим речь жителей в пределах одного региона по уровню стандартности/нестандартности, является уровень образования. В темах 1 и 2 проверялась гипотеза об интерференции – влиянии родного языка на русский язык. Так, вероятность выпадения предлога («был Москве» вместо «был в Москве») в речи бесермянских и марийских билингвов может частично объясняться интерференцией с фонетическими системами родных языков. В бесермянском и марийском языках звук [в] практически не встречается перед согласными, поэтому в русской речи перед согласными он нередко выпадает. У монолингвов также может наблюдаться опущение предлога [в], но в позиции перед гласным и в ограниченном ряде слов. Одним из наиболее вариативных явлений, отмеченных как в билингвальных, так и в диалектных корпусах, является форма существительного в конструкции с числительными (темы 2-4). Анализ таких конструкций в билингвальных корпусах показал, что нестандартное маркирование имени существительного в конструкции с числительными («два брат») объясняется в первую очередь не контактным влиянием, а невысоким уровнем владения русским языком. При этом наиболее частотные сочетания числительных («два часа») реже всего имеют нестандартное маркирование. Это можно объяснить тем, что в процессе освоения языка билингвы чаще всего сталкиваются с этими конструкциями и, вероятно, они хранятся в ментальном лексиконе как единый элемент. На основе проведённого исследования перспективным представляется включение такого параметра, как «колокационность» (совместная встречаемость слов), в дальнейшие исследования билингвального русского. Сложная система конструкций с числительными в говорах объясняется историческими изменениями. В говоре Хиславичского района Смоленской области (русско-белорусское пограничье) сохраняются конструкции типа «два мужики», соответствующие нормам древнерусского и белорусского языков. Кроме того, были выявлены нестандартные конструкции с формами среднего рода («два яйцы»), ранее не описанные для данной группы говоров. Темы 5 и 6 посвящены изучению диалектных форм типа «прошодши», которые отмечены в 16 диалектных корпусах из разных регионов России, а также билингвальном карельском. При их исследовании не было выявлено значимой взаимосвязи между числом форм на -ши, стандартных страдательных причастий прошедшего времени («пройдено») и -л форм («прошёл»), что не подтверждает ранее высказанную гипотезу о том, что -ши формы «вытесняют» либо формы на -л, либо стандартные формы на -н/т. Из рассматриваемых корпусов формы на -ши чаще всего фиксируются в говорах Опочецкого района Псковской области, Западнодвинского района Тверской области и Хиславичского района Смоленской области, поэтому они были рассмотрены подробнее. Установлено, что в смоленском говоре Хиславичей меньше диалектных форм на -ши по сравнению с двумя другими; их функции также более ограничены, поэтому можно предположить, что категория перфекта, выражаемая преимущественно -ши формами, в хиславичском говоре разрушается. В связи с этим ожидалось, что -ши формы в нём во-первых, будут чаще использоваться в атрибутивной функции, во вторых - будут более лексикализованными, но данные свидетельствуют об обратном. Результаты первого года работы представлены в трёх статьях и пяти докладах на научных конференциях. В соответствии с планом работы для презентации полученных результатов создаётся атлас вариативных признаков русской устной речи: https://lingconlab.github.io/spoken_russian_variation/

 

Публикации

1. Ермолова М.В., Мороз Г.А. Ши-формы в двух псковских и одном смоленском говорах: сопоставление подсистем Slověne, Ермолова М. В., Мороз Г. А. Отпричастные -ши-формы в двух псковских и одном смоленском говорах: сопоставление подсистем // Slověne. 2024. Т. 13, № 2. С. 157–183 (год публикации - 2024)
10.31168/2305-6754.2024.2.06

2. Яковлева А.В. Опущение предлогов в русской речи марийских и бесермянских билингвов: исследование на основе устных корпусов Труды Института русского языка им. В.В. Виноградова, Яковлева А.В. Опущение предлогов в русской речи марийских и бесермянских билингвов: исследование на основе устных корпусов // Труды Института русского языка им. В. В. Виноградова. 2025. № 4 (46). С. 264–285. (год публикации - 2025)
10.31912/pvrli-2025.4.11

3. Земичева С.С. Количественно-именные словосочетания в хиславичском говоре (русско-белорусское пограничье) Актуальные проблемы русской диалектологии. Материалы Международной конференции 25–27 октября 2024 г. М.: Институт русского языка им. В. В. Виноградова РАН, 2024. , С. 74–77 (год публикации - 2024)

4. Земичева С. С., Мороз Г. А., Наккарато К. Вариативность "годов" vs. "лет" в русских говорах: корпусное исследование. Вопросы языкознания, Земичева С. С., Мороз Г. А., Наккарато К. Вариативность годов vs. лет в русских говорах: корпусное исследование. Вопросы языкознания, 2025, 6: 7–34. (год публикации - 2025)
10.31857/0373-658X.2025.6.7-34

5. Земичева С.С. Страдательные причастия и глаголы прошедшего времени в западном и восточном среднерусских говорах: к вопросу о синтаксической вариативности Вестник Томского государственного университета (год публикации - 2026)


Аннотация результатов, полученных в 2025 году
В 2025 г. из устных корпусов был собран значительный объём языкового материала. Одним из источников материала является корпус дагестанского русского, благодаря чему выборки по некоторым признакам включали большое число билингвальных разновидностей русского языка. Так, исследование отрицательных экзистенциальных конструкций включало данные от носителей 23 разных родных языков. Анализ таких выборок является важным элементом новизны проекта. Также 2025 г. продолжилось исследование некоторых тем первого года, например, выпадение предлогов изучалось на материале новых билингвальных корпусов, созданных в Международной лаборатории языковой конвергенции НИУ ВШЭ – хантыйского русского и мансийского русского. Было установлено, что вероятность выпадения предлога в хантыйском русском и мансийском русском увеличивается, если следующий согласный является огубленным. Получила развитие идея включить в исследования параметр «коллокационность» (совместная встречаемость слов). Для этого мы воспользовались API Национального корпуса русского языка и новыми возможностями корпуса. Например, параметр «коллокационность» в исследовании признака «выпадение предлога “в”» определялся следующим образом. Для каждого существительного в наших данных определялось, как часто оно употребляется в винительном или предложном падеже на расстоянии от одного до четырех слов от предлога «в». В результате для каждой комбинации предлога и существительного («в + город», «в + наука» и т. д.) были получены два значения: количество текстов в НКРЯ, где встретилась конструкция, и общее число употреблений конструкции в корпусе. Для последующего моделирования учитывалось именно общее число употреблений конструкции в НКРЯ. Если конструкция не была обнаружена в корпусе, ее частотность принималась за 0. Для частотных предложно-падежных форм (в + город) вероятность опущения предлога билингвами возрастает, хотя параметр не показывает статистической значимости. Фактор коллокационности оказался значимым для других признаков. Так, согласно нашим данным, в отрицательных конструкциях с экзистенциальным значением («не» + «быть» + существительное) вероятность нестандартной формы существительного ниже, если пара «быть» + существительное частотна в НКРЯ (денег не было), для редких сочетаний вероятность нестандартной формы увеличивается (газ не было, машин не были). Среди новых параметров, включенных в исследование в 2025 г., было нестандартное использование возвратной глагольной частицы -ся/-сь в русской речи билингвов Дагестана и нестандартное использование глагольного вида в русской речи билингвов Дагестана. Для анализа использования возвратной глагольной частицы -ся/-сь было собрано 8035 примеров, из которых 80 нестандартных форм. В некоторых случаях использование нестандартных форм можно объяснить интерференцией с родным языком. Так, от носителя рутульского языка записан пример «когда снег растаялся в горах». В рутульском языке глагол «йицIес» ‘растопить, таять / растапливаться’ является лабильным (переходно-непереходным) [Махмудова 2001], что может объяснять избыточное использование частицы. Для каждого глагола была определена частотность леммы согласно «Частотному словарю национального корпуса русского языка» [Ляшевская, Шаров 2008] и построена модель логистической регрессии, подтвердившая, что частотность леммы обратно пропорциональна вероятности нестандартного употребления частицы -ся/-сь. Для исследования нестандартного использования глагольного вида в русской речи билингвов Дагестана из корпуса было извлечено более 20 тыс. примеров, из которых нестандартными оказались 64 примера, зафиксированные у носителей 8 разных родных языков (аварский, андийский, арчинский, кумыкский, мегебский, муиринский, рутульский, табасаранский). Удалось выявить влияние кумыкского и табасаранского языков на выбор вида в русском языке. Пример из речи носителя табасаранского языка: «Преподавал после этого, когда я домой приходил, из этой книги… главу разборчиво научить начал». Используется глагол совершенного вида «научить» вместо ожидаемого «учить». В данном случае можно говорить об интерференции с табасаранским языком, где в аналитических формах прошедшего времени вспомогательный глагол и инфинитив совпадают по виду [Шихалиева 2005: 149]. В других случаях влияние первого языка не прослеживается. Результаты второго года работы представлены в двух статьях, подготовленных к печати, и двух докладах на научных конференциях. Список литературы О.Н. Ляшевская, С.А. Шаров. Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). М.: Азбуковник, 2009. М.С. Махмудова. Морфология рутульского языка. М., 2001. Шихалиева С. Х. Глагол табасаранского языка. Автореферат на соискание ученой степени доктора филологических наук. М., 2005.

 

Публикации

1. Ермолова М.В., Мороз Г.А. Ши-формы в двух псковских и одном смоленском говорах: сопоставление подсистем Slověne, Ермолова М. В., Мороз Г. А. Отпричастные -ши-формы в двух псковских и одном смоленском говорах: сопоставление подсистем // Slověne. 2024. Т. 13, № 2. С. 157–183 (год публикации - 2024)
10.31168/2305-6754.2024.2.06

2. Яковлева А.В. Опущение предлогов в русской речи марийских и бесермянских билингвов: исследование на основе устных корпусов Труды Института русского языка им. В.В. Виноградова, Яковлева А.В. Опущение предлогов в русской речи марийских и бесермянских билингвов: исследование на основе устных корпусов // Труды Института русского языка им. В. В. Виноградова. 2025. № 4 (46). С. 264–285. (год публикации - 2025)
10.31912/pvrli-2025.4.11

3. Земичева С.С. Количественно-именные словосочетания в хиславичском говоре (русско-белорусское пограничье) Актуальные проблемы русской диалектологии. Материалы Международной конференции 25–27 октября 2024 г. М.: Институт русского языка им. В. В. Виноградова РАН, 2024. , С. 74–77 (год публикации - 2024)

4. Земичева С. С., Мороз Г. А., Наккарато К. Вариативность "годов" vs. "лет" в русских говорах: корпусное исследование. Вопросы языкознания, Земичева С. С., Мороз Г. А., Наккарато К. Вариативность годов vs. лет в русских говорах: корпусное исследование. Вопросы языкознания, 2025, 6: 7–34. (год публикации - 2025)
10.31857/0373-658X.2025.6.7-34

5. Земичева С.С. Страдательные причастия и глаголы прошедшего времени в западном и восточном среднерусских говорах: к вопросу о синтаксической вариативности Вестник Томского государственного университета (год публикации - 2026)