КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 20-18-00403

НазваниеЦифровое описание диалектов уральских языков на основании анализа больших данных

РуководительНорманская Юлия Викторовна, Доктор филологических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт системного программирования им. В.П. Иванникова Российской академии наук, г Москва

Период выполнения при поддержке РНФ 2020 г. - 2022 г.  , продлен на 2023 - 2024. Карточка проекта продления (ссылка)

Конкурс№45 - Конкурс 2020 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».

Область знания, основной код классификатора 08 - Гуманитарные и социальные науки, 08-453 - Языкознание

Ключевые словауральские языки, большие данные, платформенные исследования, цифровизация, этимология, экспериментальная фонетика, сравнительно-историческое языкознание

Код ГРНТИ16.41.25


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
В настоящее время многие уральские диалекты не имеют описаний фонетики и грамматики и словарей, существующие очерки сделаны по разным стандартам и труднодоступны. Сами языки и архивы, в которых содержатся материалы по ним, находятся под угрозой исчезновения. Энтузиасты из регионов часто пытаются самостоятельно выработать графическую систему для записи текстов на своем диалекте для создания словарей, букварей и учебников. В большинстве случаев она различается у разных носителей, и способы фиксации диалектов в XXI веке фактически оказываются на уровне менее стандартизированном, чем у создателей первых славянских книг в начале XI-XIII вв. Это в ряде случаев провоцирует конфликты в регионах. Как указано в Стратегии научно-технологического развития Российской Федерации, первым приоритетом на ближайшие 10–15 лет является «переход к передовым цифровым, интеллектуальным производственным технологиям, роботизированным системам, новым материалам и способам конструирования, созданию систем обработки больших объемов данных, машинного обучения и искусственного интеллекта». Он-лайн платформу “LingvoDoc” («ЛингвоДок», lingvodoc.ispras.ru, главный редактор – Норманская Ю. В.), которая бы позволила осуществить этот переход для описания языков народов России, мы создали в рамках проекта РНФ № 15-18-00044 «Информационная система для описания малочисленных языков народов мира. Создание описаний алтайских и уральских языков России, находящихся на грани исчезновения» (2015–2019 гг.). На платформе “LingvoDoc” было выполнено описание словарей исчезающих языков России, собранных в полевых условиях (в экспедициях) в рамках проекта и найденных в архивах за XVIII–XIX вв. Эта работа позволила нам выработать механизмы перевода языковых данных в цифровой формат и проведения их анализа с помощью специальных программ, созданных нами в рамках проекта. Анализ позволяет на первом этапе выявить ошибки в обработке материала, проведенной вручную: 1) в транскрипциях новых диалектных данных путем автоматического анализа формант гласных по размеченным на отдельные звуки спектрограммам; 2) в морфологическом анализе (глоссировании) с помощью автоматического анализатора обозначения тех или иных показателей по любому количеству диалектов; 3) в этимологических сравнениях с помощью программы ступенчатого автоматического построения рядов соответствий для реконструкций любого уровня; 4) в определении диалектных изоглосс путем автоматического нанесения на карты данных следующих типов: фонетических, морфологических, семантических, лексических, этимологических и их сочетаний; 5) в построении классификации языков и диалектов путем обсчета различий в рядах соответствий для любого набора языков и диалектов. Все перечисленные вида анализа проводятся путем обсчета большого количества данных. По уральским исчезающим языкам собрано от 3000 до 30000 лексем с контекстами и парадигмами. Обсчет такого количества данных невозможен вручную. При этом становится ясно, что при увеличении количества материала и обработке его с помощью специальных программ точность анализа возрастает по экспоненте. Также ключевым моментом является тот факт, что только корректное представление входящих данных дает возможность строить правильное описание на других уровнях. Например, в основе реконструкции должна лежать корректная транскрипция. Представление всего материала на единой платформе дает возможность для каждого идиома с помощью специальных программ выявить, где именно заложены ошибки, и, устранив их, создать непротиворечивое комплексное описание диалекта. Насколько нам известно, в мире не существует других платформ, в которых был бы организован анализ, построенный на обработке больших данных для описания языков мира. Созданная система является уникальной, что было отмечено на международной конференции «Fenno-Ugric Computational Linguistics» в Финляндии на базе Хельсинкского университета в 2016 году. Директора институтов и заведующие лабораториями по изучению финно-угорских и тюркских языков: проф. Б. Вагнер-Надь (Гамбург), проф. Й. Гипперт (Франкфурт-на-Майне), проф. Э. Винклер (Гёттинген), проф. И. Я. Селютина (Новосибирск), С. В. Онина (Ханты-Мансийск), Ф. Ш. Нуриева (Казань), Ф. Г. Хисамитдинова (Уфа), Н. В. Кондратьева (Ижевск), Л. С. Селендили (Севастополь), Н. Г. Шаймердинова (Астана) – выразили пожелание передать свои материалы на платформу “LingvoDoc” с целью их обсчета с помощью программ анализа больших данных и анализа в сравнении с данными, собранными нами в рамках проекта РНФ, поскольку было выявлено, что совместный анализ большого количества материалов по одному языку позволяет значительно уточнить его описание. В рамках проекта РНФ № 15-18-00044 на платформе “LingvoDoc” мы выполнили цифровое описание языков России, которые входят в категорию ЮНЕСКО «язык находится в критическом состоянии» (для этих языков осталось не более 10 носителей). В новом проекте представляется важным и актуальным, следуя выработанной схеме анализа на платформе “LingvoDoc”, продолжить описание всех диалектных групп уральских языков России, поскольку большинство из них являются исчезающими по классификации ЮНЕСКО: «в серьезной опасности и под угрозой исчезновения» (карельский, марийский, мокшанский, удмуртский, коми-пермяцкий, коми-язьвинский, хантыйский, тундровый ненецкий, северноселькупский языки). Также при обращении к отдельным диалектам видно, что ситуация серьезная практически со всеми уральскими языками. Полевые экспедиции, проведенные нами, показали, что часто в деревне лишь несколько пожилых людей разговаривают на том или ином диалекте марийского, удмуртского или хантыйского языков. При этом важным является тот факт, что цифровое описание языков строится в первую очередь на анализе звуков и обсчете формант. Без большого количества реальных звуковых данных невозможно верифицировать правильность транскрипции, которая лежит в основе морфологии, лексикологии, этимологии, лингвогеографии. Только обработка современных аудиозаписей (записи, сделанные не на цифровые носители и хранящиеся в архивах, в большинстве случаев не могут быть обработаны с помощью современных фонетических программ из-за их низкого качества) позволит нам установить, какие записи, сделанные учеными XVIII–XX вв., выполнены на высоком научном уровне и также могут быть привлечены к анализу. Заранее предсказать результаты такой проверки невозможно: например, оказалось, что по исчезающим языка мы можем доверять данным словарей П. С. Палласа (XVIII в.), К. Словцова (XX в.), А. Каннисто (XX в.) и Е. И. Ромбандеевой (XX в.) и не можем принимать к рассмотрению записи Ю. Клапрота (XIX в.) и Б. Мункачи (XX в.). После записи аудиоматериалов по всем диалектным группам уральских языков и анализе их в “LingvoDoc” мы планируем оценить существующие наиболее авторитетные словари и коллекции текстов с точки зрения их надежности и корректные источники также ввести в базу “LingvoDoc”, что, по нашим прогнозам, должно увеличить коллекции данных по каждому уральскому языку России минимум до 100 000 словоформ. На основании анализа этих данных с помощью специальных программ в конце проекта будет подготовлена к изданию монография, посвященная комплексному цифровому описанию уральских диалектов, с разделами, посвященными экспериментально-фонетическому, морфологическому, лексическому и сравнительно-историческому анализу. Также будет подготовлено не менее 12 статей в журналах, рецензируемых Scopus, WoS, и оформлено не менее 19 РИД по аудиословарям и корпусам текстов.

Ожидаемые результаты
В результате работы над проектом будут проведены экспедиции к носителям 19 диалектов уральских языков и созданы аудиословари диалектов уральских языков России, которые по классификации ЮНЕСКО находятся «в серьезной опасности и под угрозой исчезновения». В каждом из словарей будут представлены транскрипции в МФА (IPA), аудиозаписи нескольких произнесений в начальной форме, аудиозаписи контекстов, разметки спектрограмм аудиозаписей словоформ в программе “Praat”, информация о том, является ли слово заимствованием или принадлежит к исконной лексике, параллели из литературного языка и праформы из «Уральского этимологического словаря» под ред. К. Редеи (при наличии), этимологические связи с другими словарями уральских языков. Каждый из аудиословарей будет зарегистрирован как РИД. После создания словарей будет запущены программы обработки материала и получены следующие результаты: 1) экспериментально-фонетические описания гласных для каждого диалекта, выполненные с помощью программы “Phonology”; каждое описание ляжет в основу статьи, поскольку ранее все перечисленные идиомы не были описаны с точки зрения экспериментальной фонетики; 2) этимологический словарь уральских языков, соединяющий 19 аудиословарей, собранных в рамках настоящего проекта, со 135 словарями по другим группам уральских языков, созданных с 2012 года в рамках проектов РНФ, Президента РФ, РФФИ, РГНФ и Правительства РФ; 3) системы соответствий между всеми диалектными группами уральских языков, которые лягут в основу очерков монографии, посвященной генезису уральских диалектных систем; 4) на основе проведенного экспериментально-фонетического анализа будут выявлены существующие издания текстов на диалектах уральских языков, которые выполнены на высоком научном уровне, далее с помощью специальной программы эти тексты будут сконвертированы в корпуса диалектных текстов на платформе “LingvoDoc” (ориентировочный объем около 1 млн. словоформ); 5) по корпусам текстов будут составлены морфологические описания диалектов с указанием на частотность употребления тех или иных морфем в рассматриваемых контекстах, данные описания также войдут в качестве очерков в монографию, посвященную описанию уральских диалектов. В итоге работы над проектом будут подготовлены одна монография, не менее 12 статей в журналах, рецензируемых Scopus, WoS, и 19 этимологических аудиословарей, зарегистрированных как РИД.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2020 году
Планы, поставленные на 2020 год в рамках проекта РНФ были перевыполнены: опубликовано 13 статей WoS / Scopus, из них 3 статьи в журналах Q1. На платформе LingvoDoc созданы 60 словарь уральских диалектов и 14 корпусов текстов и их конкордансов. Из них 20 словарей собраны в экспедициях, проведенных участниками проекта в 1) д. Пасынки, Спировский район, Тверская область, 2) д. Новое Синдорово, Краснослободский район, Республика Мордовия, 3) д. Кузнецово, Горномарийский район, Республика Марий Эл, 4) д. Никишкино, Горномарийский район, Республика Марий Эл, 5) д. Красный Луг, Суксунский окргу, Пермский край, 6) д. Ванькова, Красновишерский район, Пермский край, 7) дд. Большая и Малая Серва, Кудымкарский район, Пермский край, 8) п. Жемчужный, Гайнский район, Пермский край, 9) с. Доег, Юсьвинский округ, Пермский край, 10) д. Тимкино, Чусовский округ, Пермский край, 11) д. Туискерес, Усть-Вымский район, Республика Коми, 12) с. Маджа, Корткеросский район, Республики Коми, 13) с. Туръя, Княжпогостского района, Республики Коми, 14) д. Ӧнчипиорд Усть-Вымского района, Республики Коми, 15) село Ыб, Сыктывдинский район, Республика Коми, 16) с. Грива Койгородского района. Республики Коми, 17) д. Лолошур-Возжи, Граховский район, Удмуртия, 18) д. Новая Казмаска, Завьяловский район, Удмуртия, 19) с. Халясавей, Пуровский район, ЯНАО, 20) пос. Красноселькуп, Красноселькупский район, ЯНАО. 40 словарей и 16 корпусов текстов составлены на основании архивных материалов на разных диалектах уральских языков, найденных в архивах Санкт-Петербурга, Казани, Томска и Хельсинки. Все словари и конкордансы находятся на платформе LingvoDoc по ссылке http://lingvodoc.ispras.ru/dashboard/dictionaries_all, корпуса по ссылке http://lingvodoc.ispras.ru/corpora_all. Для того, чтобы увидеть ресурсы, созданные в рамках проектах, надо выбрать http://lingvodoc.ispras.ru/dashboard/dictionaries_all Режим отображения «По грантам», грант РНФ 20-18-00403. При выборе направлений экспедиций и создания корпусов была поставлена цель максимально полно за три года работы над проектом представить полевые и архивные материалы по каждой диалектной группе уральских языков. Одновременно с работой по проведению экспедиций, работой в архивах, созданием онлайн-словарей и корпусов были поставлены следующие основные исследовательские задачи. 1) Детальный анализ памятников на ранее не описанных и в настоящее время исчезнувших диалектах уральских языков. 2) Поиск новых этимологий на основании представленных словарей, собранных в экспедициях и архивах. 3) Анализ изменений, которые произошли в диалектах за последние 250 лет, с помощью специально созданных на платформе LingvoDoc компьютерных программ с целью установления более точной диалектной классификации по сравнению с той, которая была в XVIII–XIX вв., и с учетом ее изменений в XXI в. 4) Перед программистами ИСП РАН была также поставлена техническая задача, решение которой позволит в будущем объединить корпуса на языках всех народов РФ любого объема на платформе LingvoDoc. 5) Создание на платформе LingvoDoc компьютерной среды для размещения текстов в формате .odt (Word), последующего глоссирования с помощью парсера и снятия омонимии в режиме онлайн. В 2020 г. эта задача была реализована для марийского, эрзянского, мокшанского, коми-зырянского и удмуртского языков. Кратко остановимся на результатах, полученных при решении исследовате В рамках решения этой задачи в 2020 г. были проведены следующие исследовательские работы. а) Были проанализированы особенности ранее не описанной книги «Беседы об истинном Боге и истинной вере на наречии обских остяков» св. Макария (Невского) 1900 г., найденной С. В. Ковылиным в Архиве Томского государственного университета. Результаты данного анализа отражены в 3 статьях, напечатанных в журналах, рецензируемых WoS / Scopus. б) М. П. Безенова также провела анализ памятника удмуртской письменности «Закон Божий» (1912 г.), морфология которого имеет весьма архаичный характер, схожий с реконструкцией праудмуртского состояния, предложенной В. К. Кельмаковым. Результаты этой работы отражены в 2 статьях, напечатанных в журнале, рецензируемом Scopus. в) Выполнен анализ первых словарей мансийских диалектов XVIII–XIX вв., найденных Ю. В. Норманской в Архиве СПб РАН. Анализ данного материала опубликован в 3 статьях, напечатанных в журналах, рецензируемых WoS / Scopus. Проведенный анализ книги на наречии обских селькупов и первых мансийских словарей показал, что эти языки значительно изменились за последние 100–200 лет. Наречие обских остяков, которое в 1900 г. было южноселькупским, в результате интенсивных контактов носителей данного идиома с центральными селькупами поменяло диалектную принадлежность и стало центральным селькупским. Это является уникальным примером таких быстрых изменений диалектно-дифференцирующих черт, которые надежно зафиксированы на всех уровнях языка: фонетическом, морфологическом, лексическом. Как показал наш анализ первых словарей мансийского языка, пермские манси, которые в настоящее время исчезли, но ранее считались единой группой, имели с точки зрения их диалектов очень значительные различия, из-за которых часть диалектов была более близкой к южным, другие – к западным, а некоторые занимали промежуточное положение. Более того анализ материалов XVIII в. показал, что современная диалектная классификация мансийского языка сложилась только в XIX в., а в XVIII в. она была принципиально иной. Таким образом, важность изучения первых памятников на уральских языках и их значение для истории миграций и контактов носителей в прошлом трудно переоценить. Задача № 2. Поиск новых уральских этимологий. Новые полевые и архивные словари и конкордансы текстов дают богатый материал для создания новых этимологий. В 2020 г. результаты этой работы представлены в 2 статьях в журналах, рецензируемых WoS / Scopus. В настоящее время начата работа по сплошной этимологизации аудиословарей, собраных в экспедициях. В 2020 г. в рамках работы над проектом были дополнительно созданы программы “Cognate suggestion” и “Cognate multilanguage suggestion”, которые позволяют на основании уже выявленной системы соответствий в программе “Cognate analysis” и определенного сходства переводов предлагать этимологические аналоги слов из других диалектов или языков. Точность таких предложений достаточно велика. Процент ошибок, которые устраняются вручную, – около 10–15%. Задача № 3. Классификация диалектов с точки зрения фонетико-этимологических критериев, построенная на полном анализе словарей с помощью программы “Cognate analysis”. Традиционный подход к генетической классификации языков, основанный в первую очередь на анализе общих фонетических и морфологических инноваций и используемый большинством ученых-компаративистов, до сих пор не был алгоритмизирован и компьютеризирован, и поэтому его применение могло варьироваться в зависимости от личности ученого. В результате работы по проекту в 2020 г. и работ по проектам прошлых лет на платформе LingvoDoc (lingvodoc.ispras.ru) в настоящее время в открытом доступе находится более 200 (аудио)словарей и (аудио)корпусов уральских диалектов. Этот материал позволил нам приступить к разработке программ анализа данных по уточнению транскрипций (ранее транскрибирование для коми языков было выполнено «на слух» без привлечения фонетических программ), этимологического анализа и построения классификаций на основании обсчета фонетических инноваций в близкородственных языках и диалектах. Данные программы позволяют в полуавтоматическом режиме обрабатывать большие массивы словарных данных (15000–20000 единиц) для установления фонологических систем идиомов, фонетические словари которых введены в LingvoDoc, соединения этимологическими связями, выделения рядов соответствий и дополнительных распределений между ними на материале фонетических словарей диалектов одного языка и близкородственных языков. Эта функция необходима при обработке диалектных материалов: ее обычно очень не хватает диалектологам для выяснения полного набора рядов соответствий в однотипном материале. Пока что эта функция LingvoDoc, насколько нам известно, не имеет аналогов в других системах. В результате анализа материала с помощью алгоритма “Cognate analysis” получаются ряды соответствий для гласных и согласных звуков. В настоящее время ведется работа по такому этимологическому анализу диалектов уральских языков. Поскольку для получения наиболее точных результатов требуются наиболее полные словари по всем диалектным группам, желательно как архивные, так и современные, для большинства языков эта работа еще не завершена. В 2020 г. материал для такого анализа был собран для коми, удмуртского и мансийского языков. В статье WoS Ю. В. Норманской «Коми-язьвинский – диалект коми-пермяцкого или отдельный язык» (Ежегодник финно-угорских исследований. Том 14. 2020, 4. С. 630–643) был опубликован интересный результат, полученный для коми языков, который объясняет наличие разных точек зрения, перечисленных выше. При анализе современных аудиословарей коми языков видно, что по фонетическо-этимологическим критериям расстояние от коми-язьвинского языка до современных диалектов коми-зырянского и коми-пермяцкого языков значительно больше, чем между ними, поэтому с точки зрения фонетических изменений коми-язьвинский в настоящее время является отдельным языком, наиболее близким коми-пермяцким словарям, записанным П. С. Палласом и Никитой Овчинниковым в XVIII в. Однако, как показывает проведенный анализ, 250 лет назад коми-язьвинский и коми-пермяцкий языки имели лишь незначительные диалектные различия, но за последующие два века коми-пермяцкие диалекты претерпели инновационные изменения, сблизившие их с коми-зырянскими диалектами Республики Коми, а коми-язьвинский язык сохранился в архаичном состоянии, в нем представлены особенности, характерные для первых коми-пермяцких словарей XVIII в. Таким образом, понятно, что современные коми-пермяцкие диалекты претерпели значительные изменения, возможно, под влиянием коми-зырянского языка, и современная диалектная классификация коми языков уже значительно отличается от той, которая была 250 лет назад, когда коми-язьвинский и коми-пермяцкий были близкими диалектами одного языка.

 

Публикации

1. Безенова М.П. К особенностям перевода “Закона Божия” (1912 г.) на удмуртский язык: именная морфология Урало-алтайские исследования, № 1 (36). С. 53—70 (год публикации - 2020) https://doi.org/10.37892/2500-2902-2020-36-1-53-70

2. Безенова М.П. К особенностям перевода “Закона Божия” (1912 г.) на удмуртский язык: глагольная морфология Урало-алтайские исследования, № 3 (38), с. 19-32 (год публикации - 2020) https://doi.org/10.37892/2500-2902-2020-38-3-19-32

3. Гайдамашко Р.В. Из наблюдений над русской диалектной лексикой в «Первоначальном учебнике русского языка для чердынских пермяков» 1906 г. Современная русская лексикология, лексикография и лингвогеография., - (год публикации - 2020)

4. Ковылин С.В. Беседы об истинном Боге и истинной вере на наречии обских остяков” св. Макария (Невского), 1900. Глагольная морфология Linguistica Uralica, № 3, p. 181-219 (год публикации - 2020) https://doi.org/10.3176/lu.2020.3.03

5. Ковылин С.В. Особенности синтаксиса памятника селькупской письменности “Беседы об истинном Боге и истинной вере на наречии обских остяков” св. Макария (Невского), 1900 Томский журнал лингвистических и антропологических исследований, 3 (29), c. 113-123 (год публикации - 2020)

6. Кошелюк Н.А. Мансийский язык: история научного освоения Oriental Studies, - (год публикации - 2020)

7. Норманская Ю.В. КАК МЕНЯЛАСЬ ДИАЛЕКТНАЯ ПРИНАДЛЕЖНОСТЬ СЕЛЬКУПСКОГО ГОВОРА С. ИВАНКИНО КОЛПАШЕВСКОГО РАЙОНА В XX в Вестник Томского государственного университета. Филология., № 66. C. 144–157 (год публикации - 2020) https://doi.org/10.17223/19986645/66/8

8. Норманская Ю.В. Названия одежды у прасамодийцев Вестник Томского государственного университета. Филология, 68 (год публикации - 2020) https://doi.org/10.17223/19986645/68/3

9. Норманская Ю.В. Неопубликованный мансийский словарь П.С. Палласа — ранее неизвестный мансийский диалект? Урало-алтайские исследования, № 1 (36). С. 92—100 (год публикации - 2020) https://doi.org/10.37892/2500-2902-2020-36-1-92-100

10. Норманская Ю.В. Словари пермских манси «аборигенов Сибири», собранные П. С. Палласом в XVIII веке Урало-алтайские исследования, № 3(38), с. 71-80 (год публикации - 2020) https://doi.org/10.37892/2500-2902-2020-38-3-71-80

11. Норманская Ю.В. Дискуссионная заметка к статье Н. В. Сайнаковой и С. В. Ковылина "Материалы по топонимике кетского Приобья" Урало-алтайские исследования, 3 (38), с. 152-156 (год публикации - 2020) https://doi.org/10.37892/2500-2902-2020-38-3-152-156

12. Норманская Ю.В. Коми-язьвинский – диалект коми-пермяцкого или отдельный язык Ежегодник финно-угорских исследований, том 14, № 4, с. 628-641 (год публикации - 2020) https://doi.org/10.35634/2224-9443-2020-14-4-628-641

13. Норманская Ю.В. THE SYSTEM OF VARIABLE STRESS IN NORTHERN MANSI DIALECTS AND ITS EXTERNAL CORRESPONDENCES Linguistica Uralica, № 2, p. 133-146 (год публикации - 2020) https://doi.org/10.3176/lu.2020.2.05

14. Сайнакова Н. В., Ковылин С. В. Материалы по топонимике Кетского Приобья как основа для выявления границ расселения диалектно-локальной группы šöšqum/šöšqup и подтверждения промежуточного статуса среднеобского (шёшкумского / шёшкупского) диалекта селькупского языка Урало-алтайские исследования, № 3 (38), с. 130-151 (год публикации - 2020) https://doi.org/10.37892/2500-2902-2020-38-3-130-151

15. Амелина М.К. Система именного склонения западных диалектов тундрового ненецкого языка в «Грамматике самоедского языка» (I пол. XIX в.) архимандрита Вениамина (Смирнова) в сопоставлении с современными полевыми данными Вторая школа-конференция по уралистике. Сборник тезисов., - (год публикации - 2020)

16. - Карельский язык: Почему самое востребованное издание на карельском — словарь, как «собака» превратилась в «поросячий хвостик» и кого можно ёйгать Постнаука, Авторы: Татьяна Пашкова, Ирина Новак, Светлана Нагурная и Андриан Влахов, даты публикации 20.11.2020 (год публикации - )


Аннотация результатов, полученных в 2021 году
В рамках работы по гранту в 2021 году работа шла по следующим направлениям: 1) Проведение 23 экспедиций с целью сбора аудиоматериала по современным диалектам удмуртского, эрзянского, мокшанского, коми-зырянского языков в - Республику Мордовия, Коми, Татарстан, Башкортостан, Чувашию, Оренбургскую область. По этим говорам созданы аудиословари на платформе ЛингвоДок http://lingvodoc.ispras.ru/dashboard/dictionaries_all. Также были проведены экспедиции в Псковскую область, Эстонию, Ставропольский край для сбора материала по сето и эстонскому языку. 2) Создание словарей и корпусов по 170 архивным источникам на - карельском языке (основой для словарей послужили архивные данные, собранные в рамках «Программы по собиранию материала для диалектологического атласа карельского языка» (37,5 тыс. единиц), заполненных в 1937—1950 гг. в 146 населенных пунктах Карелии); коми-пермяцком языке; коми-зырянском языке; удмуртском языке; мансийском языке; селькупском языке. Все созданные словари доступны на платформе ЛингвоДок http://lingvodoc.ispras.ru/dashboard/dictionaries_all, корпуса текстов на http://lingvodoc.ispras.ru/corpora_all 3) В 2020 году на платформе ЛингвоДок программистами ИСП РАН была создана компьютерная среда для размещения текстов в формате .odt (Word), последующего глоссирования с помощью парсера и снятия омонимии в режиме онлайн. В 2021 году в этой среде были созданы корпуса большого объема (от 30 до 100 тыс. словоформ для каждого языка) современных литературных языков со снятой омонимией на удмуртском http://lingvodoc.ispras.ru/dictionary/3648/5/perspective/3648/8/view; на коми-зырянском http://lingvodoc.ispras.ru/dictionary/3428/6/perspective/3428/9/view; http://lingvodoc.ispras.ru/dictionary/3539/766/perspective/3539/769/view; на марийском http://lingvodoc.ispras.ru/dictionary/3421/5/perspective/3421/8/view; на эрзянском http://lingvodoc.ispras.ru/dictionary/4083/4/perspective/4083/7/view, http://lingvodoc.ispras.ru/dictionary/3872/5/perspective/3872/9/view, http://lingvodoc.ispras.ru/dictionary/3814/5/perspective/3814/9/view, 4) сотрудники Финно-угорского института в Гамбурге (Германия) в рамках сотрудничества с ИСП РАН передали на платформу ЛингвоДок все материалы корпусов, созданных на основе архивных аудиозаписей по селькупскому и камасинскому языкам, насчитывающие более 100 тыс. словоформ каждый. Эти материалы были трансформированы в формат ЛингвоДока и размещены на платформе http://lingvodoc.ispras.ru/corpora_all. Далее для камасинского языка, где аудиозаписи в Элане были размечены по предложениям, было выполнено пословное сегментирование и дальнейшая конвертация этих файлов в конкорданс камасинского языка. 5) В результате анализа этого материала и сравнения его с данными по уральским языкам, собранным ранее на платформе ЛингвоДок, в 2021 году опубликовано 22 статьи (из них 16 статей в журналах, индексируемых В WoS, Scopus, в том числе 1 статья в журнале Q1 и 4 статьи в журналах Q2), сделано 23 доклада на международных или всероссийских конференциях (в том числе 3 приглашенных пленарных доклада). С помощью программы Cognate analysis, разработанной нами на платформе ЛингвоДок (результаты ее работы доступны в меню Инструменты только авторам словарей с этимологическими связями, ограничения на открытый доступ к результатам наложены в связи с участившимися случаями их плагиата) был проведен анализ изменений, которые произошли в диалектах карельского, удмуртского, мокшанского, эрзянского, хантыйского, мансийского, селькупского языков за последние 250 лет. 5.1. для карельского языка было введено в научный оборот 146 архивных словарей говоров, собранных в 1937—1950 гг. и содержащих около 37,5 тыс. словоформ. 5.2. Для удмуртского языка было проанализировано 17 говоров всех диалектных групп, из них 7 архивных книг на 4 диалектах, общий объем которых суммарно превосходит 200 тыс. словоформ, и 10 аудиословарей 6 диалектных групп, общий объем которых превосходит 100 тыс. словоформ. 5.3. Для эрзянского языка было проанализировано 35 говоров, для мокшанского языка 17 говоров, принадлежащих к разных диалектным группам, из них 33 словаря, созданных на основе первых книг 1860-1917 гг., и материалов Х.Паасонена, собранных в 1865-1919 гг. и насчитывающих более 15 тыс. словоформ из разных диалектов, и современные данные по 19 говорам, собранные в экспедициях 2020-2021 гг. 5.4. Для селькупского языка были проанализированы словари и конкордансы 20 говоров всех диалектных групп, из них 7 словарей XVIII в., учитывая, что материалы Ю.Клапрота, изданные в 1823 г. были переписаны с рукописей XVIII в., конкордансы 5 селькупских первых книг XIX в., созданных св. Макарием (Невским) и Н.П.Григоровским, общим объемом более 100 тыс. словоформ, 2 конкорданса, созданных на основе корпусов середины XX в, записанных Л.Жабо и А.И.Кузьминой, 6 современных аудиословарей, собранных в полевых условиях. 5.5. Для хантыйского языка был проанализирован материал на 27 говорах всех диалектных групп, в том числе 11 архивных словарей XVIII в., 4 первых кириллических книги и 2 больших словаря (3 издания на ваховском и васюганском диалектах, 3 на обдорском), созданных св. Макарием (Невским), А.А.Дуниным-Горкавичем и священослужителями-хантами во второй половине XIX в., общим объемом более 100 тыс. словоформ и 10 аудиословарей современных восточных и западных диалектов, собранных нами в полевых условиях. 5.6. Для мансийского языка был проанализирован материал на 19 говорах всех диалектных групп, из них 8 словарей, записанных в XVIII в., 6 конкордансов первых книг больших словарей, общим объемом более 100 тыс. словоформ, созданных священослужителями-манси и миссионерами в XIX в., 5 современных аудиословарей, собранных в полевых условиях. Наиболее значимым результатом является тот факт, что 250 лет назад классификация мансийского, хантыйского и селькупского языков была иной: мансийские диалекты еще не имели четких изоглосс, хантыйский исчезнувший южный тобольский диалект, наоборот, отличался 8 инновационными процессами от остальных говоров, в селькупском диалекты, принадлежащие к разным группам в XX в., еще не имели четких диалекто-дифференцирующих изоглосс, но отличались от исчезнувшего крайне южного томского диалекта. Хочется отметить, что, видимо, для всего этого ареала обско-угорских и селькупского языков в XVIII-XIX в. были характерны значительные изменения, которые привели к современных классифкациям и даже к исчезновению наиболее отличающихся диалектов, возможно в связи с переходом их носителей на другие языки, в частности, в тобольском хантыйском видно, что инновации произошли под тюркским влиянием, диалектов башкирского и казахского, носители которых в XVIII в. жили вместе с тобольскими хантами.

 

Публикации

1. Амелина М.К. Система именного склонения западных диалектов тундрового ненецкого языка в исторической перспективе: архивные материалы XIX века и современные полевые данные Родной язык, 2, 2021 (год публикации - 2021)

2. Безенова М.П. Фонетические особенности «Жития Св. Феодора» (1913) на удмуртском языке Урало-алтайские исследования, 2 (41) 2021, с. 22-50 (год публикации - 2021) https://doi.org/10.37892/2500-2902-2021-41-2-21-50

3. Безенова М.П. Морфологические особенности «Жития Св. Феодора» (1913) на удмуртском языке Урало-алтайские исследования, 2021. № 3 (42), 19-32 (год публикации - 2021) https://doi.org/10.37892/2500-2902-2021-42-3-19-32

4. Гайдамашко Р. В., Л. Г. Пономарева, Р Названия ягод в коми-пермяцком языке конца XVIII в. (на материале рукописей Антония Попова) Ежегодник финно-угорских исследований, 2 (15), 2021, c. 228-249 (год публикации - 2021) https://doi.org/10.35634/2224-9443-2021-15-2-228-249

5. Дубровская Н.В., Норманская Ю.В. «ЖЕЛТО-ЗЕЛЕНО-СИНИЕ» ЯЗЫКИ В ЕВРАЗИИ: КАК ОНИ ПОЯВЛЯЮТСЯ И ИСЧЕЗАЮТ? Linguistica Uralica, LVII 2021 2, p. 113-135 (год публикации - 2021) https://doi.org/10.3176/LU.2021.2.03

6. Иткин И. Б., Переверзева С. И. Некоторые уточнения к интерпретации данных обдорского ненецкого словаря Урало-алтайские исследования, 2 (41) 2021, с. 47-60 (год публикации - 2021) https://doi.org/10.37892/2500-2902-2021-41-2-145-154

7. Ковылин С.В. Материалы для ознакомления с наречием остяков Нарымского края» за 1887 год св. Макария (Невского): словоизменительная морфология глагола Сибирский филологический журнал, № 3, 2021, с. 211-230 (год публикации - 2021) https://doi.org/10.17223/18137083/75/16

8. Ковылин С.В. «Материалы для ознакомления с наречием остяков Нарымского края» за 1887 свт. Макария (Невского): именная и местоименная морфология Урало-алтайские исследования, 2 (41) 2021, с. 51-73 (год публикации - 2021) https://doi.org/10.37892/2500-2902-2021-41-2-51-72

9. Кошелюк Н.А. LingvoDoc: New Opportunities for Graphic and Phonetic Analysis of Endangered Language EasyChair, EasyChair Preprint no. 5387 (год публикации - 2021)

10. Кошелюк Н.А. LingvoDoc: Working with Text Corpora EasyChair, EasyChair Preprint no. 6242 (год публикации - 2021)

11. Кошелюк Н.А. Общие инновационные процессы в мансийских диалектах: именная морфология Вестник угроведения, 11, № 2. 2021, с.278-292 (год публикации - 2021) https://doi.org/10.30624/2220-4156-2021-11-2-278-291

12. Кошелюк Н.А. LingvoDoc: extralinguistic information and maps EasyChair, EasyChair Preprint no. 6766 (год публикации - 2021)

13. Молданова И.М. Лексико-семантические и словообразовательные особенности глаголов в материалах книги «Песни реки Казым в собрании Окружного Дома народного творчества» Вестник угроведения, 1 (11) 2021, с. 63-72 (год публикации - 2021) https://doi.org/10.30624/2220-4156-2021-11-1-63-72

14. Новак И.П. Применение методики кластеризации в решении проблем диалектного членения карельского языка (на примере дистрибуции переднеязычных щелевых согласных) Урало-алтайские исследования, 2 (41), 2021, с. 103-132 (год публикации - 2021) https://doi.org/10.37892/2500-2902-2021-41-2-103-132

15. Норманская Ю.В. Первый черемисский словарь — архаический текст или конкорданс слов из нескольких марийских диалектов? Урало-алтайские исследования, 2 (42) 2021, c. 90-99 (год публикации - 2021) https://doi.org/10.37892/2500-2902-2021-42-3-90-83

16. Норманская Ю.В. Стояла ли фонетическая реальность за ударением в обдорском словнике Г. Ф. Миллера? Урало-алтайские исследования, 2 (41) 2021, с. 155-158 (год публикации - 2021) https://doi.org/10.37892/2500-2902-2021-41-2-155-158

17. Норманская Ю.В. Сколько языков коми? Словесная культура Сибири, http://wiki.lib.tsu.ru/shorturl/1tl (год публикации - 2021)

18. Норманская Ю.В. Хантыйские диалекты или языки? Словесная культура Сибири, http://wiki.lib.tsu.ru/shorturl/1tw (год публикации - 2021)

19. Норманская Ю.В. Мансийские диалекты или языки? Словесная культура Сибири, http://wiki.lib.tsu.ru/shorturl/1tr (год публикации - 2021)

20. Норманская Ю.В. История названий одежды в праобско-угорском языке (сравнение лингвистических, археологических и этнографических данных) Словесная культура Сибири, http://wiki.lib.tsu.ru/shorturl/1kp (год публикации - 2021)

21. Норманская Ю.В. Как изменялась оленеводческая терминология у хантов (на материале сравнения первых книг XVIII-XIX вв. и современных диалектов) Словесная культура Сибири, http://wiki.lib.tsu.ru/shorturl/1kr (год публикации - 2021)

22. Федотова И.В. Диалектное членение мансийского языка в диахронии по данным базисной лексики Вестник угроведения, 2 (11) 2021, 338-346 (год публикации - 2021) https://doi.org/10.30624/2220-4156-2021-11-2-338-346

23. - Мансийский язык Постнаука, 19.02.2021, авторы Ю.В.Норманская, Н.А.Кошелюк (год публикации - )

24. - Севернохантыйский язык Постнаука, 02.2021, автор Ю.В.Норманская (год публикации - )

25. - Горномарийский язык Постнаука, 03.2021, автор Ю.В.Норманская (год публикации - )

26. - Мокшанский язык Постнаука, 03.2021, автор Ю.В.Норманская (год публикации - )

27. - Карельский язык Постнаука, 03.2021 (год публикации - )

28. - Вепский язык Постнаука, 03.2021 (год публикации - )

29. - Коми язык Постнаука, 04.2021, автор Норманская Ю.В. (год публикации - )

30. - Кильдинский саамский язык Постнаука, 04.2021, автор Норманская Ю.В. (год публикации - )

31. - Ижорский язык Постнаука, 04.2021, автор Норманская Ю.В. (год публикации - )


Аннотация результатов, полученных в 2022 году
В 2022 г. была проведена заключительная работа по обработке и анализу полевого и архивного материалов, собранных в 2020‒2021 гг. В результате этой работы была создана серия «Кириллические памятники на уральских и алтайских языках» (отв. редактор Ю. В. Норманская). В 2022 г. были изданы первые 3 тома серии: 1 том: Графико-фонетические особенности книг XIX в.; издательская группа «Альма Матер» (Москва), ISBN 978-5-6047271-6-4, 566 с. В этот том вошли статьи участников настоящего проекта: Ю. В. Норманской, М. П. Безеновой, Н. А. Кошелюк, И. М. Молдановой, М. К. Амелиной. 2 том: Ковылин С. В., Норманская Ю. В. Памятники селькупской письменности, созданные святителем Макарием (Невским); издательская группа «Альма Матер» (Москва), ISBN 978-5-6047271-8-8, 302 с. 3 том: Безенова М. П. Памятники письменности на пяти диалектах удмуртского языка конца XIX — начала XX в.; издательская группа «Альма Матер» (Москва), ISBN 978-5-6047271-9-5, 365 с. Помимо этого, было опубликовано 28 статей из них: 3 статьи в журналах Scopus, WoS Q1 и 5 статей в журналах Scopus, WoS Q2. Наиболее интересные научные результаты в 2022 г. были получены для прибалтийско-финских, мордовских и хантыйского языков, по которым нами в этом году на ЛингвоДок (lingvodoc.ispras.ru) были загружены новые полевые и архивные материалы. Карельский язык. На ЛингвоДок было загружено 185 словарей всех диалектных групп карельского языка, которые были сделаны на основе картотеки, хранившейся в библиотеке Карельского научного центра. Ранее считалось, что наиболее ярким маркером генетических различий между карельскими диалектами является рефлексация переднеязычных щелевых согласных. Но интенсивные внутренние миграции карелов послужили причиной сложения довольно непростой картины анализируемого явления. Анализ более 40 000 лексем из всех говоров карельского языка с помощью компьютерных программ показал, что выбор согласного зависит от целого ряда факторов, выступающих в различных комбинациях. Визуализация результатов исследования на карте позволила сделать вывод об ареальной природе диалектно-дифференцирующего фонетического явления; она также демонстрирует, что основные изоглоссы дистрибуции свистящих и шипящих согласных не совпадают с традиционными представлениями о границах диалектов и наречий карельского языка (см. подробнее статью [Новак 2022]). Вепсский язык. В систему ЛингвоДок было загружено 7 словарей вепсского языка, подготовленных также на основе материалов, собранных петрозаводскими учеными в XX в., на южном, северном и среднем диалектах. С помощью авторских программ было создано 2018 этимологий, содержащих 9372 лексемы. В результате их анализа была построена схема близости вепсских говоров, которая показывает, что средневепсские диалекты отличаются друг от друга даже больше, чем от близко расположенных северновепсских. Сето язык. В рамках работы по гранту была проведена экспедиция в районы проживания сето: д. Изборск (Печорский район Псковской области, Россия) и в д. Обиница (волость Сетумаа уезда Вырумаа, Эстония). Были собраны аудиословари от двух печорских сето из д. Изборск, и от двух эстонских сето из д. Обиница. В 2022 г. они стали доступны на платформе ЛингвоДок (lingvodoc.ispras.ru). Мы проанализировали ударение в языке сето в именах, которые имеют финно-угорское происхождение (см. подробнее [Normanskaja 2022]). Анализ в экспериментальной фонетической программе Praat показал, что система ударения принципиально не отличается у российских и эстонских сето. Было выявлено, что наблюдается определенная корреляция между ПУ и ФВ а.п. и соотношением долготы и интенсивности гласных первого и второго слогов в именах в сето: • если в ФВ языке представлена I а.п. (< ПУ I, III а.п.), то в сето долгота гласного второго слога будет больше долготы гласного первого слога; • если в ФВ языке представлена II а.п. (< ПУ IV а.п.), то в сето долгота гласного первого слога будет больше или равна долготе гласного второго слога, • за исключением слов с первым узким, вторым широким гласным, у которых второй гласный будет всегда более длительным, но при ФВ I а.п. максимальная интенсивность будет маркировать гласный второго слога, а при ФВ II а.п. гласный первого слога. В настоящее время можно отметить, что в языке сето, вероятно, сохранились реликты прафинноволжского ударения. Пока это единственный прибалтийско-финский язык, в котором удалось выявить хотя бы частичное сохранение этого явления. Мордовские языки. В результате анализа данных по эрзянскому и мокшанскому языкам, включая полевые записи, материалы Х. Паасонена, кириллические книги, созданные в XIX в., первые словари XVIII в., было выявлено, что современные диалектно-дифференцирующие признаки, достаточно полно описанные в литературе, присутствовали уже в записях XVIII в. Был также проведен компьютерный анализ близости мокшанских и эрзянских диалектов. Для этого на ЛингвоДоке было проанализировано 67 словарей, программным образом построено 2328 этимологий, содержащих 9270 словоформ из разных диалектов. Интересно, что по данным словарей Х. Паасонена компьютерным образом наибольшее отличие выявлено между диалектами переходной и смешанной групп (см. в Приложении «Схема мокшанских диалектов»), некоторые из которых расположены в Торбеевском районе Мордовии (с. Мордовские Юрткули), другие — за пределами Республики, в частности, в Пензенской области: Пензенском районе, Шемышейском районе (с. Колдаис). Ранее эти говоры мало привлекались к анализу, однако у Х. Паасонена собран богатый материал по ним, демонстрирующий, что говоры этих групп отличаются между собой больше, чем остальные группы между собой. Хантыйский язык. В 2021–2022 гг. С. В. Ковылин создал глоссированный корпус публикации св. Макария (Невского) «Материалы для изучения языка васюганских инородцев (остяков) Нарымского края» (1887), изданной в Томских епархиальных ведомостях (1890. № 13. С. 1–24). В настоящее время ее корпус доступен онлайн на платформе ЛингвоДок. При обращении к этому источнику видно, что, с точки зрения вокализма, он значительно отличается от современного васюганского диалекта: в нем представлено 8 гласных графем, в то время как в ваховско-васюганских записях по [DEWOs] их 15. В статье [Normanskaja 2022] васюганская система по св. Макарию была сопоставлена с наиболее значимыми доступными нам источниками по ваховско-васюганским диалектам. В результате анализа было выявлено, что наблюдается корреляция наблюдается между восточными васюганскими рефлексами гласных, представленными в трех источниках, которые были написаны двумя независимыми авторами, разделенными столетием, — П. С. Палласом и св. Макарием (Невским), — и западным обдорским хантыйским диалектом. Она характерна для всех прахантыйских фонем. Но для ПХант. *öö, *ɨɨ, *i, *ii, *u, *ü в обдорском в качестве дублетов присутствуют и другие рефлексы, которые, видимо, являются инновационными. В большинстве случаев, за исключением ПХант. *aa, *a, *oo, *öö, рефлексы в васюганском совпадают и с казымским, шурышкарским и низямским диалектами. На основании этого можно предположить, что именно в васюганском и в обдорском совпадающие рефлексы следует реконструировать для прахантыйского языка, а отличающиеся рефлексы возникли как инновационные. Итак, мы видим, что для карельского, вепсского, мокшанского, хантыйского языков существующие представления о диалектно-дифференцирующих признаках и основанная на них традиционная классификация диалектов должны быть пересмотрены в результате учета новых данных. Новые классификационные схемы доступны пользователям, у которых есть доступ к соответствующим словарям на ЛингвоДоке.

 

Публикации

1. Амелина М.К. Система именного склонения западных диалектов тундрового ненецкого языка в «Грамматике самоедского языка» (I пол. XIX в.) архимандрита Вениамина (Смирнова) в сопоставлении с современными данными Урало-алтайские исследования, № 1, т. 44, с. 7-115 (год публикации - 2022) https://doi.org/10.37892/2500-2902-2022-44-1-7-115

2. Безенова М.П. «Букварь для вотяцких детей Сарапульского уезда»: графико-орфографические и фонетические особенности Урало-алтайские исследования, № 2, т. 45, с. 7-33 (год публикации - 2022) https://doi.org/10.37892/2500-2902-2022-45-2-7-33

3. Кошелюк Н.А. On the Dialect Belonging of Archpriest Simeon Cherkalov’S Archival Mansi Dictionary Easy Chair, № 8823 (год публикации - 2022)

4. Кошелюк Н.А. LingvoDoc: Working with Cognate Analysis Easy Chair, № 7446 (год публикации - 2022)

5. Кошелюк Н.А. ”LingvoDoc” as a Solution to the Problems of Conservation of Endangered Languages (Using Example of the Mansi Language) Easy Chair, № 8383 (год публикации - 2022)

6. Кошелюк Н.А. LingvoDoc: Working with Verb Valency Easy Chair, № 8613 (год публикации - 2022)

7. Кошелюк Н.А. Common Innovative Processes in the Mansi Dialects: Number Indicators of Nominal Paradigm Easy Chair, № 8890 (год публикации - 2022)

8. Кошелюк Н.А. Common Innovative Processes in the Mansi Dialects: Noun Declension Easy Chair, № 8892 (год публикации - 2022)

9. Новак И.П. Именная морфология памятника тверской карельской письменности – перевода «Евангелия от Марка» Вестник НГУ. Серия: История, филология., № 9, т. 21, с. 9-21 (год публикации - 2022) https://doi.org/10.25205/1818-7919-2022-21-9-9-20

10. Новак И.П. Распределение переднеязычных щелевых согласных в говорах карельского языка Средней Карелии (на основе применения алгоритма «анализ когнатов» лингвистической платформы ЛингвоДок) Урало-алтайские языки, № 2, т. 45, с. 79-105 (год публикации - 2022) https://doi.org/10.37892/2500-2902-2022-45-2-79-105

11. Норманская Ю.В. Графико-фонетические различия в хантыйских диалектах по данным источников XVIII в Вестник угроведения, Т. 12. № 1. 2022. С. 84–93 (год публикации - 2022) https://doi.org/10.30624/2220-4156-2022-12-1-84-93

12. Норманская Ю.В. Как менялась классификация мансийских диалектов (исследование на материале первых кириллических книг и словарей XVIII–XIX веков) Сибирский филологический журнал, № 1. 2022. С. 126–143 (год публикации - 2022) https://doi.org/10.17223/18137083/78/10

13. Норманская Ю.В. Ударение в камасинском языке и его ареальные параллели Studia Uralo-Altaica, № 56, p. 229-242 (год публикации - 2022)

14. Норманская Ю.В. Textbook of the Vasyugan Khanty Language, Created by St. Makariy (Nevsky) in 1887, as a Source of Information About the Proto Khanty System of Vowel Phonemes Easy Chair, № 8830 (год публикации - 2022)

15. Норманская Ю.В., Кошелюк Н.А. Accuracy Analysis of Mansi Transcription in Various Sources of the Beginning of the 20th Century Easy Chair, т.09 (год публикации - 2022)

16. Норманская Ю.В., Федотова И.В. Фонетические и лексические инновации в обско-угорских диалектах XVIII-XXI в. по данным архивных и полевых материалов Hämeenmaalta Jamalille : kirja Tapani Salmiselle 07.04.2022, Helsingin yliopiston kirjasto, Хельсинки, т. 1, с. 267-279 (год публикации - 2022) https://doi.org/10.31885/9789515180858

17. Норманская Ю.В., Федотова И.В. Phonetic and lexical innovations in Ob-Ugric dialects in the 18th—21st centuries: new archival and field data Урало-алтайские исследования, т. 46, №3, с. 63-74 (год публикации - 2022) https://doi.org/10.37892/2500-2902-2022-46-3-63-74

18. Пономарева Л. Г. , Гайдамашко Р. В. Названия ягод в коми-пермяцком языке конца XVIII в. (на материале рукописей Антония Попова) Ежегодник финно-угорских исследований, т. 15, № 2, стр. 228-249 (год публикации - 2022) https://doi.org/10.35634/2224-9443-2021-15-2-228-249

19. Федотова И.В. Shared Semantic Patterns in the Basic Vocabulary of the Uralic Languages in Siberia Easy Chair, № 8989 (год публикации - 2022)

20. Федотова И.В. Semantic Shifts in the Samoyedic Basic Vocabulary and Their Parallels. 2. Nature Easy Chair, № 9313 (год публикации - 2022)

21. Ю. В. Норманская, О. Д. Борисенко, И. Б. Белобородов, А. И. Аветисян The software system LingvoDoc and the possibilities it offers for documentation and analysis of ob-ugric languages Doklady Mathematics, Volume 504, 2022, pages 60–82 (Mi danma266) (год публикации - 2022) https://doi.org/10.1134/s106456242203005x

22. Безенова М.П. Памятники письменности на пяти диалектах удмуртского языка конца XIX — начала XX в. 3 том серия Первые кириллические книги на уральских и алтайских языках, 3 том, 365 стр. (год публикации - 2022)

23. Ковылин С.В., Норманская Ю.В. Памятники селькупской письменности, созданные св. Макарием Невским. 2 том серия Кириллические памятники на уральских и алтайских языках, т. 2, 302 стр. (год публикации - 2022)

24. Норманская Ю.В. (отв. редактор) Графико-фонетические особенности книг XIX века. 1 том серия Кириллические памятники на уральских и алтайских языках. изд-во Альма-матер, Москва, 1 том, 566 стр. (год публикации - 2022)


Возможность практического использования результатов
На базе ЛингвоДока планируется создать платформу для обучения языкам РФ, которая будет содержать индивидуально подбираемые задания для каждого пользователя в зависимости от его ошибок. В основу обучающей платформы лягут предложения из глоссированных корпусов текстов со снятой омонимией, объемом не менее 100 тысяч словоупотреблений каждый, которые создаются на ЛингвоДоке. Далее эти тексты будут проанализированы с помощью специальных авторских программ, которые позволят выявить закономерности сочетаемости глаголов, предлогов с определенными падежами, наречиями и другие подобный устойчивые сочетания. По всем национальным языкам эти темы в существующих грамматиках не описаны в полном объеме. Планируется параллельно с этой работой проводить оценки ошибок школьников и студентов в Удмуртии, Коми, Мордовии, ХМАО, Якутии, Башкирии и выявить другие темы, которые тоже нуждаются в большем количестве тренировок. Собранный с помощью специальных программ материал (не менее 10 тысяч упражнений на выбранные тематики для каждого из языков проекта) будет проанализирован специалистами и ранжирован на упражнения для разного уровня владения языком. После этого упражнения будут инсталлированы в программную оболочку обучающей платформы, которую планируется подготовить в рамках настоящего проекта. Далее для каждого пользователя платформы с помощью технологий искусственного интеллекта в зависимости от допускаемых им ошибок будет подбираться индивидуальная траектория обучения.