КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 14-18-03819

НазваниеЯзык как он есть: русский мультимодальный дискурс

РуководительКибрик Андрей Александрович, Доктор филологических наук

Организация финансирования, регион федеральное государственное бюджетное учреждение науки Институт языкознания Российской академии наук, г Москва

Период выполнения при поддержке РНФ 2017 г. - 2018 г. 

Конкурс Конкурс на продление сроков выполнения проектов, поддержанных грантами Российского научного фонда по приоритетному направлению деятельности Российского научного фонда «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».

Область знания, основной код классификатора 08 - Гуманитарные и социальные науки, 08-453 - Языкознание

Ключевые словаязык, когнитивная система, коммуникация, мультимодальность, дискурс, просодия, жесты, направление взора, корпус, эксперимент, нарратив, диалог, грамматика

Код ГРНТИ16.21.33


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Настоящая заявка является продолжением проекта РНФ «Язык как он есть: русский мультимодальный дискурс», завершенного в 2016 году (см. multidiscourse.ru). Этот проект был посвящен созданию новой парадигмы, учитывающей тот факт, что обычная коммуникация между людьми имеет мультиканальную природу. Люди общаются между собой, используя слова, интонацию, жесты, мимику, движения глаз. Все эти коммуникативные каналы употребляются одновременно и в связке между собой. Мы погружены в эту мультиканальную коммуникацию в течение всей жизни, и тем не менее она остается малоисследованным явлением. Этому есть по крайней мере две причины. Во-первых, процесс коммуникации эфемерен и протекает, не оставляя материальных следов. Во-вторых, содержание разных коммуникативных каналов традиционно относится к ведению разных наук, слабо связанных между собой. Так, вербальный канал исследуется лингвистами, а жесты и движения глаз, прежде всего, психологами. В мировой науке в последние годы сформировалось направление, известное как мультимодальные исследования. Термин «мультимодальность» является несколько утрированным, т.к. речь идет по сути о двух модальностях – слуховой (вокальной) и зрительной (кинетической). Поэтому в ходе нашей работы мы пришли к выводу, что более правомерно говорить о мультиканальности: в рамках каждой из двух модальностей параллельно функционирует целый ряд каналов, например, в рамках кинетической модальности это жесты рук, жесты головы, движения глаз и т.д.; см. файл с дополнительной информацией, раздел А. Однако в заголовке проекта остается термин «мультимодальный дискурс», поскольку исходный заголовок не может быть изменен. Исследовательская группа, базирующаяся в Институте языкознания РАН, проводит комплексное исследование мультиканального дискурса на основе единого теоретического и методологического подхода. В рамках этого подхода формируется русскоязычный корпусный ресурс «Рассказы и разговоры о грушах», включающий серию записей естественной коммуникации между несколькими участниками, в совокупности с вокальной и кинетической аннотацией этих записей. Записи были выполнены при помощи оригинальных технических решений, включающих высококачественную аудиозапись и видеозапись, а также регистрацию движений глаз. К числу общих задач, поставленных на очередном этапе, относится качественное развитие мультиканального ресурса, согласование подходов в области анализа вокального и кинетического компонентов, продвижение проекта в международном контексте. Проект должен послужить развитию теории коммуникации и теории дискурса и, в частности, помочь уточнить и переинтерпретировать ряд базовых понятий, таких как разграничение адресанта и адресата, чередование реплик, паузация, дискурсивная единица. При мультиканальном подходе некоторые противопоставления неизбежно становятся менее жесткими – так, адресант, порождающий речь в данный момент, одновременно отслеживает кинетическое поведение слушающего (жесты, направление взора), то есть отчасти является также и адресатом, а слушающий, выполняя кинетическое поведение, отчасти выполняет роль адресанта. Таким образом, коммуникативные действия участников образуют сложную и неоднородную сеть, в которой необходимо признать возможность одновременной передачи значимого сигнала в разные стороны. В рамках проекта ставится также широкий круг конкретных задач, таких как уточнение роли просодии как интерфейса между речью и кинетическим поведением, развитие аннотации кинетического поведения, исследование плавности речи и жестикуляции, изучение темпа речи и жестикуляции, изучение координации речевых и жестовых единиц, разработка системы поиска в корпусе и ряд других. Совокупность этих задач обладает высокой степенью научной значимости. Большинство обозначенных задач являются новыми и ранее непосредственно не ставились. Решение этих задач существенно продвинет знания в области естественного человеческого общения. Все задачи непосредственно вытекают из работы, проведенной в рамках проекта 2014-2016 гг. Актуальность продолжения проекта обусловлена тем, что мультимодальные исследования как междисциплинарное направление продолжают набирать силу, появляется все больше новых монографий, журналов, конференций по этой тематике. В российской науке этой областью занимается лишь небольшое число исследователей. Русский язык сильно недопредставлен в мировых исследованиях по мультимодальности, а данный проект может существенно продвинуть исследование русского языка и интерес к русскому языку в международном контексте. Новизна проекта определяется тем, что предложенное нами исследование не имеет прямых аналогов. Во-первых, мы предлагаем подход, базирующийся на лингвистическом анализе и опирающийся на отечественную традицию изучения просодии – что в мультимодальных исследованиях бывает представлено далеко не всегда. Во-вторых, мы предлагаем единый формат для описания максимально широкого круга явлений, относящихся к разным каналам – от вербального компонента до различных типов кинетического поведения и движений глаз. Следует отметить, что от создаваемого нами корпусного ресурса выигрывает не только наш собственный коллектив, но и научное сообщество в целом, поскольку подобного общедоступного мультиканального (мультимодального) ресурса, сравнимого по детализации с нашим, в мировой науке, по-видимому, не существует.

Ожидаемые результаты
К числу запланированных результатов в области теории коммуникации и теории дискурса относится переинтерпретация ряда базовых понятий, таких как разграничение адресанта/адресата, чередование реплик и паузация, в контексте мультиканальной перспективы, описание роли просодии как интерфейса между речью и кинетическим поведением, согласование подходов в области анализа вокального и кинетического компонентов. Запланированные результаты в области методологии включают уточнение схемы кинетической аннотации, разработку поисковой системы, исследование возможностей автоматического определения движений в видеопотоке. В рамках проекта предполагается целая серия конкретных научных результатов по разным вопросам мультиканальной коммуникации, такие как анализ причин и сигналов нарушения плавности речи и жестов, изучение координации вокальных и жестовых единиц, исследование темпа речи и жестикуляции, анализ недостаточно изученных типов кинетического поведения, определение кинетических коррелятов референциального выбора, выявление паттернов поведения на разных этапах коммуникации. Коллектив работает на мировом уровне, хорошо информирован в разных областях современных исследований, контактирует с зарубежными коллегами, активно обнародует свои результаты в докладах и публикациях. Значимость проекта в научном сообществе определяется тем, что создаваемый ресурс сможет использоваться широким кругом исследователей, интересующихся мультимодальной коммуникацией и, вероятно, с течением времени интерес к этому ресурсу будет только возрастать. В более широком контексте социальная значимость проекта обусловлена тем, что он поможет развить и расширить международный интерес к русскому языку и русскоязычным ресурсам. Данный проект относится к фундаментальной науке, но его результаты могут иметь приложения в области человеко-машинного общения, распознавания визуальных и звуковых образов, а также в области диагностики и терапии речевых и двигательных расстройств.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2017 году
Исследовательская группа, базирующаяся в Институте языкознания РАН, на основе единого теоретического и методологического подхода проводит комплексное исследование русского мультиканального дискурса «Язык как он есть». На этапе 2017 года были продолжены аннотирование и анализ ресурса «Рассказы и разговоры о грушах», собранного в 2014–2016 гг. Ресурс был собран при помощи оригинальных технических решений, включающих высококачественную аудиозапись и видеозапись, а также регистрацию движений глаз. Каждая запись продолжалась примерно один час и включала общение четырех коммуникантов с фиксированными ролями – рассказчика, комментатора, пересказчика и слушателя. Разработанная методика включает следующие этапы. Перед началом основной части рассказчик и комментатор смотрели на персональных компьютерах «Фильм о грушах» (Chafe ed. 1980), стараясь как можно точнее запомнить сюжет фильма. Потом начиналась основная часть – сначала рассказчик рассказывал пересказчику содержание фильма, это был монологический этап рассказа. Затем в ходе интерактивного этапа разговора комментатор добавлял детали и при необходимости исправлял рассказ рассказчика, а пересказчик задавал уточняющие вопросы, проверяя свое понимание содержания фильма. После этого к собеседникам присоединялся слушатель и начинался еще один монологический этап – этап пересказа, в ходе которого пересказчик пересказывал фильм слушателю. Наконец, слушатель письменно фиксировал содержание фильма. В настоящее время подкорпус, включающий несколько записей, в состав каждой из которых входит 15 медиафайлов, а также различного рода транскрипты (вокальный, мануальный, цефалический и окуломоторный) размещен на сайте проекта по адресу http://multidiscourse.ru/corpus/. В 2017 году по той же процедуре была собрана вторая часть ресурса «Рассказы и разговоры о грушах», которая включает 16 записей общей длительностью 6 часов и средней длительностью 21 мин. В новых записях приняли участие 64 русскоязычных испытуемых в возрасте от 18 до 36 лет. Была разработана новая кинетическая анннотационная схема для среды ELAN, позволяющая системно аннотировать иерархически организованные жестовые единицы – жестовые цепочки, отдельные жесты и их фазы – как аннотации независимых слоев в среде ELAN. Жестовые единицы аннотируются независимо для левой и правой руки. В подробной аннотационной схеме была реализована систематическая дифференциация между коммуникативно значимыми жестами и общим кинетическим фоном, опирающаяся на такие кинетические параметры, как усилие, скорость, траектория, направление движения и т.д. Предлагаемая аннотационная схема позволяет аннотировать не только жесты, но также и другие компоненты жестового поведения, такие как адапторы, позы и смены поз. Данная схема была реализована в первую очередь как схема аннотации мануальных движений, то есть движений рук. В то же время эта схема принципиально применима и к другим жестовым компонентам, в частности цефалическому (движения головы). Аннотирование движений головы, мимики и положения тела в пространстве, проведенное в 2017 году, было основано на тех же принципах, которые были разработаны для аннотирования мануальных движений, подробнее см. http://multidiscourse.ru/annotation/. Мы произвели детальный анализ движений головы с формальной точки зрения и определили функции движений головы в дискурсе. Кроме того, схема ориентирована на сопоставление кинетических действий с единицами других коммуникативных каналов. Было выполнено пилотное описание положения тел собеседников и анализ позовых паттернов. Была предложена предварительная схема описания мимического поведения. Кроме того, было уточнено понятие элементарной дискурсивной единицы (ЭДЕ), ранее определенной в рамках вокальной модальности, с учетом контекста кинетических компонентов дискурса. В ходе работы в 2017 году мы уточнили характер временно́й координации вокального компонента и мануальной жестикуляции. Во-первых, было проверено предположение об определенном параллелизме между коммуникативно-просодическими пиками в устной речи (акцентными пиками) и маховыми фазами мануальных жестов. По данным проанализированного подкорпуса можно заключить, что время начала маховой фазы мануальных жестов обычно опережает время начала коммуникативно-просодических пиков. Согласно нашим предыдущим результатам (Федорова и др. 2016), однако, жесты опережают ЭДЕ только менее чем в половине случаев. Таким образом, результат для пары «акцент—мах» не полностью совпадает для пары «ЭДЕ–жест». Во-вторых, мы исследовали соотношение темпа речи и активности мануальной жестикуляции. Каждому жесту, сопровождающему речь, была поставлена в соответствие конкретная ЭДЕ (либо серия ЭДЕ) с указанием темпа, определенного автоматически с помощью специально написанного скрипта и, наоборот, каждой ЭДЕ, сопряженной с жестикуляцией, приписан жест либо серия жестов. Полученные результаты дают основания утверждать, что медленные ЭДЕ обычно встречаются вне жестов и при этом обладают меньшей продолжительностью, чем ЭДЕ с нормальным или убыстренным темпом. Быстрые ЭДЕ демонстрируют более существенную вариативность, что требует анализа дополнительных факторов, в первую очередь контекста. В-третьих, были исследованы функции, длительность и особенности жестов, появляющихся при речевых сбоях. Мы обнаружили, что жесты, появляющиеся с речевыми сбоями, оказываются длиннее, чем жесты, не сопровождающиеся речевыми сбоями. Кроме того, эти две группы различаются по времени начала жеста – жесты с речевыми сбоями обычно начинаются позже, чем жесты без сбоев. Были разработаны принципы пилотной референциальной аннотации; мы исследовали движения глаз, мануальные жесты и просодию как потенциальные факторы, влияющие на референциальный выбор собеседников. Мы обнаружили, что полная именная группа чаще сопровождается глазной саккадой, чем редуцированные референциальные выражения – местоимение и нулевая референция. С другой стороны, если маховой части жеста соответствует референциальное выражение, то оно обычно представляет собой интродуктивную полную именную группу. В экспериментальном исследовании речевых сбоев были описаны трудности поиска адекватной номинации в связи с объективным отсутствием соответствующего языкового выражения в общем лексиконе собеседников. Проведенный качественный и количественный анализ показал, что частотность упоминаний референта не связана с его когнитивной доступностью, а наличие речевых сбоев, сопряженных с выбором подходящего референциального выражения, наоборот, связано со степенью когнитивной доступности. Мы рассмотрели вербальные, кинетические и глазодвигательные особенности поведения собеседников в переходные моменты – от монолога к разговору и обратно, а также особенности, связанные с началом обоих монологов. Был описан типичный паттерн мультиканального поведения собеседников в переходные моменты: координация вокального поведения и мануальных жестов, характерные повороты и кивки головой, мимическая активность, в первую очередь улыбка, а также взгляд, задерживающийся на предыдущем собеседнике. В ходе работы были разработаны общие принципы поисковой системы, учитывающие базовые свойства мультиканальной дискурсивной аннотации. В экспериментальном порядке был реализован прототип использования «внешнего» поискового движка ELAN в веб-окружении. Серверная часть была выполнена при помощи технологии Java Servlet – производится подключение к ELAN и через входящий в стандартную библиотеку модуль elan.jar запускается поиск; результаты преобразуются в html-таблицу. Клиентская часть написана на языке JavaScript (фреймворк Vue.js). В настоящее время доступен простой поиск по отдельным слоям аннотации. Также было проведено исследование в области алгоритмического определения моментов движения в видеопотоке, наиболее подходящих для задач разметки движения. Была разработана утилита, программным образом определяющая и автоматически отображающая моменты движения в видеопотоке, что облегчило процедуру разметки мануальных движений. Научная работа по проекту строится в форме регулярных научных семинаров, которые происходят один раз в 10 дней в Институте языкознания РАН. Детальная информация о проекте размещена на сайте http://multidiscourse.ru/. В 2017 году участники коллектива сделали 18 докладов на международных конференциях, было подготовлено и реализовано 13 публикаций по теме проекта, см. раздел «Публикации и доклады» на сайте проекта http://www.multidiscourse.ru/publications/. Все запланированные на 2017 год задачи были полностью выполнены.

 

Публикации

1. Кибрик А.А. Русский мультиканальный дискурс. Часть II. Разработка корпуса и направления исследований Психологический журнал, - (год публикации - 2018)

2. Литвиненко А.О., Николаева Ю.В., Кибрик А.А. Аннотирование мультиканального дискурса: мануальные жесты Е.В. Печенкова, М.В. Фаликман (ред.) Когнитивная наука в Москве: новые исследования. Материалы конференции 15 июня 2017 г., Е.В. Печенкова, М.В. Фаликман (ред.) Когнитивная наука в Москве: новые исследования. Материалы конференции 15 июня 2017 г. М.: БукиВеди, ИППиП. 2017. С. 516-520. (год публикации - 2017)

3. Литвиненко А.О., Николаева Ю.В., Кибрик А.А. Аннотирование русских мануальных жестов: теоретические и практические вопросы Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 31 мая — 3 июня 2017 г.), Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 31 мая — 3 июня 2017 г.). Вып. 16 (23): В 2 т. — М.: Изд-во РГГУ, 2017. Т.2 С. 255–268 (год публикации - 2017)

4. Николаева Ю.В. Жесты, которые оформляют устный рассказ Е.В. Печенкова, М.В. Фаликман (ред.) Когнитивная наука в Москве: новые исследования. Материалы конференции 15 июня 2017 г., Е.В. Печенкова, М.В. Фаликман (ред.) Когнитивная наука в Москве: новые исследования. Материалы конференции 15 июня 2017 г. М.: БукиВеди, ИППиП. 2017. С. 545–549. (год публикации - 2017)

5. Николаева Ю.В. Pragmatic gestures in Russian retellings of "The Pear Stories" Российский журнал когнитивной науки, Российский журнал когнитивной науки, том 4 (3) (год публикации - 2017)

6. Сухова Н.В. Значения жестовых единиц: к вопросу об аннотировании жестов головы Российская пиарология-4: тренды и драйверы: сборник научных трудов в честь профессора Л.В. Минаевой / Под ред. А.Д. Кривоносова. СПб., Российская пиарология-4: тренды и драйверы: сборник научных трудов в честь профессора Л.В. Минаевой / Под ред. А.Д. Кривоносова. СПб.: Изд-во СПбГЭУ, 2017. С. 82-87. (год публикации - 2017)

7. Федорова О.В. Распределение зрительного внимания собеседников в естественной коммуникации: 50 лет спустя Е.В. Печенкова, М.В. Фаликман (ред.) Когнитивная наука в Москве: новые исследования. Материалы конференции 15 июня 2017 г., Е.В. Печенкова, М.В. Фаликман (ред.) Когнитивная наука в Москве: новые исследования. Материалы конференции 15 июня 2017 г. М.: БукиВеди, ИППиП. 2017. С. 370–375. (год публикации - 2017)

8. Кибрик А.А., Федорова О.В., Литвиненко А.О., Николаева Ю.В. An empirical study of multichannel communication Embodied and Situated Language Processing Conference. September 10–12, 2017. Moscow. Abstracts. P. 35–36., Embodied and Situated Language Processing Conference. September 10–12, 2017. Moscow. Abstracts. P. 35–36. (год публикации - 2017)

9. Кибрик А.А., Федорова О.В., Николаева Ю.В. Russian Multichannel Discourse International Conference on Multimodal Communication. Abstracts. P. 25, International Conference on Multimodal Communication. Abstracts. P. 25 (год публикации - 2017)

10. Николаева Ю.В. Прагматические жесты в рассказе (исследование на материале русского языка) 15th Slavic Cognitive Linguistics Conference. 12–14 October 2017. Institute for Linguistic Studies, St. Petersburg. Book of abstracts., 15th Slavic Cognitive Linguistics Conference. 12–14 October 2017. Institute for Linguistic Studies, St. Petersburg. Book of abstracts. P. 47-48. (год публикации - 2017)

11. Николаева Ю.В. Gesticulation reflects speaker’s cognitive processes during a story retelling Embodied and Situated Language Processing Conference. September 10–12, 2017. Moscow. Abstracts. P. 93., Embodied and Situated Language Processing Conference. September 10–12, 2017. Moscow. Abstracts. P. 93. (год публикации - 2017)

12. Сухова Н.В., Николаева Ю.В. On Defining Cephalic Gesture Categories International Conference on Multimodal Communication. Abstracts. P. 29., International Conference on Multimodal Communication. Abstracts. P. 29. (год публикации - 2017)

13. Федорова О.В., Кибрик А.А. Язык как он есть: непрерывность бимодальной коммуникации 15th Slavic Cognitive Linguistics Conference. 12–14 October 2017. Institute for Linguistic Studies, St. Petersburg. Book of abstracts., 15th Slavic Cognitive Linguistics Conference. 12–14 October 2017. Institute for Linguistic Studies, St. Petersburg. Book of abstracts. P. 14–15. (год публикации - 2017)

14. - Российские лингвисты предложили новый подход к описанию жестов рук при спонтанной речи Пресс-Центр ФАНО России, Дата публикации: 05.09.2017 (год публикации - )


Аннотация результатов, полученных в 2018 году
Исследовательская группа, базирующаяся в Институте языкознания РАН, на основе единого теоретического и методологического подхода с 2014 г. проводит комплексное исследование русского мультиканального дискурса «Язык как он есть». В ходе работы в 2014–2017 гг. был создан ресурс «Рассказы и разговоры о грушах». Ресурс был собран при помощи оригинальных технических решений, включающих высококачественную аудиозапись и видеозапись, а также регистрацию движений глаз. Летом 2015 г. была собрана первая часть ресурса, включающая 24 записи общей длительностью 9 часов. В 2017 г. по той же процедуре была собрана вторая часть ресурса «Рассказы и разговоры о грушах», состоящая из 16 записей общей длительностью 6 часов. В общей сложности в записях приняли участие 160 человек в возрасте от 18 до 36 лет. В настоящее время эталонный подкорпус, состоящий из трех записей, в состав каждой из которых входит 18 медиафайлов, а также различного рода транскрипты (вокальный, мануальный, цефалический и окуломоторный) размещен на сайте проекта http://multidiscourse.ru/. В 2018 г. были продолжены как аннотирование, так и анализ собранного ресурса. В ходе работы была уточнена кинетическая анннотационная схема для среды ELAN, позволяющая системно аннотировать иерархически организованные жестовые единицы – жестовые цепочки, отдельные жесты и их фазы – как аннотации независимых слоев в среде ELAN. Данная схема была реализована в первую очередь как схема аннотации мануальных движений, то есть движений рук (см. описание разработанной аннотационной схемы на сайте проекта: http://multidiscourse.ru/annotation/). Аннотирование движений головы, мимики и движений туловища в пространстве, проведенное в 2018 г., было основано на тех же принципах, которые были разработаны для аннотирования мануальных движений, подробнее см. http://multidiscourse.ru/annotation/. Кроме того, созданные схемы были ориентированы на сопоставление кинетических действий с единицами других коммуникативных каналов. Был проанализирован ряд основных теоретических понятий теории коммуникации и дискурса. В области разграничения ролей адресанта и адресата было проведено исследование взаимозависимости между направлением взгляда (=зрительным вниманием) коммуниканта и его коммуникативной ролью. Были разработаны принципы мультиканального портретирования. Портрет – это совокупность характеристик мультиканального поведения человека. Мы выделяем просодический, окуломоторный и жестовый портреты. Просодический портрет характеризует постоянные свойства конкретного человека, такие как диапазон частоты основного тона голоса. Просодический портрет необходим на этапе первичного аннотирования материала. Окуломоторный портрет создается после процедуры полуавтоматической аннотации и используется на этапе анализа. Стандартный окуломоторный портрет включает данные о суммарном количестве фиксаций, суммарной длительности фиксаций, средней, минимальной, максимальной длительностях, о 25, 50 и 75% квантилях, а также аналогичное распределение фиксаций на Рассказчике, Комментаторе, Слушателе и окружении. Расширенный окуломоторный портрет включает аналогичные данные о распределении фиксаций говорящих по этапам рассказа, разговора и пересказа, а также более сложную таблицу распределения фиксаций на части тела испытуемых – лицо, руки, корпус и другие части тела. Жестовый портрет выполняет двойную функцию – он необходим как на этапе аннотирования жестов, так и на этапе анализа. Согласно нашей методологии, жестовый портрет состоит из двух основных частей – предварительного жестового портрета и аналитического портрета. Предварительный портрет создается на основе анализа 10% собранного материала и включает следующие характеристики: (не)склонность к неподвижности, (не)склонность к использованию адапторов, типичную амплитуду жеста, типичную скорость жеста, преобладание двуручных или одноручных жестов, распределение по рукости и др. Аналитический жестовый портрет создается после завершения процедуры мануального аннотирования. Данные, необходимые для создания аналитического портрета, в частности включают: суммарное количество мануальных жестов, их длительность, среднюю, минимальную, максимальную длительности, а также распределение по 25, 50 и 75% квантилям. В ходе работы была изучена роль просодии как интерфейса между речью и кинетическим поведением человека. Был уточнен характер временно́й координации вокального компонента и мануальной жестикуляции. Во-первых, было показано, что уровень координации в парах вида «жест – ЭДЕ» значительно превосходит уровень координации в парах вида «мах – акцентированная словоформа», при этом для пар второго вида характерен опережающий характер жестикуляции при любом методе оценки, тогда как жесты скорее опережают ЭДЕ при интегральной оценке, учитывающей и левую, и правую границу, но их левые границы чаще запаздывают по отношению к левым границам ЭДЕ. Кроме того, было обнаружено, что функциональный тип жеста, продолжительность жестикуляционной единицы, а также характер движения тона в акцентированной словоформе оказывают влияние на характер координации. Во-вторых, мы исследовали соотношение темпа речи и активности мануальной жестикуляции на разных этапах коммуникации. Было обнаружено, что для всех говорящих, участвовавших как в монологических, так и в диалогических частях записи, в монологе отношение количества жестовых единиц к количеству речевых единиц значимо превышает аналогичный параметр в диалоге. В-третьих, были исследованы функции, длительность и особенности жестов, появляющихся при речевых сбоях. Было обнаружено, что ЭДЕ с речевыми сбоями часто совпадают с жестовыми сбоями. Если ЭДЕ не была завершена в связи с вмешательством другого участника, для таких ЭДЕ вероятность сопровождения жестом меньше, чем для прочих ЭДЕ. Кроме того, число жестовых сбоев оказалось значимо меньше числа встреченных в корпусе речевых сбоев. Были разработаны принципы референциальной аннотации, см. http://multidiscourse.ru/annotation/; были исследованы движения глаз, мануальные жесты и просодия как потенциальные факторы, влияющие на референциальный выбор собеседников. Было установлено, что в значимо большем количестве случаев на полные ИГ с вершиной-существительным и демонстративом махи приходятся чаще, чем на личные местоимения. Для просодического компонента было выявлено, что когда мах указательного жеста семантически совпадал с местоимением, оно сопровождалось акцентом. Для окуломоторного компонента было выявлено, что 2/3 реф. единиц, включающих полные ИГ с вершиной-существительным, сопровождались фиксациями. Решающим фактором для наличия фиксации являлась конечная позиция референциальной единицы в составе ЭДЕ. В экспериментальном исследовании речевых сбоев были описаны трудности поиска адекватной номинации в связи с объективным отсутствием соответствующего языкового выражения в общем лексиконе собеседников. Проведенный качественный и количественный анализ показал, что частотность упоминаний референта не связана с его когнитивной доступностью, а наличие речевых сбоев, сопряженных с выбором подходящего референциального выражения, наоборот, связано со степенью когнитивной доступности. Были рассмотрены вербальные, кинетические и окуломоторные особенности поведения собеседников в переходные моменты – от монолога к разговору и обратно, а также особенности, связанные с началом обоих монологов. Был описан типичный паттерн мультиканального поведения собеседников в переходные моменты, в том числе: координация вокального поведения и мануальных жестов, характерные повороты и кивки головой, мимическая активность, в первую очередь улыбка, а также взгляд, задерживающийся на предыдущем собеседнике. Было проведено исследование взаимосвязи между движениями глаз Рассказчика во время просмотра «Фильма о грушах» и особенностями его последующего пересказа. Было показано, что количество глазных фиксаций на персонажах фильма, которые упоминались рассказчиком чаще, было значимо больше, чем на более редко упоминаемых референтах. Средняя длина фиксаций во время просмотра фильма на персонажах, которые упоминались в последующем пересказе чаще, значимо превышала среднюю длину фиксаций на тех персонажах, о которых говорящий упоминал реже (девочка, мужчина с козой). Были разработаны принципы пользовательского интерфейса системы поиска и развернута первая версия поиска, см. http://multidiscourse.ru/search/. Клиентская часть была реализована как одностраничное приложение на языке Javascript. Для описания элементов интерфейса используется фреймворк Semantic UI. В онлайн-интерфейсе пользователю доступны возможности, имеющиеся во встроенном поиске программы ELAN, однако процесс составления запроса сделан более интуитивным. Серверная часть была реализована на Java. Запросы от клиентской части (создаваемые в формате JSON) обрабатываются с использованием Java Servlet, далее в качестве механизма поиска используются классы ELAN. Полученные результаты конвертируются в JSON и отправляются клиенту. В выдаче по запросу пользователь получает список контекстов, ассоциированных с фрагментами видеофайлов (связь обеспечена при помощи youtube и video.js). Уточнены способы преобразования данных из ELAN-разметки в реляционные БД MySQL, оптимизированы запросы, сопоставляющие единицы двух каналов между собой и извлекающие данные из полученных таблиц. Было продолжено исследование возможности алгоритмического определения моментов движения в видеопотоке. Опробовались варианты детекции движений головы и рук на основе компьютерного зрения. Было проведено обзорное исследование доступных вариантов программного обеспечения. Были применены метрики оценки точности детекции в разных вариантах алгоритмов, оценивалась целесообразность их применения. Также были предприняты попытки собственных реализаций программных решений детекции движения рук. Одна из успешных реализаций была основана на технике вычитания фона и детекции движения на основании заданного порога количества изменившихся пикселей в кадре видеозаписи. Скачивание доступно по адресу: https://gitlab.com/multidiscourse/multidiscourse/tree/manuMotions/green_people. В ходе работы в 2018 г. была создана англоязычная версия сайта проекта, доступная по адресу: https://multidiscourse.ru/en. Научная работа по проекту строилась в форме регулярных научных семинаров, которые происходили один раз в 10 дней в Институте языкознания РАН. Детальная информация о проекте размещена на сайте http://multidiscourse.ru/. В 2018 г. участники коллектива сделали 24 доклада на международных конференциях, было подготовлено и реализовано 27 публикаций по теме проекта, см. раздел «Публикации и доклады» на сайте проекта http://www.multidiscourse.ru/publications/. Все запланированные на 2018 г. задачи были полностью выполнены.

 

Публикации

1. Кибрик А.А., Федорова О.В. An empirical study of multichannel communication: Russian Pear Chats and Stories Психология. Журнал Высшей Школы экономики, Психология. Журнал Высшей Школы экономики. — 2018. — Т. 15, № 2. — С. 191–200. (год публикации - 2018) https://doi.org/10.17323/1813-8918-2018-2-191-200

2. Кибрик А.А., Федорова О.В. Language production and comprehension in face-to-face multichannel communication Компьютерная лингвистика и интеллектуальные технологии: По мате­риалам ежегодной международной конференции Диалог (Москва, 30 мая — 2 июня 2018 г.). — Vol. 17. — Москва, 2018., Компьютерная лингвистика и интеллектуальные технологии: По мате­риалам ежегодной международной конференции Диалог (Москва, 30 мая — 2 июня 2018 г.). — Vol. 17. — Москва, 2018. — P. 305–316. (год публикации - 2018)

3. Кибрик А.А., Федорова О.В. A «Portrait» Approach to Multichannel Discourse Proceedings of LREC 2018, Eleventh International Conference on Language Resources and Evaluation. — Miyazaki, Japan, 2018., Proceedings of LREC 2018, Eleventh International Conference on Language Resources and Evaluation. — Miyazaki, Japan, 2018. — P. 1908–1912. (год публикации - 2018)

4. Кибрик А.А., Федорова О.В. Жестикуляция, сопровождающая речь: индивидуальные различия Когнитивное моделирование: Труды Шестого Международного форума по когнитивному моделированию (30 сентября - 07 октября 2018 г., Тель-Авив, Израиль). В 2-х частях., Когнитивное моделирование: Труды Шестого Международного форума по когнитивному моделированию (30 сентября - 07 октября 2018 г., Тель-Авив, Израиль). В 2-х частях. (год публикации - 2018)

5. Кибрик А.А., Федорова О.В. О структуре мультиканального дискурса Образы языка и зигзаги дискурса. Сборник научных статей к 70-летию В.З.Демьянкова, ред. В.В.Фещенко. М.: Культурная революция, 2018., Образы языка и зигзаги дискурса. Сборник научных статей к 70-летию В.З.Демьянкова, ред. В.В.Фещенко. М.: Культурная революция, 2018, 180–191. (год публикации - 2018)

6. Кибрик А.А., Федорова О.В., Подлесская В.И. Мультиканальные корпуса: вчера, сегодня, завтра Гуманитарные чтения РГГУ – 2017, ред. А.Б. Безбородов. РГГУ М, 2018., Гуманитарные чтения РГГУ – 2017, ред. А.Б. Безбородов. — РГГУ М, 2018. — С. 499–511. (год публикации - 2018)

7. Литвиненко А.О., Кибрик А.А., Федорова О.В., Николаева Ю.В. Annotating hand movements in multichannel discourse: gestures, adaptors and manual postures Российский журнал когнитивной науки, Российский журнал когнитивной науки, 5. С. 4–17. (год публикации - 2018)

8. Николаева Ю.В. Жестовые сбои в диалоге Труды Института русского языка им. В.В. Виноградова, - (год публикации - 2019)

9. Николаева Ю.В. Рецензия на кн.: Гришина Елена. Русская жестикуляция с лингвистической точки зрения. Корпусные исследования. М.: Издательский дом "Языки славянской культуры", 2017 Вестник Моск. ун-та. Сер. 9. Филология. 2018 №3, Вестник Моск. ун-та. Сер. 9. Филология. 2018 №3, 194-198 (год публикации - 2018)

10. Федорова О.В. О русской жестикуляции с лингвистической точки зрения (к выходу монографии Е.А. Гришиной) Вопросы языкознания, Вопросы языкознания, 5. С. 114–123 (год публикации - 2018) https://doi.org/10.31857/S0373658X0001400-9

11. Федорова О.В. О коммуникативной функции взгляда Труды Института русского языка им. В.В. Виноградова, - (год публикации - 2019)

12. Федорова О.В., Жердев И.Ю. Следи за руками собеседника! (о стратегиях распределения зрительного внимания) Экспериментальная психология, - (год публикации - 2019)

13. Федорова О.В., Кибрик А.А. Общее, индивидуальное и контекст в мультиканальной коммуникации Когнитивные исследования языка, Когнитивные исследования языка. — 2018. — Т. 33. — С. 637–645. (год публикации - 2018)

14. Буденная Е.В. Скрытые связи референциального выбора и указательных махов VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018., VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018. С. 1291-1293. (год публикации - 2018)

15. Евдокимова А.А., Сухова Н.В. Movements and Meanings Overlap in Cephalic Annotation VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018., VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018. С. 1294–1296. (год публикации - 2018)

16. Евдокимова А.А., Сухова Н.В. Towards Cephalic Annotation: Do We Turn to Change the Posture? Night Whites 2018: The Fourth St. Petersburg Winter Workshop on Experimental Studies of Speech and Language. 26-27.02.2018., Night Whites 2018: The Fourth St. Petersburg Winter Workshop on Experimental Studies of Speech and Language. 26-27.02.2018. p. 42. (год публикации - 2018)

17. Кибрик А.А. Сходства и различия между вокальным и кинетическим компонентами коммуникации VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018., VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018. С. 1334–1337. (год публикации - 2018)

18. Кибрик А.А., Федорова О.В. Gesticulation portrait: A prerequisite for understanding gesture 8th International Conference on Gesture Studies. Cape Town, 4-8.07.2018., 8th International Conference on Gesture Studies. Cape Town, 4-8.07.2018. P. 198. (год публикации - 2018)

19. Кибрик А.А., Федорова О.В. «Рассказы и разговоры о грушах»: промежуточные итоги VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018., VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018. С. 499–501. (год публикации - 2018)

20. Коротаев Н.А. О временно́й координации жестикуляционных и речевых единиц в неподготовленной устной коммуникации «Слово и жест» научная конференция, посвященная памяти Е.А. Гришиной («Гришинские чтения») Москва, 8 февраля 2018 года., «Слово и жест» научная конференция, посвященная памяти Е.А. Гришиной («Гришинские чтения») Москва, 8 февраля 2018 года. С. 10-12. (год публикации - 2018)

21. Коротаев Н.А. Партитурная транскрипция устного диалога при мультиканальной коммуникации VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018., VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018. С. 565–567. (год публикации - 2018)

22. Коротаев Н.А. Вопрос и полуутверждение в структуре мультиканального дискурса VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018., VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018. С. 1311–1313. (год публикации - 2018)

23. Николаева Ю.В. Interrupted Gestures Regulate Turn-taking VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018., VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018. С. 1314–1316. (год публикации - 2018)

24. Николаева Ю.В. Жестовые сбои: контексты и функции «Слово и жест» научная конференция, посвященная памяти Е.А. Гришиной («Гришинские чтения») Москва, 8 февраля 2018 года., «Слово и жест» научная конференция, посвященная памяти Е.А. Гришиной («Гришинские чтения») Москва, 8 февраля 2018 года. С. 14-15. (год публикации - 2018)

25. Сухова Н.В., Николаева Ю.В. Towards Interchannel Correlation Between Cephalic and Manual Movements in a Russian Multimodal Discourse VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018., VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018. С. 1323–1325. (год публикации - 2018)

26. Федорова О.В. «Рассказы и разговоры о грушах»: окуломоторный компонент VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018., VIII Международная конференция по когнитивной науке. Тезисы докладов. Светлогорск: ФГБУН Институт психологии РАН, 2018. С.1325–1327. (год публикации - 2018)

27. Федорова О.В. Грамматика взгляда в исследованиях мультиканальной коммуникации «Слово и жест» научная конференция, посвященная памяти Е.А. Гришиной («Гришинские чтения») Москва, 8 февраля 2018 года., «Слово и жест» научная конференция, посвященная памяти Е.А. Гришиной («Гришинские чтения») Москва, 8 февраля 2018 года. С. 22-23. (год публикации - 2018)

28. - Удивляться после слова шляпа Чердак, Чердак, 26 июня 2018 г. (год публикации - )


Возможность практического использования результатов
Полученные результаты проекта могут быть использованы в области автоматического распознавания образов и искусственного интеллекта (подробнее см. раздел 1.10 итогового отчета).