КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 18-18-00334

НазваниеРоль статистических свойств множественных объектов в категоризации и сегментации в зрительном восприятии человека

РуководительУточкин Игорь Сергеевич, Доктор психологических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики", г Москва

Период выполнения при поддержке РНФ 2018 г. - 2020 г.  , продлен на 2021 - 2022. Карточка проекта продления (ссылка)

Конкурс№28 - Конкурс 2018 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».

Область знания, основной код классификатора 08 - Гуманитарные и социальные науки, 08-551 - Общая психология, методология и история психологии, психология личности

Ключевые словаСегментация, категоризация, восприятие, зрительные статистики

Код ГРНТИ15.21.41


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
В повседневном восприятии мы регулярно смотрим на огромное количество объектов, обладающих огромным многообразием признаков. Максимально полная и быстрая обработка всех объектов и признаков создала бы очень большие вычислительные трудности для зрительной системы (Tsotsos, 1988). Одна из многообещающих и бурно развивающихся в наши дни теорий предполагает, что для преодоления этих сложностей зрительная система суммирует информацию о признаках большого количества объектов в виде сводной статистики ансамблей (Alvarez, 2011; Haberman & Whitney, 2012). Так, даже при очень кратком предъявлении большого количества объектов наблюдатель в состоянии довольно точно оценить средний признак всех объектов и степень их вариативности, а также оценить их количество; при этом точная информация о признаках отдельных объектов будет крайне ограничена (Ariely, 2001) или даже вовсе недоступна (Parkes et al., 2001), что согласуется с идеей жестких ограничений способности к глубокой обработке объектов (Cowan, 2001; Luck & Vogel, 1997; Pylyshyn & Storm, 1988; Scholl, 2002). Однако главным предметом нашего интереса в данном проекте является не сама по себе поразительная способность к быстрому и точному вычислению сводных статистик. Помимо возможности охарактеризовать множество объектов одним статистическим параметром, наблюдатель оказывается способен разделять большие группы объектов, перемешанные в пространстве, и вычислять ансамблевые статистики для них независимо (Chong & Treisman, 2008; Emmanouil & Treisman, 2008; Halberda et al., 2006; Utochkin & Vostrikov, 2017). Подобную способность к эффективному разделению групп объектов, перемешанных в пространстве, мы называем мгновенной сегментацией и категоризацией (разумеется, речь идет о грубой категоризации, для которой достаточно отнесение всех объектов к одному или разным классам). В данном проекте нас интересует, какие правила и механизмы используется зрительной системой для принятия столь быстрого категориального решения в отношении большого количества объектов сразу. Частично вопросы зрительной сегментации изучались в рамках гештальтпсихологии (Metzger, 1936/2006), а также в области исследований восприятия текстур и простого зрительного поиска по признакам (Bacon & Egeth, 1991; Bergen & Julesz, 1983; Bravo & Nakayama, 1992; Itti & Koch, 2001; Nothdurft, 1992, 1993; Rosenholtz, 2001, 2014; Treisman, 1988; Wolfe, 1992). В обоих случаях исследователи были сконцентрированы преимущественно на категориальных подмножествах, хорошо организованных в пространстве (текстурированных участках). Это давало возможность связать группировку и сегментацию текстур с ретинотопической суммацией сигналов клеток с широкими рецептивными полями в высших отделах зрительной иерархии. Однако множественные объекты, с которыми часто сталкивается наше повседневное восприятие, могут быть перемешаны в пространстве (как например, ягоды среди листвы), и механизмы, описанные для компактных текстур, не очень хорошо подходят для объяснения способности к мгновенной категоризации таких объектов. Ранее наша научная группа предложила новую гипотезу, которая потенциально может описывать механизм мгновенной сегментации и категоризации перемешанных в пространстве объектов (Utochkin, 2015; Utochkin, & Yurevich, 2016; Utochkin, Khvostov, & Stakina, 2017). В ее основе лежит приложение положений теории ансамблевых статистик к проблеме категоризации. По нашей гипотезе, зрительная система использует информацию о форме распределения признаков множественных объектов в зрительном поле. Если общее распределение можно свести к распределению с одним более или менее выраженным пиком и плавным переходом между значениями признаков внутри этого пика, то все объекты будут скорее отнесены к одной общей категории и не будут сегментированы. Напротив, если в составе распределения выделяется несколько пиков, а между ними есть существенный разрыв, то объекты с большей вероятностью будут отнесены к разным категориям и сегментированы. В ходе реализации проекта мы планируем проведение серии экспериментальных исследований, в которых собираемся более широко и глубоко изучить процессы мгновенной сегментации категоризации. Сформулированная нами гипотеза о роли формы статистического распределения признаков будет лежать в основе всех этих экспериментов. Отдельные серии экспериментов ставят несколько разных вопросы, ответы на которые должны дать более полную картину того, как происходит категоризация. В ходе экспериментов мы попытаемся оценить, как форма распределения признаков влияет (1) на точность прямых категориальных суждений о принадлежности объектов к тем или иным классам и на способность к оценке сводных статистик отдельных подгрупп и игнорированию статистик других подгрупп. Мы также собираемся проверить, каким образом форма распределения признаков в ансамбле и возможность выделения категориальных подмножеств влияет (2) на целенаправленное обследование окружающего пространства в ходе зрительного поиска объектов с заданными признаками и (3) на характер движения глаз. (4) Также мы собираемся проверить, может ли предполагаемый нами механизм мгновенной категоризации распространяться на восприятие сложных объектов реального мира, чьи признаки являются комплексными (в то время как изначальная версия нашей теории предполагает возможность сегментации и категоризации по базовым сенсорным признакам). Наконец, (5) в ходе реализации проекта мы собираемся обратиться к поиску электрофизиологических коррелятов мгновенной сегментации и категоризации (в частности проверить гипотезу о раннем автоматическом процессе сегментации на материале компонента вызванного потенциала MMN – негативность рассогласования), что позволит нам более точно проверить гипотезы о локусе данного процесса в системе обработки зрительной информации.

Ожидаемые результаты
В результате выполнения проекта будет осуществлена масштабная проверка выдвинутой нами ранее теории о мгновенной сегментации и категоризации множественных объектов на основе сводных статистик ансамблей. Будут получены новые данные о том, каким образом зрительная система разделяет или группирует простые и сложные объекты реального мира на основе статистики базовых сенсорных и комплексных перцептивных признаков. Этот результат позволит оценить, насколько выдвинутая нами теория может быть приложима к разнообразным типам перцептивных ситуаций. Будет продемонстрировано, каким образом мгновенная сегментация или группировка может влиять на целенаправленную зрительную активность, такую как зрительный поиск релевантного объекта и движения глаз при обследовании окружающего пространства. Наконец, впервые будут выделены некоторые электрофизиологические корреляты мгновенной сегментации, которые дадут возможность более точно определить локус подобной сегментации в системе обработки зрительной информации. С общетеоретической точки зрения, наши ожидаемые результаты имеют фундаментальное значение для развития представлений о механизмах восприятия, происходящего в первые мгновения анализа зрительного стимула. Во-первых, наши исследования вносят вклад в разработку современной концепции сводных статистик ансамблей, подчеркивая не только функцию обобщения, но и малоизученную в рамках данной концепции функцию сегментации и категоризации. Тестирование наших предсказаний на задаче зрительного поиска позволит сопоставить наши представления о мгновенной категоризации не только с концепцией зрительных ансамблей, но и с параллельно развивающимися теориями зрительного поиска и зрительного внимания (в частности, с ведущей теорией управляемого поиска). Это, в свою очередь, призвано обеспечить более общее видение предполагаемого механизма сегментации и категоризации в современной концепции зрительного восприятия. Результаты исследования могут иметь также практическое значение. Если будет показано, что предлагаемый нами механизм категоризации является достаточно общим вне зависимости от типов стимулов и признаков (простые объекты с базовыми сенсорными признаками или сложные объекты с комплексными перцептивными), то этот механизм может быть имплементирован в виде алгоритма в системах компьютерного зрения для выполнения задач классификации однотипных объектов среди объектов других типов на сложных изображениях. Еще одно возможное приложение может быть связано с развитием психологически обоснованных правил визуализации сложных данных, где могут возникать проблемы с отнесением пространственно перемешанных элементов визуализации к определенным условиям. Результаты проекта планируется опубликовать в ведущих международных журналах, специализирующихся в области изучения зрительного восприятия и нейронных механизмах познания и поведения. К числу потенциальных наименований мы относим: 1. Journal of Neuroscience (Q1) 2. Journal of Experimental Psychology: General (Q1) 3. Journal of Experimental Psychology: Human Perception and Performance (Q1) 4. Journal of Vision (Q1-Q2) 5. Attention, Perception, and Psychophysics (Q2-Q3) Также планируется подготовка обзора по тематике проекта в ведущий российский журнал (например, «Психология. Журнал Высшей школы экономики»). Также в ходе реализации проекта планируется серия выступлений участников проекта на ведущих международных конференциях по результатам исследований: 1. Annual Vision Sciences Society Meeting (VSS) в 2019 и 2020 годах 2. European Conference for Visual Perception (ECVP) в 2018 и 2019 годах 3. Society for Neuroscience в 2019 или 2020 году


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2018 году
Наша возможность к корректному и детальному опознанию объектов, как правило, ограничена несколькими единицами в каждый момент времени, что обычно связывают с фундаментальными ограничениями внимания и рабочей памяти (Cowan, 2001; Luck & Vogel, 1997; Pylyshyn & Storm, 1988; Wolfe, Vo, Evans, & Greene, 2011). В свете этих ограничений особенно интересной представляется способность наблюдателя к мгновенной сегментации и категоризации (т.е. отнесение всех объектов к одному, либо к разным классам) больших групп объектов, перемешанных в пространстве, т.е. не образующих устойчивых групп. Действительно, почему в одном случае, глядя на множество перемешанных зеленых и красных объектов, мы сразу понимаем, что перед нами листья и ягоды, а в другом – что только листья, хоть и разных оттенков (как это обычно бывает осенью)? Данный проект направлен на детальную проверку выдвинутой ранее теории (Utochkin, 2015) о том, что мгновенная категоризация основана на глобальной статистической оценке формы распределения индивидуальных признаков в ансамбле множественных объектов. Согласно этой теории, признаки, образующие плавный переход в некотором (пусть даже достаточно широком) диапазоне, формируют репрезантационное распределение (такое распределение мы называем «несегментабельным») с одним пиком и более вероятно приведут к восприятию единой группы, или однотипных объектов. Напротив, признаки, образующие несколько компактных кластеров значений с отсутствующим или слабо представленным переходом между ними, с большей вероятностью будут категоризоваться как принадлежащие к разным типам (такое распределение мы называем «сегментабельным»). В 2018 году работа велась по двум запланированным направлениям и одному дополнительному. Первое направление (серия экспериментов 1) нацелено на прямую проверку гипотезы о возможности осуществлять категоризацию объектов на классы, в то время как в предыдущих работах это было продемонстрирвано теоретически и косвенно (Utochkin, 2015, Utochkin & Yurevich, 2016). В данной серии экспериментов мы напрямую просили испытуемых выполнять задачу отнесения объекта либо целых групп объектов к определенной категории на основе их размера. В качестве границы между категориями задавалась медиана, т.е. испытуемых просили оценивать размеры как относящиеся либо к «маленькой» половине, либо к «большой» половине. В качестве основного фактора, влияющего на точность категоризации, мы рассматривали форму распределения размера объектов. Мы провели два эксперимента. В эксперименте 1.1 оценивалась точность категоризации индивидуальных кругов (путем отнесения их либо к категории больших, либо к категории маленьких), в эксперименте 1.2 – точность пространственной локализации средней позиции ( центроида) определенной категориальной группы. В обоих экспериментах критической манипуляцией была форма распределения признака, задающего категорию (диаметра кругов). Форма распределений была представлена тремя условиями: гладкое распределение с маленьким диапазоном и маленьким шагом изменения признака («узкое слитное»), гладкое распределение с большим диапазоном и большим шагом («широкое»), острое распределение с большим общим диапазоном, двумя кластерами на полюсах, причем внутри кластеров шаг узкий, между кластерами- широкий («узкое разделенное»). Испытуемые продемонстрировали меньшее количество ошибок при категоризации единичного объекта и бОльшую точность в локализации центроида в «узком разделенном» условии. Именно это условие, в наших терминах, предположительно, приводит к формированию «сегментабельной» репрезентации ансамбля, т.е. поддерживает более эффективную мгновенную категоризацию. При двух других условиях, которые скорее соответствуют «несегментабельному» типу внутренней репрезентации, что приводит к более сильному смешению объектов, относящихся к заданным экспериментатором категориям. В рамках экспериментальной серии 2 мы исследовали влияние формы распределения двух признаков ансамбля на успешность управляемого зрительного поиска. Зрительный поиск представляет собой задачу, в которой испытуемом требуется на скорость ответить, есть ли среди множества предъявленных объектов (дистракторов) объект с заданными характеристиками (цель). Под управляемым зрительным поиском понимается совокупность механизмов, которые позволяют не перебирать случайным образом все дистракторы вплоть до момента обнаружения цели или констатации ее отсутствия, а привлекает внимание к ограниченному числу потенциальных объектов-кандидатов, тем самым делая поиск гораздо быстрее (эффективнее). В нашем исследовании мы проверяли, как категориальная сегментабельность позволяет осуществлять отбор таких объектов-кандидатов в задаче поиска по двум признакам (например, цвету и ориентации или длине и ориентации). Согласно нашей исходной гипотезе, справедливость которой мы проверяли также на задаче различения текстур (Utochkin, Khvostov, & Stakina, 2018), при поиске цели по сочетаниею признаков (например, вертикальный красный прямоугольник среди вертикальных зелёных и горизонтальных красных прямоугольников), сначала осуществляется сегментация и отбор элементов релевантного подмножества по одному из признаков (например, всех красных объектов), а затем уже продолжается поиск по второму признаку (вертикальности) внутри этого подмножества. Таким образом, по нашему мнению, управляемый поиск может идти путем последовательности актов мгновенной категоризации по разным признакам. В таком случае форма распределения признаков может повлиять на эффективность зрительного поиска цели, поскольку от нее зависит сама возможность выделить категориальные группы (например, красные или вертикальные объекты). Для проверки наших предположений мы провели два эксперимента (эксперименты 2.1. и 2.2), отличающиеся тестируемыми признаками. В эксперименте 2.1 поиск осуществлялся по длине и ориентации, в эксперименте 2.2 – по цвету и ориентации. Каждое из тестируемых измерений могло быть представлено среди дистракторов либо острым, «сегментабельным» распределением (только крайние значения: синий, красный; длинный, короткий, пологий, крутой), либо гладким, «несегментабельным» (представлено множество переходных градаций признаков между крайними значениями). Мы ортогонально варьировали сегментабельность дистракторов по двум измерениям: (1) «оба сегментабельны», когда распределение и длины (цвета) и ориентации были острыми, (2) «оба не сегментабельны», когда распределение и длины (цвета) и ориентации были гладкими, (3) «сегментабельное по ориентации», когда распределение ориентации было острым, а длине (цвету) – гладким, (4) «сегментабельное по длине/цвету», когда распределение длины (цвета) было острым, а ориентации – гладким. Вопреки нашему предположению, испытуемые показали одинаково эффективный поиск целевых объектов в обоих экспериментах вне зависимости от сегментабельности (в особенности в пробах, где целевой стимул присутствовал). Таким образом, мы обнаружили, что группировка и сегментация дистракторов на основе их статистики не влияет на управление поиском по сочетанию. Вслед за нашим соавтором по этой серии экспериментов Дж. Вольфом (Wolfe, 1994) мы предположили, что в ходе поиска зрительная система получает прямой приоритетный доступ к локации по обоим целевым признакам. Т.е. если мы ищем красную крутую линию, то повышенную активацию получают места занятые чем-то красным и чем-то крутым, и место пересечения активации красного и крутого, благодаря суммации, обеспечивает приоритетное привлечение внимания. В этом случае неважно, насколько хорошо красные линии сегментируются от синих, а крутые от пологих, поскольку наличие суммарной активации у целевого стимула сразу обеспечивает ему преимущество в привлечении внимания. Однако в пробах, где цель отсутствовала, мы действительно обнаружили, что поиск в сегментабельных наборах осуществляется быстрее, чем в несегментабельных по одному или обоим признакам, что в целом показывает, что механизм ансамблевой сегментации также имеет отношение к управлению поиском. Однако этот механизм проявляется в ситуации, когда внимание не привлекается напрямую локацией с максимальной активацией, т.е. присутствующей целью В дополнительном эксперименте в рамках той же серии (эксперимент 2.3) мы сравнили поиск по сочетанию признаков (цвета и ориентации) среди сегментабельных и несегменабельных дистракторов с поиском по одному признаку (только цвету или только ориентации) среди дистракторов, формирующих вместе с целью несегментабельное распределение (мы не проверяли сегментабельные распределения, поскольку в этом случае исход тривиален и представляет собой многократно описанный в литературе паттерн максимально эффективного поиска – эффект «выскакивания»). Мы снова обнаружили, что поиск по сочетанию признаков не зависит от сегментабельности дистракторов и – что особенно важно – по эффективности оказывается не хуже, а то и лучше поиска по одному признаку. Этот эффект особенно примечателен, поскольку обычно поиск по сочетанию признаков существенно уступает в эффективности поиску по признаку, но только если этот признак сегментабелен (Treisman & Gelade, 1980). Мы предполагаем, что, как и в экспериментах 2.1 и 2.2, этот эффект обеспечен суммацией активации двух целевых признаков, которая, как ни парадоксально, обеспечивает более сильную сегментацию целевого стимула, чем в случае с одним признаком, где за счет низкой сегментабельности целевой стимул отличается от дистракторов гораздо меньше. Таким образом, в данной серии экспериментов, мы обнаружили несколько иной механизм сегментации и управления вниманием для зрительного поиска объектов по сочетанию признаков, чем при поиске объектов по одному признаку (Utochkin & Yurevich, 2016) или при различении текстур (Utochkin, Khvostov, & Stakina, 2018) В дополнение к этим двум запланированным экспериментальным сериям мы провели два эксперимента, расширяющим полученные нами ранее результаты в области различения текстур, образованных разными сочетаниями двух признаков (например, длины и ориентации). Так, ранее нам было обнаружено, что испытуемые более точно различают границы между текстурами, образованными сегментабельными сочетаниями обоих признаков (например, текстура, состоящая их очень длинных и очень крутых, а также очень коротких и очень пологих линий, против текстуры, состоящей из очень длинных и очень пологих, а также очень коротких и очень крутых линий, Utochkin, Khvostov, & Stakina, 2017). В то же время, хотя бы одно несегментабельное измерение делает различение текстур почти невыполнимым. В одном из новых экспериментов мы проверяли гипотезу о том, что за такой сегментацией стоит действительно глобальный механизм оценки полной статистики всей текстуры, а не локальное выборочное оценивание отдельных приграничных элементов. При сравнении точности различения полномасштабных текстур и текстур, в которых оставлены только линии вдоль потенциальных границ, мы обнаружили преимущество для первых, что указывается на то, что вся статистика каким-то образом принимается в расчет, т.е. речь действительно идет о мгновенной категоризации всех элементов. Во втором эксперименте мы дополнительно проверяли гипотезу о механизме последовательной сегментации, при которой испытуемый сначала обращает внимание на одно категориальное подмножество (все длинные линии), а затем внутри него сравнивает средние значения по второму признаку (определяет, в какой области длинные линии пологие, а в какой крутые). В этом эксперименте мы убирали половину всех линий ниже медианы по одному из измерений (например, все короткие линии или все пологие линии), осуществляя, таким образом, искусственную селекцию подмножеств. Мы обнаружили, что в целом испытуемые справляются с задачей различения лучше, чем в экспериментах с полной текстурой, при этом уровень точности был выше, если оставшееся подмножество было сегментабельно по второму признаку. Этот эффект рассматривается как улучшение в задаче сравнения средних, поскольку сегментабельность обеспечивает более высокий контраст между средними значениями в разных участках при низкой дисперсии признаков внутри участков. Таким образом, мы продемонстрировали, что сегментабельность действительно повышает эффективность различения больших наборов объектов (текстур) за счет выделения категориальных подмножеств и повышения отношения средних различий к дисперсии, но при этом сильным ограничивающим фактором может являться селекция категориальных подмножеств, т.е. невозможность полного игнорирования других подмножеств. Результаты первого года работы отражены в одной статье, опубликованной в ведущем международном рецензируемом журнале “Cognition”, в двух рукописях, подготовленных в зарубежные реферируемые журналы (Web of Science, Scopus) по результатам серии 1 и серии 2, а также в виде 5 докладов, представленных или планируемых к представлению на ведущих международных конференциях по зрительному восприятию. Публикация: Уточкин И.С., Хвостов В.А., Стакина Ю.М. (Utochkin I.S., Khvostov V.A., Stakina Y.M.) Continuous to discrete: Ensemble-based segmentation in the perception of multiple feature conjunctions Cognition (2018 г.)

 

Публикации

1. Уточкин И.С., Хвостов В.А., Стакина Ю.М. Continuous to discrete: Ensemble-based segmentation in the perception of multiple feature conjunctions Cognition, 179 (год публикации - 2018) https://doi.org/10.1016/j.cognition.2018.06.016


Аннотация результатов, полученных в 2019 году
В 2019 году работа велась по двум запланированным направлениям и четырем дополнительным, частично расширяющим серии исследования 2018 года, а частично ставящим новые вопросы в рамках темы проекта. В серии экспериментов 4 мы изучали, является ли быстрая сегментация и категоризация автоматическим процессом или нет. Предыдущие поведенческие эксперименты показали, что процесс сегментации и категоризации происходит на ранних стадии зрительного восприятия (Utochkin, Khvostov, & Stakina, 2018) и зависит от формы статистического распределения признаков таким образом, что бимодальное (сегментабельное) распределение разделяется на категориальное группы более эффективно, чем равномерное (несегментабельное) распределение . Для уточнения локуса данного процесса мы изучили зрительную негативность рассогласования (vMMN) - компонент раннего вызванного потенциала, который считается маркером автоматического обнаружения изменений в зрительном поле (Czigler et al., 2014). Мы использовали четыре типа текстур, заданных сегментабельностью по признакам длины и ориентации: (1) оба признака сегментабельны, (2) ни один признак не сегментабелен, (3) только ориентация сегментабельна или (4) только длина сегментабельна (по аналогии со стимулами, использованными в: Utochkin et al., 2018). Мы использовали двойную “оддболл”-парадигму, которая предполагает, что задача обнаружения изменений одного стимула (первый “оддболл”), требующее внимания испытуемого, находится в центре, в то время как на заднем фоне меняется скоррелированное распределение длины и ориентации множества объектов (второй “оддболл”). Мы зафиксировали негативность рассогласования (vMMN) на изменение типа распределения фоновых объектов. При этом наибольшая амплитуда vMMN наблюдалась в экспериментальных сериях, где длина и ориентация имели сегментабельное распределение по обоим признакам. Данные результаты свидетельствуют в пользу предвнимательной и автоматический категоризации и сегментации. В серии экспериментов 5 мы изучали, до какой степени множественные объекты реального мира в принципе могут быть эффективно категоризированы по сложному признаку. Основная цель данной серии экспериментов - проверить, позволяет ли хорошая способность категорировать отдельные объекты как одушевленные или неодушевленные так же эффективно категоризовать множественные объекты по этому же признаку. Для оценки категоризации и восприятия ансамбля мы использовали задачу на “чувство числа” (Halberda et al., 2008). Мы использовали два вида распределений: сегменабельное (“чистые” представители категорий живого и неживого) и несегментабельное (к “чистым” представителям добавляются “переходные” (морфированные) экземпляры, затрудняющие однозначную категоризацию). Мы сравнивали категоризацию по признаку одушевленности с категоризацией по цвету, обычно не вызывающая никаких проблем. Мы показали, что категоризация одиночных объектов происходит с большой точностью и по простому (цвет), и по сложному признаку (одушевленность). Однако категоризация множественных объектов происходит успешно только по цвету. Глобальный эффект сегментабельности также проявился только при категоризации по цвету. Напротив, по сложному признаку категоризация происходит существенно хуже и практически не испытывает влияния сегментабельности. Настоящее исследование однозначно показывает, что очень хорошая индивидуальная категоризация отдельных элементов на основе высокоуровневого признака (одушевленность) не всегда влечет за собой эффективное вычисление глобальной статистической информации по этому признаку. Дополнительный эксперимент в рамках Серии экспериментов 1 (категоризация отдельных объектов в различных условиях сегментабельности) был нацелен на репликацию и уточнение одного из центральных феноменов, ранее обнаруженных в этом исследовании. В 2018 году в Серии экспериментов 1 мы показали, что в сегментабельном распределении точность категоризации единичных объектов была выше, а также выше была точность пространственной локализации средней позиции (центроида) категориальной группы. Однако задача по определению центроида имеет ряд ограничений, которые не позволяют случайным образом задать позиции объектов, что потенциально могло повлиять на полученные результаты. В дополнительном эксперименте 2019 года мы использовали признак ориентации, вместо центроида, поскольку ориентация не имеет ограничений в плане расположения в пространстве и чаще используется в исследованиях ансамблей. Используя схожую с экспериментом 1.2 парадигму и процедуру, в эксперименте 1.3 в качестве признака, по которому задавалась сегментабельность ансамбля, мы использовали длину линий, а в качестве признака относительно которого необходимо было дать ответ, мы использовали среднюю ориентацию линий. Результаты продемонстрировали, что в условии с сегментабельным распределением длины, ответ о средней ориентации категории были более точными и менее смещенными в сторону всего ансамбля. Таким образом, результаты трёх экспериментов демонстрируют, что форма распределения влияет на последующую категоризацию единичных и множественных объектов. В рамках Серии экспериментов 2 мы исследовали, возможно ли совершать управляемый зрительный поиск, если дистракторы не могут быть отнесены к определенной перцептивной категории. В предыдущих экспериментах (2018 год) мы показали, что сегментабельность распределения не влияет на эффективность зрительного поиска по сочетанию признаков, тем самым подтвердив положение модели управляемого поиска (Wolfe, 1994). В дополнительных экспериментах мы проверили эффективность управляемого поиска признаков в условиях, когда нисходящие управление было ограничено только одним признаком (эксперимент 2.4), а также реплицировали ранее проведенный эксперимент (эксперимент 2.5). Критической манипуляцией в обоих экспериментах был тип сегментабельности распределения признаков: 1. «сегментабельность по двум признакам» (распределения значений цвета и ориентации дистракторов включало в себя только экстремальные значения), 2. «несегментабельность» (распределение значений цвета и ориентации дистракторов включало в себя экстремальные и промежуточные значения), 3. «сегментабельность по ориентации» (распределение значений ориентации включало экстремальные значения, в то время как распределение значений цвета - промежуточные значения), 4. «сегментабельность по цвету» (распределение значений цвета включало экстремальные значения, в то время как распределение значений ориентации - промежуточные значения). В эксперименте 2.4 испытуемые выполняли поиск по подмножеству – модифицированной версии поиска по сочетанию признаков, в котором сообщался только один из признаков – цвет, а второй (ориентация) непредсказуемо менялся от пробы к пробе. Таким образом, испытуемым было необходимо найти стимул с уникальной ориентацией в заданном подмножестве. При этом ориентация целевого стимула варьировалась в каждой пробе. Во эксперименте 2.5 испытуемые выполняли стандартный поиск по сочетанию ориентации и цвета. В отличие от аналогичного эксперимента, выполненного в 2018 году (эксперимент 2.1), мы тестировали четыре размера множества для поиска (9, 17, 33 и 65 объектов), а также увеличили объем выборки испытуемых. В обоих экспериментах эффективность зрительного поиска оставалась практически неизменной при различных условиях сегментабельности дистракторов, что подтверждает ранее сделанный вывод об эффективном управлении поиска, позволяющем преодолеть ограничения, связанные с сегментацией. Новая Серия экспериментов 6 была нацелена на проверку гипотезы о независимости и параллельности вычисления различных сводных статистик ансамблей. В предыдущих исследованиях данного вопроса использовалась парадигма одиночной задачи (Yang, Tokita & Ishiguchi, 2018; Lee, Baek & Chong, 2016; Utochkin & Vostrikov 2017), когда в каждой пробе испытуемые отчитывались об одной из сводных статистик. На основе отсутствия корреляции между точностью определения статистик авторы заключили о независимости их вычисления. Недостаток одиночной задачи заключается в том, что невозможно отличить рассчитывают ли испытуемые все сводные статистики параллельно или же в каждой пробе он уделяет больше внимания только одной из статистик. В данной серии экспериментов мы использовали парадигму двойной задачи, которая предполагает последовательный отчет о двух статистиках в каждой пробе. Данный двойной отчет позволил нам отделить действительно независимые параллельные процессы в репрезентации различных ансамблевых статистик от перераспределения внимания от одной статистике к другой между пробами. Мы провели серию из трех экспериментов. В эксперименте 6.1 оценивалась точность определения среднего размера объектов и их численности, эксперименте 6.2 - точность определения среднего размера и дисперсии. Критической манипуляцией была форма ответа, которая могла быть в форме одиночного отчета (отчет только об одной из сводных статистик) или двойного отчета (последовательный отчет об одной и второй сводной статистике). Отдельно мы уточняли возможность использования оценки дисперсии в двойной задаче. Мы обнаружили, что точность определения разных статистик не коррелирует друг с другом, однако хорошо коррелирует между собой во всех экспериментальных условиях. Мы заключили, что внимание может быть разделено между двумя статистиками в двойной задаче без каких-либо существенных затрат. Таким образом, обработка среднего, диапазона и численности может производиться параллельно, что подтверждает возможность доступа к богатой статистической репрезентации множественных объектов, что является важным для дальнейшей сегментации и категоризации. В новой Серии экспериментов 7 нашей целью была проверка гипотезы о том, что признаки отдельных объектов, хранимые в памяти, также зависят от статистических свойств всей группы объектов. Мы провели серию из двух экспериментов, где испытуемым было необходимо отчитываться об индивидуальных ориентациях запоминаемых объектов или о средней ориентации всех объектов. Результаты двух экспериментов показали, что (а) припоминаемые ориентации отдельных объектов были систематически смещены в сторону среднего и (б) и оценки среднего, и оценки индивидуальных ориентаций становилась менее точными с увеличением физического диапазона ориентаций, что указывает на наследование характеристик среднего репрезентациями отдельных объектов. Ссылки на информационные ресурсы, посвященные проекту: ECVP (European Conference on Visual Perception) (страницы 57, 395, 474). Сборник тезисов: https://kuleuvencongres.be/ecvp2019/documents/ecvp2019-template-abstract-book.pdf Annual Vision Sciences Society Meeting (VSS). Тезисы доступны: https://jov.arvojournals.org/article.aspx?articleid=2751209&resultClick=1 Препринт статьи: https://www.researchgate.net/publication/332305705_Individual_representations_in_visual_working_memory_inherit_ensemble_properties

 

Публикации

1. Хвостов В.А., Уточкин И.С. Independent and parallel visual processing of ensemble statistics: Evidence from dual tasks Journal of Vision, т.19, выпуск 9, статья 3, стр.1-18 (год публикации - 2019) https://doi.org/10.1167/19.9.3


Аннотация результатов, полученных в 2020 году
В 2020 году работа велась по четырем направлениям: проведены исследования в рамках новой серии экспериментов (взамен серии экспериментов 3), дополнительные исследования по серии экспериментов 5, осуществлен дополнительный анализ данных по серии экспериментов 4, а также написана обзорная статья о восприятии ансамблей и о роли статистических свойств множественных объектов в категоризации и сегментации в зрительном восприятии человека. В новом эксперименте, который был проведен вместо серии экспериментов 3, мы изучали способность наблюдателя сегментировать и усреднять подмножества объектов на основе отличительного простого признака (например, уникального цвета, отсутствующего у остальных объектов) или отличительной комбинации признаков (например, двух цветов, присутствующих и у других подмножеств объектов, но в других сочетаниях), соответствующей репрезентации целого объекта. Результаты данного исследования показывают, что наблюдатели способны успешно сегментировать подмножество объектов на основании простого отличительного признака. Когда же подмножества отличаются по сочетанию признаков, т.е. заданы разными типами объектов, наблюдатели намного хуже справляются с поставленной задачей. Полученные результаты указывают на то, что основой для сегментации подмножества объектов является отдельные признаки, а не связанные сочетания признаков (объекты). В серии экспериментов 5 мы изучали способность к категоризации множественных объектов реального мира по сложному высокоуровневому признаку, такому как “одушевленность”. В ходе предыдущих экспериментов мы выяснили, что категоризация одиночных объектов осуществляется с высокой точностью как для простого сенсорного измерения (цвет), так и для сложного перцептивного измерения (одушевленность). Однако категоризация множественных объектов, т.е. ансамбля, происходит успешно только для цвета, но не для одушевлённости. Настоящее исследование показывает, что очень хорошая индивидуальная категоризация отдельных элементов на основе высокоуровневого признака (одушевленность) не всегда влечет за собой эффективное вычисление глобальной статистической информации по этому признаку. В ходе трёх дополнительных экспериментов, проведённых в этом году, мы реплицировали наши результаты (эксперимент 5.2) и исключили несколько альтернативных объяснений наших результатов (эксперименты 5.3 и 5.4), осуществив дополнительный контроль уровня перцептивного сходства внутри тестируемых измерений (цвета и одушевленности). Результаты эксперимента 5.2 можно назвать успешной репликацией эксперимента 5.1. Испытуемые выполняли множественную категоризацию по признаку цвета значительно лучше по сравнению с одушевлённостью (89% и 65% правильных ответов, соответственно). Кроме того, эффект сегментабельности (определенности категориального перехода) был выражен намного сильнее для цвета, по сравнению с одушевлённостью. Полученные результаты позволяют заключить, что испытуемые не могут интегрировать информацию об высокоуровневом признаке (одушевлённость) множества объектов, в то время как успешно выполняют то же самое задание для низкоуровневого признака (цвет). В эксперименте 5.3 мы варьировали перцептивную различимость двух категорий для цвета и одушевлённости. Результаты данного эксперимента в целом реплицируют результаты двух предыдущих экспериментов (5.1 и 5.2): даже с меньшей различимостью цветов, точность выполнения задачи с цветом остается высокой и по-прежнему превышает точность выполнения задачи с одушевлённостью, даже когда используются максимально различимые для наших стимульных условий одушевленные и неодушевленные стимулы. Таким образом, результаты экспериментов 5.1 и 5.2 не могут быть объяснены через большую различимость цветов по сравнению с одушевленностью. Скорее, эти результаты демонстрируют критические различия между этими двумя признаками: даже при практически идеальной индивидуальной категоризации и для одушевлённости, и для цвета, множественная категоризация – гораздо более сложное задание для одушевлённости, чем для цвета. Наконец, эксперимент 5.4 проверял влияния на результаты того факта, что условия предъявления силуэтов для индивидуальной и множественной категоризации в экспериментах 5.1 и 5.3 различались: в пробах с множественно категоризацией силуэты были разными по ориентации и размеру, а при индивидуальной категоризации – всегда стабильными. Кроме того, его результаты должны были показать, что рандомизация ориентации и размеров силуэтов не нарушает восприятия одушевлённости одиночных объектов. Испытуемые показали очень высокий процент правильных ответов (92-96%) во всех блоках данного эксперимента, без значительной разницы между блоками с вариацией ориентации и размера и без такой вариации. Это позволяет заключить, что вариации размеров и ориентаций, которая происходила в пробах с множественной категоризацией, недостаточно для объяснения низкой эффективности выполнения задания множественной категоризации по признаку одушевлённости. Таким образом, причиной значительной разницы между индивидуальной и множественной категоризацией по признаку одушевлённости в экспериментах 5.1 и 5.3 не является вариация размеров и ориентацией в пробах с множественной категоризацией. Наши результаты показывают, что причина этого заключается в неспособности испытуемых интегрировать информацию об одушевлённости множества объектов параллельно. В серии экспериментов 4, выполненных ранее, мы, используя анализ компонента вызванного потенциала под названием “негативность рассогласования”, коррелирующего с автоматическим обнаружением стимульных различий, показали автоматический характер процесса категоризации пространственно перемешанных объектов на основании формы статистического распределения их признаков. При этом ведущую роль в этом обнаружении играла сегментабельность обоих сенсорных измерений (длины и ориентации), комбинацией которых задавалось категориальное правило. В ходе дополнительного и более аккуратного анализа вызванных потенциалов мы обнаружили, что негативность рассогласования возникает в условиях, где оба признака являются сегментабельными, а также, когда сегментабельна только длина. Таким образом, мы заключаем, что разделение ансамбля на категориально разные подмножества зрительных элементов может происходить без участия внимания. По результатам выполнения проекта была также подготовлена обзорная статья, посвященная современному состоянию исследований в области восприятия ансамблей, понимаемого как способность зрительной системы извлекать обобщенные статистические свойства множества объектов, такие как среднее значение признака, дисперсию и приблизительное количество объектов. Исследования в данной области, которые изначально были сфокусированы исключительно на способности определять среднее значение выраженности признака, в последние годы охватывают все большее количество других феноменов зрительного восприятия. В статье показывается, что множество перцептивных задач, включая зрительный поиск, кодирование и удержание в рабочей и долговременной памяти, опознание и многое другое находят свою интерпретацию и развитие в рамках теории восприятия ансамблей, что показывает большой потенциал данной области исследований. Важное место в обзоре отводится рассмотрению мгновенной категоризации и сегментации, где, в том числе, суммируются результаты исследований лаборатории в рамках настоящего проекта. Результаты третьего года работы отражены в трёх статьях, опубликованных в ведущих международных рецензируемых журналах (Journal of Experimental Psychology: Human Perception and Performance; Journal of Vision; Attention, Perception, & Psychophysics), в обзорной статье в Российском журнале когнитивной науки, в двух рукописях, находящихся на рецензировании после доработки в зарубежных реферируемых журналах (Journal of Experimental Psychology: Human Perception and Performance; Scientific Reports), а также в виде 4 докладов, представленных на ведущих международных конференциях (Vision Science Society и Psychonomic Society).

 

Публикации

1. Им Х.Ё., Тюрина Н.А, Уточкин И.С. An explicit investigation of the roles that feature distributions play in rapid visual categorization Attеntion, Perception, and Psychophysics, ранний доступ (Early Access) on-line (год публикации - 2021) https://doi.org/10.3758/s13414-020-02046-7

2. Уточкин И.С., Брэди Т.Ф. Individual representations in visual working memory inherit ensemble properties Journal of Experimental Psychology: Human Perception and Performance, Том 46 Выпуск 5 Страница 458-473 (год публикации - 2020) https://doi.org/10.1037/xhp0000727

3. Уточкин И.С., Хвостов В.А., Вольф Дж.М. Categorical grouping is not required for guided conjunction search Journal of Vision, 20(8):30, 1–22 (год публикации - 2020) https://doi.org/10.1167/jov.20.8.30

4. Яковлев А.Ю., Тюрина Н.А., Уточкин И.С. Зрительное восприятие ансамблей: обзор исследований Российский журнал когнитивной науки, м 7, No 3, стр. 4 – 24, Creative Commons “Attribution” (год публикации - 2020) https://doi.org/10.47010/20.3.1


Возможность практического использования результатов
Результаты проведенных исследований в рамках проекта, во-первых, являются основой для разработки правил визуального представления различной информации (например, для визуализации данных и оформления дизайна интерфейсов). Во-вторых, полученные результаты могут быть интегрированы в процесс обучения основам статистики.