КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 20-18-00252

НазваниеПсихофизиологические механизмы переключения между стратегиями использования и исследования при принятии решений в условиях неопределенности

РуководительЧернышев Борис Владимирович, Кандидат биологических наук

Организация финансирования, регион федеральное государственное бюджетное образовательное учреждение высшего образования "Московский государственный психолого-педагогический университет", г Москва

Период выполнения при поддержке РНФ 2020 г. - 2022 г. 

Конкурс№45 - Конкурс 2020 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».

Область знания, основной код классификатора 08 - Гуманитарные и социальные науки, 08-552 - Психофизиология, психогенетика, сравнительная психология, зоопсихология, эволюционная психология

Ключевые словамагнитоэнцефалография, пупиллометрия, вероятностное обучение, стратегия использования, стратегия исследования, принятие решений, неопределенность, голубое пятно, передняя поясная кора, тета-осцилляции фронтальной средней линии, N2, ERN, FRN, расстройства аутистического спектра

Код ГРНТИ15.21.35


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Поведение человека в условиях неопределенности является предметом активного изучения в психологии, экономике, нейрофизиологии и других науках. Это обусловлено выраженным общественным запросом на изучение механизмов принятия решений в условиях труднопредсказуемой среды. Ставшие классическими работы Г.Саймона и Д.Канемана были удостоены Нобелевских премий и обозначили перелом в общественном и научном сознании - переход к строго научному анализу процессов принятия решений, которые столь важны практически в любых областях человеческой деятельности. Общеизвестно, что ошибки при принятии решений в экономике, бизнесе, политике, военном деле, медицине, образовании и других областях чреваты не только огромными денежными убытками, но также человеческими жертвами и другими внушительными потерями. С негативными последствиями ошибок, хотя и в меньших масштабах, сталкивается ребенок в процессе освоения окружающего мира, обучения в школе и т.п., равно как, например, и любой взрослый человек в процессе совершенствования профессиональных навыков. Неопределенность подразумевает, что субъект, принимающий решения, не располагает исчерпывающей информацией, необходимой для принятия решения. Неопределенность включает в себя внешний компонент - объективно непредсказуемые, случайные факторы среды, и внутренний компонент - степень неосведомленности самого субъекта о данной среде (Kahneman, Tversky, 1982, Cognition). В условиях современного многогранного динамичного мира и то, и другое характерно для принятия решений. В простейшем случае, если среда не является вероятностной и внешняя неопределенность отсутствует, то субъект может руководствоваться исходами своих предыдущих решений (сигналами обратной связи, поступающими от среды) и прийти к единственному оптимальному решению. Данный процесс известен как обучение с подкреплением, и в целом он аналогичен функционированию систем управления с обратной связью в технике. Однако если сама по себе среда характеризуется вероятностной структурой с некоторой долей непредсказуемости, то линейная логика обучения с подкреплением может оказаться неэффективной. Например, некоторое решение, являющееся на самом деле оптимальным, может быть отвергнуто по причине того, что предыдущие попытки выбора данного решения случайно привели к неуспеху; после этого объективно оптимальный выбор будет систематически отвергаться субъектом, и у субъекта уже не будет возможности узнать о выгодности данного выбора. Действуя в вероятностной среде, субъект может просто продолжать руководствоваться той ожидаемой полезностью решения, которая статистически определена им на основе накопленного опыта получения обратной связи от предыдущих решений, т. е. следовать стратегии использования. Либо субъект может пойти на риск и выбрать решение, которое на данный момент представляется ему невыгодным, – с целью сбора информации о свойствах среды и уточнения своих представлений об этой среде. Такой выбор относят к стратегии исследования, которая направлена на оптимизацию принятий решения в более отдаленной перспективе. Дилемма выбора между стратегиями использования и исследования вызывает огромный теоретический и практический интерес. Действительно, относительно простые управляющие системы, построенные лишь на обратной связи, могут быть малоэффективными в сложной среде: согласно “теореме о хорошем регуляторе”, эффективная управляющая система должна представлять собой модель той среды, с которой она взаимодействует (Conant, Ashby, 1970, Int J Systems Sci). Соответственно, живые организмы - и особенно человек - способны к активному построению гипотез и их проверке с целью построения и обновления имеющейся у них модели окружающей среды (Friston, 2010, Nat Rev Neurosci; Schwartenbeck et al., 2013; Parr, Friston, 2017, Network Neuroscience). Руководствуясь данными литературы и результатами наших собственных исследований, мы планируем изучить, как именно человек переходит от стратегии использования к стратегии исследования, какие психофизиологические и нейрофизиологические процессы толкают человека к принятию рискованного решения при переходе к стратегии исследования, чем определяется баланс между стратегиями использования и исследования. Наиболее интересным представляется вопрос, в какой мере переход к стратегии исследования действительно является спонтанным, направленным на предвосхищающую проверку субъектом собственных гипотез об окружающей среде (т.е. “проактивным”), или же переход к стратегии исследования становится следствием случайных неудач (т.е. “ретроактивным”). Психофизиологические и нейрофизиологические механизмы баланса между стратегиями использования и исследования до настоящего времени остаются недостаточно изученными. Частичное объяснение может дать модель адаптивного усиления (Aston-Jones, Cohen, 2005, Annu Rev Neurosci), которая придает большое значение норадренергической иннервации головного мозга, источником которой в мозге является голубое пятно. Поскольку диаметр зрачка является хорошим показателем активности норадренергической системы, ряд пупиллометрических исследований позволил получить важные результаты в отношении механизмов стратегии исследования (Jepma, Nieuwenhuis, 2011, J Cogn Neurosci; Hayes, Petrov, 2016, J Cogn Neurosci). Помимо голубого пятна, в процесс переключения между стратегиями вовлечен ряд других структур головного мозга, включая переднюю поясную кору, способную управлять активностью голубого пятна (Blanchard, Gershman, 2017, Cogn Affect Behav Neurosci; Cavanagh et al., 2012, Psychophysiology). Также имеются данные о вовлечении в этот процесс орбитофронтальных, островковых и ростролатеральных областей коры больших полушарий. Однако целостной картины происходящих процессов до сих пор не существует, и механизмы, регулирующие баланс между стратегиями исследования и использования, остаются в целом неизвестными. Мы разработали экспериментальную поведенческую модель, которая создает условия для лабораторного изучения данного феномена. С помощью данной экспериментальной модели мы сможем изучить как “ретроактивный” переход к стратегии исследования, так и “проактивный” переход к данной стратегии. Мы планируем ответить на поставленные вопросы, сочетая поведенческий эксперимент с пупиллометрией (т.е. регистрацией диаметра зрачка – косвенным методом измерения активности норадренергической системы) и регистрацией магнитоэнцефалограммы (позволяющей измерить активность важнейших зон коры больших полушарий). Насколько нам известно, наше исследование будет первым в данной области, основанным на применении магнитоэнцефалографии. Магнитоэнцефалография обладает чрезвычайно высоким временным и хорошим пространственным разрешением, что позволит получить надежные результаты о характере мозговых процессов, связанных с переключением между стратегиями использования и исследования. Наше исследование, сочетая указанные методы, впервые ставит задачу выявления временных и причинных связей между поведением, активностью норадренергической системы головного мозга и активностью ключевых областей коры больших полушарий. Кроме того, впервые в данном аспекте будут исследованы процессы принятия решений у взрослых с расстройствами аутистического спектра. Итогом предлагаемого проекта станет существенное углубление фундаментального понимания процессов принятия решения человеком.

Ожидаемые результаты
Настоящий проект впервые в мировой науке совмещает методы магнитоэнцефалографии и пупиллометрии с целью исследования механизмов принятия решений в условиях неопределенности и переключения между стратегиями исследования и использования. В рамках этого направления до сих пор не достигнуто понимания характера взаимодействия голубого пятна и кортикальных областей, участвующих в регуляции баланса исследования и использования (передней поясной коры и других зон). Результаты нашего исследования должны значительно прояснить сущность этого взаимодействия, так как ранее для исследования этой проблемы не использовались одновременно пупиллометрия (надежный способ оценки активности голубого пятна) и регистрация активности в коре больших полушарий головного мозга. Магнитоэнцефалография позволяет с высокой точностью локализовать источники мозговой активности и измерить изменение активности во времени. По итогам выполнения проекта мы ожидаем получить результаты, которые позволят составить целостную картину процессов выбора между стратегиями использования и исследования при выполнении задачи с вероятностным подкреплением. В частности, в период формирования прагматической модели можно ожидать “ретроактивной” причинности выбора альтернатив, характерной для обучения с подкреплением. В этом случае мы ожидаем увидеть активацию передней поясной коры как результат детекции рассогласования между ожидаемым и фактическим сигналом обратной связи. Однако на стадии сформированной прагматической модели мы ожидаем получить данные в пользу преимущественно “проактивной” причинности перехода человека к стратегии исследования. В частности, мы ожидаем, что как поведенческие и пупиллометрические показатели, так и активность вовлеченных зон мозга (поясная кора, островковая кора, ростролатеральная префронтальная кора и др.) будут предсказывать переход к стратегии исследования и/или удержание стратегии исследования. Более того, мы рассчитываем получить свидетельства того, что активация норадренергической системы вызывается передней поясной корой. Мы также предполагаем, что активация префронтальных областей коры будет опережать и активацию поясной коры, и норадренергическую активацию. Крайне важен ожидаемый результат, что соответствующая активация поясной и других зон коры больших полушарий будет наблюдаться раньше предъявления стимулов, на основе которых испытуемый будет производить принятие решения. Более того, мы ожидаем значительно большего опережения во времени для активации поясной коры и других упомянутых выше зон коры (в частности, мы ожидаем проявления указанных выше эффектов в предыдущей реализации задачи, предшествующей переходу к стратегии исследования). Также мы ожидаем, что в период, предшествующий переходу к стратегии исследования, будет повышена синхронизация осцилляций в тета-диапазоне между поясной корой и латеральными и ростральными отделами префронтальной коры. Учитывая нейрофизиологические особенности пациентов с аутизмом, мы можем ожидать, что в клинической группе выработка предпочтения выгодного стимула потребует большего количества проб, чем в контрольной выборке. На этапе исследования пациенты будут чаще переключаться с одного стимула на другой, причем безотносительно к знаку обратной связи о предыдущем выборе. Частота смены стратегии может прямо коррелировать с величиной расширения зрачка перед предъявлением стимулов. В группе пациентов с аутизмом этот показатель может парадоксальным образом коррелировать с их успешностью в усложненном варианте задания. В контрольной выборке эта взаимосвязь может оказаться противоположной. Положительная связь будет свидетельствовать о том, что невыгодные выборы отражают поисковые стратегии, а отрицательная - о недостатке чувствительности к отсроченному положительному подкреплению (накопительному выигрышу). Результаты, полученные в ходе выполнения настоящего проекта, позволят достигнуть более глубокого фундаментального понимания механизмов принятия решений в условиях неопределенности, включая обеспечение баланса режимов исследования и использования. Помимо большого фундаментального значения, результаты выполнения проекта могут быть востребованы для формирования рекомендаций по оптимизации принятия решений человеком, а также могут быть применены для развития систем машинного обучения, направленных на решение задач в сложной вероятностной среде. Результаты выполнения проекта могут иметь практическое значение в области экономики и нейроэкономики: стратегии исследования и использования несомненно относятся в том числе и к поведению потребителя (как и любого экономического агента в целом). Стратегия использования в рамках поведения потребителя — это предпочтение уже знакомой услуги или товара, а стратегия исследования — поиск новых услуг или товаров. Обладая этим знанием, компании смогут эффективнее удерживать постоянных клиентов (создавая условия для стратегии использования) и привлекать новых (создавая условия для стратегии исследования). Большое общественное значение могут также иметь результаты исследования, посвященного выявлению особенностей поведения и мозговой активности у пациентов с расстройствами аутистического спектра при принятии решений в условиях неопределенности. Многие из таких пациентов трудоспособны и обладают высоким интеллектом. Результаты этого направления могут помочь понять, как создать такую среду, которая комфортна для таких них, и которая создает им оптимальные условия для принятия решений, как создать инструменты помощи таким пациентам и инструменты диагностики данного класса заболеваний. Исследование будет выполнено на уникальном высокотехнологичном оборудовании и с применением продвинутых математических алгоритмов обработки данных. Таким образом, проект будет выполнен на высоком научном уровне, соответствующем уровню лучших лабораторий в мире.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2020 году
Проект посвящен исследованию внутренних причин и факторов, побуждающих человека переключаться между стратегией использования (при которой человек выбирает заведомо известную ему выгодную альтернативу), и стратегией исследования (при которой человек идет на риск и выбирает потенциально невыгодный вариант, с целью получения информации об окружающей среде). В 2020 году проведены две серии экспериментов: эксперименты с использованием пупиллометрической регистрации (34 испытуемых) и эксперименты с использованием магнитоэнцефалографии одновременно с пупиллометрической регистрацией (53 испытуемых). Мы применили разработанную нами модификацию методики обучения с вероятностной обратной связью, в которой независимо варьировались факторы знака, величины и вероятности подкрепления. Процедура эксперимента в обеих сериях эксперимента была одинаковой. Проведены анализы поведенческих, пупиллометрических и магнитоэнцефалографических данных, в сочетании с данными психологических опросников. Анализ данных был направлен прежде всего на то, чтобы выявить причины совершения рискованных выборов стимулов с низкой вероятностью выигрыша, т.е. перехода от стратегии использования к стратегии исследования. Мы рассматривали три основные гипотетические причины совершения рискованного выбора: (1) ретроактивный механизм, т.е. переход к выбору невыгодного стимула после эпизодических проигрышей, случающихся после выбора выгодного стимула; (2) случайные ошибки вследствие сбоев внимания; (3) проактивный механизм, т.е. упреждающее исследование среды. Согласно нашей исходной гипотезе, переключение к исследовательскому поведению базируется преимущественно на проактивном механизме. Анализ распределения вероятностей совершения рискованных выборов показал, что, в соответствии с нашей гипотезой, испытуемые действительно чаще совершали выбор рискованной альтернативы вопреки полученному перед этим сигналу обратной связи. Полученный результат согласуется с проактивным механизмом перехода к стратегии исследования. При этом для незначительной части рискованных выборов все же нельзя исключить вовлечение ретроактивного механизма. Анализ времени реакции показал, что состояние, предрасполагающее к риску (т.е. к выбору невыгодного стимула, характеризующему стратегию исследования), возникало как минимум за одну пробу до совершения рискованных выборов, и продолжалось после совершения риска в следующей пробе. Результаты анализа ширины зрачка дали полностью аналогичную закономерность. Таким образом, полученные данные говорят о формировании состояния готовности к переходу к исследовательскому поведению как минимум за одну пробу собственно до принятия рискованного решения, т.е. они подтверждают наше предположении о вовлечении проактивного механизма перехода к стратегии исследования. Анализ как времени реакции, так и величины относительного расширения зрачка после рискованных выборов невыгодного стимула показал, что после рискованного выбора неожиданным для испытуемого становился выигрыш, а не проигрыш. Следовательно, идя на рискованный выбор, испытуемые ожидали проигрыша. Таким образом, результаты анализа времени реакции и ширины зрачка свидетельствуют в пользу неслучайного характера рискованных выборов невыгодного стимула. Такой результат позволяет сделать вывод, что рискованные выборы в целом не являются случайными ошибками, происходящими вследствие сбоев внимания. Анализ данных опросников показал, что спонтанные переходы к риску после получения ожидаемой награды могут быть связаны с тенденцией к поиску приятных впечатлений. Те испытуемые, которые склонны с интересом пробовать все новое, пользуясь удачным моментом, и многие вещи в своей жизни делают исключительно ради удовольствия, чаще переходили к риску после наград, чем после наказаний, т.е. действовали согласно проактивному механизму. В то же время, люди, не склонные к активному поиску положительных эмоций, чаще шли на риск непосредственно после проигрышей, т.е. подчинялись ретроактивному механизму. Интересно, что величина относительного расширения зрачка при предъявлении сигнала обратной связи об исходе рискованного выбора (в сравнении со зрачковыми ответами на сигналы обратной связи о выгодных выборах) положительно коррелировала с оценками чувствительности системы торможения поведения. Т.е., те испытуемые, которые более склонны чрезмерно беспокоиться о правильности своих действий, продемонстрировали наибольшую степень расширения зрачка при невыгодном выборе. Поскольку проанализированный нами временной интервал соответствует пику медленного развития реакции зрачка на обратную связь об исходе пробы, предшествовавшей риску, мы можем предполагать, что оно отражает детекцию внутреннего конфликта при подготовке испытуемым невыгодного решения. Иными словами, у индивидов с повышенной чувствительностью к негативному подкреплению может быть выше субъективная значимость ожидаемого высоковероятного штрафа при переходе к риску. Один из блоков эксперимента основывался на задаче реверсивного обучения: на протяжении блока производилась многократная смена роли выгодного и невыгодного стимула. Это заставляло испытуемых менять свою субъективную прагматическую модель в отношении того, какой стимул является выгодным. При анализе поведенческих показателей в данном блоке мы получили прямую корреляцию между склонность к рискам в основных блоках эксперимента и способностью гибко следовать за изменениями вероятностной структуры среды в реверсивном обучении. Т.е. испытуемые, которые демонстрировали выраженное избегание рискованных выборов в основной задаче обучения (т.е. в задаче с неизменными вероятностями обратной связи), с трудом переучивались при изменении условий вознаграждения. Это подтверждает нашу гипотезу о том, что рискованные выборы в вероятностной среде отражают индивидуальный уровень склонности к исследовательскому поведению. В объективно изменчивой среде склонность к исследовательскому поведению и проверке гипотез позволяла испытуемым быстро накапливать информацию об изменившихся условиях среды. Предварительный анализ магнитоэнцефалограммы в пространстве источников показал, что мощность тета-осцилляций была повышена как непосредственно перед рискованными решениями, так и перед выполнением выбора в соседних реализациях (непосредственно предшествующих рискованным выборам и непосредственно следующих за ним). Локализация эффектов в случае принятия решения перед рискованными выборами указывает на переднюю поясную кору. Эти результаты подтверждают нашу гипотезу, что принятие рискованного решения сопряжено с конфликтом между двумя альтернативами. Наличие предвестников рискованного выбора в предыдущей пробе говорит также в пользу проактивного механизма перехода к стратегии исследования. Локализация эффектов усиления тета-осцилляций в реализациях, предшествующих риску, указывает на вовлечение распределенной сети, включающей в себя несколько областей коры больших полушарий. Частотно-временной анализ магнитоэнцефалограммы также показал сильный продолжительный эффект мощности тета осцилляций во временном интервале, известном как интервал реакции на обратную связь/ошибку (200-600 мс после предъявления обратной связи) при сравнении рискованного и нерискованного выборов. Важно, что фронтально-центральная локализация эффекта также предположительно свидетельствует об участии передней поясной коры в реакции на выигрыш или проигрыш, следующими за рискованным выбором. Это указывает на усиленное вовлечение мозговой системы мониторинга выполнения задачи в условиях повышенной значимости сигнала обратной связи после рисков, что, в свою очередь, подтверждает неслучайный характер рискованных выборов и их направленность на исследование среды. Таким образом, в первом году выполнения проекта собран обширный экспериментальный материал и проведен анализ поведенческих, пупиллометрических и магнитоэнцефалографических данных. Полученные результаты подтвердили наши исходные гипотезы и принесли новые значимые результаты о внутренних механизмах перехода от стратегии использования к стратегии исследования.

 

Публикации

1. Козунова Г.Л., Сайфулина К.Э., Прокофьев А.О., Шлепнев П.Б., Медведев В.А., Строганова Т.А., Чернышев Б.В. Pupil dilation as a precursor of risky choice in probabilistic gambling task Advances in Cognitive Research, Artificial Intelligence, and Neuroinformatics. Post-proceedings of the 9th International Conference on Cognitive Studies (Intrercognsci-2020) 11-16 of October, 2020, Moscow, Russia, - (год публикации - 2021)

2. Сайфулина К.Э., Козунова Г.Л., Медведев В.А., Рытикова А.М., Чернышев Б.В. Принятие решения в условиях неопределенности: стратегии исследования и использования. "Современная зарубежная психология", Современная зарубежная психология. 2020. Том 9. No 2. С. 93—106 (год публикации - 2020) https://doi.org/10.17759/jmfp.2020090208

3. Козунова Г.Л., Прокофьев А.О., Медведев В.А., Сайфулина К.Э., Шлепнев П.В., Строганова Т.А., Чернышев Б.В. Расширение зрачка как предвестник рискованного выбора человека в условиях вероятностного подкрепления. сборник трудов Первого национального конгрессе по когнитивным исследованиям, искусственному интеллекту и нейроинформатике (CAICS-2020), - (год публикации - 2020)


Аннотация результатов, полученных в 2021 году
Проект нацелен на изучение психофизиологических механизмов, направляющих поведение человека в условиях дилеммы между стратегиями использования и исследования (exploration-exploitation dilemma). Такая дилемма часто возникает при принятии решений в условиях неопределенности – как в профессиональной деятельности, так и в быту. Следуя стратегии использования, т.е. выбирая заведомо знакомый и умеренно выгодный вариант решения, человек лишает себя возможности узнать что-либо об остальных опциях – некоторые из которых могут оказаться еще более выгодными. Однако, переходя к стратегии исследования, т.е. выбирая незнакомую опцию, человек рискует совершить весьма невыгодный выбор, однако при этом он стремится получить новую информацию, которая, возможно, принесет ему пользу когда-либо в будущем. В наших экспериментах мы применяем разработанную нами модификацию методики обучения с вероятностной обратной связью, в которой независимо варьируются факторы знака, величины и вероятности подкрепления. При выполнении проекта мы анализируем поведенческие, пупиллометрические, и магнитоэнцефалографические данные, зарегистрированные во время эксперимента. Пупиллометрия позволяют оценить с хорошим временным разрешением степень активности норадренергической системы голубого пятна, которая не только вовлечена в процессы принятия решения в целом, но и участвует непосредственно в решении дилеммы между стратегиями исследования и использования. Магнитоэнцефалография позволяет регистрировать мозговую активность с высочайшим временным разрешением и хорошим пространственным разрешением, превосходя по сочетанию этих показателей все остальные методы неинвазивной нейровизуализации. В 2021 году мы продолжили набор экспериментальных данных; в том числе нами записана выборка участников с подтвержденными расстройствами аутистического спектра. Проанализированы поведенческие, пупиллометрические и магнитоэнцефалографические данные в сочетании с данными психологических опросников и тестов, на нейротипичной выборке и на выборке участников с расстройствами аутистического спектра. Анализ данных направлен на то, чтобы выявить мозговые процессы в связи с совершением невыгодных выборов стимулов с низкой вероятностью выигрыша, т.е. перехода от стратегии использования к стратегии исследования. Примененная нами экспериментальная задача на обучение с вероятностной обратной связью позволила разделить два вида стратегии исследования – случайное и направленное. Случайное исследование (random exploration) подразумевает равновероятный случайный выбор любой из числа доступных альтернатив: такой тип стратегии исследования наблюдается на начальных стадиях обучения с подкреплением, и именно его мы наблюдали в тех блоках, в которых участники эксперимента не научились правилам задачи. Однако после достижения критерия обучения характер исследовательского поведения менялся – исследование становилось направленным (directed exploration), т.е. ориентированным на получение информации о той опции, в отношении которой неопределенность наиболее велика. Новизна нашего подхода состоит в том, что мы можем анализировать психофизиологические механизмы именно направленного исследования, и сравнивать их со случайным исследованием, в то время как подавляющее большинство психофизиологических работ, посвященных дилемме между стратегиями исследования и использования, фактически адресовались лишь к стратегии случайного исследования. Мы показываем, что если согласно большому количеству работ при случайном исследовании преобладает состояние "отстранения от задачи" (что, собственно, и делает выборы случайными), то при направленном исследовании картина принципиально другая. Вместо тонического состояния, предрасполагающего к отстранению от задачи, при направленном исследовании возникает конфликт между двумя несовместимыми программами действия. С одной стороны, приобретенная человеком прагматическая модель толкает его к повторению тех выборов, которые уже проявили себя как выгодные (обладающие высокой ожидаемой полезностью). С другой стороны, вероятностная структура вознаграждения заставляет человека строить гипотезы относительно структуры задачи и предполагать существование в них скрытых закономерностей, которые он надеется выявить. При столкновении двух побуждений возникает конфликт. Согласно полученным нами результатам, возникновение данного конфликта на физиологическом и психофизиологическом уровне подтверждается всеми проанализированными нами показателями, включая время реакции, размер зрачка, мощность магнитоэнцефалограммы в тета и бета диапазонах. Психофизиологические доказательства возникновения конфликта, сопряженного с переходом к стратегии исследования, получены в нашей работе впервые. Мы впервые получили доказательства проактивного характера перехода к стратегии направленного исследования. В частности, это доказывается распределением вероятностей совершения рискованных выборов: участники чаще совершали исследовательский выбор невыгодной альтернативы вопреки положительному подкреплению предшествующего выбора выгодного стимула. Полученные нами данные показывают, что состояние конфликта, предрасполагающее к переходу к стратегии исследования (выбору невыгодного стимула), возникает еще в предыдущей реализации, когда участник на самом деле продолжает следовать стратегии использования, т.е. еще пока выбирает выгодный стимул. Замедление времени реакции и расширение зрачка в пробах, непосредственно предшествовавших переходу к стратегии исследования, были сходны с таковыми в исследовательских пробах, и заведомо отличались от значений этих показателей при устойчивом следовании стратегии использования. Усиление осцилляций в тета-диапазоне также было выявлено не только непосредственно перед совершением выбора невыгодного стимула, но также и перед выполнением выбора в соседних реализациях (непосредственно предшествующим исследовательским выборам и непосредственно следующим за ним). Кроме того, мы выявили, что только при выгодных выборах, непосредственно предшествующих переходу к стратегии исследования, во время ожидания сигнала обратной связи возникает выраженное усиление мощности бета осцилляций в левой префронтальной коре. Это наблюдение говорит о том, что ожидание сигнала обратной связи в этих реализациях уже сопряжено с процессами, которые, вероятно, приведут к игнорированию сигнала обратной связи в данной реализации и обеспечат переход к выбору альтернативного, невыгодного стимула независимо от сигнала обратной связи в данной реализации. Направленный характер исследовательского выбора невыгодного стимула подтверждается особым характером мозговой реакции на обратную связь, который ярко проявляется только в данном типе реализаций. А именно в ответ на обратную связь после исследовательского выбора возникала резкая дифференциация мощности бета-осцилляций: значительный подъем после отрицательной обратной связи и, наоборот, резкий спад после положительной обратной связи. На первый взгляд, такой результат противоречит современным представлениям, согласно которым мощность бета ритма усиливается после положительной обратной связи, а не после отрицательной. Однако в ситуации исследовательского поведения, направленного на проверку правила "от противного", значение сигналов обратной связи оказывается инвертированным: отрицательный сигнал фактически подкрепляет имеющуюся прагматическую модель, и мощный всплеск синхронизированного бета-ритма отражает поддержку существующей модели ("статуса-кво). Положительный же сигнал обратной связи в ответ на исследовательский выбор невыгодного стимула толкает к разрушению существующей модели, что и проявляется в виде десинхронизации бета осцилляций. В отчетном периоде нами собрана экспериментальная выборка с привлечением участников с расстройствами аутистического спектра. Наличие данных расстройств подтверждено по результатам беседы участников с опытным психиатром и по результатам опросников и тестов, включая специализированные опросники, направленные на выявление признаков расстройств аутистического спектра. При этом тестирование интеллекта по Векслеру показало лишь очень незначительное снижение интеллекта в группе с расстройствами аутистического спектра в сравнении с нейротипичной выборкой, причем только в вербальных субтестах. Таким образом, мы подтверждаем, что участники в клинической выборке являются высоко функциональными. Анализ поведенческих и пупиллометрических данных, полученных на выборке участников с расстройствами аутистического спектра, показывает, что в целом поведенческие показатели при выполнении задачи на обучение с вероятностной обратной связью не проявили значимых отличий от нейротипичной выборки. При этом выявлено два существенных отличия в выборке с расстройствами аутистического спектра – сниженное время реакции и сниженная чувствительность к отрицательной обратной связи. Таким образом, можно заключить, что участники с расстройствами аутистического спектра справляются с задачей, применяя иные внутренние стратегии по сравнению с нейротипичной выборкой. Исходя из известных отличий в функционировании мозга при расстройствах аутистического спектра (таких как измененные параметры работы норадренергической системы и функционирования префронтальных областей коры) мы ожидаем выявить закономерные отличия между выборками в отношении мозговых механизмов, вовлеченных в решение дилеммы между использованием и исследованием. Таким образом, на втором году выполнения проекта проведена обработка собранного ранее материала, и собран экспериментальный материал на клинической выборке участников с расстройствами аутистического спектра. Полученные результаты подтвердили наши исходные гипотезы и принесли новые значимые сведения о внутренних механизмах перехода от стратегии использования к стратегии исследования.

 

Публикации

1. Козунова Г.Л., Сайфулина К.Э., Прокофьев А.О., Медведев В.А., Рытикова А.М., Строганова Т.А., Чернышев Б.В. Pupil Dilation and Response Slowing Distinguish Deliberate Explorative Choices in the Probabilistic Learning Task bioRxiv, biorxiv.org/content/10.1101/2021.10.19.464963v1.full.pdf (год публикации - 2021) https://doi.org/10.1101/2021.10.19.464963

2. Мясникова А.С., Третьякова В.Д., Сайфулина К.Э., Козунова Г.Л., Рытикова А.М., Чернышев Б.В. Beta-band power predicts exploratory choices in probabilistic environment OPERA MEDICA ET PHYSIOLOGICA, Opera Med Physiol. 2021. Vol. 8 (3) p. 59-64 (год публикации - 2021) https://doi.org/10.24412/2500-2295-2021-3-59-64

3. Козунова Г.Л., Медведев В.А., Юрист Л.Н., Чернышев Б.В. Индивидуальные различия в поведении человека в изменчивой среде: баланс между когнитивной гибкостью и накоплением свидетельств Сборник материалов ежегодной конференции по когнитивной науке, посвященной памяти Дж. С. Брунера, «Психология познания», 2022 год, г. Ярославль, - (год публикации - 2022)

4. Мясникова А.С., Осипова А.А., Чернышев Б.В. АКТИВНОСТЬ В ДИАПАЗОНЕ ТЕТА РИТМА УКАЗЫВАЕТ НА ПРОАКТИВНУЮ СТРАТЕГИЮ ПРИНЯТИЯ РИСКОВАННЫХ РЕШЕНИЙ. Нейронаука для медицины и психологии: XVII Международный междисциплинарный конгресс. Судак, Крым, Россия; 30 мая – 10 июня 2021 г.: Труды Конгресса / Под ред. Е.В. Лосевой, А.В. Крючковой, Н.А. Логиновой. – Москва: МАКС Пресс, 2021. – 456 с., Нейронаука для медицины и психологии: XVII Международный междисциплинарный конгресс. Судак, Крым, Россия; 30 мая – 10 июня 2021 г.: Труды Конгресса / Под ред. Е.В. Лосевой, А.В. Крючковой, Н.А. Логиновой. – Москва: МАКС Пресс, 2021., стр.274-276 (год публикации - 2021) https://doi.org/10.29003/m2247.sudak.ns2021-17/274-275

5. Мясникова А.С., Прокофьев А.О., Чернышев Б.В. Feedback-Related Beta-Band Power Predicts Risky Choices in a Probabilistic Gambling Task International Journal of Psychophysiology. Proceedings of the 20th World Congress of Psychophysiology (IOP 2021) of the International Organization of Psychophysiology (IOP), International Journal of Psychophysiology Volume 168, Supplement, October 2021, Page S122 (год публикации - 2021) https://doi.org/10.1016/j.ijpsycho.2021.07.356

6. Мясникова А.С., Чернышев Б.В. FEEDBACK-RELATED BETA-BAND POWER PREDICTS EXPLORATION IN A PROBABILISTIC GAMBLING TASK Когнитивная наука в Москве: новые исследования. Материалы конференции 23 – 24 июня 2021. Под ред. Е.В. Печенковой, М.В. Фаликман, А.Я. Койфман. – М.: ООО «Буки Веди», ИППиП. 2021 г. — 556 стр., Когнитивная наука в Москве: новые исследования. Материалы конференции 23 – 24 июня 2021. Под ред. Е.В. Печенковой, М.В. Фаликман, А.Я. Койфман. – М.: ООО «Буки Веди», ИППиП. 2021 г., стр. 39-44 (год публикации - 2021)

7. Сайфулина К.Э., Козунова Г.Л., Медведев В.А., Чернышев Б.В. ДВА КОНФЛИКТА ПРИ ПРИНЯТИИ РЕШЕНИЙ В ГЭМБЛИНГ-ЗАДАЧЕ: ПУПИЛЛОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ Когнитивная наука в Москве: новые исследования. Материалы конференции 23 – 24 июня 2021. Под ред. Е.В. Печенковой, М.В. Фаликман, А.Я. Койфман. – М.: ООО «Буки Веди», ИППиП. 2021 г. — 556 стр., Когнитивная наука в Москве: новые исследования. Материалы конференции 23 – 24 июня 2021. Под ред. Е.В. Печенковой, М.В. Фаликман, А.Я. Койфман. – М.: ООО «Буки Веди», ИППиП. 2021 г., стр. 388-394 (год публикации - 2021)

8. Чернышев Б.В., Сайфулина К.Э., Козунова Г.Л., Прокофьев А.О., Медведев В.А. Spontaneous Exploratory Choices Under the Probabilistic Gambling Task Involve the State of conflict: A Pupillometric Study International Journal of Psychophysiology. Proceedings of the 20th World Congress of Psychophysiology (IOP 2021) of the International Organization of Psychophysiology (IOP), International Journal of Psychophysiology Volume 168, Supplement, October 2021, Page S218 (год публикации - 2021) https://doi.org/10.1016/j.ijpsycho.2021.07.589


Аннотация результатов, полученных в 2022 году
Проект направлен на изучение психофизиологических механизмов принятия решения в условиях дилеммы между стратегиями использования и исследования. Такая дилемма возникает при принятии решений в условиях неопределенности – т.е. при недостатке информации. Следуя стратегии использования, т.е. постоянно выбирая только заведомо знакомый приемлемый вариант решения, человек лишает себя возможности узнать что-либо об остальных опциях – и, возможно, упускает некую еще бо́льшую выгоду. Переходя к стратегии исследования, т.е. выбирая незнакомую опцию, человек стремится получить новую информацию, которая, возможно, принесет ему пользу когда-либо в будущем, однако при этом он рискует совершить невыгодный выбор. В отчетном году наша основная задача состояла в том, чтобы изучить, как происходит принятие решений не только на нейротипичной выборке, но и у взрослых людей с расстройствами аутистического спектра (РАС) с высокой функциональностью – т.е. в целом адаптированных на приемлемом уровне и сохранившим трудоспособность. Из литературы известно, что принятие решений в целом, и особенно в условиях неопределенности, дается весьма трудно для лиц с РАС, что существенно сужает для них выбор возможных профессий. Изучение особенностей работы мозга этой группы людей в вероятностных условиях необходимо, чтобы обеспечить им возможность повысить их адаптивность и качество их жизни. Соответственно, в 2022 году нами проведены магнитоэнцефалографические эксперименты с привлечением добровольных участников с расстройствами аутистического спектра (РАС), а также дополнительно проведены эксперименты с привлечением новых участников нейротипичной выборки – с целью обеспечения равного половозрастного состава. Поскольку цель экспериментального исследования состояла в том, чтобы изучить спонтанные отклонения от выгодной стратегии поведения (переходы от режима использования к режиму исследования), мы использовали разработанную нами модификацию методики обучения с вероятностной обратной связью. Испытуемым многократно предъявлялась для выбора пара стимулов — иероглифов из японской слоговой азбуки Хирагана, повернутых под разными углами и располагающихся в правой и левой частях экрана. Стимулы менялись местами в случайном порядке. Каждый выбор приносил выигрыш или проигрыш: участник эксперимента мог потерять некоторое количество очков или приобрести. Один иероглиф приносил выигрыш чаще, чем другой. Выигрыши и проигрыши следовали в псевдослучайном порядке. Очки суммировались на протяжении всего эксперимента; после эксперимента испытуемый получал денежное вознаграждение, равное накопленной сумме очков. Во время эксперимента проводилась непрерывная регистрация размера зрачка с помощью айтрекера Eyelink 1000 Plus и регистрация магнитоэнцефалографической активности головного мозга при помощи 306-канального магнитоэнцефалографа (Elekta Neuromag Vector View). Полученные нами результаты показали, что участники с РАС справлялись с задачей наравне с нейротипичными добровольцами того же пола и возраста. Однако наши данные показывают, что процессы в их мозге отличаются рядом особенностей, и внешне сходный поведенческий результат достигался иными средствами. С одной стороны, мы выявили, что формирование прагматической модели у них ослаблено: в том числе, на протяжении всего эксперимента их мозг продолжал отвечать на знак сигналов обратной связи, подаваемых после заведомо выгодных выборов – в то время как в нейротипичной группе этого не наблюдалось. С другой стороны, эффекты, связанные с конфликтом, выявлены в схожей степени как для нейротипичной выборки, так и в выборке лиц с РАС. Поскольку и на поведенческом уровне они в целом достигали результатов, сопоставимых с нейротипичной выборкой, можно заключить, что даже слабой (или постоянно обновляемой) прагматической модели им было в целом достаточно для адекватного выполнения задачи. Обращает на себя внимание то, что для участников с РАС, судя по результатам анализа магнитоэнцефалографических бета-осцилляций, любое принятие решений в данной задаче сопровождалось усиленной обработкой информации, в то время как в нейротипичной группе было выраженное усиление признаков обработки информации только перед исследовательскими выборами. Это наблюдение можно соотнести с повышенной тревожностью и нетерпимостью к неопределенности в группе с РАС. Выборка с РАС существенно отличалась от нейротипичной в отношении выгодных выборов, следовавших непосредственно перед невыгодным рискованным выбором: судя по имеющимся данным, конфликт при принятии решения в этом типе реализаций был сильно увеличен по сравнению с нейротипичной группой – несмотря на то, что выбор в данной реализации все же происходил в пользу выгодного стимула, т.е. все еще в соответствии со стратегией использования. Однако, в этих же реализациях, в реакции на обратную связь имеются признаки не только сохранившегося, но даже усилившегося закрепления имеющейся у них прагматической модели – что, казалось бы, противоречит приближающемуся исследовательскому выбору. Предположительно, по ходу цепочки следующих друг за другом выгодных выборов, совершаемых на основе стратегии использования, одновременно и накапливался конфликт, и происходили процессы, направленные на удержание в рамках прагматической модели и противодействующие конфликту. Парадоксально, но при совершении собственно исследовательского выбора уже не возникало различий в ответе мозга на положительные и отрицательные сигналы обратной связи, как будто они становились равноценными. Иными словами, исследовательский выбор не выглядел как целенаправленная проверка альтернативных гипотез. Полученные данные показывают, что если нейротипичные участники эксперимента использовали стратегию направленного исследования – т.е. целенаправленный выбор опции, сопряженной с большей неопределенностью, то у участников в РАС мы обнаружили признаки, указывающие отчасти на случайное исследование – т.е. срыв выполнения, отстранение от задачи, игнорирование ее правил. Более того, этот эффект, видимо, имел длительный характер – что отличает участников с РАС от нейротипичных участников эксперимента, у которых эффекты носили отчетливо фазический характер. Таким образом, в отчетном году нами показано, что в выборке участников с РАС: (1) слабее формируется прагматическая модель, (2) состояние конфликта сопровождает не только исследовательские типы выбора, но и другие, особенно последние выгодные выборы, непосредственно предшествующие исследовательским выборам; (3) стратегия исследования в группе с РАС имеет черты случайного исследования.

 

Публикации

1. Б.В. Чернышев, К.И. Пульцина, В.Д. Третьякова, А.С. Мясникова, А.О. Прокофьев, Г.Л. Козунова,Т.А. Строганова Losses resulting from deliberate exploration trigger beta oscillations in frontal cortex bioRxiv, bioRxiv (2022): 10.06.510948 (год публикации - 2022) https://doi.org/10.1101/2022.10.06.510948

2. Г.Л. Козунова, Ф.Х. Закиров, А.М. Рытикова, Т.А. Строганова, Б.В. Чернышев Нейробиологические факторы нарушения исполнительных функций при аутизме Журнал высшей нервной деятельности им. И.П.Павлова, - (год публикации - 2023)

3. Козунова Г.Л., Новиков А.Ю., Строганова Т.А., Чернышев Б.В. Нетерпимость к неопределенности и трудности принятия решений в ситуациях социального взаимодействия у взрослых пациентов с высокофункциональным аутизмом: обзор психологических исследований. Клиническая и специальная психология, - (год публикации - 2023)

4. Козунова Г.Л., Сайфулина К.Э., Прокофьев А.О., Медведев В.А., Рытикова А.М., Строганова Т.А., Чернышев Б.В. Pupil dilation and response slowing distinguish deliberate explorative choices in the probabilistic learning task Cognitive, Affective, & Behavioral Neuroscience, том 22, сс. 1108–1129 (год публикации - 2022) https://doi.org/10.3758/s13415-022-00996-z

5. Б.В. Чернышев, К.И. Пульцина, В.Д. Третьякова, А.С. Мясникова, Т.А. Строганова Beta oscillations in human MEG synchronize after negative rather than positive outcomes following exploratory decisions under a probabilistic gambling task The 22nd International Conference on Biomagnetism (Biomag 2022). Proceedings of the Conference., The 22nd International Conference on Biomagnetism (Biomag 2022). Proceedings of the Conference. p.488 (год публикации - 2022)

6. Г. Л. Козунова, Л. Н. Юрист, А. Ю. Николаева, А. Ю. Новиков, Б. В. Чернышев ПРОФИЛЬ ИНТЕЛЛЕКТА И НЕТЕРПИМОСТЬ К НЕОПРЕДЕЛЕННОСТИ У ПАЦИЕНТОВ С ВЫСОКОФУНКЦИОНАЛЬНЫМ АУТИЗМОМ Психология сегодня: актуальные исследования и перспективы. Том 2., Психология сегодня: актуальные исследования и перспективы: материалы Всероссийского психологического форума в 2 томах (Екатеринбург, 28–30 сентября 2022 года). Том 2. — C. 203-206. (год публикации - 2022)

7. - Расширение зрачка и замедление реакции в условиях выбора - исследование ученых МГППУ сайт Московского государственного психолого-педагогического университета, - (год публикации - )

8. - Решаешь? По глазам вижу! сайт Российского научного фонда, - (год публикации - )

9. - Решаешь? По глазам вижу! портал “Нейроновости”, - (год публикации - )

10. - Исследование ученых МГППУ: расширение зрачка и замедление реакции в условиях выбора портал "Информио" (ООО "РИНФИЦ"), - (год публикации - )

11. - Решаешь? По глазам вижу! портал проекта ALEV, - (год публикации - )


Возможность практического использования результатов
Результаты, полученные нами при выполнении настоящего проекта, могут применяться при прогнозировании поведения людей в ситуациях с высокой неопределенностью, в том числе для решения маркетинговых, управленческих и социально-коммуникационных задач. Сведения об особенностях процесса обучения и принятия решений у высокофункциональных пациентов с расстройствами аутистического спектра могут использоваться для определения круга задач, исполняемых сотрудниками с РАС, и гармонизации условий труда.