КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 18-71-10108

НазваниеОптимальный транспорт: численные методы и приложения к анализу данных

РуководительДвуреченский Павел Евгеньевич, Кандидат физико-математических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, г Москва

Период выполнения при поддержке РНФ 07.2018 - 06.2021  , продлен на 07.2021 - 06.2023. Карточка проекта продления (ссылка)

Конкурс№30 - Конкурс 2018 года по мероприятию «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-203 - Теория оптимизации и исследование операций

Ключевые словаОптимальный транспорт, выпуклая оптимизация, ускоренный градиентный спуск, прямо-двойственный метод, распределенные алгоритмы, центральная предельная теорема, вероятностная мера, расстояние Монжа-Канторовича-Васерштейна, пространство Васерштейна, барицентр Васерштейна, несбалансированный оптимальный транспорт, метод балансировки

Код ГРНТИ27.47.19


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
В последние годы наблюдается увеличение роли концепции оптимального транспорта в машинном обучении (в том числе глубинном обучении), анализе изображений, компьютерной графике и других высокотехнологичных методах анализа данных. На основе оптимизационной задачи поиска оптимального транспорта, впервые рассмотренной Г. Монжем и обобщенной Л.В. Канторовичем, вводится понятие транспортного расстояния между вероятностными мерами, называемое расстоянием Монжа-Канторовича-Васерштейна (МКВ-расстояние). Это расстояние оказалось естественным для сложных объектов, рассматриваемых в анализе данных. Последнее основано на том, что это расстояние позволяет на основе расстояния в некотором базовом метрическом пространстве, определить расстояние между вероятностными мерами, определенными на этом базовом пространстве. Это позволяет анализировать сложные объекты, которые могут быть смоделированы как вероятностные меры, например, изображения или поток видео, который является последовательностью изображений. Одной из задач, в которых этот подход хорошо себя зарекомендовал, является задача поиска изображений, похожих на заданное пользователем изображение (image retrieval). Известно, что можно так определить расстояние в цветовом пространстве, что это расстояние будет соответствовать восприятию близости цветов человеком. На основе этого расстояния можно определить МКВ-расстояние в пространстве цветовых гистограмм изображений. Такая гистограмма задается набором интервалов цветов и представляет собой для каждого цветового интервала долю пикселей изображения, цвет которых принадлежит этому интервалу. Причем эти гистограммы являются вероятностными мерами над цветовым пространством и расстояние между двумя изображениями вычисляется как МКВ-расстояние между их цветовыми гистограммами. Другими примерами задач, в которых подход на основе оптимального транспорта дает хорошие результаты, являются классификация изображений с помощью МКВ-расстояния, определенного на основе евклидова расстояния между пикселями изображений; анализ текстов с помощью МКВ-расстояния между текстами, определенного на основе расстояния между словами; и многие другие. Тем не менее, успех концепции оптимального транспорта в приложениях носит по большей части эвристический и инженерный характер. Отсутствие строгого математико-статистического обоснования и понимания статистических свойств пространств мер ограничивают расширение области применимости этого подхода в приложениях. Так, стандартный подход в машинном обучении рассматривает данные как случайные реализации из некоторого вероятностного распределения. Если анализируются сложные данные, такие как изображения, то каждый элемент данных сам по себе является вероятностной мерой. Следовательно, важно понять, как работать со случайными вероятностными мерами, распространить на этот случай центральную предельную теорему и другие классические результаты. Отсутствие полностью теоретически обоснованных численных методов ограничивает применимость этого подхода как к новым прикладным задачам, так и к известным прикладным задачам с большим объемом данных или с большей размерностью анализируемых объектов. Эра больших данных предъявляет серьезные требования к вычислительной эффективности предлагаемых процедур и алгоритмов. Несмотря на свою эффективность, современные численные методы не позволяют за разумное время вычислить МКВ-расстояние между двумя трехмерными изображениями мозга с высоким разрешением. В то же время, недостаточно просто предложить эвристический метод для вычисления транспортного расстояния между объектами высокой размерности. Чтобы иметь гарантии адекватности времени работы алгоритма, необходимо получить теоретические оценки его сложности. Как итог, основная проблема, рассматриваемая в проекте, состоит в отсутствии в достаточной степени теоретически обоснованных численных методов для вычисления транспортного расстояния между объектами высокой размерности и недостаточная теоретическая обоснованность статистических приложений концепции оптимального транспорта. Решение этих проблем позволит разработать практические, эффективные и понятные алгоритмы для более широкого диапазона приложений и масштабов задач. Задача предлагаемого проекта состоит в продвижении в решении описанной выше проблемы, а именно в разработке новых численных методов и оценке их сложности, а также в получении новых теоретических результатов о применимости концепции оптимального транспорта и применении этих результатов в конкретных приложениях. В соответствии с этой большой задачей, мы делим проект на два подпроекта с конкретными наборами задач. Первый проект направлен на разработку численных методов и их теоретическое обоснование, второй проект направлен на разработку статистических инструментов для работы с данными, являющимися элементами пространства Васерштейна вероятностных мер, то есть пространства мер, наделенного МКВ-расстоянием. Концепция оптимального транспорта в применении к задачам машинного обучения является хорошим примером синергетического эффекта от взаимодействия математической статистики и оптимизации. Поэтому соединение оптимизационного и статистического проекта в один видится сильной стороной предлагаемого проекта. Часть коллектива, имеющая опыт в оптимизации будет влиять на другую часть, специализирующуюся в статистике, и наоборот. Подпроект 1. Численные методы для транспортных расстояний между объектами высокой размерности. В некоторых приложениях, таких как классификация изображений рукописных цифр, анализируемые объекты моделируются как вероятностные меры. МКВ-расстояние между двумя вероятностными мерами определяется как минимальное значение целевой функции в специальной задаче оптимизации, которая является задачей линейного программирования. Если объекты имеют большую размерность (например, размерность изображения - это число пикселей в нем), то стандартные методы, например, симплекс метод или методы внутренней точки, не могут быть применены для решения этой задачи. Причина в том, что сложность этих алгоритмов O(n^3), где n - размерность пространства объектов. Самый эффективный на сегодняшний день подход в этом случае состоит в энтропийной регуляризации задачи линейного программирования и применении метода Синхорна (в русскоязычной литературе известен как метод балансировки Брегмана-Шацкого-Шелейховского) для решения этой задачи. Недавно было показано, что сложность этого алгоритма n^2/e^3, где e - желаемая точность аппроксимации расстояния. Обратная кубическая зависимость от точности не позволяет гарантированно получить хорошую точность за разумное время. В связи с этим обстоятельством в проекте планируется а) улучшить оценку сложности метода Синхорна и б) разработать альтернативный подход на основе ускоренного градиентного метода. На практике часто возникает необходимости сравнения двух мер разной суммарной массы. Например, эти меры могут быть изображениями разной яркости или одна из этих мер является изображением мозга с опухолью, а вторая изображением мозга без опухоли. Возникает необходимость определения расстояния между радоновскими мерами, а не вероятностными мерами. В таких ситуациях транспортное расстояние определяется на основе задачи поиска несбалансированного оптимального транспорта, которая является выпуклой задачей нелинейного программирования. Энтропийная регуляризация и обобщения метода Синхорна также могут быть применены для решения этой задачи, но почти ничего не известно об оценках сложности этих алгоритмов для этой задачи. Поэтому в проекте планируется обобщить оценки метода Синхорна и подход на основе ускоренного градиентного метода и получить новые алгоритмы и оценки сложности для задачи поиска несбалансированного оптимального транспорта и транспортного расстояния на ее основе. При работе с набором случайных объектов естественным является определение его типичного представителя или “среднего” объекта. Если эти объекты являются нетривиальными, например изображениями, то определение понятия среднего тоже становится нетривиальным. Один из подходов, зарекомендовавший себя в машинном обучении, состоит в рассмотрении этих объектов как мер и определении на основе транспортного расстояния среднего объекта как такого объекта, сумма транспортных расстояний от которого до всех объектов из набора минимальна. Этот объект называется барицентром, порожденным транспортным расстоянием. В частном случае МКВ-расстояния его называют барицентром Васерштейна. Вычисление барицентра является более сложной задачей, чем вычисление транспортного расстояния, так как включает в себя многократное вычисление транспортного расстояния. В этой ситуации энтропийная регуляризация также используется на практике, но вопрос о теоретических оценках сложности остается открытым. Кроме того, число объектов в наборе может быть настолько большим, что они не могут быть обработаны в оперативной памяти одного компьютера и хранятся в распределенной среде. Поэтому необходима разработка распределенных алгоритмов поиска барицентра. На основе вышесказанного в проекте планируется а) обобщить развиваемые алгоритмы и их оценки сложности на задачу вычисления барицентра, порожденного общим транспортным расстоянием и б) предложить распределенный алгоритм поиска барицентра Васерштейна и оценку сложности этого алгоритма. Подпроект 2. Статистические инструменты для работы с данными из пространств Васерштейна. Эффективное использование и распространение существующих методов статистического анализа на пространства с нетривиальной геометрией требуют дополнительного исследования свойств последних. Например, выбор расстояния определяет такие кумулятивные характеристики случайного множества, принадлежащих многообразию, как среднее, вариабельность и т.д. Особый интерес представляют пространства Васерштейна, которые в некотором смысле учитывают внутреннюю геометрию наблюдаемых данных. В особенности следует отметить не регуляризованное и регуляризованное 2-расстояния Васерштейна, последнее, в частности, сравнительно легко вычисляется, что с практической точки зрения является неоспоримым плюсом. Помимо выбора расстояния, среди ключевых аспектов в ратификации методов анализа данных, использующих оптимальный транспорт, следует выделить понимание статистических свойств таких кумулятивных характеристик, как барицентр Васерштейна, оптимальные транспортные планы или расстояние Монжа-Канторовича, как функционал случайной меры. Эта задача возникает при разработке методов анализа случайных множеств мер. Рассмотрим меры, как независимые одинаково распределенные случайные величины. Первый вопрос касается сходимости эмпирического распределения мер к своему не случайному аналогу, например в смысле расстояния Монжа-Канторовича над мерами, определенными над пространством мер. Еще один важный вопрос - состоятельность эмпирического барицентра (регуляризованного или не регуляризованного), т.е. его сходимость к популяционному аналогу и скорость это сходимости. На вышеперечисленных свойствах также базируются многие другие статистические конструкции, например доверительные множества вокруг барицентров или методология непараметрического тестирования для двух выборок. Помимо понимания статистических свойств, приведенных выше, новые методы анализа данных, использующие оптимальный транспорт, требуют разработки специальных инструментов. Мы рассматриваем два направления исследований. Первое связано с задачей определения гауссовских процессов над пространствами Монжа-Канторовича. Методология распространяет классические ядерные методы на множества мер. Вторая задача, возникшая в контексте semi-supervised learning, в англоязычной литературе называется domain adaptation problem. Она формулируется следующим образом. Дан набор случайных размеченных выборок, сгенерированных согласно некоторым распределениям; также имеется неразмеченная выборка, сгенерированная согласно (искаженному) деформированному распределению; соответственно, требуется присвоить метки классов (тех же, что и в размеченных выборках) элементам искаженной выборки с минимальной погрешностью. Задача особенно актуальна в свете того, что на сегодняшний день продуцируется большое количество не размеченных данных, в то время как построение разметки на них является дорогостоящей процедурой. Планируется предложить новую модель для этой задачи, которая будет основана на идеях оптимального транспорта, а также численные методы ее решения.

Ожидаемые результаты
Мы приводим ожидаемые результаты проекта в соответствии с содержанием подпроектов. 1. Численные методы для транспортных расстояний между объектами высокой размерности Для метода Синхорна планируется получить оценки сложности вычисления МКВ-расстояния лучше, чем имеющиеся в литературе. Планируется усилить этот результат об оценках сложности с помощью разрабатываемого в проекте альтернативного подхода для вычисления МКВ-расстояния на основе ускоренного градиентного метода. Это позволит применять концепцию оптимального транспорта в прикладных задачах анализа данных большего объема и размерности, чем сейчас. К тому же, подход на основе ускоренного градиентного метода будет более гибким и позволит применять к задаче поиска оптимального транспорта другие регуляризации, например, регуляризацию квадратом евклидовой нормы. Такая регуляризация является предпочтительной, так как порождает разреженную аппроксимацию транспортного плана, в отличие от энтропийной регуляризации. Разреженная аппроксимация транспортного плана важна в таких приложениях как изменение цветовой гаммы изображения (image color transfer), в котором требуется изменить цветовую гамму изображения на основе цветовой гаммы другого изображения, или обобщение алгоритма машинного обучения на новую выборку (domain adaptation), в котором целью является получение модели для новых данных на основе имеющейся модели похожих данных, но сгенерированных из другого распределения. Также на основе ускоренного градиентного метода с полной релаксацией на каждой итерации планируется разработать алгоритм для вычисления МКВ-расстояния, который будет иметь те же оценки скорости сходимости, но будет быстрее работать на практике. Планируется обобщить перечисленные алгоритмы и их оценки сложности на задачи вычисления транспортных расстояний, основанных на задаче поиска несбалансированного оптимального транспорта. Для таких задач оценки сложности для существующих алгоритмов на основе метода Синхорна не известны. Такие методы создадут теоретически обоснованную вычислительную базу для сравнения сложных объектов с разной массой, например, изображений мозга с опухолью и без нее. Кроме того, предлагаемые в проекте алгоритмы и их оценки сложности планируется обобщить на задачи вычисления барицентра, порожденного общим транспортным расстоянием. Это создаст теоретически обоснованную вычислительную базу для центральной предельной теоремы в пространстве Васерштейна и для определения понятия среднего по выборке среди объектов сложной природы, таких как изображения. Планируется также разработать распределенный алгоритм для вычисления барицентра Васерштейна и оценить сложность этого алгоритма. Это позволит вычислять “средний” объект в случае когда объем данных настолько велик, что данные приходится распределять по нескольким компьютерам. В целом результатами этого подпроекта будут новые теоретически обоснованные методы для вычисления более широкого класса транспортных расстояний и барицентров. Также отметим, что задача оценки матрицы корреспонденций трафика, возникающая в транспортном моделировании, является энтропийно-регуляризованной задачей поиска оптимального транспорта. Поэтому предлагаемые в проекте алгоритмы и их оценки сложности могут быть применены в транспортном моделировании при создании систем интеллектуального управления транспортной сетью города и систем городского транспортного планирования. 2. Статистические инструменты для работы с данными из пространств Васерштейна Во второй части проекта планируется исследовать пространство мер, снабженное регуляризованным МКВ-расстоянием, а именно: получить критерии сходимости для регуляризованного транспортного расстояния, изучить квази-метрические и топологические свойства данного пространства. Также будут изучены свойства (регуляризованных) барицентров, такие как единственность и устойчивость относительно малых вариаций параметра регуляризации и распределения. Кроме того, мы исследуем свойства барицентров и их репрезентативность, т.е. в какой степени они отражают свойства рассматриваемых мер, например, выпуклость носителя или лог-вогнутость плотности распределения. Далее, будут получены результаты о концентрации эмпирических барицентров Васерштейна, в частности, центральная предельная теорема (в касательном пространстве к пространству Васерштейна либо в пространстве параметров для конечномерных параметрических семейств). Теория оптимального транспорта является мощным инструментом для развития статистического анализа сложных данных, которые могут быть представлены в виде случайных мер. В данном проекте мы сконцентрируемся на построении доверительных множеств для барицентров Васерштейна и обобщении непараметрических статистических критериев, основанных на линейной упорядоченности данных (например, ранговые критерии), на многомерный случай. Разработанные методы планируется применить к задаче обнаружения структурных изменений в данных. Другое направление исследований, представленное в проекте, касается построения гауссовских процессов, индексированных мерами из пространства Васерштейна. Потребность в таких объектах возникает, например, в численных экспериментах, когда априорная информация о процессе допускает множество возможных значений и выражается с помощью априорного распределения. В этом случае, наблюдая случайные реализации для такого распределения в некоторых точках, мы хотим предсказывать значение процесса в других точках. Комбинация теории оптимального транспорта и методологии обучения с частичным привлечением учителя (semi-supervised learning) ведет к развитию новых методов классификации. Мы планируем предложить новый подход к решению задачи, называемой в англоязычной литературе domain adaptation problem. Задача заключается в следующем: имея размеченную тренировочную выборку, требуется разметить новую выборку, которая сгенерирована из распределения, близкого к распределению исходной выборки. Планируется также получить теоретические гарантии качества для данного метода при определенных условиях на модель генерации случайных выборок.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2018 году
Подход на основе оптимального транспорта хорошо зарекомендовал себя в задачах обработки данных, имеющих геометрическую струтуру, например, изображений. Например, если рассматривать изображения как вероятностные меры, то расстояние Васерштейна задает естественное расстояние между ними. Это расстояние можно использовать, например, в классификации и кластерном анализе. Кроме того, барицентр Васерштейна, заданный соотвествующим расстоянием, позволяет определить "средее" изображение. Применение этого подхода осложняется высокой вычислительной сложностью вычисления расстояния и барицентра. Во-первых, изображения имеют большое число пикселей, а, во-вторых, само число обрабатываемых изображений может быть большим. Кроме того, данные могут быть зашумлены, что требует разработки аппарата математической статистики. В отчетном периоде исследованы существующие и предложены новые алгоритмы для решения задач оптимального транспорта, а именно для вычисления расстояния Васерштейна и барицентра Всерштейна набора вероятностных мер. Для работы в режиме больших данных использован подход распределенной оптимизации, в котрой большая задача разбивается на маленькие блоки и каждый блок выполняется отдельным компьютером. Также в отчетном периоде было введено определение барицентра Буре-Вассерштейна: среднего по Фреше какой-либо меры, заданной над пространством полуопределенных эрмитовых операторов. В частности, рассмотрен барицентр, построенный на произвольном аффинном подпространстве пространства полуопределенных эрмитовых операторов, приведены условия его существования и единственности. Кроме того, получены результаты касательно свойств сходимости эмпирического барицентра: центральная предельная теорема, асимптотическое распределение расстояния между барицентром и его оценкой, а также концентрация в норме фробениуса и в метрике Буре-Вассерштейна.

 

Публикации

1. Двуреченский П.Е., Двинских Д.М., Гасников А.В., Урибе Ц., Недич А. Decentralize and randomize: Faster algorithm for Wasserstein barycenters Advances in Neural Information Processing Systems 31 (NIPS 2018), Advances in Neural Information Processing Systems 31, pp.10760-10770 (год публикации - 2018)

2. Крошнин А.В., Двинских Д.М., Двуреченский П.Е., Гасников А.В., Тупица Н.К., Урибе Ц.А. On the Complexity of Approximating Wasserstein Barycenter Proccedings of 36th International Conference on Machine Learning, - (год публикации - 2019)

3. Стонякин Ф.С., Двинских Д.М., Двуреченский П.Е., Крошнин А. В., Кузнецова О.А., Агафонов А.И., Гасников А.В., Тюрин А.И., Урибе Ц.А., Пасечнюк Д.А., Артамонов С.И. Gradient Methods for Problems with Inexact Model of the Objective Lecture Notes in Computer Science, - (год публикации - 2019)


Аннотация результатов, полученных в 2019 году
Были продолжены работы в блоке численных методов для задач оптимального транспорта: вычисление расстояния Васерштейна и расстояния Хеллингера-Канторовича, которое обобщает первое на случай мер разной массы. Типичное приложение первого - расстояние между изображениями, используемое для их классификации. Оказывается, что расстояние Васерштейна очень хорошо отражает геометрический характер изображений как объектов в многомерном пространстве. В то же время, на практике часто возникает необходимость сравнения двух мер разной суммарной массы. Например, эти меры могут быть изображениями разной яркости или одна из этих мер является изображением мозга с опухолью, а вторая изображением мозга без опухоли. В таких ситуациях транспортное расстояние определяется на основе задачи поиска несбалансированного оптимального транспорта и типичным примером является расстояние Хеллингера-Канторовича. Основной сложностью в применении этих расстояний на практике является их вычислительная сложность. Так, для изображений 1000 на 1000 пикселей требуется решить задачу с 10 в 12 степени переменных. На текущем этапе были предложены новые методы для эффективного вычисления этих расстояний. Более сложным объектом, основанным на задаче оптимального транспорта является барицентр Васерштейна. Этот объект обобщает понятие среднего на нелинейные пространства Васерштейна. Оказывается, что такой барицентр позволяет ввести подходящее понятие среднего изображения для набора изображений. В рамках статистического подхода этот набор является случайным и необходимо исследовать статистические свойства их барицентра. На текущем этапе разработанная техника доказательства сходимости эмпирических барицентров при увеличении размера выборки позволила получить результаты, касающиеся аналитического контроля качества методологии построения неасимптотических доверительных интервалов для бариентра. Предложенный подход был также использован для тестирования гипотезы о неоднородности данных, например обнаружении изменений в динамическом потоке изображений. Кроме того, был предложен метод непараметрического тестирования, основанный на концепции многомерных рангов, позволяющий для сложных случайных объектов определять, сгенерированы ли они различным способом или одинаковым. Результаты проекта были представлены на конференциях, организованных международными ведущими математическими и образовательными центрами (Математический центр в Обервольфахе, Германия; Математический центр в Люмини, Франция; Образовательный центр “Сирус” в Сочи, Россия), на ведущей международной конференции по методам машинного обучения NeurIPS, проводившейся в Ванкувере, Канада, а также на крупной международной конференции по оптимизации International Conference on Continuous Optimization в Берлине.

 

Публикации

1. Гуминов С.В., Нестеров Ю.Е., Двуреченский П.Е., Гасников А.В. Guminov_et_al_2019_AcceleratedPrimal-DualGradient Doklady Mathematics, Vol. 99, No. 2, pp. 125–128. (год публикации - 2019) https://doi.org/10.1134/S1064562419020042

2. Двинских Д.М., Горбунов Э.А., Гасников А.В., Двуреченский П.Е., Урибе Ц. Dvinskikh_et_al_CDC_2019_Primal-Dual approaches for distributed stochastic convex optimizaiton 2019 IEEE 58th Conference on Decision and Control (CDC), pp.7435-7440 (год публикации - 2019) https://doi.org/10.1109/CDC40024.2019.9029798

3. Нестеров Ю.Е.,Гасников А.В.,Гуминов С.В., Двуреченский П.Е. Nesterov_et_al_2020_Primal-dual accelerated gradient methods with small-dimensional relaxation oracle Optimization Methods and Software, pp.1-38 (год публикации - 2020) https://doi.org/10.1080/10556788.2020.1731747


Аннотация результатов, полученных в 2020 году
Были продолжены работы в блоке численных методов для задачи (энтропийно-регуляризованного) оптимального транспорта. Предложены новые адаптивные методы, позволяющие в том числе решать задачу не сбалансированного оптимального транспорта. Примером применения не сбалансированного оптимального транспорта является поиск расстояния между изображениями, моделируемых как радоновские меры, и последующая классификация этих изображений на основе расстояния между ними. При этом рассматриваются меры различной массы, что затрудняет применение расстояния Васерштейна, сводящегося к вычислению сбалансированного оптимального транспорта. Более сложным объектом, основанным на задаче оптимального транспорта является барицентр Васерштейна. Этот объект обобщает понятие среднего на нелинейные пространства Васерштейна. Оказывается, что такой барицентр позволяет ввести подходящее понятие среднего изображения для набора изображений и использовать его, например для задач классификации или для обратной задачи восстановления типичного изображения по наблюдениям его случайной трансформации. Поиск барицентра Васерштейна является нетривиальной оптимизационной задачей большой размерности. Как и задача оптимального транспорта эта задача может быть сформулирована как прямо-двойственная задача поиска седловой точки, в которой прямые переменные это барицентр и транспортные планы, а двойственные - это множители Лагранжа. Мотивируясь этой переформулировкой на данном этапе были предложены ускоренные методы решения седловых задач, которые послужат базой для новых эффективных методов решения задачи оптимального транспорта и задачи поиска барицентра Васерштейна. Для того, чтобы иметь возможность эффективно решать задачу поиска барицентра Васерштейна в продолжение исследований предыдущих отчетных периодов, в частности статьи NeurIPS 2018, проведено систематическое исследование децентрализованных распределенных методов оптимизации, получены новые методы для решения таких задач в различных постановках: с прямым или двойственным оракулом, гладкие или негладкие, выпуклые или сильно выпуклые. Для всех методов получены оценки сложности, которые в большинстве случаев являются оптимальными. Кроме вычислительного аспекта для барицентров Васерштейна, важным является изучение пространства Васерштейна а также статистических свойств пространства Васерштейна. В рамках статистического подхода этот набор мер, для которых ищется барицентр, является случайным и необходимо исследовать статистические свойства барицентра этого набора. На текущем этапе предложена конструкция положительно определенного ядра на пространстве Васерштейна вероятностных мер, что в частности позволило определить гауссовские процессы, индексированные элементами пространства Васерштейна, а также обобщить стандартные статистические объекты определяемые на гильбертовых пространствах на пространство Васерштейна. Особое внимание уделено пространству Буре-Васерштейна, соответствующего частному случаю пространства Васерштейна для эллиптических распределений. Также проведено систематическое исследование свойств энтропийно-регуляризованного барицентра Васерштейна. Показано существование и единственность энтропийно-регуляризованного барицентра, а также предложена его характеризация через среднее потенциалов Канторовича. В стохастической постановке получен сильный закон больших чисел в пространствах Васерштейна и в пространствах Гёльдера, доказана функциональная центральная предельная теорема. За отчетный период по проекту опубликовано и принято к публикации 6 статей, из которых одна в издании первого квартиля. Результаты проекта были представлены в 13 докладах на конференциях и семинарах, в частности на ведущей международной конференции по оптимальному управлению Conference on Decision and Control, на международной конференции INFORMS Telecommunications and Network Analytics Conference.

 

Публикации

1. Алкуса М. С., Гасников А. В., Двинских Д. М., Ковалев Д. А., Стонякин Ф. С. 2020_Alkousa_et_al_Accelerated Methods for Saddle-Point Problem Computational Mathematics and Mathematical Physics, Vol. 60, No. 11, pp. 1787–1809 (год публикации - 2020) https://doi.org/10.1134/S0965542520110020

2. Бако Ф., Суворикова А.Л., Гинсбургер Д., Лубес Ж-М., Спокойный В.Г. 2020_Bachoc_et_al_Gaussian processes with multidimensional distribution inputs via optimal transport and Hilbertian embedding Electronic Journal of Statistics, Vol. 14, pp. 2742–2772 (год публикации - 2020) https://doi.org/10.1214/20-EJS1725

3. Двинских Д.М., Гасников А.В. 2021_Dvinskikh_Gasnikov_Decentralized and parallel primal and dual accelerated methods for stochastic convex programming problems Journal of Inverse and Ill-posed Problems, - (год публикации - 2021) https://doi.org/10.1515/jiip-2020-0068

4. Двуреченский П.Е., Гасников А.В., Омельченко С.С.,Тюрин А.И. 2020_Dvurechensky_et_al_ASTM_A Stable Alternative To Sinkhorn Algorithm MOTOR 2020: Mathematical Optimization Theory and Operations Research, vol 12095, pp 406-423 (год публикации - 2020) https://doi.org/10.1007/978-3-030-49988-4_28

5. Тупица Н.К., Гасников А.В., Двуреченский П.Е., Гуминов С.В. 2020_Tupitsa_et_al_Strongly convex optimization for the dual formulation of optimal transport Mathematical Optimization Theory and Operations Research, vol 1275, pp 192-204 (год публикации - 2020) https://doi.org/10.1007/978-3-030-58657-7_17

6. Тупица Н.К., Двуреченский П.Е., Гасников А.В., Урибе Ц. 2020_Tupitsa_et_al_Multimarginal_Optimal Transport IEEE 59th Conference on Decision and Control (CDC), pp. 6132-6137 (год публикации - 2020) https://doi.org/10.1109/CDC42340.2020.9304010


Возможность практического использования результатов
Полученные теоретические и прикладные результаты имеют широкий спектр возможных приложений, в том числе в области анализа изображений, медицинской инженерии, или обработке других данных, допускающих описание в терминах распределений (например, цитометрия). Отметим, что расстояние Васерштейна является естественным для описания и анализа пространства геометрических форм (с точки зрения восприятия геометрических объектов человеческим глазом), поэтому среди возможных перспективных направлений работы с медицинскими изображениями отметим: 1) создание индивидуальных анатомических моделей пациентов по мультимодальным данным; 2) создание автоматизированных методов приведения к унифицированному виду данных, полученных в различных условиях (например, собранных в разных лабораториях), 3) отрисовка и картирование текстур. 4) методы диагностики заболеваний или исследования возрастных изменений по мультимодальным снимкам органов, например, с помощью МРТ, КТ. Такие постановки задачи возникают, например, при анализе изображений мозга или кишечника, различных бронхиальных патологий. Теоретические результаты полученные в данном исследовании позволяют расширить область применимости моделей на основе оптимального транспорта. Метод domain adaptation используется для переноса уже существующей разметки на новые данные, что существенно снижает стоимость предварительной обработки данных. Гауссовский процессы над пространствами мер можно использовать для предсказания различных сигналов, ассоциированных со снимками. Важной частью проведенных исследований является разработка эффективных численных методов для решения задач оптимального транспорта. Предложенные методы позволяют расширить область применимости методов на основе оптимального транспорта, использование которых на практике было затруднено из-за значительной вычислительной трудоемкости. Разрабатываемые в проекте численные методы оптимизации оказались также применимы задачам моделирования транспортных потоков в городской транспортной сети, например, к классической задаче восстановления матрицы корреспонденций по энтропийной модели, к поиску равновесий в моделях распределения транспортных потоков по путям передвижения. Поэтому результаты проекта потенциально могут привести к повышению эффективности управления городскими транспортными сетями.