КАРТОЧКА
ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер 22-21-00035
НазваниеРазработка алгоритмов определения спектров собственных значений персистентных лапласианов симплициальных комплексов, представляющих изображения объектов
РуководительЧуканов Сергей Николаевич, Доктор технических наук
Организация финансирования, регион федеральное государственное бюджетное учреждение науки Институт математики им. С. Л. Соболева Сибирского отделения Российской академии наук, Новосибирская обл
Период выполнения при поддержке РНФ | 2022 г. - 2023 г. |
Конкурс№64 - Конкурс 2021 года «Проведение фундаментальных научных исследований и поисковых научных исследований малыми отдельными научными группами».
Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-726 - Системы и технологии интеллектуального анализа данных и распознавания образов
Ключевые словараспознавание образов, расстояние Вассерштейна, симплициальный комплекс, персистентные гомологии, оператор Лапласа, топологический анализ данных
Код ГРНТИ28.23.15
СтатусУспешно завершен
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Настоящий проект является развитием проекта РФФИ № 18-07-00526 «Алгоритмы декомпозиции векторного поля при отображении изображений на основе метода метаморфизма».
Целью проекта является разработка алгоритмов распознавания форм объектов на основе нахождения модифицированных расстояний Вассерштейна между этими формами. Модифицированное расстояние Вассерштейна определяется с учетом расстояния между формами объектов, обусловленным рассогласованием между спектрами собственных значений персистентных лапласианов. Для выполнения этой цели должен быть разработан алгоритм определения спектров собственных значений персистентных лапласианов симплициальных комплексов, представляющих формы объектов.
В теории распознавания образов широко используются методы вычислительной геометрии, алгебраической топологии, теории вероятностей. Методы вычислительной геометрии позволяют характеризовать информацию о локальной структуре объекта, но приводят к усложнению данных. Признаки, созданные на основе моделей алгебраической топологии, позволяют характеризовать информацию о глобальной внутренней структуре, но существенно сокращают информацию о локальной структуре.
Концепция персистентной гомологии использует процедуру фильтрации; в процессе фильтрации создается ряд вложенных симплициальных комплексов, закодированных топологической информацией. Продолжительность жизни топологических инвариантов в процессе изменения параметра фильтрации связана с топологическими и геометрическими свойствами форм объекта.
Для измерения соответствия между персистентными гомологиями симплициальных комплексов, представляющих формы объектов, используется расстояние Вассерштейна. Топологические свойства форм объектов могут рассматриваться как признаки машинного обучения. Для этого используются алгоритмы формирования персистентных bar-кодов при сравнении форм объектов.
Топологические характеристики (числа Бетти и характеристики Эйлера) не обеспечивают достаточное количество признаков для распознавания образов, поэтому построение алгоритмов нахождения спектров персистентных лапласианов симплициальных комплексов, представляющих формы объектов, для сравнения форм объектов, которые позволяют увеличить количество признаков для распознавания образов, является актуальным.
В проекте предлагается использовать спектры собственных чисел персистентных лапласианов в качестве топологических характеристик форм объектов. Лапласиан k-го порядка можно определить из соотношения: $L_k = \partial_{k+1} \partial_{k+1}^* + \partial_k^* \partial_k$, где $\partial_k$ – граничный оператор отображения: $C_k(X) \to C_{k-1}(X)$; $C_k(X)$ – k-мерные цепи в симплициальном комплексе X, представляющим форму объекта. Использование спектров собственных чисел персистентных лапласианов существенно расширяет многообразие топологических характеристик. Аналогично нахождению интервалов "birth-death" для критических значений чисел Бетти предлагается формировать интервалы "birth-death" для критических значений спектров собственных чисел лапласианов. Числа Бетти k-го порядка можно определить как число нулевых собственных значений лапласиана $L_k$.
Алгоритмы формирования спектров собственных значений персистентных лапласианов симплициальных комплексов, представляющих формы объектов, позволят повысить разнообразия информации и количество признаков машинного обучения при сравнении форм объектов.
При сравнении форм объектов в проекте предлагается сформировать модифицированное расстояние Вассерштейна, основанное на определении расстояния между соответствующими интервалами "birth-death" сравниваемых форм объектов и на сравнении спектров собственных значений лапласианов.
Ожидаемые результаты. Использование алгоритмов определения спектров собственных значений персистентных лапласианов симплициальных комплексов позволят модифицировать расстояние Вассерштейна между формами объектов. Алгоритмы определения спектров собственных значений лапласианов инвариантны по отношению к евклидовым преобразованиям изображений объектов. Будут предложены методы распознавания образов на основе определения модифицированного расстояния Вассерштейна между формой (изображением) объекта и формой шаблона. Числа Бетти и характеристики Эйлера не обеспечивают достаточное количество признаков для распознавания образов, поэтому построение алгоритмов нахождения спектров персистентных лапласианов симплициальных комплексов для сравнения форм объектов является актуальным.
Ожидаемые результаты
Использование алгоритмов определения спектров собственных значений персистентных лапласианов симплициальных комплексов, представляющих формы (изображения) объектов, позволят модифицировать расстояние Вассерштейна между формами объектов. Алгоритмы определения спектров собственных значений лапласианов инвариантны по отношению к евклидовым преобразованиям изображений объектов.
Будут предложены методы распознавания образов на основе определения модифицированного расстояния Вассерштейна между формой (изображением) объекта и формой шаблона.
Числа Бетти и характеристики Эйлера не обеспечивают достаточное количество признаков для распознавания образов, поэтому построение алгоритмов нахождения спектров персистентных лапласианов симплициальных комплексов, представляющих формы объектов, для сравнения форм объектов, которые позволяют увеличить количество признаков для распознавания образов, является актуальным.
Публикации.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Аннотация результатов, полученных в 2022 году
В 2022 году были получены следующие результаты.
Рассмотрена обработка сигналов на симплициальных комплексах. Приведена формула разложения Ходжа для дискретных полей, аналогичная формуле разложения Ходжа для гладких векторных полей. Рассматриваются построение и оценка операторов градиента, дивергенции, ротора и матриц Лапласа для дискретных векторных полей. Выполнено сравнение форм объектов, основанное на построении персистентной гомологии при формировании метрики Вассерштейна. Метод персистентной гомологии из вычислительной топологии обеспечивает баланс между уменьшением размерности данных (в алгебраической топологии) и геометрической характеристикой внутренней структуры объекта. Алгоритмы формирования персистентных баркодов и тропические функции используются для сравнения изображений объектов. Разработаны алгоритмы сравнения динамических систем, основанные на топологическом анализе данных. Рассмотрены методы преобразования персистентных баркодов и персистентных диаграмм в персистентные ландшафтные функции.
Рассмотрены математические модели и функции представления объектов персистентного ландшафта, основанные на методе персистентной гомологии. Персистентные ландшафтные функции позволяют отображать персистентные диаграммы в гильбертовом пространстве. Ядро персистентного ландшафта связано с функциями персистентного ландшафта, которые формирует отображение в гильбертово пространство со скалярным произведением. Предложена формула для определения расстояния между персистентными ландшафтами, которая позволяет находить расстояния между изображениями объектов. Согласно предложенной формуле, возможно сравнение объектов (изображений); например, сравнение представленного объекта с объектами, которые являются элементами базы данных.
На основе алгебры многочленов в пространстве баркодов, которые используются в качестве координат, расстояния в пространстве баркода определяются путем сравнения интервалов от одного баркода к другому и вычисления штрафных санкций. Для этих целей используются тропические функции, которые учитывают базовую структуру пространства баркодов. Рассмотрены методы построения рациональных тропических функций. Для увеличения разнообразия параметров (признаков машинного обучения) построены фильтры для сканирования объекта по строкам слева направо и сканирования по столбцам снизу вверх. Это добавляет пространственную информацию к топологической информации. Метод построения персистентных ландшафтов совместим с подходом построения тропических рациональных функций при получении персистентных гомологий.
Результаты для модулей персистентности с одним параметром распространяются на многопараметрические модули персистентности. Представлены инварианты для многопараметрических модулей персистентности, которые расширяют результаты для однопараметрических модулей персистентности до многопараметрических модулей персистентности. Использование многопараметрических функций персистентного ландшафта увеличивает разнообразие параметров, характеризующих форму объекта, точность определения расстояния между изображениями объектов.
Метод топологического анализа данных, основанный на формировании персистентных ландшафтных функций, используется для оценки расстояния между структурами динамических систем и временных рядов выходных сигналов этих динамических систем. На основе функций персистентного ландшафта можно построить отображение персистентных диаграмм и персистентных баркодов в гильбертово пространство со скалярным произведением. Расстояния между соответствующими функциями персистентного ландшафта могут быть определены с использованием p-нормы. Отображение персистентных диаграмм и персистентных баркодов в гильбертово пространство, основанное на формировании персистентных ландшафтных функций с последующим определением расстояния между объектами, имеет преимущество перед другими методами определения расстояния, так как уменьшается количество вычислительных операций.
При сравнении структур динамических систем и временных рядов выходных сигналов представленных объектов со структурами динамических систем и временными рядами выходных сигналов объектов, на основе оценки расстояния между динамическими структурами, которые являются элементами базы данных, можно идентифицировать нормальное состояние или отказ представленные объекты. Для анализа временных рядов предложено использование вложения Takens, которое позволяет получить облако точек в d-мерном пространстве на основе информации о временных рядах. Топологический анализ данных с использованием персистентных баркодов и персистентных ландшафтов выполняется из результирующего облака точек. В соответствии с функциями персистентных ландшафтов облаков точек различных объектов (сигналов) эти объекты сравниваются. Сравнение объектов позволяет определить расстояние между объектами путем вычисления p-нормы разницы в функциях персистентных ландшафтов разных объектов. Анализ временных рядов выходной информации динамических систем, основанный на методах внедрения Takens и TDA, может быть использован для выявления штатного функционирования систем и их отказов.
Новизна предлагаемых методов построения персистентного ландшафта и топологического анализа данных для получения информации о форме объекта заключается в возможности количественной оценки расстояния между объектами (изображениями объектов). Результаты, полученные в ходе внедрения, соответствуют мировому уровню.
Результаты, полученные в работе, могут быть использованы при сравнении (изображений) объектов; при количественном определении расстояний между (изображениями) объектов; преобразование временных рядов выходной информации динамических систем в облака точек с последующим топологическим анализом данных; оценка штатного/нештатного функционирования динамических систем на основе топологического анализа данных.
Публикации
1. Чуканов С.Н. Формирование признаков машинного обучения на основе методов вычислительной топологии Компьютерная оптика, Компьютерная оптика. – 2022. (год публикации - 2022)
2. Чуканов С.Н., Чуканов И.С. FORMATION OF MACHINE LEARNING FEATURES BASED ON THE CONSTRUCTION OF TROPICAL FUNCTIONS Моделирование и анализ информационных систем, Моделирование и анализ информационных систем. 2022;29(3):200-209. (год публикации - 2022) https://doi.org/10.18255/1818-1015-2022-3-200-209
3. Чуканов С.Н., Чуканов И.С. Формирование признаков машинного обучения на основе топологического анализа данных ВЕСТНИК ВГУ, СЕРИЯ: СИСТЕМНЫЙ АНАЛИЗ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ, Вестник ВГУ. Серия: Системный анализ и информационные технологии. – 2022. – №. 3. – С. 115-126 (год публикации - 2022) https://doi.org/10.17308/sait/1995-5499/2022/3/115-126
4. Чуканов С.Н., Чуканов И.С. ОЦЕНИВАНИЕ ОБЛАСТИ ПРИТЯЖЕНИЯ УСТОЙЧИВОГО РАВНОВЕСИЯ В НЕЛИНЕЙНОЙ ПОЛИНОМИАЛЬНОЙ СИСТЕМЕ АВИАКОСМИЧЕСКОЕ ПРИБОРОСТРОЕНИЕ, Авиакосмическое приборостроение. – 2022. – № 7– С. 25-31 (год публикации - 2022) https://doi.org/10.25791/aviakosmos.7.2022.1288
5. Чуканов С.Н., Чуканов И.С., Широков И.В., Лейхтер С.В. Анализ данных (монография) Издательство Омского государственного университета, 108 стр (год публикации - 2022)
Аннотация результатов, полученных в 2023 году
В отчетном периоде были получены следующие конкретные научные результаты.
Рассмотрена обработка сигналов на симплициальных комплексах. Приведена формула разложения Ходжа для дискретных полей, аналогичная формуле разложения Ходжа для гладких векторных полей. Рассматриваются построение и оценка операторов градиента, дивергенции, ротора и матриц Лапласа для дискретных векторных полей. Выполнено сравнение форм объектов, основанное на построении персистентной гомологии при формировании метрики Вассерштейна. Метод персистентной гомологии из вычислительной топологии обеспечивает баланс между уменьшением размерности данных (в алгебраической топологии) и геометрической характеристикой внутренней структуры объекта. Алгоритмы формирования персистентных баркодов и тропические функции используются для сравнения изображений объектов.
Разработаны алгоритмы сравнения динамических систем, основанные на топологическом анализе данных.
Рассмотрены методы преобразования персистентных баркодов и персистентных диаграмм в персистентные ландшафтные функции. Рассмотрены математические модели и функции представления объектов персистентного ландшафта, основанные на методе персистентной гомологии. Персистентные ландшафтные функции позволяют отображать персистентные диаграммы в гильбертово пространство. Ядро персистентного ландшафта связано с функциями персистентного ландшафта, которые формирует отображение в гильбертово пространство со скалярным произведением.
Предложена формула для определения расстояния между персистентными ландшафтами, которая позволяет находить расстояния между изображениями объектов. Согласно предложенной формуле, возможно сравнение объектов. На основе алгебры полиномов в пространстве баркодов расстояния в пространстве баркодов определяются путем сравнения интервалов от одного баркода к другому и вычисления штрафных санкций. Для этих целей используются тропические функции, которые учитывают базовую структуру пространства баркодов.
Рассмотрены методы построения рациональных тропических функций. Для увеличения разнообразия параметров построены фильтры для сканирования объекта по строкам слева направо и сканирования по столбцам снизу вверх. Это добавляет пространственную информацию к топологической информации. Метод построения персистентных ландшафтов совместим с подходом построения тропических рациональных функций при получении персистентных гомологий. Результаты для модулей персистентности с одним параметром распространяются на многопараметрические модули персистентности.
Представлены инварианты для многопараметрических модулей персистентности, которые расширяют результаты для однопараметрических модулей персистентности до многопараметрических модулей персистентности. Использование многопараметрических функций персистентного ландшафта увеличивает разнообразие параметров, характеризующих форму объекта, точность определения расстояния между изображениями объектов. Метод топологического анализа данных, основанный на формировании персистентных ландшафтных функций, используется для оценки расстояния между структурами динамических систем и временных рядов выходных сигналов этих динамических систем. На основе функций персистентного ландшафта можно построить отображение персистентных диаграмм и персистентных баркодов в гильбертово пространство со скалярным произведением. Расстояния между соответствующими функциями персистентного ландшафта могут быть определены с использованием p-нормы. Отображение персистентных диаграмм и персистентных баркодов в гильбертово пространство, основанное на формировании персистентных ландшафтных функций с последующим определением расстояния между объектами, имеет преимущество перед другими методами определения расстояния, так как уменьшается количество вычислительных операций. При сравнении структур динамических систем и временных рядов выходных сигналов представленных объектов со структурами динамических систем и временными рядами выходных сигналов объектов, на основе оценки расстояния между динамическими структурами, которые являются элементами базы данных, можно идентифицировать нормальное состояние или отказ представленные объекты.
Для анализа временных рядов предложено использование вложения Takens, которое позволяет получить облако точек в d-мерном пространстве на основе информации о временных рядах. Топологический анализ данных с использованием персистентных баркодов и персистентных ландшафтов выполняется из результирующего облака точек. В соответствии с функциями персистентных ландшафтов облаков точек различных объектов (сигналов) эти объекты сравниваются. Сравнение объектов позволяет определить расстояние между объектами путем вычисления p-нормы разности функций персистентных ландшафтов разных объектов. Анализ временных рядов выходной информации динамических систем, основанный на методах внедрения Takens и TDA, может быть использован для выявления штатного функционирования систем и их отказов.
Проведено исследование ассиметричных ориентированных сетей, дугам которых назначаются веса, методами топологического анализа данных. Так как сети ассиметричные, то веса дуг между одинаковыми узлами в различных направлениях также являются разными. Для исследования топологии таких сетей построены Dowker комплексы (Dowker фильтрации), которые представляют собой обобщение Čech комплекса на случай асимметричных ориентированных сетей.
Новизна предлагаемых методов построения персистентного ландшафта и топологического анализа данных для получения информации о форме объекта заключается в возможности количественной оценки расстояния между объектами (изображениями объектов).
Публикации
1. Магазев А.А., Широков И.В. Структура дифференциальных инвариантов при свободном действии группы симметрии. Известия высших учебных заведе-ний. Математика. – 2023. – №. 6. – С. 31-40, №. 6, стр. 31-40 (год публикации - 2023) https://doi.org/10.26907/0021-3446-2023-6-31-40
2. Чуканов С.Н. ФОРМИРОВАНИЕ ПРИЗНАКОВ НА ОСНОВЕ МЕТОДОВ ВЫ-ЧИСЛИТЕЛЬНОЙ ТОПОЛОГИИ Компьютерная оптика. 2023. Т. 47. № 3. С. 482-490., № 3,. Т. 47, стр. 482-490. (год публикации - 2023) https://doi.org/10.18287/2412-6179-CO-1190
3. Чуканов С.Н. Сравнение сложных динамических систем на основе топологического анализа данных КОМПЬЮТЕРНЫЕ ИССЛЕДОВАНИЯ И МОДЕЛИРОВАНИЕ, № 3, том. 15, стр. 513–525 (год публикации - 2023) https://doi.org/10.20537/2076-7633-2023-15-3-513-525
4. Чуканов С.Н., Чуканов И.С. ОЦЕНИВАНИЕ ВЗАИМОДЕЙСТВИЯ КАНАЛОВ СЛОЖНЫХ ДИНАМИЧЕСКИХ СИСТЕМ НА ОСНОВЕ ТОПОЛОГИЧЕСКОГО АНАЛИЗА ДАННЫХ Авиакосмическое приборостроение, № 9, стр. 18-23 (год публикации - 2023) https://doi.org/10.25791/aviakosmos.9.2023.1360
5. Чуканов С.Н., Чуканов И.С. ИСПОЛЬЗОВАНИЕ ТОПОЛОГИЧЕСКОГО АНАЛИЗА ДАННЫХ ДЛЯ ВИЗУАЛИЗАЦИИ ВЫХОД-НОЙ ИНФОРМАЦИИ ПРИБОРОВ Научная визуализация. 2023. Т. 15. № 2. С. 11-21., № 2, Т. 15, стр. 11-21. (год публикации - 2023) https://doi.org/10.26583/sv.15.2.02
6. Чуканов С.Н., Чуканов И.С., Лейхтер С.В. ИСПОЛЬЗОВАНИЕ ПЕРСИСТЕНТНОЙ ЭНТРОПИИ ДЛЯ ТОПОЛОГИЧЕСКОГО АНАЛИЗА ДАННЫХ Математические структуры и моделирование, № 3, Том 67, стр. 94–103 (год публикации - 2023) https://doi.org/10.24147/2222-8772.2023.3.94-103
7. Чуканов С.Н.,Чуканов И.С., Лейхтер С.В. ОПРЕДЕЛЕНИЕ РАССТОЯНИЯ МЕЖДУ ИЗОБРАЖЕНИЯМИ НА ОСНОВЕ ТОПОЛОГИЧЕСКОГО АНАЛИЗА ДАННЫХ В сборнике: Математическое и компьютерное моделирование. Сборник материалов X Международной науч-ной конференции. Омск, 2023. С. 100-102., стр. 100-102. (год публикации - 2023)
Возможность практического использования результатов
Полученные в работе результаты могут быть использованы:
- при сравнении (изображений) объектов;
- при количественном нахождении расстояний между (изображениями) объектов;
- преобразовании временных рядов выходной информации динамических систем в облака точек с последующим топологическим анализом данных;
- идентификации систем (например, систем управления) по выходной информации приборов (например, оптикоэлектронных);
- оценивания ориентации объектов по информации оптикоэлектронных приборов;
- сравнение информации геоинформационных систем с реальной информацией, формируемой аппаратурой чувствительных элементов;
- использовании типологической информации в целях комплексирования информации (например, при фильтрации Калмана);
- оценивании штатного/нештатного функционировании динамических систем для топологического анализа данных.