КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 19-71-00082

НазваниеРазработка нейросетевых алгоритмов обнаружения объектов новых классов на изображениях

Руководитель Осокин Антон Александрович, Кандидат физико-математических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" , г Москва

Конкурс №40 - Конкурс 2019 года «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-202 - Интеллектуальный анализ данных и распознавание образов

Ключевые слова обнаружение объектов, распознавание по одной демонстрации, нейросети, глубинное обучение, компьютерное зрение, машинное обучение

Код ГРНТИ28.23.37


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Проблема обнаружения и идентификации (или, в частном случае, классификации) объектов часто является необходимым элементом многих систем автоматического анализа изображений. В качестве примеров использования обнаружения и идентификации в конкретных приложениях можно привести обнаружение препятствий системой автоматического управления автомобилем, обнаружение и распознавание лиц людей, обнаружение и анализ товаров на полке магазина. Над проблемой обнаружения и идентификации ведется работа с момента появления области компьютерного зрения, но полного решения не существует. Ведь в самом общем своем виде эта проблема неразрывно связана с общими вопросами «понимания», что делает объект объектом, и «понимания» содержания изображений. Тем не менее, частные случаи проблемы обладают огромной прикладной значимостью и в некоторых постановках уже довольно давно существуют системы показывающие хорошие прикладные результаты (например, существуют системы определения личности человека по фотографии). Дальнейшее расширение областей применимости существующих систем и улучшение их характеристик (точность и скорость работы, требования к обучающей выборке и т.д.) откроет дорогу их использованию в новых приложениях. Одним из самых необходимых улучшений является уменьшение требований к данным для обучения, а именно отказ от требований наличия обучающей выборки с отмеченными объектами именно тех классов, которые нужно обнаруживать. За последние годы технология построения систем обнаружения объектов (детекторов) по полностью размеченным данным большого объема с фиксированным списком классов существенно улучшилась и уже активно используется в приложениях. Качественный скачок в качестве технологии обусловлен широким использование глубоких нейросетей и значительными усилиями по построению подходящих моделей. Более сложная же постановка обнаружения по одной демонстрации (one-shot object detection) изучена существенно меньше. В 2018 году появилось несколько методов для похожих постановок задач, но все они решают задачу лишь частично и приводят к существенному снижению качества относительно аналогов, обученных по стандартной схеме. Тем не менее все эти работы показывают, что создание и обучение нейросетевых моделей, работающих только по одной демонстрации объекта возможно. Особым наиболее изученным (из-за практической важности) частным случаем рассматриваемой постановки является задача распознавания лиц людей по изображению, для уже существуют используемые на практике системы. Задача обнаружения объектов по одной демонстрации тесно связана с несколькими другими постановками, во всех из которых в последние годы достигнут значительный прогресс: обучение классификаторов по сверхмалым выборкам (или обучение обучению, или мета-обучение), задача поиска по изображениям (image retrieval), задача отслеживания объектов на видео (visual object tracking). Недавний прогресс в этих задачах дает основания полагать, что и в поставленной задаче можно достигнуть существенного прогресса за 2 года.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


 

Публикации

1. Осокин А.А., Ломакин В.Д., Сумин Д.А. OS2D: One-Stage One-Shot Object Detection by Matching Anchor Features arXiv, arXiv:2003.06800 (год публикации - 2020)

2. Осокин А.А. Three Simple Approaches to Combining Neural Networks with Algorithms Communications in Computer and Information Science, Communications in Computer and Information Science, Volume 1223, Data Analytics and Management in Data Intensive Domains 21st International Conference, DAMDID/RCDL 2019, Kazan, Russia, 2019, Revised Selected Papers (год публикации - 2020)

3. Осокин А.А., Сумин Д.А., Ломакин В.Д. OS2D: One-Stage One-Shot Object Detection by Matching Anchor Features Computer Vision – ECCV 2020, Proceedings of the 16th European Conference on Computer Vision, LNCS, volume 12360, pp 635-652 (год публикации - 2020)
10.1007/978-3-030-58555-6_38

4. Осокин А.А. Three Simple Approaches to Combining Neural Networks with Algorithms Communications in Computer and Information Science, Proceedings of DAMDID/RCDL 2019: Data Analytics and Management in Data Intensive Domains, Volume 1223, Pages 3-12 (год публикации - 2020)
10.1007/978-3-030-51913-1_1


 

Публикации

1. Осокин А.А., Ломакин В.Д., Сумин Д.А. OS2D: One-Stage One-Shot Object Detection by Matching Anchor Features arXiv, arXiv:2003.06800 (год публикации - 2020)

2. Осокин А.А. Three Simple Approaches to Combining Neural Networks with Algorithms Communications in Computer and Information Science, Communications in Computer and Information Science, Volume 1223, Data Analytics and Management in Data Intensive Domains 21st International Conference, DAMDID/RCDL 2019, Kazan, Russia, 2019, Revised Selected Papers (год публикации - 2020)

3. Осокин А.А., Сумин Д.А., Ломакин В.Д. OS2D: One-Stage One-Shot Object Detection by Matching Anchor Features Computer Vision – ECCV 2020, Proceedings of the 16th European Conference on Computer Vision, LNCS, volume 12360, pp 635-652 (год публикации - 2020)
10.1007/978-3-030-58555-6_38

4. Осокин А.А. Three Simple Approaches to Combining Neural Networks with Algorithms Communications in Computer and Information Science, Proceedings of DAMDID/RCDL 2019: Data Analytics and Management in Data Intensive Domains, Volume 1223, Pages 3-12 (год публикации - 2020)
10.1007/978-3-030-51913-1_1