Разработка нейросетевых алгоритмов обнаружения объектов новых классов на изображениях

КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

ОБЩИЕ СВЕДЕНИЯ

Номер проекта 19-71-00082

НазваниеРазработка нейросетевых алгоритмов обнаружения объектов новых классов на изображениях

Руководитель Осокин Антон Александрович, Кандидат физико-математических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" , г Москва

Конкурс №40 - Конкурс 2019 года «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-202 - Интеллектуальный анализ данных и распознавание образов

Ключевые слова обнаружение объектов, распознавание по одной демонстрации, нейросети, глубинное обучение, компьютерное зрение, машинное обучение

Код ГРНТИ28.23.37

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ

Аннотация
Проблема обнаружения и идентификации (или, в частном случае, классификации) объектов часто является необходимым элементом многих систем автоматического анализа изображений. В качестве примеров использования обнаружения и идентификации в конкретных приложениях можно привести обнаружение препятствий системой автоматического управления автомобилем, обнаружение и распознавание лиц людей, обнаружение и анализ товаров на полке магазина. Над проблемой обнаружения и идентификации ведется работа с момента появления области компьютерного зрения, но полного решения не существует. Ведь в самом общем своем виде эта проблема неразрывно связана с общими вопросами «понимания», что делает объект объектом, и «понимания» содержания изображений. Тем не менее, частные случаи проблемы обладают огромной прикладной значимостью и в некоторых постановках уже довольно давно существуют системы показывающие хорошие прикладные результаты (например, существуют системы определения личности человека по фотографии). Дальнейшее расширение областей применимости существующих систем и улучшение их характеристик (точность и скорость работы, требования к обучающей выборке и т.д.) откроет дорогу их использованию в новых приложениях. Одним из самых необходимых улучшений является уменьшение требований к данным для обучения, а именно отказ от требований наличия обучающей выборки с отмеченными объектами именно тех классов, которые нужно обнаруживать. За последние годы технология построения систем обнаружения объектов (детекторов) по полностью размеченным данным большого объема с фиксированным списком классов существенно улучшилась и уже активно используется в приложениях. Качественный скачок в качестве технологии обусловлен широким использование глубоких нейросетей и значительными усилиями по построению подходящих моделей. Более сложная же постановка обнаружения по одной демонстрации (one-shot object detection) изучена существенно меньше. В 2018 году появилось несколько методов для похожих постановок задач, но все они решают задачу лишь частично и приводят к существенному снижению качества относительно аналогов, обученных по стандартной схеме. Тем не менее все эти работы показывают, что создание и обучение нейросетевых моделей, работающих только по одной демонстрации объекта возможно. Особым наиболее изученным (из-за практической важности) частным случаем рассматриваемой постановки является задача распознавания лиц людей по изображению, для уже существуют используемые на практике системы. Задача обнаружения объектов по одной демонстрации тесно связана с несколькими другими постановками, во всех из которых в последние годы достигнут значительный прогресс: обучение классификаторов по сверхмалым выборкам (или обучение обучению, или мета-обучение), задача поиска по изображениям (image retrieval), задача отслеживания объектов на видео (visual object tracking). Недавний прогресс в этих задачах дает основания полагать, что и в поставленной задаче можно достигнуть существенного прогресса за 2 года.

ОТЧЁТНЫЕ МАТЕРИАЛЫ