КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 17-74-10148

НазваниеНовые технологии получения и анализа данных в феномике растений: система SpikeDroid для анализа колоса пшеницы при помощи мобильных устройств

РуководительГенаев Михаил Александрович, Кандидат биологических наук

Организация финансирования, регион Федеральное государственное бюджетное научное учреждение "Федеральный исследовательский центр Институт цитологии и генетики Сибирского отделения Российской академии наук", Новосибирская обл

Период выполнения при поддержке РНФ 07.2017 - 06.2019 

Конкурс№23 - Конкурс 2017 года по мероприятию «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 04 - Биология и науки о жизни, 04-207 - Системная биология; биоинформатика

Ключевые словафеномика растений, компьютерное фенотипирование, мобильные устройства, анализ цифровых изображений, базы данных, зерно, колос, злаки

Код ГРНТИ34.55.15


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Феномика – новая, бурно развивающаяся область биологии, возникшая на стыке биологии, информатики и инженерии, связанная с разработкой методов измерения параметров фенотипа, его описания, компьютерной обработки фенотипических данных. Феномика растений опирается на использование методов анализа цифровых изображений для морфометрии признаков растений. Особенностью феномики растений является необходимость учета широкого спектра условий внешней среды (температуры, влажности, освещенности, типа почвы, и др.), в которой произрастают растения. Одними из важных признаков злаков являются характеристики колоса, тесно связанные с урожайностью растения. Настоящий проект направлен на создание передовых компьютерных технологий для сбора, хранения и анализа информации о фенотипических характеристиках колоса пшеницы на основе мобильных платформ на OS Android, методов анализа цифровых изображений, баз данных и машинной классификации. В основе проекта будет лежать существующее решение для мобильных платформ OS Android – приложение SeedCounter, разработанное для оценки размеров зерен пшеницы при помощи мобильных устройств в полевых условиях. В рамках проекта будут решаться следующие задачи: (1) Совершенствование приложения SeedCounter для обработки данных по анализу семян растений произвольной формы. Приложение будет дополнено методами классификации зерен произвольной формы, а также методами привязки к гео-данным при получении изображения зерен. (2) Создание приложения SpikeDroid для оценки характеристик формы колоса пшеницы. Данное приложение будет направлено на получение изображения колоса, оцифровку его морфометрических параметров на основе алгоритмов анализа цифровых изображений и обработки цифровых сигналов. (3) Создание базы данных по хранению информации о фенотипе колоса и интеграция с ней приложений SeedCounter и SpikeDroid. Данная база будет интегрирована с приложениями через Интернет. Она будет хранить информацию об изображении (переданным с мобильного устройства), время и место сбора информации, характеристики сорта растения из базы данных по коллекциям растений. База будет доступна как с мобильных устройств, так и с персональных компьютеров. В результате работы проекта будут отработаны: -Компьютерные технологии описания фенотипических признаков в базе данных фенотипа колоса. -Информационные технологии взаимосвязи между системой хранения данных и мобильным приложением. -Алгоритмы морфометрии зерен и колоса на основе анализа изображений с учетом их реализации на мобильных устройствах. -Технологии привязки фенотипической информации к гео-данным. Полученные методы сбора, хранения и обработки данных будут применены для описания коллекций ИЦиГ СО РАН сортов и линий пшеницы, будет проведена оценка взаимосвязи характеристик формы колоса с особенностями генотипа пшеницы.

Ожидаемые результаты
В ходе работы по проекту ожидаются следующие результаты: (1) Совершенствование приложения SeedCounter : 1) Разработка алгоритма анализа формы зерна, для детального описания морфометрии зерен произвольной формы. 2) Реализация разработанного алгоритма распознавания зерен в мобильном приложении SeedCounter. 3) Интеграция приложения с базой данных о фенотипе колоса. (2) Создание приложения SpikeDroid: 1) Разработка алгоритма анализа формы колоса. 2) Реализация разработанного алгоритма распознавания зерен в мобильном приложении. 3) Интеграция приложения с базой данных о фенотипе колоса. (3) Базы данных по хранению информации о фенотипе колоса, интегрированная с приложениями SeedCounter и SpikeDroid. (4) Оценка взаимосвязи характеристик формы колоса с особенностями генотипа пшеницы на основе анализа растений из коллекций ИЦиГ СО РАН.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2017 году
Структура колоса – один из важнейших признаков злаков, связанный с такими их хозяйственно ценными качествами, как продуктивность, легкость обмолота. Колосья отличаются по форме, размерам, плотности, остистости, цвету и т. д. Оценка характеристик колоса выполняется экспертом на основании визуального анализа колоса и в настоящее время требует существенных затрат времени. Эффективность определения характеристик колосьев можно повысить за счет внедрения компьютерных технологий, организации хранения информации в базах данных, использования алгоритмов машинного обучения для анализа полученной информации. Проект посвящен новому подходу к сбору, хранению и анализу информации о морфометрических характеристиках колоса пшеницы. В результате выполнения первого этапа проекта разработано несколько протоколов получения цифровых изображений колоса. Создана компьютерная информационная система SpikeDroidDB, которая позволяет хранить цифровые изображения колоса, аннотировать их фенотипические характеристики (всего 14 признаков), предоставляет гибкую систему запросов для доступа к данным. В системе SpikeDroidDB для растений взаимосвязанным образом описываются генотип, фенотип, место и условия выращивания. Web-интерфейс системы SpikeDroidDB доступен по адресу http://spikedroid.biores.cytogen.ru/ и позволяет работать с системой как со стационарных компьютеров, так и с мобильных устройств. С использованием SpikeDroidDB произведена оцифровка и аннотация коллекции колосьев гибридов F2 от скрещивания австралийского сорта мягкой пшеницы TripleDirk с образцом KU506 китайской пшеницы Triticum yunnanense. Проведен анализ изменчивости колосьев по форме, длине и ширине. Используя данные, накопленные в системе SpikeDroidDB, мы разработали метод морфометрии колоса пшеницы. Было реализовано несколько вариантов алгоритма автоматического распознавания колоса, которые используют разные модели аппроксимации его формы: профилирование, преобразование Фурье, трапециевидная модель, радиальная модель. При решении задачи классификации колосьев по типу формы колоса (норма, спельта, компакт) и остистости (остистый, безостый) мы использовали несколько методов машинного обучения (логистическую регрессию, случайный лес и метод ближайшего соседа). Результаты показали, что точность определения типа колоса составила 0.59, а остистости – 0.71. Задачи, поставленные на текущем этапе исследований, были успешно выполнены.

 

Публикации

1. М.А. Генаев , Е.Г. Комышев, Фу Хао, В.С. Коваль, Н.П. Гончаров, Д.А. Афонников SpikeDroidDB: an information system for annotation of morphometric characteristics of wheat spike Vavilov Journal of Genetics and Breeding, 22(1):132-140 (год публикации - 2018) https://doi.org/10.18699/VJ18.340


Аннотация результатов, полученных в 2018 году
Форма и структура колоса – важнейшие характеристики возделываемых злаков, связанные с такими их хозяйственно ценными качествами, как продуктивность, отсутствие ломкости колоса и легкость обмолота. Для выявления генов, контролирующих данные признаки, необходим сбор и анализ большого количества морфометрических данных, которые в большинстве исследований выполняются экспертами на основании визуального анализа колоса и измерений вручную. Автоматизация этого процесса за счет внедрения технологий анализа цифровых изображений позволит сократить затраты времени на сбор обработку данных. Мы предлагаем метод оценки количественных характеристик колоса на основе анализа 2D изображений, полученных в результате цифровой съемки колоса с помощью двух протоколов, расположенного на столе (в одной проекции) и вертикально на прищепке (в четырех проекциях). Метод позволяет выделить на изображении колос, ости, и оценить их количественные характеристики (площадь на изображении, длину, ширину, округлость и другие параметры). Для описания формы колоса предложено несколько подходов: модели сечений, четырехугольников, радиальная модель. Параметры этих моделей были использованы для предсказания плотности колоса и его типа (спельтоидного, нормы и компактного) методами машинного обучения. Показано, что для изображений в одной проекции (на столе) средняя ошибка предсказания плотности колоса на тестовых данных составила 4.61 (~18%), для параметров, полученных в результате анализа четырех проекций колоса – 3.33 (~13%). При автоматической классификации колоса на три типа наилучшее значение меры F1 для изображений, полученных по протоколу на столе составило 0.78 (логистическая регрессия), а при анализе четырех проекций колоса – 0.85 (случайный лес). Реализация предложенного метода на языке Java, примеры изображений и инструкции для запуска доступны по адресу http://wheatdb.org/werecognize Применение методов количественного цифрового фенотипирования для анализа параметров клубнеобразования диких клубненосных видов картофеля актуально для аннотации коллекций и для отбора оптимального донорного материала в работах по селекции культурного картофеля. На сегодняшний день в литературе не описано методов, позволяющих объективно количественно оценить морфологические параметры клубней дикого картофеля. В настоящей работе был проведен эксперимент по оценке морфологических характеристик клубней диких видов секции Petota Dumort. рода Solanum L. при помощи мобильного приложения SeedCounter, анализирующего изображения объектов, размещенных на стандартном листе бумаги. Двенадцать образцов генотипов из коллекции ВИР, относящихся к девяти диким видам, были выращены в вегетационных сосудах, расположенных в парнике, обтянутом укрывным материалом, в сроки вегетации культурного картофеля (Новосибирская область). Урожай клубней получен с представителей девяти генотипов. Измерена масса клубней с одного растения, урожай каждого растения проанализирован при помощи настольной версии приложения SeedCounter (http://wheatdb.org/seedcounter). Произведен подсчет клубней, для каждого клубня получены следующие характеристики: длина, ширина, площадь проекции на лист бумаги, отношение длины к ширине, округлость, закругленность, шероховатость и компактность. При попарном сравнении девяти видов по перечисленным параметрам были выявлены достоверные различия в 86 % исследуемых пар. На основании показателей отношения длины к ширине и площади проекции клубня предложена формула для вычисления объема урожая клубней с одного куста. Вычисленные значения объема урожая имеют высокую корреляцию со значениями массы урожая с одного куста. Показатель объема урожая предлагается использовать для общей характеристики клубнеобразования дикого картофеля по четырехбалльной шкале (от 0 до 3). В исследуемой группе образцов выявлены генотипы, обладающие нулевым, слабым, средним и высоким клубнеобразованием. Полученные данные частично соответствуют оценке клубнеобразования, проведенной по критериям ВИР. Различие в результатах оценки, вероятно, связано с условиями выращивания материала. Результаты применения метода позволяют рассматривать его как перспективный способ стандартного фенотипирования образцов коллекций диких видов картофеля.

 

Публикации

1. К.А. Иванова, Е.Г. Комышев, М.А. Генаев, А.А. Егорова, К.А. Колошина, Н.А. Чалая, Д.А. Афонников, А.В. Кочетов, Е.В. Рогозина, С.В. Герасимова Оценка количественных характеристик клубнеобразования дикого картофеля на основе анализа изображений клубней с использованием компьютерного приложения SeedСounter Вавиловский журнал генетики и селекции, - (год публикации - 2019) https://doi.org/10.18699/VJ19.35-o

2. Михаил Генаев, Евгений Комышев, Николай Смирнов, Юлия Кручинина, Николай П. Гончаров, Дмитрий Афонников Morphometry of the Wheat Spike by Analyzing 2D Images Agronomy, - (год публикации - 2019) https://doi.org/10.20944/preprints201903.0091.v1

3. Генаев М.А., Комышев Е.Г., Фу Фау, Коваль В.С., Гончаров Н.П., Афонников Д.А. Digital collection of morphological variability of wheat spike Bioinformatics of Genome Regulation and Structure\Systems Biology (BGRS\SB-2018) : The Eleventh International Conference (20–25 Aug. 2018, Novosibirsk, Russia); Abstracts, - (год публикации - 2018) https://doi.org/10.18699/BGRSSB-2018-133

4. Комышев Е.Г., Генаев М.А., Афонников Д.А. МЕТОД МОРФОМЕТРИИ КОЛОСА ПШЕНИЦЫ НА ОСНОВЕ АНАЛИЗА ИЗОБРАЖЕНИЙ Материалы международного конгресса «Биотехнология: состояние и перспективы развития» 25 - 27 ФЕВРАЛЯ 2019 Г., - (год публикации - 2019)

5. Комышев Е.Г., Генаев М.А., Туманян С.Р., Гончаров Н.П., Афонников Д.А., Коваль В.С. Wheat ear recognizing algorithm for high throughput wheat phenotyping Bioinformatics of Genome Regulation and Structure\Systems Biology (BGRS\SB-2018) : The Eleventh International Conference (20–25 Aug. 2018, Novosibirsk, Russia); Abstracts, - (год публикации - 2018) https://doi.org/10.18699/BGRSSB-2018-146

6. - Умелец недели: биолог Михаил Генаев Программа "Чудо техники" на НТВ, запись программы доступна по ссылке https://www.ntv.ru/peredacha/chudo_tehniki/m24780/o515677/video/ (начиная с 37 ой минуты) (год публикации - )


Возможность практического использования результатов
Настоящая работа позволила продемонстрировать полезность компьютерных подходов для сбора, хранения, идентификации и классификации информации, связанной с признаками структуры колоса пшеницы, интересующими исследователей при работе с зерновыми злаками, что, как известно, очень трудоемко делать «вручную». Разработанные в процессе выполнения методы будут способствовать к переходу и внедрению в сельское хозяйство концепции “точного” земледелия. В перспективе результаты массового фенотипирования колосьев в условиях поля могут быть использованы для построения математических моделей, которые будут давать фермерам рекомендации по проведению аграрных мероприятий (полив, внесение удобрений, уборка урожая и т.д.).