КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер проекта 24-24-00405
НазваниеИзучение закономерностей сезонной динамики спектральных характеристик древесных растений для дистанционной идентификации видов и мониторинга их состояния
Руководитель Козловский Борис Леонидович, Кандидат биологических наук
Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Южный федеральный университет" , Ростовская обл
Конкурс №89 - Конкурс 2023 года «Проведение фундаментальных научных исследований и поисковых научных исследований малыми отдельными научными группами»
Область знания, основной код классификатора 04 - Биология и науки о жизни; 04-301 - Охрана окружающей среды
Ключевые слова Дистанционное зондирование, гиперспектральная съемка, временные ряды спектральных характеристик, вегетационные индексы, машинное обучение, период вегетации, фенология кленов, Acer campestre, Acer platanoides, Acer negundo, Acer saccharinum, Acer ibericum, экология растений, физиология растений
Код ГРНТИ34.35.00
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
В ближайшее время можно ожидать создание надежной и точной технологии ДЗЗ с помощью спектральных сенсоров для оперативного мониторинга древесной растительности на больших пространствах с высоким временным разрешением (Sankey, Tatum, 2022; Seyednasrollah et al. 2021; Wu et al., 2020; Zarco-Tejada et al., 2019). Это может привести к значительному прогрессу в краткосрочном и долгосрочном прогнозе развития древесной растительности, всесторонней оценки ее состояния. Вместе с тем, для дистанционного мониторинга растений до сих пор существует проблема плохой повторяемости результата во времени и пространстве. Модели идентификации видов (или состояния растений), построенные по спектральным характеристикам растений для конкретного отрезка времени или конкретной территории часто не срабатывают в другом временном интервале и на других территориях. В настоящее время нет однозначного ответа на вопрос: является ли неудовлетворительная воспроизводимость результата непреодолимым технологическим барьером для спектрального ДЗЗ или проблема может быть решена путем совершенствования техники и моделирования процессов. Ответить на это вопрос можно по результатам многолетнего эксперимента изучения сезонной динамики спектральных характеристик растений, полученных с помощью гиперспектральной камеры в максимально контролируемых условиях. Наличие датасета подробных сезонных рядов спектральных характеристик древесных растений за репрезентативное количество лет является необходимым условием построения динамической модели для идентификации видов адекватной во времени.
Проект предполагает построить на основании многолетних сезонных рядов спектральных характеристик модель идентификации видов древесных растений (на примере пяти видов клена) адекватную во времени. Определить наиболее информативные спектральные характеристики (или рассчитать оригинальные) и оптимальные этапы периода вегетации растений для идентификации видов.
Объектами исследования предполагается выбрать Acer campestre L., A. platanoides L., A. negundo L., A. saccharinum L., A. ibericum Bieb. Этот набор кленов представляет широкий спектр экологических групп от гигромезофита (A. negundo) до ксеромизифита (A. ibericum).
Спектральные характеристики листьев древесных растений будут получены с помощью гиперспектральной камеры, дающей больше информации в сравнении с мультиспектральными камерами. Будут получены значения 125 спектральных каналов в диапазоне 450–950 нм., их производные, рассчитаны значения не менее 80 вегетационных индексов. Гиперспектральная съемка объектов будет осуществляться весь период вегетации кленов с интервалом 7-10 дней. Параллельно в полевых условиях будет фиксироваться фенологическое состояние растений и климатические характеристики сезона. Будут определены концентрации фотосинтетических пигментов в листьях кленов.
Полученные данные будут обработаны методами математической статистики (t-test, Analysis of Variance (ANOVA)) и математического анализа данных (Principal Component Analysis (PCA), Linear Discriminant Analysis (LDA), Random Forest (RF), Decision Tree (DT), Support-Vector Machines (SVM)) и моделирования.
В ходе реализации проекта будет, проведена гиперспектральная съемка в лабораторных условиях листьев пяти видов клена в течении периода их вегетации с интервалом в 7-10 дней, сформирован датасет спектральных и климатических характеристик и других параметров за 5 лет, зарегистрирована база данных – датасет, разработана и верифицирована модель сезонной динамики спектральных характеристик видов клена для их идентификации. Будут опубликованы три статьи в журналах Web of Science Core Collection и (или) Scopus Q1-Q2.
(см. файл с дополнительной информацией 1, разделы «Актуальность тематики» и «Список используемых источников»)
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Аннотация результатов, полученных в 2024 году
В ходе проведения исследования получены детальные временные ряды гиперспектральных снимков листьев Acer campestre, A. platanoides, A. negundo, A. saccharinum и A. ibericum, охватывающие их фенологическое развитие. Всего получено 10125 гиперспектральных снимков.
Проведены фенологические наблюдения за образцами пяти видов клена. Установлены различия в фенологическом развитии листьев и побегов кленов, которые могут быть значимыми для идентификации кленов по их спектральным характеристикам.
Проведено определение содержания фотосинтетических пигментов в листьях трех видов клена (A. campestre, A. negundo и A. saccharinum). Наибольшие различия в содержании фотосинтетических пигментов между видами зафиксированы на этапе старения листьев. Установленно, что сезонную динамику суммы хлорофиллов хорошо описывает Photochemical Reflectance Index (PRI), динамику показателя отношение хлорофиллов к каротиноидам – Сhlorophyll/Сarotenoid index (CCI). Normalized Difference Vegetation Index (NDVI) не реагирует на изменение содержания фотосинтетических пигментов в листьях клена, что связано с эффектом насыщения этого ВИ при высоком содержании хлорофиллов.
В ходе исследования получены значения 125 спектральных каналов и рассчитано 84 узкополосных ВИ для всего временного ряда гиперспектральных снимков пяти видов клена. Сформирован датасет значений ВИ и спектральных каналов для листьев Acer campestre, A. platanoides, A. negundo, A. saccharinum и A. ibericum за 2021-2024 гг. а также результаты фенологических наблюдений и метеорологические характеристики по суткам за этот же период. Разведочный анализ полученных данных показал, что большинство ВИ не распределяется по нормальному закону. Установлены неколлинеарные ВИ – ARI, Boochs, CCI, CI, CRI1, D1, D2, Datt3, Datt4, DDn, DPI, DWSI4, EVI, Gitelson, Gitelson2, LSINorm, LSIRed, MCARI, MCARI2, modPRI, MPRI, NDVI, PARS, PRI, PRI_CI2, PRI_norm, PSND, PSSR, SR4, SR5, TCARI2, TCARI2_OSAVI2 и TGI. Визуализация значений ВИ с помощью алгоритма PCA показала, что дифференциация видов усиливается в осенние сроки гиперспектральной съемки.
Проведен анализ спектральных характеристик пяти видов кленов с помощью алгоритмов машинного и глубокого машинного обучения.
Определены ведущие факторы для построения модели идентификации видов клена. По вкладу в изменение индекса Джини и ошибки классификации определены значимые для идентификации видов кленов спектральные каналы и ВИ. Значимые спектральные каналы лежат в интервалах спектра 460-480, 560-640, 670-720 и 850-920 нм. Наибольший вклад в разделение видов клена с помощью алгоритмов машинного обучения вносят индексы CCI, MPRI, DWSI4, Datt4, CRI1 и DDn. Установлено, что высокая точность идентификации видов достигается в периоды весеннего развития и осеннего старения листьев.
Лучший результат идентификации кленов был получен с помощью ансамбля из четырех алгоритмов (DecisionTreeClassifier + k-Nearest Neighbors + Random Forest + Gradient Boosting) – точность предсказания видов в 2023 году (при тестировании на данных 2021 и 2022 гг.) достигла 54.81%. Составлено и протестировано несколько моделей Recurrent neural network, включая первые слои LSTM или Simple RNN. Предсказание видов клена в 2023 году при обучении на данных 2021 и 2022 гг. достигло 51.8%, мера эффективности прогнозирования F1 score – 0.819.
Установлено, что слияние спектральных характеристик с метеорологическими данными является эффективным приемом повышения точности классификации видов кленов (точность идентификации видов клена алгоритмами машинного обучения повысилась на 13.21%).
Показано, что оригинальный способ создание искусственных спектральных профилей путем случайного выбора значений каждого спектрального канала на уровне листа повышает точность классификации кленов при использовании модели RNN с Dropout слоями на 14.0%.
Предложен способ визуализации спектральных сигнатур кленов с помощью алгоритма PCA через проекции неколлинеарных ВИ на первые две главные компоненты в процессе их фенологического развития, реализованный в трехмерном пространстве. Количественное описание сигнатур кленов осуществлено через построение кривой значений медианы первой главной компоненты, по преобразованным в непрерывный ряд чисел календарным датам.
Публикации
1.
Дмитриев П.А., Дмитриева А.А., Федоринова О.И., Козловский Б.Л.
Определение оптимальных периодов в фенологическом развитии видов клена для их идентификации по спектральным характеристикам листьев
Живые и биокосные системы, Живые и биокосные системы 2024, № 49 (год публикации - 2024)
10.18522/2308-9709-2024-49-11
2.
Игнатова М.А., Козловский Б.Л., Дмитриева А.А., Вардуни Т.В., Дмитриев П.А.
Оценка сезонной динамики фотосинтетических пигментов в листьях кленов с помощью вегетационных индексов, рассчитанных по данным гиперспектральной съемки
АгроЭкоИнфо, АгроЭкоИнфо 2024, № 2 (год публикации - 2024)
10.51419/202142206
3.
Александров А.А., Дмитриев П.А., Дмитриева А.А., Полтавский А.В., Козловский Б.Л.
Impact of spectral and meteorological data fusion on the accuracy of woody plant identification using deep machine learning methods
Lecture Notes in Networks and Systems (год публикации - 2024)
10.1007/978-3-031-77688-5_20
Аннотация результатов, полученных в 2025 году
Исследование в рамках проекта было направлено на решение принципиальной для дистанционного зондирования задачи – идентификации видов по спектральным характеристикам в режиме «здесь и сейчас». На практике принцип «здесь и сейчас» означает, что модель, обученная на большом объеме спектральных данных, будет способна без дополнительного «дообучения» на целевом датасете с высокой точностью идентифицировать виды в любое время и в любом месте. Целью исследования было построение динамической модели (на примере пяти видов клена), способной идентифицировать виды на временном срезе целевого периода вегетации, без необходимости «дообучения» на части данных целевого датасета (т.е. модели устойчивой к сдвигу значений гиперспектральных данных вследствие временного разрыва).
В качестве объектов исследования были использованы Acer campestre L., A. platanoides L., A. negundo L., A. saccharinum L. и A. ibericum Bieb.
В ходе исследования проводилась гиперспектральная съемка листьев пяти видов клена (Acer campestre L., A. platanoides L., A. negundo L., A. saccharinum L. и A. ibericum Bieb.) с интервалом 5–7 дней в течение всего вегетационного периода 2025 г. Параллельно определялось содержание фотосинтетических пигментов (Acer campestre, A. negundo, A. saccharinum), велись фенологические наблюдения, фиксировались метеорологические характеристики. В результате был сформирован датасет спектральных характеристик (84 вегетационных индекса – ВИ, значения спектральных каналов, значения главных компонент ВИ – PC1-PC7), фенологических, физиологических и метеорологических характеристик. Получены охранные документы на РИД.
Разведочный анализ данных выявил значительное перекрытие значений вегетационных индексов (ВИ) по вегетационным сезонам в многомерном пространстве признаков. Были определены пары ВИ, демонстрирующие различие видовых кластеров: Carter2 и Datt5, Carter2 и DDn, Carter2 и DWSI4, Carter4 и Carter5, Carter4 и DWSI4, Carter5 и DDn, CRI3 и DDn, CRI3 и DWSI4, CRI4 и DWSI4, Datt2 и Datt5, DDn и DWSI4, DDn и NDVI3, DDn и EVI, NDVI3 и EVI.
Разработан и протестирован новый метод предобработки гиперспектральных данных – Random Reflectance (RR). Метод RR использовался в исследовании для снижения шумов в данных, выравнивания классов по объемам выборок в моделях классификации и повышения точности классификации. Показано, что применение метода RR приводит к увеличению оценки F1 на 11,8% при использовании алгоритма Random Forest (RF), на 17,4% при использовании алгоритм Gradient Boosting (GB) и на 29,1% при бинарной классификации с помощью рекуррентной нейронной сети (RNN).
Установлено, что индивидуальность видов клена может проявляться в особенностях временного ряда спектральных характеристик за период их вегетации (спектральная фенологическая подпись – СФП). Разработан метод для генерации СФП. В качестве СФП предложено использовать временные ряды значений медианы первой главной компоненты (PC1) совокупности ВИ. Характерные особенности СФП на основе значений PC1 хорошо сохраняются по вегетационным сезонам (что не наблюдается у «классических» СФП на основе NDVI), и могут служить для идентификации видов древесных растений. Новый метод генерации СФП рекомендован для описания спектральной фенологии листопадных и вечнозеленых древесных растений.
Были разработаны динамические модели различной архитектуры для идентификации видов клена по спектральным характеристикам, использующие в качестве классификаторов Recurrent Neural Network (RNN) и Logistic Regression (LR). Принципиальная схема динамической моделей представляет собой блок из отдельных моделей обученных и предсказывающих видовую принадлежность образцов на узком отрезке их периода вегетации, связанных в ансамбль.
При тестировании многоклассовых моделей с использованием RNN и LR на данных целевого вегетационного сезона при условии, когда модель не обучалась на их части, наблюдалось резкое падение средней точности многоклассовых моделей (в три раза до 25–30%), в сравнении с моделями, обучение и тестирование которых проводилось на данных целевого вегетационного периода. Однако, в бинарных динамических моделях RNN, в которых был реализован принцип One-vs-All, средняя для вегетационного периода точность осталась достаточно высокой – 50–80%. Таким образом, эти модели оказались устойчивыми к «data drift» связанным с временным разрывом. На отдельных отрезках периода вегетации точность идентификации для конкретных видов с помощью бинарных динамических моделей превышала 75% и достигала 85%. В большинстве случаев требуемая точность идентификация видов клена достигалась в начале вегетационного периода. Бинарные модели, в которых в качестве классификатора использовался алгоритм LR, оказались менее устойчивыми к «data drift» связанным с временным разрывом и менее точными при классификации видов клена, чем модели RNN.
Таким образом, задача идентификации видов клена по спектральным характеристикам с помощью динамических моделей, обученных на четырехлетнем датасете (2021–2024 гг.) без использования «дообучения» на целевом датасете (2025 г.), была решена при условии учета фенологических спектральных особенностей видов. Высокая точность и устойчивость к data drift, связанного с временным разрывом, модели идентификации видов была достигнута путем:
Применения для предобработки гиперспектральных данных метода RR;
Использования в качестве алгоритма классификации RNN;
Использования в моделях принципа One-vs-All;
Учета особенностей спектральной фенологии видов.
По результатам исследования в 2025 году опубликовано 3 статьи в журналах AgriEngineering (Scopus Q1), European Journal of Forest Engineering (Scopus Q2), International Journal of Remote Sensing (Scopus Q2), получены охранные документы на РИД, Результаты представлены на Международной научно-практической конференции.
Публикации
1.
Дмитриев П.А., Дмитриева А.А., Федоринова О.И., Козловский Б.Л.
Определение оптимальных периодов в фенологическом развитии видов клена для их идентификации по спектральным характеристикам листьев
Живые и биокосные системы, Живые и биокосные системы 2024, № 49 (год публикации - 2024)
10.18522/2308-9709-2024-49-11
2.
Игнатова М.А., Козловский Б.Л., Дмитриева А.А., Вардуни Т.В., Дмитриев П.А.
Оценка сезонной динамики фотосинтетических пигментов в листьях кленов с помощью вегетационных индексов, рассчитанных по данным гиперспектральной съемки
АгроЭкоИнфо, АгроЭкоИнфо 2024, № 2 (год публикации - 2024)
10.51419/202142206
3.
Александров А.А., Дмитриев П.А., Дмитриева А.А., Полтавский А.В., Козловский Б.Л.
Impact of spectral and meteorological data fusion on the accuracy of woody plant identification using deep machine learning methods
Lecture Notes in Networks and Systems (год публикации - 2024)
10.1007/978-3-031-77688-5_20
Возможность практического использования результатов
Полученные результаты могут быть использованы для совершенствования технологии дистанционного зондирования древесной растительности.