КАРТОЧКА ПРОЕКТА,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 21-77-20042

Название"Атлас флоры России": система документации и анализа пространственного разнообразия растений

РуководительСерегин Алексей Петрович, Доктор биологических наук

Организация финансирования, регионФедеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный университет имени M.В.Ломоносова», г Москва

Годы выполнения при поддержке РНФ 2021 - 2024 

КонкурсКонкурс 2021 года по мероприятию «Проведение исследований на базе существующей научной инфраструктуры мирового уровня» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Объект инфраструктуры Депозитарий живых систем Московского университета

Область знания, основной код классификатора 07 - Науки о Земле, 07-706 - Биогеография

Ключевые словагеография, география растений, биогеография, флора, сосудистые растения, ботаника, флористика, базы данных, пространственные данные, пространственный анализ, таксономия, Россия, ГИС

Код ГРНТИ34.29.00


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
На сегодняшний день, Россия значительно отстает от большинства стран мира по уровню обеспеченности пространственными данными о биологическом разнообразии своей территории. Цель программы "Атлас флоры России" – сбор, систематизация, обеспечение доступа и анализ сведений о разнообразии и пространственном распределении растений в виде онлайн-базы данных, на основе которой будет выяснена географическая картина флоры страны с использованием современных технологий. Для достижения заявленной цели мы сформулировали следующие задачи: (1) оцифровка исходных материалов – геопривязка 660 тыс. образцов из Гербария Московского университета и 400 тыс. образцов из организаций-участников консорциума Цифрового гербария МГУ с территории России; (2) расширение корпуса волонтёров, участвующих в нашем проекте "Флора России | Flora of Russia" на платформе iNaturalist, расширение их навыков и спектра решаемых задач; (3) установление пробелов и дополнительная оцифровка коллекций сторонних организаций из плохо представленных территорий; (4) разработка онлайн-модуля для публикации и аналитической работы с геопространственной информацией; (5) анализ географической картины флоры России. Создание единой базы данных "Атласа флоры России" на платформе Цифрового гербария МГУ (который сам по себе уже является консорциумом пяти российских учреждений, имеющих гербарные коллекции) значимо в двух плоскостях. Строго научная значимость успешного выполнения данного проекта заключается в создании массива больших пространственных данных о сосудистых растениях России как с использованием традиционного корпуса источников (гербарные коллекции, литература), так и новейших методов сбора данных силами сетевого сообщества натуралистов-любителей. Практическая значимость заключается в исключительно высокой масштабируемости проекта: любой исследователь может формировать выборку данных на любом уровне (а именно от глобального до локального), насыщая базу данных детальными сведениями о распространении растений России. При реализации проекта будут активно использоваться несколько ключевых принципов: автономность групп, открытость для сотрудничества, привлечение волонтёров, автоматизация управления, публичность. Для этого будет привлечено самое большое в России сообщество в области "гражданской науки" (citizen science) – участники проекта "Флора России | Flora of Russia" на платформе iNaturalist, число которых сейчас составляет 10 280 человек. Впервые в мире будет по единым методологическим стандартам составлена географическая база данных распространения живых организмов (в данном случае – сосудистых растений) на столь обширную территорию. Впервые будут получены электронные данные высокой плотности по биоразнообразию внетропических регионов Евразии. Впервые будет получена основа для достоверного моделирования и статистической обработки данных по географии растений этого региона. И, наконец, впервые будет осуществлена полная геопривязка цифровых данных из гербария МГУ, имеющего более 1 миллиона образцов. В Цифровом гербарии МГУ уже сейчас содержатся геопривязки 519 840 образцов, мы занимаем по этому показателю 13-е место в мире. Востребованность геоданных в различных исследованиях заставила нас более детально остановиться на этом аспекте работы. В случае реализации проекта, Гербарий МГУ войдет в пятерку ведущих гербариев мира по объемам электронных геоданных, а Россия станет одним из лидеров документации пространственных данных о растениях Земли.

Ожидаемые результаты
В ходе выполнения проекта будут получены следующие основные результаты. Результат 1. На платформе Цифрового гербария МГУ будет разработан портал "Атлас флоры России" со свободным доступом к данным о разнообразии растений России и сопредельных территорий. Портал будет единой точкой доступа к: (1) оцифрованным образцам из Гербария Московского университета; (2) специально разработанным базам данным на основе оцифровки сведений из изданных печатных атласов; (3) данным о разнообразии растений России, доступным по свободным лицензиям в GBIF; (4) базам данных организаций-участников консорциума "Цифрового гербария МГУ" (сейчас включает МГУ, ГБС РАН, Кузбасский ботанический сад РАН, Иркутский гос. университет, Тульский гос. пед. университет); (5) базе данных проекта "Флора России | Flora of Russia" на iNaturalist. Соответствие мировому уровню разрабатываемого портала "Атлас флоры России" заключается в: двуязычности платформы (английский, русский); использовании международных стандартов сбора, хранения и экспорта данных о биоразнообразии; автоматическом взаимодействии с внешними международными базами данных; открытому доступу к исходным данным по лицензии CC-BY 4.0; агрегации региональных баз данных в единой (национальной) точке доступа; привлечение крупного сообщества любителей, уже участвующих в нашей работе. Результат 2. Библиотека отсканированных изображений гербарных образцов на платформе Цифрового гербария МГУ превысит 1,5 млн штук (из них 1,1 млн образцы из Гербария МГУ и 0,4 млн из организаций-участников консорциума, прежде всего ГБС РАН), в т.ч. 1,05 млн штук с территории России (из них 0,65 млн образцы из Гербария МГУ и 0,4 млн из организаций-участников консорциума). За четыре года будет обеспечен наиболее интенсивный рост коллекций среди гербариев России – будет включено в фонды Гербария МГУ не менее 48 тыс. новых образцов растений, в т.ч. в результате специальных экспедиционных исследований. Соответствие мировому уровню библиотеки изображений гербарных образцов заключается в том, что она: уже сейчас является восьмым по величине цифровым гербарием мира по числу сканов, десятым по числу записей в базе данных, 13-м по числу геопривязок; будет обеспечивать доступ к изображениям 40 тыс. видов растений (изображения для нескольких тысяч растений доступны только тут); будет постоянно поддерживаться и обновляться в результате интенсивного пополнения коллекций; Гербарий МГУ в результате оцифровки станет более привлекательным местом для хранения физических коллекций для ученых России и мира. Результат 3. Будет создана самая большая в России пространственная база данных по разнообразию растений. Общее число записей составит к концу проекта (2024 г.) составит 10 млн штук - 1,5 млн из Цифрового гербария МГУ, 7,5 млн из проекта "Флора России | Flora of Russia" на iNaturalist, 1 млн из других источников, доступных в GBIF по свободным лицензиям. Таким образом, в структуре данных 2 млн записей будут основаны на гербарных образцах, 7,5 млн - на наблюдениях, подтвержденных фотографией, 0,5 млн - на прочих типах данных. Соответствие мировому уровню пространственной базы данных по разнообразию растений: по общему числу привязанных к координатам образцов Цифровой гербарий МГУ войдет в десятку среди гербариев мира; будут переведены в электронный вид пространственные данные из русскоязычной литературы, недоступные зарубежным пользователям напрямую; будет расширено и усилено крупнейшее в России сообщество волонтёров-участников проекта "Флора России | Flora of Russia" на iNaturalist, собирающих данные о биоразнообразии в парадигме "гражданской науки". Результат 4. Для каждого из 12,5 тыс. видов флоры России будет составлена серия из трех карт (при наличии минимальных достаточных исходных данных): (1) значковая карта местонахождений; (2) карта ареала в результате апроксимации конкретных данных – контурная или сеточная; (3) прогнозная карта в результате моделирования по алгоритмам MaxEnt. Карты будут отвечать требованиям настраиваемости, масштабируемости, интерактивности, открытости исходных данных. Соответствие мировому уровню картографических ресурсов "Атласа флоры России": для многих видов будут созданы первые известные карты ареалов в пределах России; для видов, распространенных преимущественно в России, это будут первые карты их общих ареалов; созданные карты будут доступны для изучения и редактирования пользователями; исходные материалы будут доступны в виде машиночитаемых баз данных. Возможность практического использования запланированных результатов проекта в экономике и социальной сфере Здесь мы видим три магистральных направления практического использования данных "Атласа флоры России": 1. Для научных целей инвентаризации биоразнообразия на разных масштабах. Разрабатываемый портал основан, прежде всего, на строгих научных структурированных данных, которые накоплены в Московском университете за 200 лет существования университетского Гербария и за два года нашей работы над проектом "Флора России | Flora of Russia" на iNaturalist. Точная гривязка каждой находки к конкретной точке позволит легко масштабировать и агрегировать данные, а также дополнять их. 2. Для образовательных целей. Поскольку мы собираемся обеспечить полуавтоматический обмен данными с открытыми платформами, то любая фотография с геотэгом, сделанная и отправленная на какой-либо открытый ресурс любителем природы (например, iNaturalist), будет отображаться на портале "Атлас флоры России" с авторством находки. Убеждены, что этот простой механизм позволит увлечь неравнодушных поиском новых интересных растений на соседнем газоне или в ближайшем лесопарке. На сегодняшний день сообщество наших волонтёров уже превышает 10 000 человек. 3. Для принятия решений чиновниками в случае необходимости обоснования флористического разнообразия того или иного участка. Растения – основа любого ландшафта, в том числе на сугубо урбанизированных территориях. Их общее разнообразие и конкретные местонахождения, скажем, охраняемых видов постоянно приходится учитывать при принятии различных решений – как сугубо природоохранных, так и при строительстве каких-либо объектов. Портал будет содержать информацию о находках охраняемых растений, карантинных сорняков, лекарственных и декоративных растений.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2021 году
Годовой план работы научной группы включал 15 этапов: частично взаимосвязанных, частично автономных. Сведения о фактически проделанной работе структурированы по этапам. Этап 1. Подготовка и сканирование новых материалов. Ключевой этап работы, необходимый для пополнения оцифрованных коллекций Цифрового гербария МГУ (https://plant.depo.msu.ru/). Работа по данному этапу шла как в Гербарии МГУ, так и в организациях-участниках консорциума Цифрового гербария МГУ. Планировалось, что будет подготовлено и отсканировано не менее 12 тыс. новых образцов (Гербарий МГУ). Это новые коллекции, которые будут переданы в первый год проекта в коллекцию Гербария МГУ и потребуют первичной оцифровки – (1) создания библиотеки изображений, (2) ввода кратких метаданных, (3) монтировки и включения в фонды. По факту, мы осуществили включение 12 тыс. новых образцов из отделов Восточной Европы (3,3 тыс.), Сибири и Дальнего Востока (2,0 тыс.), Кавказа (2,0 тыс.), Крыма (0,5 тыс.), Зарубежной Азии (0,7 тыс.) и других (1,5 тыс.). Также планировалось, что будет отсканировано и размещено на портале Цифрового гербария МГУ не менее 40 тыс. фондовых образцов участников консорциума. Эта работа также полностью выполнена: 41 тыс. сканов поступили из шести сторонних коллекций. Это MHA (Гербарий Главного ботанического сада РАН, г. Москва) – 10 тыс. новых образцов, IRKU (Гербарий Иркутского государственного университета) – 13 тыс. новых образцов, KUZ (Гербарий Кузбасского ботанического сада СО РАН, г. Кемерово) – 9 тыс. новых образцов, TULGU (Гербарий Тульского государственного университета) – 4 тыс. новых образцов, KULPOL (Гербарий Музея-заповедника «Куликово поле», г. Тула) – 3 тыс. новых образцов, TKM (Гербарий Тульского областного краеведческого музея) – 2 тыс. новых образцов. Краткие метаданные, необходимые для индексации, введены для 53 тыс. новых образцов. Развернутые метаданные (текст этикеток) введены для 31 тыс. новых образцов. Результаты, полученные на этом этапе, полностью соответствуют ожидаемым. Этап 2. Геопривязка образцов по алгоритму ИСТРА. Алгоритм ИСТРА связывает отдельные образцы в группы по заданным ключевым параметрам. Это позволяет агрегигровать отдельные образцы в группы по результатам предварительного ввода текстовых данных и осуществлять привязку в автоматическом и полуавтоматическом режиме. По факту, за девять месяцев 2021 г. по образцам из России сделана ручная геопривязка 27 тыс. образцов (было 254,9 тыс., стало 277,2 тыс.). Кроме того, свыше 50 тыс. образцов видов флоры России было привязано к карте из других государств для полноты отражения ареалов. Работа алгоритма ИСТРА постоянно совершенствовалась для улучшения качества геопривязки. В частности, написаны новые фрагменты кода, учитывающие нормирование выборок по паре «Коллектор» - «Дата» с помощью географических данных (район гербария). На 7.12.2021 г. у нашей научной группы имеются следующие наиболее заметные массивы автоматичски полученных с помощью алгоритма ИСТРА геоданных по субъектам Федерации: Московская область (47127 ед.), г. Москва (15631), Республика Крым (14315), Рязанская область (11122), Волгоградская область (9035), Владимирская область (8811), Приморский край (8558), Тульская область (8092), Республика Башкортостан (7689), Республика Саха (Якутия) (6746). Этот список заметно отличается от массивов ручных (точных) геоданных, поскольку мы тестируем различные модели работы с образцами (сплошная ручная привязка, приоритет ручной, приоритет автоматической, случайная выборка). Результаты, полученные на этом этапе, соответствуют ожидаемым. Этап 3. Геопривязка образцов ручная. Ручная геопривязка более трудоемкая, однако ее результативность зависит от предварительной работы алгоритма ИСТРА. Ручные геопривязки критически важны для адекватного моделирования ареалов. По факту, за девять месяцев 2021 г. по образцам из России сделана ручная геопривязка 55 тыс. образцов (было 298,5 тыс., стало 353,5 тыс.). Отставание от плана связано с более интенсивной работой по геопривязке образцов с помощью автоматического алгоритма ИСТРА и геопривязкой образцов видов флоры России из сопредельных государств. Таким образом общее число геопривязок для «Атласа флоры России» выросло выше плана. На 7.12.2021 г. у нашей научной группы имеются следующие наиболее заметные массивы ручных геоданных по субъектам Федерации: Московская область (31559 ед.), Красноярский край (21249), г. Москва (17636), Республика Крым (11583), Владимирская область (9888), Республика Бурятия (9852), Кемеровская область (9219), Тульская область (7705), Краснодарский край (7419), Иркутская область (7243). Результаты, полученные на этом этапе, соответствуют ожидаемым. Этап 4. Ввод текстовых данных с этикеток. Эта работа не является приоритетной для атласа, однако она позволяет сократить время, необходимое для точной ручной геопривязки образцов. В приоритете – ввод текстовых данных со старых этикеток (19 век), не содержащих точных географических сведений. По итогам первого года проекта, план заметно перевыполнен – введено 121 тыс. этикеток (было 376 тыс., стало 497 тыс.). Благодаря достигнутым результатам дальнейшая работа по этому этапу будет сокращена. На 7.12.2021 г. у нашей научной группы имеются следующие наиболее заметные массивы оцифрованных (полностью введенных в базу) этикеток по субъектам Федерации: Московская область (62855 ед.), г. Москва (34916), Республика Крым (18002), Владимирская область (16415), Тульская область (13923), Рязанская область (13160), Краснодарский край – предгорья (10583), Краснодарский край – побережье (9053), Республика Башкортостан (8037), Красноярский край (7883). Результаты, полученные на этом этапе, заметно превосходят ожидаемые. Этап 5. Анализ пространственных пропусков. Подготовлена серия интернет-публикаций, в каждой из которых мы анализировали региональные диспропорции данных в проекте "Флора России" на iNaturalist. Мы cделали это накануне полевого сезона 2021 г., рассказывая о том, куда следует отправиться пользователям платформы, чтобы принести пользу в сборе данных для "Атласа флоры России". Этот обзор охватил 24 ведущих региона нашего проекта по числу сделанных наблюдений. Например, https://www.inaturalist.org/projects/flora-of-russia/journal/46934-pereraspredelenie-usiliy-moskovskaya-oblast – по Московской области, https://www.inaturalist.org/projects/flora-of-russia/journal/47119-pereraspredelenie-usiliy-moskva – по Москве и т.д. Этап 6. Продолжается оцифровка исторической литературы, что является современной тенденцией в области интеллектуального анализа данных о биоразнообразии. Мы полностью перевели в формат массива данных и опубликована в GBIF монографию "Flora des Gouvernements Wladimir" (Флёров, 1902). Она включает 8 889 записей 654 таксонов (в основном видов) из 366 местонахождений. Этап 7. Публикация материалов в ЦГ МГУ. Результаты реализации этапов 2, 3 и 4 суммируются и взаимно связываются на этапе 7. Общие результаты данного этапа заметно превзошли ожидаемые благодаря активной работе научной группы. Общее число геопривязок Цифрового гербария МГУ превышает 719 тыс. (план – 450 тыс.), общее число введенных этикеток превышает 450 тыс. (план – 300 тыс.). Эти результаты являются ключевыми индикаторами состояния проекта. Счетчики числа геопривязок и числа оцифрованных этикеток находится на главной странице портала (http://plant.depo.msu.ru/) и обновляются в режиме реального времени. Общая статистика Цифрового гербария МГУ на 7.12.2021 г. Образцов: 1162993. Изображений: 1142203. Видов: 39127. Геопривязок: 719724. Этикеток: 497239. OCR: 661591. Этап 8. Поддержка ЦГ МГУ. Производился непрерывно в режиме 365/7/24. Осуществлялся членами IT-команды для обеспечения распределенного доступа к данным как членов научной группы, так и пользователей. Устранено несколько десятков нестабильностей. Этап 9. Разработка портала. Разработано детальное техническое задание и запущена тестовая версия портала "Атлас флоры России". Обеспечен тестовый доступ для членов научной группы для отладки взаимодействия и устранения недоработок. Этап 10. Подготовка картографических сервисов. На сегодняшний день для работы над атласом используются возможности картографической визуализации данных на трёх платформах: Цифровой гербарий МГУ, GBIF и iNaturalist. Этап 11. Подготовка публикаций. Полностью подготовлено и опубликовано к моменту сдачи промежуточного отчета за первый год проекта 4 статьи в журналах Web of Science Core Collection. Кроме того, 1 статья в журнале Scopus и 1 статья в журнале из списка RSCI. Этап 12. Подготовка отчетов. Технический этап. Этап 13. Подготовка наборов данных для онлайн публикации. Этап 14. Интеграция сторонних наборов данных. Основой данных для «Атласа флоры России», как уже было сказано, станут данные, размещенные в GBIF. Таким образом, в рамках отчёта мы будем давать обзор сведений по флоре России, которые содержатся в GBIF. На 2.12.2021 г. в GBIF содержатся данные об 1 902 174 240 находках, поступивших из 63 842 массивов данных (датасетов) от 1 763 публикующих организаций. В качестве находок фигурируют коллекционные образцы, задокументированные факты встреч отдельных видов, сведения из литературы и некоторые другие типы данных. По сосудистым растениям России поисковый модуль GBIF выдает 3 839 443 находки (без учёта Крыма). Кроме того, имеется 141 156 находка по сосудистым растениям Крыма (только с геопривязками). Таким образом, общий объем данных по флоре сосудистых растений в GBIF составляет 3 980 599, а к концу 2021 г. превысит, по-видимому, 4 млн записей. Последний раз статистику GBIF по этим показателям мы снимали 25.04.2021 г. В тот момент в GBIF значилось 3 050 629 находок по флоре России (2 957 820 с основной территории, 92 809 из Крыма). Таким образом, за 7 месяцев практической реализации проекта данные по флоре России в GBIF выросли на 929 970 записей.

 

Публикации

1. - Россияне примут участие в чемпионате мира по документированию флоры и фауны своих городов ТАСС, https://tass.ru/obschestvo/11278753 (год публикации - ).

2. - 1 миллион наблюдений дикорастущих растений страны собрал проект МГУ «Флора России» Портал "Год науки", https://годнауки.рф/news/1080/ (год публикации - ).

3. - Нейронные сети научились узнавать свыше 90% фотографий растений флоры России Портал "Год науки", https://годнауки.рф/news/4375/ (год публикации - ).

4. Бочков Д.А. Флористические находки адвентивных видов в Московском регионе Бюллетень Московского общества испытателей природы. Отдел биологический, Т. 126, № 3. — С. 26–28. (год публикации - 2021).

5. Верхозина А.В., Бирюков Р.Ю., Богданова Е.С., Бондарева В.В., Черных Д.В., Дорофеев Н.В., Дорофеев В.И., Эбель А.Л., Ефимов П.Г., Ефремов А.Н., Эрст А.С., Фатерыга А.В., Гамова Н.С. и др. Findings to the flora of Russia and adjacent countries: New national and regional vascular plant records, 3 Botanica Pacifica, Vol. 10(1). P. 85–108 (год публикации - 2021).

6. Серегин А.П. Contribution to the "Atlas of the Russian Flora": Twelve local floras of European Russia Biodiversity Data Journal, Vol. 9. — P. e73013 (год публикации - 2021).

7. Серегин А.П. Flora of Vladimir Oblast, Russia: an updated grid dataset (1867–2020) Biodiversity Data Journal, Vol. 9. — P. e68046. (год публикации - 2021).

8. Серегин А.П., Басов Ю.М. Fleroff goes digital: georeferenced records from "Flora des Gouvernements Wladimir" (Fleroff, 1902) Biodiversity Data Journal, Vol. 9. — P. e75299. (год публикации - 2021).

9. Щербаков А.В., Казакова М.В., Любезнова Н.В., Пастушенко А.Д., Серегин А.П. A grid-based database on vascular plant distribution in the Meshchersky National Park, Ryazan Oblast, Russia Biodiversity Data Journal, Vol. 9. — P. e75892. (год публикации - 2021).