КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 21-77-20042

Название"Атлас флоры России": система документации и анализа пространственного разнообразия растений

РуководительСерегин Алексей Петрович, Доктор биологических наук

Организация финансирования, регион Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный университет имени M.В.Ломоносова», г Москва

Период выполнения при поддержке РНФ 2021 г. - 2024 г. 

Конкурс№51 - Конкурс 2021 года по мероприятию «Проведение исследований на базе существующей научной инфраструктуры мирового уровня» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Объект инфраструктуры Депозитарий живых систем Московского университета.

Область знания, основной код классификатора 07 - Науки о Земле, 07-706 - Биогеография

Ключевые словагеография, география растений, биогеография, флора, сосудистые растения, ботаника, флористика, базы данных, пространственные данные, пространственный анализ, таксономия, Россия, ГИС

Код ГРНТИ34.29.00


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
На сегодняшний день, Россия значительно отстает от большинства стран мира по уровню обеспеченности пространственными данными о биологическом разнообразии своей территории. Цель программы "Атлас флоры России" – сбор, систематизация, обеспечение доступа и анализ сведений о разнообразии и пространственном распределении растений в виде онлайн-базы данных, на основе которой будет выяснена географическая картина флоры страны с использованием современных технологий. Для достижения заявленной цели мы сформулировали следующие задачи: (1) оцифровка исходных материалов – геопривязка 660 тыс. образцов из Гербария Московского университета и 400 тыс. образцов из организаций-участников консорциума Цифрового гербария МГУ с территории России; (2) расширение корпуса волонтёров, участвующих в нашем проекте "Флора России | Flora of Russia" на платформе iNaturalist, расширение их навыков и спектра решаемых задач; (3) установление пробелов и дополнительная оцифровка коллекций сторонних организаций из плохо представленных территорий; (4) разработка онлайн-модуля для публикации и аналитической работы с геопространственной информацией; (5) анализ географической картины флоры России. Создание единой базы данных "Атласа флоры России" на платформе Цифрового гербария МГУ (который сам по себе уже является консорциумом пяти российских учреждений, имеющих гербарные коллекции) значимо в двух плоскостях. Строго научная значимость успешного выполнения данного проекта заключается в создании массива больших пространственных данных о сосудистых растениях России как с использованием традиционного корпуса источников (гербарные коллекции, литература), так и новейших методов сбора данных силами сетевого сообщества натуралистов-любителей. Практическая значимость заключается в исключительно высокой масштабируемости проекта: любой исследователь может формировать выборку данных на любом уровне (а именно от глобального до локального), насыщая базу данных детальными сведениями о распространении растений России. При реализации проекта будут активно использоваться несколько ключевых принципов: автономность групп, открытость для сотрудничества, привлечение волонтёров, автоматизация управления, публичность. Для этого будет привлечено самое большое в России сообщество в области "гражданской науки" (citizen science) – участники проекта "Флора России | Flora of Russia" на платформе iNaturalist, число которых сейчас составляет 10 280 человек. Впервые в мире будет по единым методологическим стандартам составлена географическая база данных распространения живых организмов (в данном случае – сосудистых растений) на столь обширную территорию. Впервые будут получены электронные данные высокой плотности по биоразнообразию внетропических регионов Евразии. Впервые будет получена основа для достоверного моделирования и статистической обработки данных по географии растений этого региона. И, наконец, впервые будет осуществлена полная геопривязка цифровых данных из гербария МГУ, имеющего более 1 миллиона образцов. В Цифровом гербарии МГУ уже сейчас содержатся геопривязки 519 840 образцов, мы занимаем по этому показателю 13-е место в мире. Востребованность геоданных в различных исследованиях заставила нас более детально остановиться на этом аспекте работы. В случае реализации проекта, Гербарий МГУ войдет в пятерку ведущих гербариев мира по объемам электронных геоданных, а Россия станет одним из лидеров документации пространственных данных о растениях Земли.

Ожидаемые результаты
В ходе выполнения проекта будут получены следующие основные результаты. Результат 1. На платформе Цифрового гербария МГУ будет разработан портал "Атлас флоры России" со свободным доступом к данным о разнообразии растений России и сопредельных территорий. Портал будет единой точкой доступа к: (1) оцифрованным образцам из Гербария Московского университета; (2) специально разработанным базам данным на основе оцифровки сведений из изданных печатных атласов; (3) данным о разнообразии растений России, доступным по свободным лицензиям в GBIF; (4) базам данных организаций-участников консорциума "Цифрового гербария МГУ" (сейчас включает МГУ, ГБС РАН, Кузбасский ботанический сад РАН, Иркутский гос. университет, Тульский гос. пед. университет); (5) базе данных проекта "Флора России | Flora of Russia" на iNaturalist. Соответствие мировому уровню разрабатываемого портала "Атлас флоры России" заключается в: двуязычности платформы (английский, русский); использовании международных стандартов сбора, хранения и экспорта данных о биоразнообразии; автоматическом взаимодействии с внешними международными базами данных; открытому доступу к исходным данным по лицензии CC-BY 4.0; агрегации региональных баз данных в единой (национальной) точке доступа; привлечение крупного сообщества любителей, уже участвующих в нашей работе. Результат 2. Библиотека отсканированных изображений гербарных образцов на платформе Цифрового гербария МГУ превысит 1,5 млн штук (из них 1,1 млн образцы из Гербария МГУ и 0,4 млн из организаций-участников консорциума, прежде всего ГБС РАН), в т.ч. 1,05 млн штук с территории России (из них 0,65 млн образцы из Гербария МГУ и 0,4 млн из организаций-участников консорциума). За четыре года будет обеспечен наиболее интенсивный рост коллекций среди гербариев России – будет включено в фонды Гербария МГУ не менее 48 тыс. новых образцов растений, в т.ч. в результате специальных экспедиционных исследований. Соответствие мировому уровню библиотеки изображений гербарных образцов заключается в том, что она: уже сейчас является восьмым по величине цифровым гербарием мира по числу сканов, десятым по числу записей в базе данных, 13-м по числу геопривязок; будет обеспечивать доступ к изображениям 40 тыс. видов растений (изображения для нескольких тысяч растений доступны только тут); будет постоянно поддерживаться и обновляться в результате интенсивного пополнения коллекций; Гербарий МГУ в результате оцифровки станет более привлекательным местом для хранения физических коллекций для ученых России и мира. Результат 3. Будет создана самая большая в России пространственная база данных по разнообразию растений. Общее число записей составит к концу проекта (2024 г.) составит 10 млн штук - 1,5 млн из Цифрового гербария МГУ, 7,5 млн из проекта "Флора России | Flora of Russia" на iNaturalist, 1 млн из других источников, доступных в GBIF по свободным лицензиям. Таким образом, в структуре данных 2 млн записей будут основаны на гербарных образцах, 7,5 млн - на наблюдениях, подтвержденных фотографией, 0,5 млн - на прочих типах данных. Соответствие мировому уровню пространственной базы данных по разнообразию растений: по общему числу привязанных к координатам образцов Цифровой гербарий МГУ войдет в десятку среди гербариев мира; будут переведены в электронный вид пространственные данные из русскоязычной литературы, недоступные зарубежным пользователям напрямую; будет расширено и усилено крупнейшее в России сообщество волонтёров-участников проекта "Флора России | Flora of Russia" на iNaturalist, собирающих данные о биоразнообразии в парадигме "гражданской науки". Результат 4. Для каждого из 12,5 тыс. видов флоры России будет составлена серия из трех карт (при наличии минимальных достаточных исходных данных): (1) значковая карта местонахождений; (2) карта ареала в результате апроксимации конкретных данных – контурная или сеточная; (3) прогнозная карта в результате моделирования по алгоритмам MaxEnt. Карты будут отвечать требованиям настраиваемости, масштабируемости, интерактивности, открытости исходных данных. Соответствие мировому уровню картографических ресурсов "Атласа флоры России": для многих видов будут созданы первые известные карты ареалов в пределах России; для видов, распространенных преимущественно в России, это будут первые карты их общих ареалов; созданные карты будут доступны для изучения и редактирования пользователями; исходные материалы будут доступны в виде машиночитаемых баз данных. Возможность практического использования запланированных результатов проекта в экономике и социальной сфере Здесь мы видим три магистральных направления практического использования данных "Атласа флоры России": 1. Для научных целей инвентаризации биоразнообразия на разных масштабах. Разрабатываемый портал основан, прежде всего, на строгих научных структурированных данных, которые накоплены в Московском университете за 200 лет существования университетского Гербария и за два года нашей работы над проектом "Флора России | Flora of Russia" на iNaturalist. Точная гривязка каждой находки к конкретной точке позволит легко масштабировать и агрегировать данные, а также дополнять их. 2. Для образовательных целей. Поскольку мы собираемся обеспечить полуавтоматический обмен данными с открытыми платформами, то любая фотография с геотэгом, сделанная и отправленная на какой-либо открытый ресурс любителем природы (например, iNaturalist), будет отображаться на портале "Атлас флоры России" с авторством находки. Убеждены, что этот простой механизм позволит увлечь неравнодушных поиском новых интересных растений на соседнем газоне или в ближайшем лесопарке. На сегодняшний день сообщество наших волонтёров уже превышает 10 000 человек. 3. Для принятия решений чиновниками в случае необходимости обоснования флористического разнообразия того или иного участка. Растения – основа любого ландшафта, в том числе на сугубо урбанизированных территориях. Их общее разнообразие и конкретные местонахождения, скажем, охраняемых видов постоянно приходится учитывать при принятии различных решений – как сугубо природоохранных, так и при строительстве каких-либо объектов. Портал будет содержать информацию о находках охраняемых растений, карантинных сорняков, лекарственных и декоративных растений.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2021 году
Годовой план работы научной группы включал 15 этапов: частично взаимосвязанных, частично автономных. Сведения о фактически проделанной работе структурированы по этапам. Этап 1. Подготовка и сканирование новых материалов. Ключевой этап работы, необходимый для пополнения оцифрованных коллекций Цифрового гербария МГУ (https://plant.depo.msu.ru/). Работа по данному этапу шла как в Гербарии МГУ, так и в организациях-участниках консорциума Цифрового гербария МГУ. Планировалось, что будет подготовлено и отсканировано не менее 12 тыс. новых образцов (Гербарий МГУ). Это новые коллекции, которые будут переданы в первый год проекта в коллекцию Гербария МГУ и потребуют первичной оцифровки – (1) создания библиотеки изображений, (2) ввода кратких метаданных, (3) монтировки и включения в фонды. По факту, мы осуществили включение 12 тыс. новых образцов из отделов Восточной Европы (3,3 тыс.), Сибири и Дальнего Востока (2,0 тыс.), Кавказа (2,0 тыс.), Крыма (0,5 тыс.), Зарубежной Азии (0,7 тыс.) и других (1,5 тыс.). Также планировалось, что будет отсканировано и размещено на портале Цифрового гербария МГУ не менее 40 тыс. фондовых образцов участников консорциума. Эта работа также полностью выполнена: 41 тыс. сканов поступили из шести сторонних коллекций. Это MHA (Гербарий Главного ботанического сада РАН, г. Москва) – 10 тыс. новых образцов, IRKU (Гербарий Иркутского государственного университета) – 13 тыс. новых образцов, KUZ (Гербарий Кузбасского ботанического сада СО РАН, г. Кемерово) – 9 тыс. новых образцов, TULGU (Гербарий Тульского государственного университета) – 4 тыс. новых образцов, KULPOL (Гербарий Музея-заповедника «Куликово поле», г. Тула) – 3 тыс. новых образцов, TKM (Гербарий Тульского областного краеведческого музея) – 2 тыс. новых образцов. Краткие метаданные, необходимые для индексации, введены для 53 тыс. новых образцов. Развернутые метаданные (текст этикеток) введены для 31 тыс. новых образцов. Результаты, полученные на этом этапе, полностью соответствуют ожидаемым. Этап 2. Геопривязка образцов по алгоритму ИСТРА. Алгоритм ИСТРА связывает отдельные образцы в группы по заданным ключевым параметрам. Это позволяет агрегигровать отдельные образцы в группы по результатам предварительного ввода текстовых данных и осуществлять привязку в автоматическом и полуавтоматическом режиме. По факту, за девять месяцев 2021 г. по образцам из России сделана ручная геопривязка 27 тыс. образцов (было 254,9 тыс., стало 277,2 тыс.). Кроме того, свыше 50 тыс. образцов видов флоры России было привязано к карте из других государств для полноты отражения ареалов. Работа алгоритма ИСТРА постоянно совершенствовалась для улучшения качества геопривязки. В частности, написаны новые фрагменты кода, учитывающие нормирование выборок по паре «Коллектор» - «Дата» с помощью географических данных (район гербария). На 7.12.2021 г. у нашей научной группы имеются следующие наиболее заметные массивы автоматичски полученных с помощью алгоритма ИСТРА геоданных по субъектам Федерации: Московская область (47127 ед.), г. Москва (15631), Республика Крым (14315), Рязанская область (11122), Волгоградская область (9035), Владимирская область (8811), Приморский край (8558), Тульская область (8092), Республика Башкортостан (7689), Республика Саха (Якутия) (6746). Этот список заметно отличается от массивов ручных (точных) геоданных, поскольку мы тестируем различные модели работы с образцами (сплошная ручная привязка, приоритет ручной, приоритет автоматической, случайная выборка). Результаты, полученные на этом этапе, соответствуют ожидаемым. Этап 3. Геопривязка образцов ручная. Ручная геопривязка более трудоемкая, однако ее результативность зависит от предварительной работы алгоритма ИСТРА. Ручные геопривязки критически важны для адекватного моделирования ареалов. По факту, за девять месяцев 2021 г. по образцам из России сделана ручная геопривязка 55 тыс. образцов (было 298,5 тыс., стало 353,5 тыс.). Отставание от плана связано с более интенсивной работой по геопривязке образцов с помощью автоматического алгоритма ИСТРА и геопривязкой образцов видов флоры России из сопредельных государств. Таким образом общее число геопривязок для «Атласа флоры России» выросло выше плана. На 7.12.2021 г. у нашей научной группы имеются следующие наиболее заметные массивы ручных геоданных по субъектам Федерации: Московская область (31559 ед.), Красноярский край (21249), г. Москва (17636), Республика Крым (11583), Владимирская область (9888), Республика Бурятия (9852), Кемеровская область (9219), Тульская область (7705), Краснодарский край (7419), Иркутская область (7243). Результаты, полученные на этом этапе, соответствуют ожидаемым. Этап 4. Ввод текстовых данных с этикеток. Эта работа не является приоритетной для атласа, однако она позволяет сократить время, необходимое для точной ручной геопривязки образцов. В приоритете – ввод текстовых данных со старых этикеток (19 век), не содержащих точных географических сведений. По итогам первого года проекта, план заметно перевыполнен – введено 121 тыс. этикеток (было 376 тыс., стало 497 тыс.). Благодаря достигнутым результатам дальнейшая работа по этому этапу будет сокращена. На 7.12.2021 г. у нашей научной группы имеются следующие наиболее заметные массивы оцифрованных (полностью введенных в базу) этикеток по субъектам Федерации: Московская область (62855 ед.), г. Москва (34916), Республика Крым (18002), Владимирская область (16415), Тульская область (13923), Рязанская область (13160), Краснодарский край – предгорья (10583), Краснодарский край – побережье (9053), Республика Башкортостан (8037), Красноярский край (7883). Результаты, полученные на этом этапе, заметно превосходят ожидаемые. Этап 5. Анализ пространственных пропусков. Подготовлена серия интернет-публикаций, в каждой из которых мы анализировали региональные диспропорции данных в проекте "Флора России" на iNaturalist. Мы cделали это накануне полевого сезона 2021 г., рассказывая о том, куда следует отправиться пользователям платформы, чтобы принести пользу в сборе данных для "Атласа флоры России". Этот обзор охватил 24 ведущих региона нашего проекта по числу сделанных наблюдений. Например, https://www.inaturalist.org/projects/flora-of-russia/journal/46934-pereraspredelenie-usiliy-moskovskaya-oblast – по Московской области, https://www.inaturalist.org/projects/flora-of-russia/journal/47119-pereraspredelenie-usiliy-moskva – по Москве и т.д. Этап 6. Продолжается оцифровка исторической литературы, что является современной тенденцией в области интеллектуального анализа данных о биоразнообразии. Мы полностью перевели в формат массива данных и опубликована в GBIF монографию "Flora des Gouvernements Wladimir" (Флёров, 1902). Она включает 8 889 записей 654 таксонов (в основном видов) из 366 местонахождений. Этап 7. Публикация материалов в ЦГ МГУ. Результаты реализации этапов 2, 3 и 4 суммируются и взаимно связываются на этапе 7. Общие результаты данного этапа заметно превзошли ожидаемые благодаря активной работе научной группы. Общее число геопривязок Цифрового гербария МГУ превышает 719 тыс. (план – 450 тыс.), общее число введенных этикеток превышает 450 тыс. (план – 300 тыс.). Эти результаты являются ключевыми индикаторами состояния проекта. Счетчики числа геопривязок и числа оцифрованных этикеток находится на главной странице портала (http://plant.depo.msu.ru/) и обновляются в режиме реального времени. Общая статистика Цифрового гербария МГУ на 7.12.2021 г. Образцов: 1162993. Изображений: 1142203. Видов: 39127. Геопривязок: 719724. Этикеток: 497239. OCR: 661591. Этап 8. Поддержка ЦГ МГУ. Производился непрерывно в режиме 365/7/24. Осуществлялся членами IT-команды для обеспечения распределенного доступа к данным как членов научной группы, так и пользователей. Устранено несколько десятков нестабильностей. Этап 9. Разработка портала. Разработано детальное техническое задание и запущена тестовая версия портала "Атлас флоры России". Обеспечен тестовый доступ для членов научной группы для отладки взаимодействия и устранения недоработок. Этап 10. Подготовка картографических сервисов. На сегодняшний день для работы над атласом используются возможности картографической визуализации данных на трёх платформах: Цифровой гербарий МГУ, GBIF и iNaturalist. Этап 11. Подготовка публикаций. Полностью подготовлено и опубликовано к моменту сдачи промежуточного отчета за первый год проекта 4 статьи в журналах Web of Science Core Collection. Кроме того, 1 статья в журнале Scopus и 1 статья в журнале из списка RSCI. Этап 12. Подготовка отчетов. Технический этап. Этап 13. Подготовка наборов данных для онлайн публикации. Этап 14. Интеграция сторонних наборов данных. Основой данных для «Атласа флоры России», как уже было сказано, станут данные, размещенные в GBIF. Таким образом, в рамках отчёта мы будем давать обзор сведений по флоре России, которые содержатся в GBIF. На 2.12.2021 г. в GBIF содержатся данные об 1 902 174 240 находках, поступивших из 63 842 массивов данных (датасетов) от 1 763 публикующих организаций. В качестве находок фигурируют коллекционные образцы, задокументированные факты встреч отдельных видов, сведения из литературы и некоторые другие типы данных. По сосудистым растениям России поисковый модуль GBIF выдает 3 839 443 находки (без учёта Крыма). Кроме того, имеется 141 156 находка по сосудистым растениям Крыма (только с геопривязками). Таким образом, общий объем данных по флоре сосудистых растений в GBIF составляет 3 980 599, а к концу 2021 г. превысит, по-видимому, 4 млн записей. Последний раз статистику GBIF по этим показателям мы снимали 25.04.2021 г. В тот момент в GBIF значилось 3 050 629 находок по флоре России (2 957 820 с основной территории, 92 809 из Крыма). Таким образом, за 7 месяцев практической реализации проекта данные по флоре России в GBIF выросли на 929 970 записей.

 

Публикации

1. Бочков Д.А. Флористические находки адвентивных видов в Московском регионе Бюллетень Московского общества испытателей природы. Отдел биологический, Т. 126, № 3. — С. 26–28. (год публикации - 2021)

2. Верхозина А.В., Бирюков Р.Ю., Богданова Е.С., Бондарева В.В., Черных Д.В., Дорофеев Н.В., Дорофеев В.И., Эбель А.Л., Ефимов П.Г., Ефремов А.Н., Эрст А.С., Фатерыга А.В., Гамова Н.С. и др. Findings to the flora of Russia and adjacent countries: New national and regional vascular plant records, 3 Botanica Pacifica, Vol. 10(1). P. 85–108 (год публикации - 2021) https://doi.org/10.17581/bp.2021.10110

3. Серегин А.П. Contribution to the "Atlas of the Russian Flora": Twelve local floras of European Russia Biodiversity Data Journal, Vol. 9. — P. e73013 (год публикации - 2021) https://doi.org/10.3897/BDJ.9.e73013

4. Серегин А.П. Flora of Vladimir Oblast, Russia: an updated grid dataset (1867–2020) Biodiversity Data Journal, Vol. 9. — P. e68046. (год публикации - 2021) https://doi.org/10.3897/BDJ.9.e68046

5. Серегин А.П., Басов Ю.М. Fleroff goes digital: georeferenced records from "Flora des Gouvernements Wladimir" (Fleroff, 1902) Biodiversity Data Journal, Vol. 9. — P. e75299. (год публикации - 2021) https://doi.org/10.3897/bdj.9.e75299

6. Щербаков А.В., Казакова М.В., Любезнова Н.В., Пастушенко А.Д., Серегин А.П. A grid-based database on vascular plant distribution in the Meshchersky National Park, Ryazan Oblast, Russia Biodiversity Data Journal, Vol. 9. — P. e75892. (год публикации - 2021) https://doi.org/10.3897/BDJ.9.e75892

7. - Россияне примут участие в чемпионате мира по документированию флоры и фауны своих городов ТАСС, https://tass.ru/obschestvo/11278753 (год публикации - )

8. - 1 миллион наблюдений дикорастущих растений страны собрал проект МГУ «Флора России» Портал "Год науки", https://годнауки.рф/news/1080/ (год публикации - )

9. - Нейронные сети научились узнавать свыше 90% фотографий растений флоры России Портал "Год науки", https://годнауки.рф/news/4375/ (год публикации - )


Аннотация результатов, полученных в 2022 году
Работа по гранту шла по плану-графику, на каждом этапе она была проделана в полном объеме, по некоторым этапам результаты значительно превзошли намеченные ожидания. Годовой план работы научной группы включал 15 этапов: частично взаимосвязанных, частично автономных. Сведения о фактически проделанной работе структурированы ниже по этапам. Наиболее важными этапами в 2022 году, которые уже сейчас определяют важнейшие достижения проекта, стали: Этап 6 (в части создания базы данных «Local floras of Russia: records from literature», 566 009 записей из 604 источников); Этап 9 (в части разработки и внедрения модуля «Помогатор» Цифрового гербария МГУ для работы волонтёров и привлечение волонтёров); Этап 10 (в части подготовки и онлайн-публикации предварительных карт «Атласа флоры России» для 9062 видов сосудистых растений); Этап 15 (в части разработки новых карт флористического районирования России). Этап 1. Подготовка и сканирование новых материалов. Планировалось, что в 2022 г. будет подготовлено и отсканировано в Гербарии МГУ не менее 12 тыс. новых образцов. В марте 2022 года в фонды Гербария МГУ передана коллекция Института леса АН СССР. Общий оценочный объем коллекции – 20–28 тыс. образцов. По итогам обработки новых сборов и частичной обработки переданной коллекции Института леса факту, мы осуществили в 2022 г. включение в фонды Гербария МГУ 15,8 тыс. новых образцов из отделов Восточной Европы (5 681 шт.), Сибири и Дальнего Востока (6 489 шт.), Кавказа (2 273 шт.), Средней Азии (1 064 шт.), Монголии (330 шт.) и других. Общий объем физической коллекции достиг отметки в 1 107 261 образцов, по объемам фондовой коллекции это 59-й гербарий мира. Доля оцифрованных коллекций составляет 94,6%. Этап 2. Геопривязка образцов по алгоритму ИСТРА; Этап 3. Геопривязка образцов ручная. Планировалось, что будет привязано к координатам не менее 50 тыс. образцов (30 тыс. шт. по алгоритму ИСТРА; 20 тыс. шт. ручных геопривязок). За отчётный год мы впервые ввели в базу координаты для 103 347 образцов. Покрытие геоданными выросло до 66,8% всех образцов Цифрового гербария МГУ, а для образцов сосудистых растений с территории России – до 80,0% (649 350 из 811 422). Однако результаты 2022 г. в этой части гораздо больше – нам радикально улучшилось качество геоданных в результате планомерной ручной верификации автоматических геопривязок: так, с территории России за 2022 г. в базе было учтено 129 тыс. новых ручных геопривязок (было 277,2 тыс., стало 406,2 тыс.). Этап 4. Ввод текстовых данных с этикеток. Планировалось, что будет введено в базу данных текст этикеток не менее 20 тыс. образцов. Эта работа не является приоритетной для «Атласа», однако она позволяет сократить время, необходимое для точной ручной геопривязки образцов (Этап 3). По итогам 2022 г., достигнутые результаты заметно превосходят плановые – введено 64 тыс. этикеток (было 497 тыс., стало 561 тыс.). Этап 5. Анализ пространственных пропусков. Выявление пространственных пропусков проведено для оцифрованных в 2022 г. данных литературы (база данных «Local floras of Russia»). У нас имеется всего один крупный пропуск на границе Якутии и Красноярского края. Это, на сегодняшний день, единственное крупное белое пятно на карте флористической изученности России. По территории площадью около 200 000–250 000 кв. км не имеется ни одного опубликованного флористического списка, маршрутного описания флоры, результатов геоботанического или ресурсного обследования растительного мира. Эта территория включает среднее течение р. Ниж. Тунгуска, верховья р. Вилюй, верховья р. Оленёк, среднее течение р. Котуй. Кроме того, традиционно подготовлена серия интернет-публикаций для волонтёров, в каждой из которых мы анализировали региональные диспропорции данных проекта «Флора России» на iNaturalist: https://www.inaturalist.org/projects/flora-rossii-i-kryma-flora-of-russia-and-the-crimea/journal/64284 Этап 6. Оцифровка печатных атласов. Работы по данному этапу в текущем году не предполагались, однако именно здесь был достигнут один из действительно важных научных результатов проекта за 2022 год. Мы создали ещё один действительно большой массив данных по флоре России. База данных «Local floras of Russia: records from literature» на 27.11.2022 является третьим по объему источником открытых электронных данных по разнообразию сосудистых растений России в GBIF. Число записей в базе «Local floras of Russia» составляет 566 009 шт. Мы оцифровали данные из 3 017 географических пунктов (604 источника) – это как полные описания локальных флор, так и важнейшие работы с маршрутным описанием флоры и растительности глубиной до 1975 г. (в т.ч. полные архивы важнейших отечественных журналов, сборники статей, монографии, диссертации). Средняя точность геопривязки составила 21 965 м. Этап 7. Публикация материалов в ЦГ МГУ. Общие результаты данного этапа заметно превзошли ожидаемые благодаря активной работе научной группы. Общее число геопривязок Цифрового гербария МГУ превышает 832 тыс. (план – 600 тыс.), общее число введенных этикеток превышает 566 тыс. (план – 340 тыс.). Эти результаты являются ключевыми индикаторами состояния проекта. Счетчики числа геопривязок и числа оцифрованных этикеток находится на главной странице портала (http://plant.depo.msu.ru/ ) и обновляются в режиме реального времени. Общая статистика Цифрового гербария МГУ на 3.12.2022 г.: образцов – 1 248 669; изображений – 1 227 368; видов – 39 827; геопривязок – 831 858; этикеток – 565 759; OCR – 670 640. Этап 8. Поддержка ЦГ МГУ. Производился непрерывно в режиме 365/7/24. Осуществлялся членами IT-команды для обеспечения распределенного доступа к данным как членов научной группы, так и пользователей. Устранено несколько десятков нестабильностей. Этап 9. Разработка портала. В 2022 г. создан новый модуль «Помогатор» Цифрового гербария МГУ (https://plant.depo.msu.ru/pomogator ). Это игровой модуль для волонтёров и, одновременно, полезный инструмент в повседневной гербарной работе. Тестовая версия «Помогатора» запущена в ноябре 2022 г. За месяц (т.е. в период тестирования системы) участниками дано 79 157 ответов – 58 868 ответов от сотрудников Гербария МГУ и 20 289 ответов от волонтёров. Этап 10. Подготовка картографических сервисов. Это ещё один этап, по которому получен прорывной результат: подготовлен, сгенерирован и выложен в открытый доступ комплект сеточных карт «Атласа флоры России» для 9 062 видов (около 80% флоры России). Карты для 2500 видов проверены и аннотированы. Предварительные карты «Атласа» доступны в Цифровом гербарии МГУ в паспорте каждого образца как в опен-версии (например, https://plant.depo.msu.ru/open/public/item/MW0009416), так и в полной карточке образца (например, https://plant.depo.msu.ru/open/module/itempublic?d=P&openparams=%5Bopen-id%3D1743789%5D , закладка «Атлас флоры России»). Этап 11. Подготовка публикаций. Полностью подготовлено и опубликовано к моменту сдачи промежуточного отчета за второй год проекта 3 статьи в журналах Web of Science Core Collection. Кроме того, издана 1 статья в журнале из Scopus и 4 публикации, индексируемых в РИНЦ. См. раздел публикации. Этап 12. Подготовка отчетов. Технический этап. Этап 13. Подготовка наборов данных для онлайн публикации. Этап 14. Интеграция сторонних наборов данных. Основой данных для «Атласа флоры России» стали данные, размещенные в GBIF. Общий объем данных по флоре сосудистых растений России в GBIF составляет 5 327 088 записей (в т.ч. из них 1,8 млн записей – это данные нашей научной группы, а еще 2,1 млн – это данные, которые мы курируем). Этап 15. Анализ данных. Была разработана 26-частная схема флористического районирования России на основе кластерного анализа сеточных данных. Филогенетическое районирование России на основании сеточных данных «Атласа» при современных разрешающих способностях метода удалось довести до 6 выделов. Итоговое шестичастное деление показывает хорошее расхождение неметрического многомерного шкалирования в пространстве филогенетических расстояний.

 

Публикации

1. Верхозина А.В., Анисимов А.В., Бешко Н.Ю., Бирюков Р.Ю., Бондарева В.В., Черных Д.В., Дорофеев Н.В., Дорофеев В.И., Эбель А.Л., Ефремов А.Н., Эрст А.С., Эсанов Х.К., Есина И.Г., Фатерыга А.В., Фатерыга В.В., Фоменко В.А., Гамова Н.С. и др. Findings to the flora of Russia and adjacent countries: New national and regional vascular plant records, 4 Botanica Pacifica, Vol. 11 (1). P. 129-157 (год публикации - 2022) https://doi.org/10.17581/bp.2022.11116

2. Гамова Н.С. Baikalsky State Nature Biosphere Reserve and its buffer zone: floristic data Biodiversity Data Journal, Vol. 10: e76946 (год публикации - 2022) https://doi.org/10.3897/BDJ.10.e76946

3. Гамова Н.С. Чужеродные виды растений в Байкальском заповеднике Труды Мордовского государственного природного заповедника имени П.Г. Смидовича, Вып. 31. С. 108-131. (год публикации - 2022) https://doi.org/10.24412/cl-31646-2686-7117-2022-31-108-131

4. Гамова Н.С., Коротков Ю.Н., Лясота И.В. Orchis militaris L. и другие флористические находки в Байкальском заповеднике Труды Мордовского государственного природного заповедника имени П.Г. Смидовича, Вып. 30. C. 111-156 (год публикации - 2022) https://doi.org/10.24412/cl-31646-2686-7117-2022-30-111-156

5. Кошовский Т.С., Геннадиев А.Н., Гамова Н.С., Фаронова Е.А., Язрикова Т.Е. Post-fire state of taiga soils and vegetation of the Khamar-Daban Range (Cisbaikalia) Eurasian Soil Science, Vol. 55, No. 9, pp. 1196–1208. (год публикации - 2022) https://doi.org/10.1134/S1064229322090101

6. Фон Рааб-Штраубе Э., Раус Т., Бартолуччи Ф., Бергмейер Э., Богданович С.А., Бондарева Л.В., Чорна Г., Димитров Д.С., Домина Г., Элефтериаду Э., Мокни Р.Э., Галассо Г., Гестри Г., Гианнакис Т., Хохла М., Хубатка П., ..., Серегин А.П. и др. Euro+Med-Checklist Notulae, 15 Willdenowia, Vol. 52. P. 273-299 (год публикации - 2022) https://doi.org/10.3372/wi.52.52205

7. Гамова Н.С. Чужеродные виды во флоре Байкальского заповедника и его охранной зоны Фитоинвазии: остановить нельзя сдаваться: мат-лы Всеросс. науч.-практ. конф. с международным участием (Москва, Ботанический сад биологического факультета МГУ, 10–11 февр. 2022 г.) / отв. ред. В. В. Чуб. - М.: Изд-во Моск. ун-та, 2022. - 494, [1] с. : ил., С. 133-138 (год публикации - 2022)

8. Серегин А.П. Проект «Флора России» на iNaturalist как источник данных о распространении, расселении и видовом составе адвентивной флоры страны Фитоинвазии: остановить нельзя сдаваться: мат-лы Всеросс. науч.-практ. конф. с международным участием (Москва, Ботанический сад биологического факультета МГУ, 10–11 февр. 2022 г.) / отв. ред. В. В. Чуб. - М.: Изд-во Моск. ун-та, 2022. - 494, [1] с. : ил., С. 59-65. (год публикации - 2022)

9. - В Цифровом гербарии МГУ опубликованы карты «Атласа флоры России» Поиск, https://poisknews.ru/themes/biologiya/v-czifrovom-gerbarii-mgu-opublikovany-karty-atlasa-flory-rossii/ (год публикации - )

10. - Участники проекта "Флора России" загрузили на портал 2 миллиона фото растений ТАСС.Наука, https://nauka.tass.ru/nauka/15332707 (год публикации - )

11. - Проект МГУ «Флора России» перешагнул отметку в два миллиона наблюдений растений Научная Россия, https://scientificrussia.ru/articles/proekt-mgu-flora-rossii-peresagnul-otmetku-v-dva-milliona-nabludenij-rastenij (год публикации - )


Аннотация результатов, полученных в 2023 году
Наиболее важными результатами в 2023 г. (третий год проекта из четырёх), которые уже сейчас определяют важнейшие достижения проекта, стали: Этап 6 (в части создания и размещения в открытом доступе базы данных «Vascular plants of the Soviet Far East (1985–2006)», 156 760 точек); Этап 10 (в части размещения в открытом доступе карт «Атласа флоры России» для 8793 видов сосудистых растений, в т.ч. 4882 полностью проверенные карты); Этап 15 (в части создания новой карты флористического районирования России). Этап 1. Подготовка и сканирование новых материалов. В 2023 г. в фонды Гербария МГУ поступило и было полностью обработано 14 354 образца (план не менее 12 тыс.). Общий объем физической коллекции достиг отметки в 1 121 615 образцов, по объемам фондовой коллекции это 59-й гербарий мира. Доля оцифрованных коллекций превышает 95%. В результате активного роста коллекций и инфраструктурных решений Гербарий Московского университета получил дополнительные институциональные голоса для голосования на Номенклатурной сессии Международного ботанического конгресса, который состоится в 2024 г. в Мадриде. Число голосов было увеличено с трёх до четырёх (или пяти). Окончательное решение будет опубликовано в феврале 2024 г. Этап 2. Геопривязка образцов по алгоритму ИСТРА; Этап 3. Геопривязка образцов ручная. За отчётный год мы впервые ввели в базу координаты для 82 132 образцов (планировалось, что будет привязано к координатам не менее 25 тыс. образцов – 15 тыс. шт. по алгоритму ИСТРА; 10 тыс. шт. ручных геопривязок). Однако результаты 2023 г. в этой части гораздо значительнее – мы заметно улучшили качество геоданных в результате планомерной ручной верификации автоматических геопривязок: так, с территории России за 2023 г. в базе было учтено 41,8 тыс. новых ручных геопривязок (было 406,2 тыс., стало 448,0 тыс.). Этап 4. Ввод текстовых данных с этикеток. По итогам 2023 г., достигнутые результаты заметно превосходят плановые – введено 64 тыс. этикеток (было 561 тыс., стало 625 тыс.) (планировалось, что будет введён в базу данных текст этикеток не менее 15 тыс. образцов). Эта работа не является приоритетной для «Атласа», однако она позволяет сократить время, необходимое для точной ручной геопривязки образцов (Этап 3). Кроме того, оцифровка текстовых данных стала эффективным инструментом для геопривязки образцов с помощью автоматических и полуавтоматических методов обработки текстового корпуса (Этап 4). Этап 5. Анализ пространственных пропусков. Результатами анализа пространственных пропусков стал ранжированный перечень атласов, флор и сводок, которые будут в приоритетном порядке переведены в формат базы данных для закрытия максимального числа квадратов. Этап 6. Оцифровка печатных атласов. Результаты работ по оцифровке 1135 карт по 4142 видам из восьмитомной сводки «Сосудистые растения Советского Дальнего Востока» (1985–1996) полностью размещены в открытом доступе по адресу https://doi.org/10.15468/pa3dv8 . Из этого источника после оцифровки карт мы получили следующее число новых записей по регионам: Чукотский АО – 17573 шт., Магаданская область – 10254 шт., Камчатский край – 22605 шт., Хабаровский край – 25428 шт., Амурская область – 18921 шт., ЕАО – 3323 шт., Приморский край – 38709 шт., Сахалинская область – 18817 шт., а также Якутия – 41 шт. Этап 7. Публикация материалов в ЦГ МГУ. Общее число геопривязок Цифрового гербария МГУ превышает 905 тыс., общее число введенных этикеток превышает 625 тыс. Эти результаты являются ключевыми индикаторами состояния проекта в части работы с гербарными коллекциями. Счетчики числа геопривязок и числа оцифрованных этикеток находится на главной странице портала (http://plant.depo.msu.ru/) и обновляются в режиме реального времени. Общая статистика Цифрового гербария МГУ на 29.11.2023 г.: образцов – 1297712, изображений – 1274394, видов – 36959, геопривязок – 905211, этикеток + OCR – 625329 + 660857. Этап 8. Поддержка ЦГ МГУ. Производился непрерывно в режиме 365/7/24. Осуществлялся членами IT-команды для обеспечения распределенного доступа к данным как членов научной группы, так и пользователей. Также на серверы Цифрового гербария МГУ переведена фундаментальная электронная библиотека «Флора и фауна», созданную А.Б. Шипуновым. После смерти основателя в декабре 2022 г. она едва не была утрачена (общий объем 16 437 наименований отсканированных книг по различным вопросам ботаники и зоологии и около 6 тыс. флор на иностранных языках). Доступно зеркало системы по адресу https://shipunov.depo.msu.ru/shipunov/school/sch-ru.htm Этап 9. Разработка портала. Работы по данному этапу в 2023 году не предполагались. Этап 10. Подготовка картографических сервисов. В качестве ключевого результата для проекта в 2023 году мы разместили в открытом доступе комплект обновлённых и отредактированных карт «Атласа флоры России», который содержит сеточные карты 8793 видов сосудистых растений, в т.ч. 4882 полностью проверенные карты. Обновлённые карты опубликованы в Цифровом гербарии МГУ. Прямые ссылки на комплект карты: https://plant.depo.msu.ru/module/collectionpublic?openparams=[open-id=301765963] https://plant.depo.msu.ru/open/public/search?collection=ATLAS https://plant.depo.msu.ru/open/public/search?searchBy=any&queryString=FLORUS%20ATLAS Этап 11. Подготовка публикаций. За третий год проекта полностью подготовлено и опубликовано 2 статьи в Q1-журналах Web of Science Core Collection (журналы «Molecular Biology and Evolution», «Ecology and Evolution»). Кроме того, издано 2 статьи в журналах, индексируемых в Scopus (журналы «Botanica Pacifica», «Ботанический журнал»). Этап 12. Подготовка отчетов. Технический этап. Этап 13. Подготовка наборов данных для онлайн публикации. Этап 14. Интеграция сторонних наборов данных. На 3.12.2022 г. по сосудистым растениям России поисковый модуль GBIF выдавал 5 137 464 находки (без учёта Крыма), а годом позже (30.11.2023 г.) ¬– 6 273 944 шт. Таким образом, за третий год практической реализации проекта данные по флоре России в GBIF выросли на 1 136 480 ед. Кроме того, имеется 220 354 находки по сосудистым растениям Крыма (только с геопривязками), что на 30 730 шт. больше, чем год назад (было 189 624 ед.). Таким образом, общий объем данных по флоре сосудистых растений России в GBIF составляет 6 494 298 записей. Этап 15. Анализ данных. Мы провели флористическое районирование России на основе датасета FLORUS23 с использованием кластерного и филогенетического анализа сеточных данных. Оно состоит из 26 безранговых районов, которым мы дали предварительные названия. Ниже приведен список районов и для каждого дан топ-вид с максимальным индикаторным значением IndVal. Ареалы этих видов наилучшим образом характеризуют получившиеся пространственные выделы: 1) Алтае-Саянский: Juniperus pseudosabina (0,57); 2) Становой: Salix alexii-skvortzovii (0,40); 3) Северо-Европейский: Melampyrum sylvaticum (0,31); 4) Уральский: Seseli krylovii (0,87); 5) Путоранский: Papaver variegatum (0,53); 6) Восточносибирский: Thesium repens (0,27); 7) Кавказский: Trifolium trichocephalum (0,92); 8) Кольско-Ямальский: Hieracium alpinum (0,47); 9) Курило-Сахалинский: Abies sachalinensis (0,85); 10) Крымско-Кубанский: Alyssum hirsutum (0,72); 11) Джугджурский: Crepis burejensis (0,39); 12) Курило-Камчатский: Cypripedium yatabeanum (0,55); 13) Корякский: Mertensia pubescens (0,40); 14) Даурский: Oxytropis myriophylla (0,75); 15) Верхоянский: Smelowskia jacutica (0,44); 16) Ишимский: Seseli strictum (0,69); 17) Среднеобский: Abies sibirica (0,20); 18) Урало-Донской: Stachys recta (0,62); 19) Среднерусский: Picea abies (0,46); 20) Маньчжурский: Vitis amurensis (0,71); 21) Прикаспийский: Artemisia pauciflora (0,76); 22) Гыдано-Новоземельский: Phippsia concinna (0,29); 23) Высокоарктический: Saxifraga platysepala (0,59); 24) Лено-Чукотский: Cardamine digitata (0,38); 25) Якутский: Papaver jacuticum (0,41); 26) Колымский: Eremogone tschuktschorum (0,22).

 

Публикации

1. Брожова В., Бульстад Й.С., Серегин А.П., Эйдесен П.Б. From everywhere all at once: Several colonization routes available to Svalbard in the early Holocene Ecology and Evolution, Volume 13 (3): e9892 (год публикации - 2023) https://doi.org/10.1002/ece3.9892

2. Колесникова У.К., Скотт А.Д., Ван де Велде Ж.Д., Бернс Р., Тихомиров Н.П., Пфордт У., Кларке А.Ц., Янт Л., Серегин А.П., Векеманс Х., Лорент С., Новикова П.Ю. Transition to self-compatibility associated with dominant S-allele in a diploid Siberian progenitor of allotetraploid Arabidopsis kamchatica revealed by Arabidopsis lyrata genomes Molecular Biology and Evolution, 40(7):msad122 (год публикации - 2023) https://doi.org/10.1093/molbev/msad122

3. Серегин А.П., Пашкина В.Н., Поспелов И.Н. Геоданные Гербария МГУ: структура данных и методика геопривязки Ботанический журнал, Т. 108 (5), с. 490–504 (год публикации - 2023) https://doi.org/10.31857/S0006813623050083

4. Чепинога В.В., Серегин А.П., Баркалов В.Ю., Эбель А.Л., Ефимов П.Г., Фризен Н.В., Гончаров А.А., Кечайкин А.А., Князев М.С., Коробков А.А., Королюк Е.А., Косачев П.А. и др. New combinations and new names in vascular plants of Asian Russia Botanica Pacifica, 12(2):120-133 (год публикации - 2023) https://doi.org/10.17581/bp.2023.12s06

5. - Проект «Флора России» собрал более 2,5 млн фотографий растений Наука.рф, https://наука.рф/news/proekt-flora-rossii-sobral-bolee-2-5-mln-fotografiy-rasteniy-/ (год публикации - )

6. - Проект МГУ «Флора России» преодолел отметку в 2,5 миллиона фотографий растений Научная Россия, https://scientificrussia.ru/articles/proekt-mgu-flora-rossii-preodolel-otmetku-v-25-milliona-fotografij-rastenij (год публикации - )

7. - Число фотографий растений краудсорсинг-проекта "Флора России" превысило 2,5 млн ТАСС, https://nauka.tass.ru/nauka/17721579 (год публикации - )