КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер проекта 24-24-00460
НазваниеТехнологии мобилизации первичной информации о биоразнообразии: от литературного наследия к озеру данных
Руководитель Созонтов Артём Николаевич, Кандидат биологических наук
Организация финансирования, регион федеральное государственное бюджетное учреждение науки Институт экологии растений и животных Уральского отделения Российской академии наук , Свердловская обл
Конкурс №89 - Конкурс 2023 года «Проведение фундаментальных научных исследований и поисковых научных исследований малыми отдельными научными группами»
Область знания, основной код классификатора 04 - Биология и науки о жизни; 04-107 - Экология биосистем
Ключевые слова Информатика биоразнообразия, экология, зоология, биогеография, биоразнообразие, мониторинг, охрана природы, геоэкология, геоинформационные технологии, ГИС, большие данные, пауки, Урал
Код ГРНТИ34.35.00
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Состояние и функционирование экосистем определяет благополучие человека, обеспечивая плодородие почв, пищевую безопасность, предоставляя чистый воздух, воду и другие жизненно важные ресурсы. Состояние экосистем находится в теснейшей связи с их ключевым компонентом -- биоразнообразием. Очевидно, что его изучение должно осуществляться в соответствии с мировыми стандартами качества, поскольку первичные данные о биоразнообразии лежат в основе принятия управленческих решений в сельском и лесном хозяйстве, в природоохранной деятельности и здравоохранении. Эффективность этих решений и глубина нашего понимания функционирования экосистем критически зависят от первичных данных о биоразнообразии, их качестве, доступности, репрезентативности.
Подходы, применяемые для управления данными о биоразнообразии, существенно продвинулись за последнее десятилетие, но все ещё не в полной мере используют арсенал существующих способов обработки данных и машинного обучения. Для сокращения этого отставания мы планируем применить существующие вычислительные технологии к решению насущных и актуальных задач современной экологии. Будут разработаны и подготовлены к масштабированию технологии интенсивного извлечения первичных данных о распространении и разнообразии живых организмов из множества опубликованных статей, монографий и других печатных материалов, их переноса в цифровой формат в соответствии с современными стандартами.
В результате реализации проекта будет разработано онлайн-приложение для оцифровки литературных данных о находках живых организмов. Приложение будет оснащено модулями интеграции данных об условиях окружающей среды и видовых характеристиках организмов, анализа и визуализации всего комплекса данных. К оцифровке литературных источников планируется привлечь волонтеров в рамках проекта гражданской науки (Citizen Science). В качестве модельного таксона и региона выбраны пауки и Урал соответственно. Кроме Citizen Science, мы применим технологии Data Science, а именно натренируем нейросеть для извлечения данных о биоразнообразии из литературы. Полученный набор данных будет размещен в сети вместе с инструментами анализа и визуализации, а также в виде цифровой копии на ведущих репозиториях для данных о биоразнообразии. Квалификация рабочего коллектива соответствует задачам проекта, а сами задачи – современному мировому уровню развития информатики биоразнообразия.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Аннотация результатов, полученных в 2024 году
Для оцифровки данных о находках биологических организмов разработана, протестирована, оптимизирована и в штатном режиме развернута цифровая инфраструктура. Она состоит из базы данных, двух онлайн-приложений, облачного хранилища и телеграм-бота. Веб-приложение “Faunistica 2.0” служит непосредственно для ввода данных из публикаций и его использование кратно ускоряет этот процесс. Веб-приложение “Arachnolibrary” служит для управления списком публикаций, хранения и доступа к их полным текстам. Статья об архитектуре, интерфейсе и функционале первого веб-приложения подготовлена, второго приложения – подготовлена и опубликована. Телеграм-бот задействован для регистрации пользователей и управления их учетными записями.
На данный момент библиография по арахнологическим публикациям постсоветского пространства, собранная на Arachnolibrary, содержит 5300 записей с полным набором метаданных. К 1500 источникам прикреплены полные тексты. Из публикаций по Уральскому региону в базе представлено 370 публикаций. Из них 140 не содержат первичный материал или даже упоминания видов и, таким образом, не содержат данных для извлечения.
Сформированы наборы данных по административному делению субъектов РФ, относящихся к Уральскому региону, а также таксономическим названиям видов, которые могут быть отмечены в публикациях. Оба эти набора иерархически структурированы и позволяют во время ввода информации задействовать такие функции как сужение перечня вариантов, автоподстановка и автодополнение.
Запущен проект научного волонтерства по оцифровке арахнологической литературы. Его продвижение осуществлялось на оффлайн-мероприятиях, суммарно охвативших аудиторию более 1000 человек, а также в СМИ и в сети Интернет. Описание проекта размещено на федеральной платформе добро.рф (https://dobro.ru/event/10873785), кроме того информация размещена непосредственно в онлайн-приложении. В социальных сетях проекта размещено 86 постов о проекте, пауках и оцифровке данных, просмотренных суммарно более 20 000 раз. За четыре последних месяца на участие зарегистрировалось 80 пользователей, внесших 1430 записей из 30 публикаций.
Результаты работы первого года представлены в виде докладов на девяти конференциях международного и всероссийского уровня: “34th European Congress of Arachnology” (Ренн, Франция), “XIX International Colloquium on Soil Zoology (ICSZ)” (Кейптаун, ЮАР), “XIII Популяционный семинара памяти Н. В. Глотова” (Нижний Тагил), LVIII Всероссийская конференция молодых ученых “Экология: факты, гипотезы, модели” (Екатеринбург), IX Всероссийская конференция с международным участием “Горные экосистемы и их компоненты” (Нальчик), Международное совещание “Сохранение и рациональное использование лесных генетических ресурсов” и “Продуктивность лесов в условиях меняющегося климата” (Петрозаводск), “Математическая биология и биоинформатика” (Пущино), Всероссийская конференция “80 лет экологической науке на Урале” (Екатеринбург), Международный симпозиум “Данные о биоразнообразии гор и пустынь Евразии” и тренинге “BioDATA Advanced– Accelerating biodiversity research through DNA barcodes, collection and observation data” (Алматы, Казахстан).
Публикации
1. Плакхина Е.В., Соколова С.С., Digitizing biodiversity data of soil invertebrates: Citizen science initiative starting with spiders XIX International Colloquium on Soil Zoology. Cape Town, South Africa. 2024. P. 120., XIX International Colloquium on Soil Zoology. Cape Town, South Africa. 2024. P. 120. (год публикации - 2024)
2. Соколова С.С., Плакхина Е.В., Созонтов А.Н. Оцифровка данных о пауках Урала в рамках проекта научного волонтёрства Материалы IX Всероссийской конференции «Горные экосистемы и их компоненты». Нальчик: Институт экологии горных территорий, 2024. С. 101–106., Мат. IX Всероссийской конференции «Горные экосистемы и их компоненты». Нальчик: Институт экологии горных территорий, 2024. С. 101–106. (год публикации - 2024)
3.
Созонтов А.Н., Михайлов К.Г.
Arachnolibrary: digital library for arachnological literature
Invertebrate Zoology, Vol. 21. № 4. P. 526–533. (год публикации - 2024)
10.15298/invertzool.21.4.08
4. Созонтов А.Н. Digitizing spider biodiversity data: from literature legacy to digital lake 34th European Congress of Arachnology. Rennes, France: Rennes University, 2024. P. 21., 34th European Congress of Arachnology. Rennes, France: Rennes University, 2024. P. 21. (год публикации - 2024)
5.
Иванова Н.В., Шашков М.П., Созонтов А.Н., Филиппова Н.В.3, Ермолов С.А.4, Соколова С.С.2,5, Устинова А.Л.6, Плакхина Е.В.
Опыт реализации региональных проектов оцифровки литературного наследия
Доклады Международной конференции “Математическая биология и биоинформатика”.
Т. 10. № e55. C. 1–5., Доклады Международной конференции “Математическая биология и биоинформатика”.
Т. 10. № e55. C. 1–5. (год публикации - 2024)
10.17537/icmbb24.53
6. Созонтов А.Н., Ухова Н.Л., Есюнин С.Л. Открытые данные многолетнего мониторинга пауков висимского биосферного заповедника Проблемы популяционной биологии: материалы XIII Всероссийского популяционного семинара с международным участием. Нижний Тагил: Нижнетагильский государственный социально-педагогический институт, 2024. С. 420–427., Проблемы популяционной биологии: материалы XIII Всероссийского популяционного семинара с международным участием. Нижний Тагил: Нижнетагильский государственный социально-педагогический институт, 2024. С. 420–427. (год публикации - 2024)
7. Созонтов А.Н., Иванова Н.В., Соколова С.С., Устинова А.Л., Плахина Е.В. Пауки России в GBIF: современное состояние и перспективы расширения данных Всероссийская конференция «Продуктивность лесов в условиях меняющегося климата». Тезисы докладов. Петрозаводск: КарНЦ РАН, 2024. С. 96. , Всероссийская конференция «Продуктивность лесов в условиях меняющегося климата». Тезисы докладов. Петрозаводск: КарНЦ РАН, 2024. С. 96. (год публикации - 2024)
8.
Михайлов Ю.Е., Ермаков А.И., Есюнин С.Л., Созонтов А.Н.
Паукообразные горных вершин Южного Урала
Фауна Урала и Сибири, 2025. № 1. С. 15-33. (год публикации - 2025)
10.5281/zenodo.17062948
9.
Плакхина Е.В., Созонтов А.Н., Есюнин С.Л., Иванова Н.В., Шумигай Д.В.
Spiders (Arachnida: Araneae) of PSU’s Botanical Garden (Perm, Russia)
Biodiversity Data Journal, 2025. Vol. 13. No. 163152. P. 1-20. (год публикации - 2025)
10.3897/BDJ.13.e163152
10.
Созонтов А.Н., Филиппова Н.В.
Подготовка и публикация статей о данных
Фауна Урала и Сибири, 2025. № 1. С. 6-14. (год публикации - 2025)
10.5281/zenodo.17062738
11. Иванова Н.В., Шашков М.П., Созонтов А.Н. Проблемы использования объединенных данных о биоразнообразии для моделирования потенциальных ареалов видов Математическое моделирование в экологии, Материалы Девятой Национальной научной конференции с международным участием, 2-4 апреля 2025 г. Пущино, ФИЦ ПНЦБИ РАН, 2025. С. 32-34. (год публикации - 2025)
12. Фурсов К.С., Соколова С.С., Плакхина Е.В., Устинова А.Л., Созонтов А.Н. Научное волонтерство в изучении биоразнообразия: подход к организации проекта и исследованию мотивации с использованием смешанной методологии [=Citizen Science in Biodiversity Studies: Project Design and Motivation Research Using a Mixed-Methods Approach] СОЦИОЛОГИЯ НАУКИ И ТЕХНОЛОГИЙ, Вып. 1. (год публикации - 2026)
13. Созонтов А.Н., Иванова Н.В., Плакхина Е.В., Соколова С.С., Устинова А.Л. Оцифровка арахнологического литературного наследия: итоги первого года работы 80 лет экологической науке на Урале: материалы всероссийской научной конференции с международным участием, 80 лет экологической науке на Урале: материалы всероссийской научной конференции с международным участием, посвященной 80-летию Института экологии растений и животных УрО РАН, г. Екатеринбург, 11–15 ноября 2024 г. Екатеринбург: Реэкшен, 2024. С. 209-211. (год публикации - 2024)
Аннотация результатов, полученных в 2025 году
За отчётный период достигнуты значительные результаты по всем ключевым для привлечения волонтеров к извлечению научной информации направлениям: развито онлайн-сообщество, проведён комплекс популяризаторских мероприятий, расширен функционал платформы, обеспечена интеграция с академической средой и подготовлена к публикации аналитическая статья, суммирующая научно-методические выводы проекта. Сообщество активно, продолжает пополняться, а подходы, показавшие свою эффективность, приняты “на вооружение” коллегами. Сам проект научного волонтерства перешел в зрелую фазу и был трижды упомянут на федеральных и международных мероприятиях в качестве примера флагманского проекта научного волонтерства.
Более 400 человек прошло полноценную регистрацию. Это число прирастает стабильно почти на +1 ежедневно. По состоянию на 10.12.2025 всего волонтерами внесено более 34 000 неуникальных записей – заложен запас на перекрестную валидацию. Динамика поступления записей лавинообразная – их большая часть пришлась на последние месяцы реализации проекта.
Извлеченные из литературы данные были выверены специалистами, стандартизированы и размещены в свободном доступе на IPT ИЭРиЖ УрО РАН и зарегистрированы на портале gbif, где стали доступны штатными средствами поиска. Кроме того, данные размещены на собственном портале, предназначенном для поиска информации о находках видов. Данные предоставляются их в виде полных и сокращенных таблиц, интерактивной карты, могут быть сопровождены информацией об экологических характеристиках (traits) видов, а также климатических и физико-географических параметрах мест их обнаружения.
В 2025 г. доклады, содержащие сведения о результатах работы по данному проекту, были представлены на одиннадцати научных и научно-образовательных мероприятиях международного, всероссийского и регионального уровня. Инструменты и технологии оцифровки литературных данных о биоразнообразии, разрабатываемые в рамках проекта, получили положительную оценку со стороны специалистов, некоторые из них выразили намерение адаптировать опыт проекта под изучаемые ими регионы и/или группы организмов.
Публикации
1. Плакхина Е.В., Соколова С.С., Digitizing biodiversity data of soil invertebrates: Citizen science initiative starting with spiders XIX International Colloquium on Soil Zoology. Cape Town, South Africa. 2024. P. 120., XIX International Colloquium on Soil Zoology. Cape Town, South Africa. 2024. P. 120. (год публикации - 2024)
2. Соколова С.С., Плакхина Е.В., Созонтов А.Н. Оцифровка данных о пауках Урала в рамках проекта научного волонтёрства Материалы IX Всероссийской конференции «Горные экосистемы и их компоненты». Нальчик: Институт экологии горных территорий, 2024. С. 101–106., Мат. IX Всероссийской конференции «Горные экосистемы и их компоненты». Нальчик: Институт экологии горных территорий, 2024. С. 101–106. (год публикации - 2024)
3.
Созонтов А.Н., Михайлов К.Г.
Arachnolibrary: digital library for arachnological literature
Invertebrate Zoology, Vol. 21. № 4. P. 526–533. (год публикации - 2024)
10.15298/invertzool.21.4.08
4. Созонтов А.Н. Digitizing spider biodiversity data: from literature legacy to digital lake 34th European Congress of Arachnology. Rennes, France: Rennes University, 2024. P. 21., 34th European Congress of Arachnology. Rennes, France: Rennes University, 2024. P. 21. (год публикации - 2024)
5.
Иванова Н.В., Шашков М.П., Созонтов А.Н., Филиппова Н.В.3, Ермолов С.А.4, Соколова С.С.2,5, Устинова А.Л.6, Плакхина Е.В.
Опыт реализации региональных проектов оцифровки литературного наследия
Доклады Международной конференции “Математическая биология и биоинформатика”.
Т. 10. № e55. C. 1–5., Доклады Международной конференции “Математическая биология и биоинформатика”.
Т. 10. № e55. C. 1–5. (год публикации - 2024)
10.17537/icmbb24.53
6. Созонтов А.Н., Ухова Н.Л., Есюнин С.Л. Открытые данные многолетнего мониторинга пауков висимского биосферного заповедника Проблемы популяционной биологии: материалы XIII Всероссийского популяционного семинара с международным участием. Нижний Тагил: Нижнетагильский государственный социально-педагогический институт, 2024. С. 420–427., Проблемы популяционной биологии: материалы XIII Всероссийского популяционного семинара с международным участием. Нижний Тагил: Нижнетагильский государственный социально-педагогический институт, 2024. С. 420–427. (год публикации - 2024)
7. Созонтов А.Н., Иванова Н.В., Соколова С.С., Устинова А.Л., Плахина Е.В. Пауки России в GBIF: современное состояние и перспективы расширения данных Всероссийская конференция «Продуктивность лесов в условиях меняющегося климата». Тезисы докладов. Петрозаводск: КарНЦ РАН, 2024. С. 96. , Всероссийская конференция «Продуктивность лесов в условиях меняющегося климата». Тезисы докладов. Петрозаводск: КарНЦ РАН, 2024. С. 96. (год публикации - 2024)
8.
Михайлов Ю.Е., Ермаков А.И., Есюнин С.Л., Созонтов А.Н.
Паукообразные горных вершин Южного Урала
Фауна Урала и Сибири, 2025. № 1. С. 15-33. (год публикации - 2025)
10.5281/zenodo.17062948
9.
Плакхина Е.В., Созонтов А.Н., Есюнин С.Л., Иванова Н.В., Шумигай Д.В.
Spiders (Arachnida: Araneae) of PSU’s Botanical Garden (Perm, Russia)
Biodiversity Data Journal, 2025. Vol. 13. No. 163152. P. 1-20. (год публикации - 2025)
10.3897/BDJ.13.e163152
10.
Созонтов А.Н., Филиппова Н.В.
Подготовка и публикация статей о данных
Фауна Урала и Сибири, 2025. № 1. С. 6-14. (год публикации - 2025)
10.5281/zenodo.17062738
11. Иванова Н.В., Шашков М.П., Созонтов А.Н. Проблемы использования объединенных данных о биоразнообразии для моделирования потенциальных ареалов видов Математическое моделирование в экологии, Материалы Девятой Национальной научной конференции с международным участием, 2-4 апреля 2025 г. Пущино, ФИЦ ПНЦБИ РАН, 2025. С. 32-34. (год публикации - 2025)
12. Фурсов К.С., Соколова С.С., Плакхина Е.В., Устинова А.Л., Созонтов А.Н. Научное волонтерство в изучении биоразнообразия: подход к организации проекта и исследованию мотивации с использованием смешанной методологии [=Citizen Science in Biodiversity Studies: Project Design and Motivation Research Using a Mixed-Methods Approach] СОЦИОЛОГИЯ НАУКИ И ТЕХНОЛОГИЙ, Вып. 1. (год публикации - 2026)
13. Созонтов А.Н., Иванова Н.В., Плакхина Е.В., Соколова С.С., Устинова А.Л. Оцифровка арахнологического литературного наследия: итоги первого года работы 80 лет экологической науке на Урале: материалы всероссийской научной конференции с международным участием, 80 лет экологической науке на Урале: материалы всероссийской научной конференции с международным участием, посвященной 80-летию Института экологии растений и животных УрО РАН, г. Екатеринбург, 11–15 ноября 2024 г. Екатеринбург: Реэкшен, 2024. С. 209-211. (год публикации - 2024)
Возможность практического использования результатов
Экономическая сфера
- Формирование технологического задела для цифровизации данных о биоразнообразии.
- Создание масштабируемой программной платформы для оцифровки научной и природоохранной информации.
- Снижение затрат на обработку и интеграцию литературных данных за счёт автоматизации и стандартизации.
- Поддержка принятия управленческих решений в природопользовании, лесном и сельском хозяйстве, ООПТ, экологическом мониторинге.
- Основа для разработки прикладных сервисов и аналитических продуктов (ГИС-сервисы, экспертные системы, отчётность).
- Возможность тиражирования технологий для коммерческих и некоммерческих проектов в сфере биоинформатики и экологии.
Социальная сфера
- Развитие научного волонтерства и гражданской науки.
- Повышение научной грамотности и вовлечённости населения в исследовательскую деятельность.
- Создание доступной образовательной цифровой среды для работы с научными данными.
- Поддержка межрегионального и международного научного сотрудничества.
- Сохранение и актуализация научного и природного наследия.
Научно-технологическое развитие
- Формирование воспроизводимой методологии оцифровки литературных данных о биоразнообразии.
- Создание универсальных цифровых инструментов, адаптируемых к различным регионам и таксономическим группам.
- Интеграция российских данных в международные научные инфраструктуры при сохранении национального контроля над источниками.
- Подготовка кадров и развитие компетенций в области цифровой экологии, биоинформатики и управления данными.