«Основной принцип работы системы — адаптивная форма паспорта образца, которая изначально вмещает минимум информации, присущей каждому образцу независимо от типа биоматериала и коллекции: данные о том, где и каким образом был получен образец, а также информацию о живом организме, из которого взят материал. Остальная часть паспорта настраивается так, чтобы оптимально и полно отражать сведения, специфичные для разных живых существ и единиц хранения, от бактерий до животных», — сообщает научный координатор проекта «Ноев ковчег», ведущий научный сотрудник биологического факультета МГУ Петр Каменский.
Система предусматривает автоматическую загрузку уже известных сведений о хранящихся организмах из авторитетных международных баз данных, таких как Catalog of Life, NCBI GenBank и другие. Таким образом, паспорт образца может содержать самую разнообразную информацию, вплоть до последовательности генома организма.
Создание столь масштабной электронной системы требует строгой упорядоченности образцов, для чего было произведено штрихкодирование. Каждому образцу был присвоен уникальный штрих-код, который наносится непосредственно на образец. Сфотографировав штрих-код обычным смартфоном, можно за доли секунды найти в базе данных всю доступную информацию о данном образце, загрузить его паспорт. Разработчики планируют создать удобный инструментарий для работы с информацией, содержащейся в системе, и внедрить возможность оформления онлайн-заявки для получения биологического материала как внутренним, так и сторонним пользователям.
Число доступных в системе образцов постоянно увеличивается за счет загрузки новых коллекций и добавления информации из уже имеющихся. «На данный момент в систему загружено около 510 тыс. образцов, 500 тыс. из которых — гербарные образцы, а около 10 тыс. — подробно охарактеризованные микроорганизмы. Для них, помимо микрофотографий, в систему загружены подробные описания, вплоть до предпочитаемого «меню» и «отпечатков пальцев» (фрагментов последовательностей генома). К концу 2018 года мы планируем загрузить в информационную систему все образцы, которые есть в коллекциях МГУ», — говорит Петр Каменский.
Информационная система разработана с таким расчетом, чтобы в ней могли размещаться данные по коллекциям не только МГУ, но и других научных организаций. Таким образом, впервые создан прототип системы, способной объединить в информационном поле все российские биоколлекции.
«Сейчас в системе находится 19 коллекций, процесс инвентаризации, оцифровки и загрузки данных продолжается. Физически коллекции Депозитария МГУ располагаются в тех лабораториях, в которых с ними работают. Если взять биологический факультет, то там находится как минимум сто коллекций. Раньше владельцы коллекций друг про друга знали мало, и, соответственно, пользоваться коллекциями могли только те люди, которые непосредственно с ними работали. С вводом в действие нашей информационной системы ситуация кардинально поменялась», — говорит Петр Каменский.
Представленные в системе данные и организмы уже активно используются в работе учеными, что отражено в опубликованных ими статьях, последние из которых вышли в журналах PLOS ONE, Molecular Phylogenetics and Evolution и Photosynthesis Research.
Создание информационной системы Депозитария МГУ имени М.В. Ломоносова проходит в рамках гранта Российского научного фонда «Научные основы создания Национального банка-депозитария живых систем».