КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 23-78-10119

НазваниеИсторические информационные ресурсы в исследовательской инфраструктуре: модели репрезентации, анализа и интеграции данных по региональной истории

РуководительПолежаева Татьяна Владимировна, Кандидат исторических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский Томский государственный университет", Томская обл

Период выполнения при поддержке РНФ 07.2023 - 06.2026 

Конкурс№85 - Конкурс 2023 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 08 - Гуманитарные и социальные науки, 08-110 - Вспомогательные исторические дисциплины

Ключевые словаисторический источник, исторический информационно-аналитический ресурс, история Сибири, история православия, цифровые научные коммуникации, цифровое культурное наследие, открытая наука

Код ГРНТИ03.81.00


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Концепция «открытой науки», призывающая сделать результаты научных исследований доступными для широкой аудитории, в приложении к историческим наукам означает, в том числе, необходимость обеспечения свободного доступа к историческим источникам. С 1980-х гг. данная задача решалась путем массовой цифровизации материалов, хранящихся в институтах памяти (архивах, библиотеках, музеях). Однако, как показывают современные исследования, такие ресурсы остаются мало востребованными как профессиональными историками, так и обучающимися. Кроме того, отсутствуют методические разработки по источниковедческой критике создаваемых ресурсов, а также не выработаны принципы долговременного сохранения уже созданных оцифрованных коллекций. Обозначенный комплекс проблем требует переосмысления подходов к репрезентации исторических сюжетов в цифровой среде и формированию научно обоснованной модели исторических информационных ресурсов, учитывающей особенности бытования исторических источников в цифровой среде и цифровых научных коммуникаций. Такой подход составляет новизну исследования. Актуальность предлагаемого решения обеспечивается необходимостью раскрытия аналитического потенциала исторических информационных ресурсов, а также разработки научных принципов сохранения цифровых коллекций, что позволит спрогнозировать потенциальные перспективы и риски складывания нового формата научного знания и научных коммуникаций, а также создать условия для встраивания российского источниковедения в мировые исследовательские тенденции. Кроме того, сегодня как никогда актуален вопрос создания национальной исследовательской инфраструктуры для исторических наук, которая включала бы в себя сеть исследовательских коллективов и организаций, общие инструменты и технологии, стандарты работы, а также данные и информационные аналитические ресурсы. Таким образом, проект направлен на решение актуальных теоретико-методологических задач современного источниковедения, а также практических задач цифровой трансформации исторической науки и исторического образования.

Ожидаемые результаты
Ожидаемые результаты: 1. Новое проблемное поле на стыке информационных наук, науковедения и исторического источниковедения. 2. Модель оценки степени интеграции исторических информационных ресурсов в научные коммуникации и исследовательскую инфраструктуру. 3. Модель информационно-аналитического ресурса «Православный ландшафт таежной Сибири: акторы, институты, сети» 4. Карта рисков сохранности исторической информации в цифровой среде. Научная значимость 1. Определение междисциплинарных подходов к созданию национальной исследовательской инфраструктуры цифрового исторического и культурного наследия – комплексных информационных систем, объединяющих на технологическом уровне ресурсы учреждений хранения и памяти, их характеристика. 2. Разработка модели источниковедческого анализа исторических информационных ресурсов, включающей оценку степени их интеграции в цифровые научные коммуникации и оценку рисков сохранности в цифровой среде. 3. Разработка модели информационно-аналитического ресурса «Православный ландшафт таежной Сибири: акторы, институты, сети»: повышение информационного потенциала уже введенных в научный оборот источников с помощью цифровых инструментов работы с данными, установление различных зависимостей социальных, культурных и природных факторов и процессов формирования поселенческой и конфессиональной сети. По результатам исследования будет опубликовано не менее 8 статей, индексируемых Web of Science, Scopus, а также представлено не менее 4х докладов на мероприятиях всероссийского и международного уровней. Общественная значимость 1. Популяризация истории и культурного наследия Сибири. 2. Основа для проектов в области гражданской науки и самоархивирования. Соответствие результатов мировому уровню будет подтверждено участием в международных и всероссийских конференциях, проводимых авторитетными научными, научно-образовательными и культурными центрами, а также публикациями в в высокорейтинговых изданиях, индексируемых в базах данных «Сеть науки» (Web of Science Core Collection) и / или «Скопус» (Scopus). Ожидаемые результаты могут быть использованы: 1. В исследованиях по источниковедению и цифровой трансформации институтов памяти. 2. В библиотечном, музейном и архивном деле при проектировании платформ и сервисов для исследователей. 3. В курсе источниковедения для подготовки специалистов в области историко-культурного, библиотечного, музейного и архивного направлений. 4. В учебных практиках студентов по историческим и IT специальностям.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2023 году
В результате реализации первого этапа проекта была разработана аналитическая база данных «Библиотеки об истории Сибири», включившая 314 информационных ресурсов 189 центральных библиотек регионов и вузов Сибирского, Дальневосточного и Уральского федеральных округов. Указанные ресурсы были описаны по 35 параметрам. Созданный аналитический корпус включил разнородные источники по тематике (история организации, история региона, история страны), типу ресурса (полнотекстовые электронные библиотеки / коллекции, краеведческие порталы или веб-страницы, виртуальные выставки, электронные (био)-библиографические справочники), ценности (коллекции редких книг и книжных памятников). Было установлено, что среди указанных информационных ресурсов по объему данных превалируют оцифрованные источники, чаще всего размещенные в электронных библиотеках с использованием специального программного обеспечения (самые популярные программы – Ирбис, DSpace). Была описана модель репрезентации регионального исторического наследия библиотеками, в которой сохраняются принципы и практики работы с физическими объектами, перенесенные в цифровую среду. Зафиксированы «болевые точки» для историков в области провенанса цифровых коллекций, репликации объектов, принципов размещения объектов в коллекции и инструментов работы с ними. В качестве перспективной модели интеграции исторических информационных ресурсов библиотек в научные коммуникации предложено использование принципов «коллекции как данные» и происхождения данных (data lineage). Последний усложняет традиционную хронологию, фиксируя все изменения объекта в цифровой среде и рассматривая движение информации от источника по точкам обработки и применения. В качестве базового критерия определения востребованности ресурсов, создаваемых библиотеками, было определено цитирование коллекций. Оно определялось по ссылочному аппарату публикаций, проиндексированных в РИНЦ. Установлено, что лидерами по цитированию являются электронные библиотеки, реализованные на DSpace. Выделена характерная особенность исследовательского информационного поведения: предпочитают цитировать бумажную версию, даже если работали с электронной. Кроме того, в качестве косвенного критерия востребованности использовалось количество благодарностей библиотекарям, которые присутствуют в соответствующих разделах публикаций. Так, по базе Web of Science было подсчитано, что за 2019-2023 гг. российские историки поблагодарили библиотеки 356 раз, из них сибирские библиотеки получили 3 благодарности. В ходе реализации проекта была разработана карта рисков и угроз сохранности исторической информации в цифровой среде. Для оцифрованных ресурсов были выделены риски, возникающие: а) на этапе отбора и подготовки объекта для оцифровки, б) на этапе машинной обработки и ATR (automatic text recognition), в) публикации, обеспечения доступа и использования данных. Для born-digital материалов актуальна группа рисков в). Для текущей модели цифрового ресурса библиотек самой актуальной проблемой оказывается технологическая уязвимость. На ее преодоление могут быть направлены усилия государственной платформы Гостех (модуль «Наука» сейчас находится в разработке). Перспективными представляются разработки Solid( social linked data) Тима Бернерс Ли и проект пост-платформ А. Турского. Отдельно были описаны риски, связанные с внедрением искусственного интеллекта в технологические процессы библиотек. Абрис текущей модели информационных ресурсов библиотек позволил перейти к проектированию научно обоснованной модели информационно-аналитического ресурса «Православный ландшафт таежной Сибири: акторы, институты, сети». На первом этапе проекта был сформирован перечень и дана характеристика методологических и методических подходов к представлению источников тематически связанных с конфессиональной (православной) историей региона, в том числе: а) обоснован подход к изучению и цифровой презентации религиозного ландшафта региона как системы официальных и неформальных социальных сетей, конкуренция которых продуцирует разные информационные потоки, формирует разные образы «православной Сибири» и разные типы стейкхолдеров, заинтересованных в их трансляции; б) определены параметры и содержание базовой, дополняющей и генерируемой информации онлайн ресурса с учетом задач развития «цифрового источниковедения» и использования born-digital материалов для расширения источниковой базы по религиозной истории региона и изучения процессов формирования групповых идентичностей и солидарностей (территориальных, религиозных, этнических и пр.). Введена типология религиозных ландшафтов (древовидный и ризомный), которая в перспективе позволит визуализировать и учитывать основные конституирующие факторы православного ландшафта таежной Сибири – церковно-государственную программу строительства приходской жизни, интеллектуальную и хозяйственную активность старообрядческого населения. Разработаны алгоритмы сбора конкретно-исторических данных и их хранения в цифровом формате, нацеленные: а) на раскрытие связей между разными социальными акторами и институтами, качеством приходской жизни и популярностью официальных и неофициальных культовых мест, ареалами распространения канонических и неканонических религиозных практик (шаблон сбора данных включает 31 тематическую группу с 335 привязанными к географическим координатам дескрипторами); б) на обеспечение безопасного хранения и расширения цифровых данных, их анализа историческими и математическими методами. По материалам епархиальной печати и клировых ведомостей приходов Томского уезда составлена база данных (в настоящее время – 3690 записей). Уточнены принципы и алгоритмы соединения и взаимной проверки нарративных и статистических источников при формировании фактографической базы онлайн ресурса. Использование типологии исторических данных (повторяющаяся, верифицируемая, уникальная информация) позволило определить региональные составляющие церковно-государственной презентации образа «православной Сибири» на рубеже XIX–XX вв., выявить новые корреляции между редакторской политикой и объемами предоставляемой информации о приходской жизни. С помощью математического анализа клировых ведомостей обнаружены разрывы и противоречия в создаваемой «сверху» и стихийно возникающей «снизу» сети религиозных сообществ региона (в числе новых данных – установленные зависимости между возрастом, образованием, опытом священников и темпами школьного строительства в приходах с большим числом староверов). Материалы будут использованы для комплексного представления половозрастного и этноконфессионального состава старожилов и переселенцев, проверки математическими методами их потенциальной готовности связывать свою религиозную жизнь с конкретными культовыми местами и конфессиональными лидерами. В ходе реализации проекта было опубликовано 3 научных статьи, принято участие в 4 научных конференциях.

 

Публикации

1. - Археографическая практика: «муравьиная работа» или опыт вхождения в современную науку? Сайт Научной библиотеки Томского государственного университета, 18 июля 2023 г. (год публикации - )

2. Болдовская Т.Е., Гресь В.И., Ветров А.Е. Историческая иммортализация: эффективные методы долгосрочного хранения исторических данных Математические структуры и моделирование, - (год публикации - 2023)

3. Дутчак Е.Е., Болдовская Т.Е. Историк в пространстве междисциплинарности: взгляд студентов Вестник Томского государственного университета, №500. С.5-14. (год публикации - 2024) https://doi.org/10.17223/15617793/500/1

4. Полежаева Т.В. О проблеме сохранения научных данных в цифровой среде Университетская книга, №9. С. 59-61 (год публикации - 2023)

5. Полежаева Т.В., Сасина О.А. Роль библиотек в информационной инфраструктуре исторической науки Научные и технические библиотеки, - (год публикации - 2024)