КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер проекта 23-28-10074
НазваниеАнализ имиджа города Архангельска в социальных медиа с помощью технологий больших данных
Руководитель Казяба Виктория Викторовна, Кандидат филологических наук
Организация финансирования, регион Федеральное государственное автономное образовательное учреждение высшего образования "Северный (Арктический) федеральный университет имени М. В. Ломоносова" , Архангельская обл
Конкурс №76 - Конкурс 2023 года «Проведение фундаментальных научных исследований и поисковых научных исследований малыми отдельными научными группами» (региональный конкурс)
Область знания, основной код классификатора 08 - Гуманитарные и социальные науки; 08-451 - Филология
Ключевые слова большие данные, big data, имидж города, Архангельск, социальные медиа, интернет, seo-анализ, корпус текстов, цифровизация, датабанк, датасет
Код ГРНТИ16.01.29
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Проект посвящен изучению имиджа города Архангельска в социальных медиа с помощью технологий больших данных (big data). Являясь неотъемлемой частью стратегического управления городом, имиджевая политика и продвигаемый образ территориального образования выступают важными инструментами для привлечения инвестиций и туристов, регулирования социально-экономических и культурных процессов и иных задач муниципального значения.
Архангельск, как столица Поморья, обладает всеми признаками геопродукта, который должен быть эффективным в процессе конкурентной борьбы на внешних и внутренних рынках. Архангельск, имея очевидные устойчивые проблемы с оттоком населения, не самое выигрышное и климатически благоприятное географическое расположение, нуждается в особенно мощной и одновременно гибкой маркетинговой стратегии преподнесения инвестиционных и прочих имиджевых преимуществ на основе объективных данных.
Применение способов работы с большим количеством разнообразных данных может не только ускорить и облегчить аналитические процессы городского маркетинга и даже управления, но и алгоритмизировать их, полностью автоматизировав. Создание алгоритма сбора, разметки, оценки и анализа больших данных о городском имидже с помощью машинных и ручных способов является магистральной проблемой проекта.
Актуальность проекта обусловлена совокупностью факторов: стратегической функцией управления имиджем города; обострившейся конкурентной борьбой между территориальными образованиями; инвестиционным потенциалом удачной имиджевой стратегии города; объективными социально-экономическими проблемами города Архангельска; отсутствием автоматизированных цифровых возможностей оценки и аналитики имиджа города на основе больших массивов данных; потребностью в динамическом наблюдении имиджмейкеров за обратной связью от городских потребителей и ньюсмейкеров; вниманием к региональной культуре и ее конкурентным преимуществам.
В рамках проекта впервые предлагается комплексный подход к проблеме оценки имиджа города в контексте концепции digital humanities и с применением технологий big data. Специально создаваемое под цели проекта программное обеспечение гарантирует объемный и релевантный общим и специальным задачам маркетинговых исследований массив данных. Интеграция в классический исследовательский процесс автоматизированных, цифровых программных продуктов позволит наряду с ручным анализом произвести качественно-количественную оценку урбанистического имиджа Архангельска в социальных медиа как на лингвистическом, так и на экстралингвистическом уровнях. Широкое понимание границ имиджевого поля города в социальных медиа - от официальных медиаресурсов с текстовыми публикациями до социальных сетей и частных комментариев в них - позволяет впервые произвести достоверный анализ и сопоставление имиджа Архангельска с позиций разных потребителей геопродукта. Комплексный анализ характеристик изучаемых текстов с маркетинговых позиций позволяет всесторонне раскрыть брендинговый, имиджевый и инвестиционный потенциал Архангельска с возможностью дальнейшей корректировки. Социально-экономические факторы имиджа города рассматриваются и интерпретируются вместе с культурными и лингвокультурными данными. Будет предпринята попытка формирования интернет-лексикона Архангельска, как важной части вербального имиджа города, отражающего региональную идентичность горожан, своеобразие их мышления и мировидения.
Новизна подтверждается задачей создания алгоритма по сбору, оценке и анализу имиджевых данных города с применением технологий больших данных для динамического применения в практике управления любым территориальным образованием.
Предполагаемые результаты значимы со стратегических, социально-экономических и культурных позиций для развития и продвижения региона на внешних и внутренних рынках. Также проект обеспечивает взаимопроникновение цифровых технологий и гуманитарных исследовательских подходов для достижения новых экономических вызовов.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Публикации
1. Казяба В.В., Щипицина Л.Ю. Urban – media – verbal: теоретическая модель вербального имиджа города в социальных медиа Научный результат. Вопросы теоретической и прикладной лингвистики», Том 9, Выпуск № 4, 2023 (год публикации - 2023)
Аннотация результатов, полученных в 2024 году
В отчетный период реализации плана работ (2024г.) проектным коллективом были достигнуты все поставленные задачи.
В ходе ряда официальных встреч проектный коллектив определил формы сотрудничества с представителями Администрации Архангельска по части обмена данными об имидже города.
Завершены работы по фундаментальным исследованиям феномена городского имиджа в социальных медиа, а также определен и описан методологический и инструментальный аппарат урбанистических исследований. Созданная для исследования имиджа Архангельска источниковая матрица насчитывает 52 социальных медиа официального и неофициального статуса, реализующих коммуникативную, информационно-развлекательную и рефлексивно-потребительскую функции. На основе сплошного анализа источников обоснована необходимость использования технологии больших данных для имиджевых исследований городских пространств в социальных медиа. Для каждого типа источника выработана собственная методика и подходы к отбору материала (наличие/ отсутствие триггерных слов, определение периода публикаций и др.), а также ключевые критерии (размер аудитории читателей, открытость и доступность контента, периодичность публикации и т.д.). Основной объем работ был связан с улучшением и расширением функциональных возможностей специально созданного проектным коллективом в 2023 году программного обеспечения (веб-приложения) с авторской архитектурой и оригинальным интерфейсом, реализующего агрегацию, хранение и анализ текстов по заданным параметрам и источникам. В 2024 году улучшена система поиска и машинной предобработки текстов, разработан алгоритм и интерфейсы для ручного и автоматического анализа данных, внедрен и апробирован новый дополнительный вид анализа – геолокационный, реализован сервис подсчета и вывод статистических данных анализа с возможностью обращения к картотеке примеров, представлена возможность формирования отдельных баз данных из общего массива больших данных с последующим разбиением материала на отдельные источниковые категории – датасеты, с целью проведения сопоставительных исследований между разными источниками и каналами продвижения городского имиджа. Сохранены и улучшены функции поиска по массиву отобранных публикаций, а также среди относящихся к ним комментариев. Для сравнительного анализа переработан сервис ручного анализа текстов и интерфейс отображения статистики. Добавлена возможность выбора и просмотра статистики по карточкам анализируемых текстов по принадлежности к периоду. Для карточек анализируемых текстов и общей статистики в интерфейс было добавлено отображение ключевых слов и именованных сущностей с информацией о частоте их встречаемости. Все сервисы работающие в составе веб-приложения размещены в корпоративной сети университета (САФУ). Техническая архитектура приложения обладает универсальностью, адаптивностью, воспроизводимостью и потенциалом к масштабированию с последующим преобразованием в публичный сервис и/или ресурс.
Завершена процедура датамайнинга – собран массив больших данных, коррелирующих с задачами проекта и представляющих практическую ценность для имиджевых исследований городских пространств. На момент отчета объем данных представлен 1349731 текстом с сопутствующей информацией (геолокационные отметки – 17496, комментарии – 4558770, изображения – 744906). Данные охватывают период с 26.11.2006 по настоящее время и представлены в формате динамически формирующегося массива с перманентной агрегацией подходящих под поисковые параметры текстов.
Завершена выработка оригинальной методики и схемы комплексного анализа вербального имиджа Архангельска. Методика анализа включает в себя 3 аналитических направления: жанрово-типологический анализ, контент-анализ (с выделением и описанием рациональных компонентов и эмоциональных составляющих вербального имиджа), лингвистический анализ (с выделением лингвостатистического анализа SEO-показателей и собственно лингвистической характеристикой текстовых материалов). Для каждого из аналитических направлений исследования выработаны и предложены конкретные критерии, параметры, методы, инструменты. Для изучения из общего массива данных текстов за определенный период разработана и апробирована методика выделения и создания конкретных баз данных. На основе методики создана база данных текстов за 2023 год с последующим выделением в ее структуре 2 датабанков за апрель и ноябрь месяц, каждый из которых представлен набором из 6 датасетов в соответствии с установленными типами источников. База данных за 2023 год представлена на государственную регистрацию в Федеральный институт промышленной собственности под названием «ИмАрх» (патентная заявка № 2024624597).
На материале апрельского и ноябрьского датабанков проведен комплексный ручной и машинный анализ имиджа Архангельска по определенной аналитической схеме, получены и описаны основные результаты исследования. Подготовлены данные для автоматизации ручного анализа, а также для создания моделей машинного обучения на собранных данных и примерах.
Завершена лексикографическая работа по исследованию имиджа города Архангельска – получены данные от 200 информантов, собраны и обработаны лексикографические данные из социальных медиа через разработанное веб-приложение; издан «Народный словарь Архангельска», включающий в себя неофициальную топонимию города (534 единицы).
Подготовлен задел для монографии «Теоретико-методологические основы оценки и комплексный анализ имиджа города с помощью технологии больших данных (на примере города Архангельска)».
Результаты исследования обнародованы на научных мероприятиях (16 за отчетный период), а также в виде 9 опубликованных статей, из них: в изданиях WoS/Scopus Q1 – 1 статья; Scopus Q2/ RSCI – 2 статьи; WoS – 1 статья. Получить представление о работе веб-приложения, ознакомиться с некоторыми элементами интерфейса, статистическими и геолокационными данными, а также разработанными методологическими основами анализа и оценки имиджа города можно по ссылке https://city-image.website.yandexcloud.net/
Публикации
1. Попов Р.В. Региолектный словарь и новые возможности лексикографии Человек и мир в зеркале русской лексикографии (к 75-летию первого издания «Словаря русского языка» С.И. Ожегова): Материалы Международной научной конференции (Тверь, 25-26 октября 2024 г.) / Под ред. И.М. Ганжиной – Тверь: Издательство Тверского государственного университета, 2024. – 144 с. , Человек и мир в зеркале русской лексикографии (к 75-летию первого издания "Словаря русского языка" С.И. Ожегова). Материалы Международной научной конференции. Тверь, 2024. С. 103-104. (год публикации - 2024)
2. Попов Р.В. Неофициальная астионимия Архангельска Русистика в ХХIвеке[Электронный ресурс]: сборник научных трудов / отв. ред. Р.В. Попов, С.А. Смирнова. –Электрон. текст. дан. (2,6Мб). –Киров: Изд во МЦИТО, 2024. –1 электрон. опт. диск (CD-R). –Систем. требования: PC, Intel 1 ГГц, 512 Мб RAM, 2,6Мб свобод. диск. пространства; CD-привод; ОС Windows XP и выше, ПО для чтения pdf-файлов. –Загл. с экрана., Неофициальная астионимия Архангельска // Русистика в ХХI веке [Электронный ресурс]: сборник научных трудов Международной научно-практической конференции (Северодвинск, 26–28 марта 2024 г.) / отв. ред. Р.В. Попов, С.А. Смирнова. – Электрон. текст. дан. (2,6 Мб). – Киров: Изд-во МЦИТО, 2024. – С. 101–108. (год публикации - 2024)
3. Щипицина Л.Ю., Казяба В.В. Имидж города в многожанровом отражении публикаций социальных медиа Жанры речи, Жанры речи, 2025 (год публикации - 2025)
4. Щипицина Л.Ю. Лингвистические средства создания имиджа города в социальных медиа: инфраструктурная составляющая Изучение иностранного языка и медиаурбанистика в цифровую эпоху: пути, форматы, перспективы, Изучение иностранного языка и медиаурбанистика в цифровую эпоху: пути, форматы, перспективы. Архангельск: САФУ, 2024. С. 92–103. 12 стр. 0,8 п.л. (год публикации - 2024)
5.
Казяба В.В.
От языка города до интернет-социолекта: мультивселенная современной социолингвистики
Филологические науки. Научные доклады высшей школы, Филологические науки. Научные доклады высшей школы, № 1, С. 161-165
DOI 10.20339/PhS.1-24.161 (год публикации - 2024)
10.20339/PhS.1-24.161
6. Казяба В.В., Попов Р.В. Региолектная лексикография: проблемы и их решение в эпоху цифровизации Вопросы лексикографии, Вопросы лексикографии, № 34 (декабрь), 2024 г. (год публикации - 2024)
7. Щипицина Л.Ю., Казяба В.В. Медийный формат vs. жанр в социальных медиа Жанры речи, Жанры речи, 2025 (год публикации - 2025)
8. Щипицина Л.Ю. Городской новостной портал как жанр социальных медиа Язык, коммуникация и социальная среда, Язык, коммуникация и социальная среда. 2024. № 22. С. 192-206. РИНЦ 15 стр. 1 п.л. (год публикации - 2024)
9. Попов Р.В. Лингвокультурная интерференция при формировании архангельского региолекта Лингвокультурологические чтения : сборник статей Международной научно-практической конференции, проведенной в рамках I Международного лингвокультурологического форума «Лингвокультурология и коммуникативная реальность XXI века: новые вызовы – новое осмысле- ние». Москва, РУДН, 19–20 октября 2023 г. / под редакцией В. В. Воробьева, М. Л. Новиковой, Д. С. Скнарева. – Москва : РУДН, 2024. – 510 с. : ил., Лингвокультурологические чтения. Сборник статей Международной научно-практической конференции, проведенной в рамках I Международного лингвокультурологического форума "Лингвокультурология и коммуникативная реальность XXI века: новые вызовы - новое осмысление". Москва, 2024. С. 362-364. (год публикации - 2024)
10. Попов Р.В. Народный словарь Архангельска Народный словарь Архангельска [18+] / Роман Попов. – Архангельск: Партнер НП, 2024. – 104 с., Народный словарь Архангельска [18+] / Роман Попов. – Архангельск, 2024. – 104 с. (год публикации - 2024)
Возможность практического использования результатов
Результаты проекта имеют возможность своего практического использования в первую очередь для города Архангельска и Архангельской области. Произведенная комплексная независимая оценка имиджа г. Архангельска как муниципального образования и туристической дестинации с позиций разных слоев населения и выполненный анализ существующего маркетингового и репутационного потенциала г. Архангельска на основе полученных данных позволяют оценить эффективность существующей стратегии развития региона и города, выявить сильные и слабые стороны, репутационные риски, отладить работу в сфере туристического развития и общественных связей. Предложенная автоматизация процессов оценивания городского имиджа в динамике с возможностью верификации, экспертизы и корректировки имиджевых стратегий позволяет существенно экономить время и финансовые средства на объемные, достоверные исследования, опирающиеся на большие данные, вырабатывая новые инструменты управления языковой и имиджевой политикой, брендинга города и области для повышения конкурентоспособности и туристической привлекательности региона, сохранение социо- и лингвокультурного наследия города и области. С другой стороны, все разработанные фундаментальные, методологические и прикладные положения проекта обладают адаптивностью, универсальностью и потенциалом к масштабированию и переносу на опыт любых других дестинаций.
Полученный теоретико-методологический задел проекта позволяет выполнять подобные исследования по оценке и комплексному анализу урбанистического имиджа специалистами, занятыми в сферах регионального и муниципального управления, рекламы и маркетинга, внешних связей и туризма, брендинга, информационной и языковой политики, лингвистики, информационных технологий, экономики, в т.ч. цифровой, общественных связей и социологии, лингвокультурологии.
Созданные технологические заделы в виде цифровых и информационных продуктов и ресурсов могут оптимизировать и ускорить ряд управленческих процессов, способствуют верификации и быстрой независимой аналитике и исследованиям фактически любых урбанистических процессов и аспектов (история, культура, политика, экономика, социальная сфера, инфраструктура) на обширном материале.