КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 23-21-00338

НазваниеМодель компетентностно-ориентированного скоринга для IT-сферы

РуководительАбрамов Максим Викторович, Кандидат технических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки "Санкт-Петербургский Федеральный исследовательский центр Российской академии наук", г Санкт-Петербург

Период выполнения при поддержке РНФ 2023 г. - 2024 г. 

Конкурс№78 - Конкурс 2022 года «Проведение фундаментальных научных исследований и поисковых научных исследований малыми отдельными научными группами».

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-201 - Искусственный интеллект и принятие решений

Ключевые словаПрофессиональная идентичность, профессиональное самопознание, профессиональная ориентация, выбор карьеры, рекомендательная система, социальные медиа, анализ цифровых следов, технологии обработки знаний, Data Science, машинное обучение, карьерная траектория

Код ГРНТИ28.23.35


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Актуальность и постановка проблемы. На сегодняшний день актуальной остаётся проблема осознанного и своевременного выбора профессии, а также все заметнее становится родственная проблема смены профессии. В сфере IT ситуация обостряется её высоким кадровым голодом и резким ростом, в результате чего образуется большое число новых профессий, на которые остро требуются новые специалисты. Сориентироваться в этой ситуации оказывается достаточно сложно. При этом, с одной стороны, в каждом конкретном случае, как правило, нет возможности рекомендовать однозначный выбор профессии, который окажется гарантировано оптимальным, однако, с другой стороны, вывод о том, что никакие рекомендации не будут обоснованными также окажется несправедливым. Таким образом, указанные проблемы приходится решать в классическом для искусственного интеллекта контексте неопределенности данных и знаний. Целью данного проекта является повышение применимости инструментов для профессиональной ориентации в IT сфере через развитие подходов и методов, используемых в современных автоматизированных системах, представляющих подобные сервисы. А именно предлагается реализовать прототип поддержки принятия решений, с одной стороны, основывающийся на взаимосвязях между личностными особенностями пользователей в профессиональном контексте и контентом, публикуемым в социальных медиа, а с другой, учитывающий закономерности между личностными особенностями пользователей и выбором специализации в IT-сфере. Автоматизация профессиональной ориентации будет задействовать методы искусственного интеллекта и науки о данных для выявления данных взаимосвязей. В рамках данного проекта предполагается сочетание двух направлений сбора и обработки данных о респондентах: 1) с помощью традиционных методик, позволяющих определить личностные предрасположенности и профессиональные предпочтения респондентов; 2) извлечение из аккаунтов указанных респондентов в социальных медиа. При этом в качестве респондентов планируется привлечь студентов старших курсов, обучающихся на IT-специальностях, и/или специалистов, работающих в данной сфере. Научная новизна исследования заключается в увеличении числа прогнозируемых характеристик профессионального ориентирования и личностных особенностей, извлекаемых со страниц в социальных медиа, синтезе применяемых подходов, предлагаемая конфигурация используется впервые. Ожидается, что данный подход позволит получать комплексные оценки с большей точностью и возможностью построения персонализированных рекомендаций и представлений не только об области потенциальной деятельности, но и о предпочтительной роли в команде либо роли, в которой предполагается, что испытуемый сможет лучше всего себя проявить. Практическая значимость результатов проекта заключается в снижении уровня безработицы в IT-сфере посредством удачного выбора профессии, повышении уровня удовлетворенности жизнью за счет обоснованного выбора эффективной карьерной траектории или ее своевременной ревизии. Проект лежит в рамках одного из направлений Стратегии научно-технического развития Российской Федерации, а именно способствует переходу к передовым цифровым, интеллектуальным производственным технологиям, роботизированным системам, новым материалам и способам конструирования, создание систем обработки больших объемов данных, машинного обучения и искусственного интеллекта. Его реализация сделает вклад как в переход к передовым цифровым, интеллектуальным технологиям через запуск прототипа программного комплекса для прогнозирования профессиональной ориентации, карьерной траектории, так и в развитие систем обработки больших объемов данных, машинного обучения и искусственного интеллекта через разработку методов, моделей и алгоритмов прогнозирования по цифровым следам, оставляемым пользователями в социальных сетях.

Ожидаемые результаты
По итогам выполнения проекта будут получены следующие результаты: 1. Обзор и компаративный анализ современных методов и подходов к профессиональной ориентации человека в сфере IT, автоматизации профориентации через анализ контента, публикуемого пользователем в социальной медиа, рекомендательных систем в области профориентации. Будет проведено интервьюирование специалистов-организаторов и экспертов профориентационной деятельности с целью выработки предложений по учёту особенностей профориентации. Выбраны системы категоризации существующих IT-специальностей. Значимость результата заключается в формировании пространства подходов, на основе которого можно строить соответствующие методы, модели и алгоритмы. 2. Подходы к приоритизации рекомендуемых видов/направлений деятельности, способов представления пользователю результатов приоритизации, формирование подходов к обработке неопределенности и нестабильности/неустойчивости сформированной в результате анализа данных приоритизации. Значимость полученного результата заключается в формировании потенциала для синтеза новых моделей профессионального ориентирования, лежащих на стыке разных дисциплин, основанных на систематизации существующих методов и подходов к профессиональной ориентации, подходов к приоритизации рекомендуемых видов/сфер деятельности, способов представления пользователю результатов приоритизации, формирование подходов к обработке неопределенности и нестабильности/неустойчивости, сформированной в результате анализа данных приоритизации. 3. Выявленные возможные ключевые маркеры, метрики и предикторы, характеризующие степень выраженности личностных особенностей пользователя, в рамках задачи профориентации через анализ параметров/свойств контента (текстового, графического, аудио или видео), публикуемого в социальных медиа, в том числе с использованием методов data science. Полученные в результате анализа и отбора методы и инструменты обработки и анализа текстового, аудио-, или видео- и графического контента, обладающие потенциалом использования при формировании профориентационного предложения. А также новые и/или усовершенствованные и адаптированные существующие методы извлечения информации из цифровых следов пользователей в контексте формирования профориентационного предложения. Значимость результата заключается в идентификации ключевых маркеров, метрик и предикторов, характеризующие степень выраженности личностных особенностей пользователя, а также формировании инструментария для извлечения цифровых следов, которые используются для оценки выраженности личностных особенностей пользователя и, опосредованно, прогнозировании профориентации, карьерной траектории. 4. Выборка, состоящая из лиц, связанных с IT-сферой, и содержащая цифровые следы, извлеченные из аккаунтов респондентов в социальных медиа; информацию о степени выраженности личностных особенностей пользователей, их профессиональных склонностей, выявленных посредством традиционных методик, известных в психологии и социологии (тест Холланда, тест Йовайши, тест Климова, карта интересов Голомштока, 5-факторный личностный опросник или “Большая пятерка”, 16-факторный личностный опросник Р.Б. Кеттелла, тест Келлермана-Плутчика “Индекс жизненного стиля”, тест на определение ценностных ориентаций С.Шварца); сведения о принадлежности к одной из отобранных категорий IT-специальностей. Выборка будет получена по результатам первого этапа полевого исследования. Значимость результата заключается в использовании полученных данных для выявления взаимосвязей между цифровыми следами пользователей, извлеченных из социальных медиа, и их профориентационными склонностями. Полученные датасеты также могут быть использованы для других задач в области идентификации взаимосвязей между цифровыми следами и результатами, полученными посредством стандартных методик, известных в психологии и социологии, в том числе с применением методов data science и машинного обучения. 5. Выявленные ключевые особенности данных и метаданных, публикуемых в социальных медиа цифровых изображений, письменной речи (в постах, в комментариях, в субтитрах), устной речи — в аудио- или визуальных образах, рядах, появление которых обусловлено принадлежностью к различным социально-профессиональным типам личности, посредством произведенного анализа и систематизации полученных датасетов. Причем выявление таких особенностей будет произведено как экспертами на основе согласованных мнений, так и при помощи автоматического распознавания с использованием методов машинного обучения. Значимость полученного результата заключается в апробации выдвинутых гипотез о ключевых маркерах, метриках и предикторах, являющихся значимыми при выявлении профессиональных склонностей индивида. 6. Выявленные зависимости между ответами респондентов, полученными в ходе применения традиционных методик по идентификации личностных особенностей и профессиональных склонностей, и их принадлежностью той или иной категории IT-специальностей. Значимость полученного результата заключается в его последующем применении в рекомендательной системе для формирования профориентационного предложения. 7. Методы, модели и алгоритмы для формирования профориентационного предложения на основе обработки и анализа информации, извлекаемой из социальных медиа пользователя. Значимость полученного результата заключается в формировании базы для появления востребованного пользователями инструментария прогнозирования профориентационных склонностей в IT-сфере. Модели принятия решений, позволяющие использовать разнородную информацию об индивиде: результаты тестов, цифровые следы пользователя онлайн медиа, экспертную информацию на основе байесовских сетей доверия. 8. Архитектура и прототип комплекса программ для проведения вычислительных экспериментов с учетом обозначенных выше результатов, иными словами позволяющего на основе big data и small data, извлекаемых из социальных медиа, автоматизировано строить рекомендации по профориентации, повышению квалификации, профессиональной траектории. Апробация результатов разработанных методов, моделей, алгоритмов и прототипа комплекса. Значимость результата заключается в автоматизации и апробации полученных теоретических и практических наработок для автоматизации построения рекомендаций по профориентации. 9. Лабораторный образец на поддомене сайта коллектива исследователей проекта и тестирование в образовательном/профессиональном контекстах в сфере IT. Значимость результата заключается в практическом применении итогов проектной работы в реальном практическо-научном веб-приложении. Данный результат ориентирован на применение в общественной деятельности, направленной на поддержку молодежи в соответствии с Федеральным законом № 489 от 30 декабря 2020 г. «О молодежной политике в Российской Федерации» Научная значимость проекта заключается в формировании перспективного комплексного теоретического и практического подхода по повышению применимости инструментов для профессиональной ориентации пользователя социальных медиа через использование и развитие методов искусственного интеллекта и Data Science. Данные методы позволят выявить взаимосвязи между цифровыми следами пользователей и выраженностью их личностных особенностей, оценка которых будет получена с помощью традиционных методик (тестирования), а также между личностными особенностями и специализацией в IT-сфере. В свою очередь, выявленные связи и предложенные закономерности помогут автоматизировать процесс построения рекомендаций в области профессиональной ориентации и, тем самым, обеспечить более точный и оперативный доступ к списку подходящих профессий как молодежи, так и представителей других возрастных страт. Все результаты проекта и их значимость лежит в рамках одного из направлений Стратегии научно-технического развития Российской Федерации, а именно способствует переходу к передовым цифровым, интеллектуальным производственным технологиям, роботизированным системам, новым материалам и способам конструирования, создание систем обработки больших объемов данных, машинного обучения и искусственного интеллекта. Его реализация сделает вклад как в переход к передовым цифровым, интеллектуальным технологиям через запуск прототипа программного комплекса для прогнозирования профессиональной ориентации, карьерной траектории, так и в развитие систем обработки больших объемов данных, машинного обучения и искусственного интеллекта через разработку методов, моделей и алгоритмов прогнозирования по цифровым следам, оставляемым пользователями в социальных сетях.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2023 году
В ходе реализации первого этапа проекта получены результаты, создающие прочный задел для проведения последующего этапа работ: – Проведен обширный обзор и анализ методов и подходов к профессиональной ориентации, в том числе, ориентированных на сферу IT, включая автоматизацию этого процесса через анализ контента в социальных медиа и существующие в данной области рекомендательные системы. – Исследование существующих систем категоризации IT-специальностей выявило их разрозненность, в связи с этим была проведена работа по разработке собственной системы категоризации IT-специальностей. На основе публикаций в онлайн-сообществах IT-специалистов, категоризации, содержащейся в сервисах для поиска работы и платформ онлайн-образования в сфере IT, а также интервьюирования экспертов, работающих на различных позициях в IT, было выделено 5 основных категорий: разработка, QA-специалист, работа с данными и исследования, менеджмент, дизайн. Выделенные категории позволили разработать опросник для получения выборки, необходимой для анализа данных и решения последующих задач. – На основе проведённых консультаций и обсуждений с экспертами профориентационной деятельности были выработаны предложения по учёту особенностей профориентации в IT-индустрии, проведено обсуждение методологии сбора данных, разработана спецификация вопросов опросника для людей, связанных с IT-индустрией, и тех, кто с ней не связан. Опросник был внедрён в приложение «Психологические тесты» в онлайн социальной сети «ВКонтакте» (https://vk.com/services?w=app7794698_203437876), где любой желающий, имеющий профиль в данной сети, может пройти его. – По результатам анализа существующих методов принятия решений для приоритезации рекомендуемых видов/направлений деятельности был выбран метод экспертных оценок, который в последующем может быть использован для формирования априорных распределений в байесовском подходе. Для идентификации дополнительных характеристик, которые могут лечь в систему приоритезации рекомендуемых видов деятельности, была проверена и подтверждена гипотеза о наличии взаимосвязей между желанием респондента сменить род деятельности, факторами, которыми он руководствовался при выборе профессии и типом социально-профессиональной направленности. – Проанализированы источники цифровых следов пользователя. В качестве основы для дальнейшего исследования были отобраны: посты пользователей, анкетные данные, подписки на сообщества, публикуемые фотографии (в частности, аватар пользователя в онлайн социальной сети). – Подтверждена гипотеза о различии в результатах теста Голланда (кодах RIASEC) для ведущих тематик подписок по частоте появления в верхней и нижней триадах, а также по средним баллам. – Исследована возможность автоматизации оценки психологических особенностей пользователей социальной сети на основе их текстовых постов. – Выявлены кластеры пользователей со схожими профилями психометрических показателей теста «Большая пятёрка». Для описания зависимости между полученной кластеризацией и графическими характеристиками изображения аватара пользователя была предложена концептуальная байесовская сеть доверия. – Для извлечения информации из цифровых следов пользователей были разработаны: • программа предназначена для анализа ключевых индикаторов профессии по данным о тематиках подписок пользователя на сообщества в онлайн социальной сети на основе выявленных статистических взаимосвязей; • программа для автоматизации процесса извлечения цветовых, стилометрических и содержательных признаков графического контента, с разбиением по разным планам. Сведения о реализации проекта, опубликовано по ссылке: https://dscs.pro/grants/it-scoring/.

 

Публикации

1. Хлобыстова А.О., Абрамов М.В. A Study of the Relationship between Personality Type and Factors Influencing Career Choice IEEE, 2023 XXVI International Conference on Soft Computing and Measurements (SCM). IEEE, 2023. pp. 219-222. (год публикации - 2023) https://doi.org/10.1109/SCM58628.2023.10159118

2. Хлобыстова А.О., Абрамов М.В. Исследование связи профессионального типа личности и факторов, влияющих на выбор профессии СПб.: СПбГЭТУ «ЛЭТИ», Международная конференция по мягким вычислениям и измерениям. – 2023. – Т. 1. – С. 301-304. (год публикации - 2023)

3. Хлобыстова А.О., Столярова В.Ф, Абрамов М.В. Characterization of the Person’s Leading Interests in Terms of RIASEC Scores Lecture Notes in Networks and Systems, Lecture Notes in Networks and Systems, vol 776. Springer, Cham. pp. 281-290 (год публикации - 2023) https://doi.org/10.1007/978-3-031-43789-2_26

4. Абрамов М.В., Бушмелев Ф.В., Столярова В.Ф., Тулупьева Т.В. Color and Сontextual Feature Extraction from Images Version 01 for Python (CCFE IMG py.v.01) -, 2023683465 (год публикации - )

5. Столярова В.Ф., Абрамов М.В., Сабреков А.А. Automation of the dependencies between RIASEC score and user's subscription themes for R, version 01 (Ad RIASEC Sub v01) -, 2023683447 (год публикации - )

6. - Модель компетентностно-ориентированного скоринга для IT-сферы dscs.pro, - (год публикации - )