Новые технологии для проектирования облачных сервисов машинного обучения, сохраняющих конфиденциальность

КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

ОБЩИЕ СВЕДЕНИЯ

Номер проекта 25-71-30007

НазваниеНовые технологии для проектирования облачных сервисов машинного обучения, сохраняющих конфиденциальность

Руководитель Бабенко Михаил Григорьевич, Доктор физико-математических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Северо-Кавказский федеральный университет" , Ставропольский край

Конкурс №107 - Конкурс 2025 года по мероприятию «Проведение исследований научными лабораториями мирового уровня в рамках реализации приоритетов научно-технологического развития Российской Федерации» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-201 - Искусственный интеллект и принятие решений

Ключевые слова машинное обучение, гомоморфное шифрование, облачные вычисления, протокол конфиденциальных вычислений, нейронные сети, распределенные вычисления

Код ГРНТИ50.07.05

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ

Аннотация
Проект направлен на исследование и разработку новых теоретических принципов и реализующего их программного инструментария для проектирования и разработки систем машинного обучения, сохраняющих конфиденциальность, с заданной надежностью, безопасностью, избыточностью данных и точностью результата. Научная новизна проекта обусловлена адаптацией к техническим ограничениям гомоморфных шифров существующих и разработкой новых методов машинного обучения для проектирования облачных сервисов машинного обучения, сохраняющих конфиденциальность (Privacy-Preserving Machine Learning as a Service, PP-MLaaS). В рамках проекта решаются следующие задачи: - адаптация методов сжатия моделей машинного обучения к техническим ограничениям гомоморфных шифров для проектирования облачных сервисов, сохраняющих конфиденциальность; - развитие теоретических основ и создание масштабируемых алгоритмов для проектирования, конструирования и идентификации моделей машинного обучения, сохраняющих конфиденциальность; - исследование существующих и разработка новых сценариев кибератак на модели машинного обучения, сохраняющие конфиденциальность и разработка методики минимизации негативного воздействия атак; - разработка новых методов сбора, хранения и обработки данных, обеспечивающих эффективное использование моделей машинного обучения, сохраняющих конфиденциальность с заданной надежностью, безопасностью, избыточностью данных и точностью результата. - разработка технологии проектирования доверенного искусственного интеллекта в рамках модели PP-MLaaS, её тестирование и подготовка технической и обучающей литературы по её использованию. Практическим результатом проекта является разработка программного инструментария для проектирования облачных сервисов машинного обучения, сохраняющих конфиденциальность, с регулируемой надежностью, безопасностью, избыточностью данных и точностью результата, позволяющего обрабатывать конфиденциальную информацию в зашифрованном виде. Он образует ядро для создания различных доверенных сервисов обработки конфиденциальной информации в зашифрованном виде, позволяющих обеспечить заданные технические характеристики системы. Реализация данного проекта позволит разрешить противоречие между возможностями уменьшения финансовых издержек предприятий и существующими рисками кражи конфиденциальной информации при использовании облачных сервисов.

Ожидаемые результаты
1. Новые методы сжатия моделей машинного обучения, адаптированные к техническим ограничениям гомоморфных шифров, для проектирования облачных сервисов машинного обучения, сохраняющих конфиденциальность. Комплекс программ, реализующий методы сжатия моделей машинного обучения. 2. Масштабируемые алгоритмы для проектирования, конструирования и идентификации моделей машинного обучения, сохраняющих конфиденциальность. Сценарии использования масштабируемых алгоритмов машинного обучения и определения границ применимости для решения практических задач. Комплекс программ, реализующий масштабируемые алгоритмы машинного обучения. 3. Новые сценарии кибератак на модели машинного обучения, сохраняющие конфиденциальность. Методика минимизации негативного воздействия атак на модели машинного обучения, сохраняющие конфиденциальность. 4. Новые методы сбора, хранения и обработки данных, обеспечивающие эффективное использование разработанных моделей машинного обучения, сохраняющих конфиденциальность с заданной надежностью, безопасностью, избыточностью данных и точностью результата. Комплекс программ, реализующий методы сбора, хранения и обработки данных, обеспечивающий эффективное использование разработанных моделей машинного обучения, сохраняющих конфиденциальность. 5. Технология проектирования и разработки доверенных систем на основе средств искусственного интеллекта и машинного обучения, сохраняющих конфиденциальность, её тестирование и подготовка технической и обучающей литературы по её использованию. Полученные в ходе реализации проекта научные результаты внесут существенный вклад в область проектирования систем обработки конфиденциальных данных в зашифрованном виде в распределенных средах и расширят границы применимости гомоморфного шифрования для решения практических задач. Практические результаты проекта (комплекс программ) будут востребованы индустриальным партнером (Институт системного программирования им. В.П. Иванникова РАН) для создания на их основе прикладных сервисов, встраиваемых в продукт Asperitas. Ожидаемые результаты будут находиться на уровне или превосходить имеющиеся российские и зарубежные аналоги.

ОТЧЁТНЫЕ МАТЕРИАЛЫ

Аннотация результатов, полученных в 2025 году
Разработаны теоретические основы и масштабируемые алгоритмы проектирования, конструирования и идентификации моделей машинного обучения, сохраняющих конфиденциальность, включающие модифицированные схемы горизонтального, вертикального и федеративного трансферного обучения с безопасной агрегацией на гомоморфных шифрах. На основе полученных в работе аналитических оценок сходимости и сетевой нагрузки, где скорость снижения функционала и объем передаваемых данных выражаются через число участников, частоту обмена и параметры шифра, показано, что при соблюдении выведенных условий на шаг обучения и глубину вычислительного графа зашифрованная глобальная модель сохраняет тот же порядок сходимости, что и незашифрованная. Анализ полученных формул для времени итерации и количества операций показывает, что предложенные модификации протокола и схем агрегации позволяют сократить время обработки данных более чем в два раза по сравнению с базовыми решениями без нарушения требований безопасности и конфиденциальности. Предложены методы сжатия и архитектурной оптимизации моделей (квантизация, дистилляция, использование идей метода Винограда и минимально избыточной модулярной арифметики), адаптированные к ограничениям гомоморфного шифрования. Было показано, что выбор оптимального уровня квантизации и структуры сверточных блоков позволяет перейти к новому классу нейронных сетей с меньшей мультипликативной глубиной при неизменной точности. Сопоставление теоретических оценок сложности и экспериментальных данных подтверждает более чем десятикратное ускорение обработки шифртекстов благодаря сокращению числа умножений и уменьшению размеров зашифрованных слоев при сохранении качества модели на уровне исходной. Применение полученных подходов позволили уменьшить размеры искусственных нейронных сетей более чем в 1500 раз и повысить скорость их обработки в 30 раз при сохранении достаточного уровня точности. Разработаны новые методы контроля результатов и повышения надежности и отказоустойчивости нейронных сетей, сохраняющих конфиденциальность, основанные на двух вариантах реализации: функции ядра Акушского и минимально избыточной модулярной арифметике. Для предложенных схем получены формулы, описывающие вероятность невыявленной ошибки, избыточность кодирования и вычислительную сложность процедур контроля, что позволяет параметризовать систему по требуемому уровню надежности. Показано, что комбинирование функции ядра Акушского с минимально избыточной системой остаточных классов обеспечивает эффективное обнаружение, локализацию и исправление ошибок в распределенных средах с зашифрованными данными при умеренном росте избыточности. На основании этих результатов разработаны сценарии использования полученных конструкций для реализации базовых блоков моделей машинного обучения, ориентированных на работу в условиях частичных отказов и недостоверных каналов связи. Создан комплекс программ, реализующий предложенные методы и алгоритмы, включающий модули федеративного обучения с гомоморфным шифрованием, средства сжатия и оптимизации моделей, а также подсистемы контроля корректности вычислений и восстановления при ошибках. Структура программного комплекса и результаты вычислительных экспериментов непосредственно опираются на полученные в работе формулы оценки сложности, глубины гомоморфных схем и параметров кодов на базе минимально избыточной модулярной арифметики, что обеспечивает воспроизводимость и переносимость научных результатов. Созданный комплекс служит основой для подготовки и защиты диссертации, публикаций в ведущих журналах, проведения научных школ и дальнейшего развития направления конфиденциальных вычислений на основе методов машинного обучения.

Публикации

1. Лапина М.А., Гриценко Д.Д., Кеньков Е.А., Багаутдинова А.Р., Соломянко А.А. Detection of denial-of-service attacks in software-configurable networks using machine learning methods Труды института системного программирования РАН, том 37, выпуск 6, часть 4 (год публикации - 2025)

2. Гордеев С. М., Ширяев Е. М., Кучеров Н. Н., Кучуков В. А., Луценко В. В.,Коваленко Е. С. Программа обработки сценариев кибератак на модели машинного обучения, сохраняющие конфиденциальность Государственная регистрация программы для ЭВМ, Бюл. № 12, № 2025694609 (год публикации - 2025)

3. Лапина М.А., Подручный Н.В., Русанов М.А., Бабенко М.Г. Research of machine learning methods for detecting network attacks Труды института системного программирования РАН, том 37, вып. 4, часть 2, 2025 (год публикации - 2025)
10.15514/ISPRAS-2025-37(4)-24

4. Ширяев Е.М., Лапина М.А., Гордеев С.М., Бабенко М.Г. CKKS-Based Secure Data Processing for IoT Environments Lecture Notes in Networks and Systems (год публикации - 2026)

5. Гордеев С. М., Ширяев Е. М., Бабенко М. Г., Кучеров Н. Н. Федеративное обучение как способ защиты личных данных при анализе жизненных показателей людей в IoT-системах Национальный Суперкомпьютерный Форум, Электронный документ (год публикации - 2025)

6. Гордеев С.М., Ширяев Е.М., Лапина М.А., Бабенко М.Г. TFHE for Encrypted Machine Learning: A Practical Evaluation Capitalizing on Efficient Binary Circuits Lecture Notes in Networks and Systems (год публикации - 2026)

7. Гордеев С.М., Синицын А.А., Лапина М.А. Composition of Differential Privacy Mechanisms in Iterative Machine Learning: A Comparative Study Lecture Notes in Networks and Systems (год публикации - 2026)

8. Калмыков И.А., Оленев А.А., Духовный Д.В., Проворнов И.А., Сляднев В.С. A Method for Fault Tolerance of AES Encryption Systems Focused on Improving the Cybersecurity of VANET Through the Use of Residue Codes World Electric Vehicle Journal, Т. 16. – №. 8. – 2025. – С. 462. (год публикации - 2025)
10.3390/wevj16080462

9. Луценко В.В., Бабенко М.Г. Генерация компактных базисов системы остаточных классов Труды Института системного программирования РАН, Т. 37. – №. 5. – С. 43-52. – 2025. (год публикации - 2025)
10.15514/ISPRAS-2025-37(5)-3

10. Луценко В.В., Герюгова А.Э., Бабенко М.Г. High Speed Algorithm for Number Sign Detection in Residue Number System Based on Akushsky Core Function Труды института системного программирования РАН (год публикации - 2026)

11. Коваленко Е.С., Ширяев Е.М., Кучеров Н.Н., Бабенко М.Г. Анализ эффективности конвейеров локального выравнивания со сжатием данных генома без потерь Труды института системного программирования РАН (год публикации - 2026)

12. Гордеев С.М., Синицын А.А., Лапина М.А. Design of Number-Theoretic Transforms Using Diemitko Numbers Lecture Notes in Networks and Systems (год публикации - 2026)

13. Гордеев С. М., Ширяев Е. М., Кучеров Н. Н., Кучуков В. А., Луценко В. В.,Коваленко Е. С. Программа реализации квантизированной сверточной нейронной сети, сохраняющей конфиденциальность Государственная регистрация программы для ЭВМ, Бюл. № 12, № 2025694693 (год публикации - 2025)

14. Пресс-служба СКФУ В СКФУ ОТКРЫЛАСЬ МЕЖДУНАРОДНАЯ ШКОЛА МОЛОДЫХ УЧЁНЫХ «ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И КИБЕРБЕЗОПАСНОСТЬ» сайт СКФУ (год публикации - 2025)

15. Команда Yandex Cloud Как учёные ускорили обработку зашифрованных данных в 30 раз Yandex Cloud (год публикации - 2025)

16. Луценко В. В. Разработка математической модели, методов и алгоритмов для повышения скорости обработки данных в туманных вычислениях с использованием модулярной арифметики Москва (год публикации - 2025)

17. Ширяев Е. М. Математическая модель, методы и алгоритмы эффективной реализации искусственных нейронных сетей, сохраняющих конфиденциальность Москва (год публикации - 2025)

18. Ширяев Е.М., Бабенко М.Г., Гордеев С.М., Коваленко Е.С. Экспериментальный анализ кодов исправления ошибок в системе остаточных классов на базе приближенного ранга числа Труды института системного программирования РАН (год публикации - 2026)

19. Безуглова Е.С., Ширяев Е.М., Кучеров Н.Н., Бабенко М.Г. Modification of the Smith-Waterman Algorithm for Local Alignment of Genetic Sequences Based on the Window Method Труды Института системного программирования РАН, том 37, вып. 5, 2025 г., стр. 183–194 (год публикации - 2025)
10.15514/ISPRAS-2025-37(5)-14

20. Бабенко М.Г., Синицын А. А., Дерябин М.А. Оптимизация алгоритма расширения оснований в модулярном коде для гомоморфных шифров Труды института системного программирования РАН (год публикации - 2026)