КАРТОЧКА ПРОЕКТА,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 19-19-00566

НазваниеПерспективные аппаратные средства с повышенной помехозащищённостью для задач обработки данных и моделирования динамических систем на основе векторных вычислителей

РуководительТюкин Иван Юрьевич, Доктор технических наук

Организация финансирования, регионФедеральное государственное автономное образовательное учреждение высшего образования "Санкт-Петербургский государственный электротехнический университет "ЛЭТИ" им. В.И. Ульянова (Ленина)", г Санкт-Петербург

Года выполнения при поддержке РНФ 2019 - 2021 

КонкурсКонкурс 2019 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами»

Область знания, основной код классификатора 09 - Инженерные науки, 09-605 - Комплексирование и обработка информации в технических системах

Ключевые словавекторный сопроцессор, векторизация, MIPS, SIMD, QEMU, FPGA, ASIC, система остаточных классов, нейронные сети, обработка сигналов и изображений, кодирование, защита целостности данных, хаотические системы

Код ГРНТИ50.33.39


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Все современные процессоры в том или иной форме имеют аппаратную поддержку векторных вычислений. Правильное использование векторных регистров позволяет получить существенный прирост производительности благодаря выполнению нескольких однотипных операций за одну инструкцию при решении задач с естественным параллелизмом. К таким задачам можно отнести анализ многомерных гетерогенных сигналов, обработку растровых изображений, формирование и рендеринг объектов трехмерной графики, рекуррентный и бифуркационный анализ сложных динамических систем. Все эти задачи являются вычислительно затратными, и основным способом ускорения вычислений при их решении выступает использование векторных процессоров, многопоточных вычислений и специализированного математико-алгоритмического обеспечения. Особенно важным становится вопрос создания аппаратно-ориентированного математического аппарата при решении задач без естественного параллелизма на векторных вычислителях. В таких случаях параллелизм операций должен быть заложен на уровне алгоритма. Актуальность данной работы заключается в разработке современного отечественного процессора, обладающего повышенной помехозащищённостью и криптостойкостью, для обработки данных и многомерного анализа сигналов на основе рекуррентных алгоритмов с естественным параллелизмом за счет взаимной независимости пикселов динамической рекуррентной карты, представленной в виде многоцветного или монохромного изображения с высоким разрешением, способного обнаруживать и исправлять ошибки в арифметических модулях. Основным принципом повышения производительности вычислений является их параллельное исполнение, используемое на всех уровнях организации вычислительного устройства, архитектуры команд и непосредственно микроархитектуры процессора. Следует отметить, что простое увеличение используемых элементарных конструкций, таких как лингвистические единицы языка программирования, количества элементов (АЛУ, ядер) практически никогда не приводит к пропорциональному росту полной вычислительной производительности. Предсказание поведения приложений на будущих, ещё не спроектированных системах, представляется крайне важным элементом работы, так как позволяет заранее обнаружить слабые места проекта и перераспределить средства для получения оптимальной системы. Целью работы является полноплатформенная симуляция вычислительных векторных систем с их последующим прототипированием на FPGA, решающая задачу прогнозирования производительности и иных характеристик аппаратных решений до запуска серийного производства. Для построения и исследования моделей будет использован программный симулятор QEMU (www.qemu.org), предоставляющий ряд инструментов, необходимых для проводимого исследования: исполнение графических приложений на всех процессорах системы, распределение нагрузки как на отдельные элементы архитектуры команд, так и все узлы вычислителя, изучение влияния немодифицированной операционной системы. Включение всех деталей работы векторного микропроцессора, устройств оперативной памяти, сетевых маршрутизаторов приводит к существенному замедлению и невозможности проведения значительного объёма исследований в разумное время. Поэтому нами будет использован гибридный подход, в котором моделирование используется для получения значений ключевых параметров, характеризующих работу приложения внутри симулируемой системы, а также аппаратно-ориентированные методы и алгоритмы, позволяющие ускорить процесс моделирования за счет распараллеливания модельного процесса. Полученные статистические данные в дальнейшем будут применены в формульных описаниях и оценках производительности векторных многопроцессорных вычислителей при решении различных классов задач. Так как безопасность и надежность являются одними из первостепенных вопросов при проектировании современных процессоров и сопроцессоров, будет уделено особое внимание вопросам обеспечения целостности информации, обеспечению целостности кэш памяти, арифметических блоков, содержащихся в процессоре, а также целостности управляющих инструкций. Криптографические сопроцессоры для обеспечения целостности представленных выше элементов вычислительного устройства используют дополнительные компоненты, выполняющие хеширование инструкций, а также информации, записываемой и выгружаемой из кэша. Такой подход позволяет убедиться в целостности информации путем сравнения хеш-суммы текущего значения блока и предварительно сохраненной контрольной суммой. Однако метод на основе хеш-значений не подходит для обеспечения целостности некриптографических сопроцессоров, поскольку сильно снижает производительность последних. Нецелесообразно использование для некриптографических сопроцессоров также алгоритмов легковесной криптографии, несмотря на их аппаратную эффективность. Наибольшей производительности можно достичь при использовании методов помехоустойчивого кодирования, способных обнаружить ошибки любой кратности. В данном проекте предлагаются схемы обеспечения целостности для векторного сопроцессора, построенные на основе кодовых конструкций, содержащих PN и APN функций. Актуальность данного научного проекта обусловлена высоким практическим интересом к составлению эффективных схем обеспечения целостности, способных обнаружить ошибки любой кратности, а также не снижающих значительно производительность устройства. Также предлагается разработка и исследование архитектуры криптографических сопроцессоров, основанных на дискретных отображениях с управляемой симметрией и генераторах псевдослучайных последовательностей на их основе. Результаты проекта могут быть использованы при построении высокопроизводительных систем обработки сигналов и изображений, встраиваемых систем анализа многомерных сигналов на основе рекуррентных диаграмм высокого разрешения, при разработке суперкомпьютеров, предназначенных для имитационного моделирования сложных естественных и технических процессов, а также способных обеспечивать защиту от возможных преднамеренных и случайных ошибок, возникающих в модулях сопроцессора, криптографические операции и функции генератора псевдослучайных последовательностей с заданной величиной дальней корреляцией значений. Одним из эффективных путей снижения энергопотребления процессорами является оптимизация арифметического уровня вычислений. К сожалению, за последние полвека при разработке микропроцессорных систем в большинстве случаев используется позиционная система счисления, унаследованная от процессоров ранних поколений. Наступает время для существенного изменения подходов к использованию систем счисления в цифровых системах и разработки новых непозиционных систем счисления, особенно для использования во встраиваемых проблемно-ориентированных процессорах. Среди различных альтернативных числовых систем, Система Остаточных Классов (СОК) является одной из самых известных систем, которая способна обеспечить параллельную реализацию арифметических операций, особенно для сложения и умножения чисел. СОК оперирует с небольшими остатками, вместо обработки чисел большой разрядности в позиционных системах счисления. Мотивацией данного проекта является способность СОК к увеличению скорости вычислительных систем за счет распараллеливания арифметических операций. Работа в рамках данного проекта будет направлена на развитие новых, высокоэффективных версий устройств и систем, функционирующих в СОК, для увеличения возможностей применения СОК на практике. Основной целью является разработка новых устройств на основе СОК, позволяющих достичь наилучшего сочетания параметров цифровых устройств: производительности, энергопотребления и аппаратных затрат. Существенное внимание будет уделено разработке СОК с большим числом модулей для улучшения коэффициента параллелизма, что может быть эффективно использовано в криптографических приложениях. Следующим этапом станет разработка эффективных устройств для аппаратной реализации разработанных систем на основе СОК. Все устройства будут смоделированы и реализованы на различных аппаратных платформах (FPGA и ASIC) для оценки их эффективности в сравнении с ранее разработанными решениями на основе СОК. Наконец, в рамках данного проекта планируется использовать разработанные СОК в таких приложениях как цифровая обработка сигналов, обработка изображений, криптография и компьютерные сети. Вторым направлением данного проекта является обеспечение сопроцессора высоким уровнем безопасности и отказоустойчивости с помощью методов теории кодирования и оснащения его блоками генерации псевдослучайных последовательностей с улучшенными статистическим свойствами на основе хаотических нелинейных отображений с управляемой симметрией. Данное научное исследование представляет собой принципиально новый результат, обеспечивая развитие теории кодирования, теории совершенно нелинейных и почти совершенно нелинейных функций, а также усовершенствование полученных ранее результатов. Исследование методов кодирования на основе PN и APN функций привело к созданию новых схем обнаружения ошибок, способных обнаруживать любую комбинацию ошибок с заданной вероятностью. Данный проект призван расширить применение методов кодирования на основе PN и APN функций. Коды на основе PN и APN функций впервые будут использованы для обеспечения целостности информации, инструкций и арифметических блоков в векторных сопроцессорах. В этом отношении предлагаемый научный проект обладает новизной и представляет большую практическую ценность при решении задач обеспечения целостности и защиты информации. Предлагаемые аппаратно-ориентированные методы позволяют эффективно использовать преимущества векторных вычислений при решении задач моделирования динамических систем, описываемых дифференциальными уравнениями, в т.ч. уравнениями в частных производных. Использование композиционных и экстраполяционных схем позволяет распараллеливать решение задач, не предусматривающих естественного параллелизма, и существенно ускорять процесс моделирования сложных систем за счет использования векторных вычислений. Предлагаемые новые алгоритмы рекуррентного и бифуркационного анализа, в свою очередь, основаны на особых свойствах авторских методов численного моделирования, как то: наличие нескольких вариантов коммутации одного и того же алгоритма, обладающих равной скоростью расхождения траектории решения и общими статистическими свойствами, что позволяет избежать выбора изначального смещения и перенормировки при расчете ляпуновского спектра и фрактальной размерности. Обратимость и симметричность таких алгоритмов позволяет моделировать консервативные нелинейные системы на длительных интервалах времени без искажения фазовых и энергетических свойств модели в отличие от используемых сейчас явных и неявных методов интегрирования. Опираясь на опыт коллектива в построении кодовых конструкций вейвлетных AMD кодов, оценке вероятности маскировки ошибок для большого кол-ва конструкций, а также выполнения теоретических и практических задач аналогичного масштаба в теории помехоустойчивого кодирования, можно утверждать, что возможность получения запланированных результатов сомнений не вызывает. Используемые в исследовании методы и ожидаемые результаты соответствуют мировому уровню, они не имеют аналогов в нашей стране и за рубежом.

Ожидаемые результаты
1. Новый метод вычисления позиционной характеристики на основе модифицированной китайской теоремы об остатках (КТО) и искусственных нейронных сетях, позволяющий переводить числа из системы остаточных классов (СОК) в позиционную систему счисления. Уточнить существующие оценки количества разрядов, необходимых в методе КТОм для реализации немодульных операций. 2. Новый численный метод вычисления позиционной характеристики, основанный на модифицированной функции ядра. Доказать, что в отличии от классической формы функции ядра, модифицированная форма является строго монотонной, что позволяет сократить количество операций для точного определения взаимного положения двух чисел на числовой прямой. Разработать нейросетевой метод к вычислению позиционных характеристик позволяет сократить количество используемых в вычислениях разрядов относительно КТОм. Установить точное значение количества знаков после запятой, необходимое для выполнения операции сравнения чисел на основе модифицированной функции ядра. 3. Новые методы обеспечения целостности для структуры векторного сопроцессора на основе кодовых конструкций, использующих PN и APN функции, способных обнаружить ошибки любой кратности, в предложенных методах будут использоваться кодовые конструкции построенные на вэйвлетных и сплайн-вэйвлетных преобразованиях, конструкции будут представлять AMD коды – коды устойчивые к алгебраическим манипуляциям. 4. Новые нейросетевые алгоритмы выполнения операции сравнения чисел, представленных в системе остаточных классов, основанные на использовании различных форм функции ядра, а также подход к их аппаратной реализации на основе алгоритмов вычисления функции ядра и модифицированной функции ядра, основанных на модели обобщенной функции ядра. Разработанный метод минимум в 1.4 раза эффективнее с точки зрения занимаемой площади, минимум в 1.4 раз быстрее и в 1.5 раза энергоэффективнее аналогов. 5. На основе модифицированной диагональной функции как минимальной модифицированной функции ядра разработать алгоритмы определения знака числа и определения переполнения диапазона модулярных чисел. Разработать схемы их аппаратной реализации. 6. Разработать нейросетевой подход к определению, локализации и исправлению ошибок в коде СОК, сочетающий в себе метод проекций, реализованный на базе модифицированной диагональной функции, и метод расширения диапазона представления чисел в СОК, основанный на функции ядра. 7. Энергоэффективные нейросетевые цифровые фильтры на базе интеграции системы остаточных классов и искусственных нейронных сетей. 8. Новый нейросетевой алгоритм модульного умножения чисел в системе остаточных классов основанный на интеграции искусственных нейронных сетей и приближенного метода, который в минимум в 1.7 раз выигрывает в площади и минимум в 1.8 раз во временной задержке по сравнению с существующими подходами. 9. Алгоритмы многоразрядной арифметики на базе интеграции системы остаточных классов и искусственных нейронных сетей для эллиптической криптографии. 10. Реконфигурируемый процессор цифровой обработки сигналов, использующего систему остаточных классов для маломощных приложений. 11. Высокопроизводительные аппаратно-ориентированные алгоритмы численного моделирования динамических систем, использующие векторный принцип организации вычислений и превосходящие по вычислительной эффективности известные методы. 12. Высокопроизводительные алгоритмы анализа нелинейных сигналов и систем на основе подходов рекуррентного, статистического, фазового и бифуркационного анализа, адаптированных в соответствии с парадигмой векторных вычислений. 13. Математическое описание семейства дискретных хаотических отображений, обладающих свойством ротационной симметрии и функциональной вариабельности в зависимости от свойств входного сигнала, а также данные об их фазовых, бифуркационных и статистических свойствах. 14. Архитектура генераторов псевдослучайных последовательностей с повышенной криптостойкостью и управляемыми статистическими свойствами на основе новых дискретных хаотических отображений. 15. Методика высокопроизводительного шифрования изображений аппаратными средствами на основе хаотических генераторов псевдослучайных последовательностей с использованием векторных вычислений.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2019 году
Разработаны методы и алгоритмы проектирования систем остаточных классов с диагональной функцией специального вида. Применение диагональной функции вида 2^n или 2^n-1 позволяет снизить затраты при аппаратной реализации проблемных операций системы остаточных классов: сравнения чисел, определения знака числа, обнаружения, локализация и исправления ошибок и деления. Сравнение предложенных методов и алгоритмов с известными подходами на основе Китайской теоремы об остатках и Китайской теоремы об остатках с дробными вычислениями проводилось на основе экспериментального аппаратного моделирования на FPGA Xilinx Artix 7 xc7a200tfbg484-2 в системе автоматизированного проектирования Vivado 2016.3. Результаты моделирования для системы остаточных классов с тремя модулями показали, что разработанные подходы позволяют сократить аппаратные затраты на 5.98–49.72%. Результаты моделирования для системы остаточных классов с четырьмя модулями показали, что разработанные подходы позволяют сократить время выполнения проблемных операций на 4.92–21.95% и уменьшить аппаратные затраты на 50%, по сравнению с известными аналогами. Разработан метод аппаратной реализации сверточной нейронной сети для распознавания образов с использованием вычислений в системе остаточных классов. Минимизированная конфигурация сверточной нейронной сети включает сверточный слой, слой выбора максимальных элементов и классификатор, который организован как традиционный многослойный персептрон. Аппаратное моделирование операции свертки показало, что использование предложенного метода, основанного на системе остаточных классов с набором модулей специального вида, позволяет сократить аппаратные затраты на 32,6% по сравнению с реализацией в традиционной двоичной системе счисления. Сравнение предлагаемой аппаратной архитектуры с программной реализацией, показало, что использование аппаратно-программной архитектуры сокращает среднее время распознавания изображения на 62,66 %. Разработаны методы обеспечения целостности для арифметических блоков векторного сопроцессора, кэш-памяти и управляющих инструкций. Разработанные методы основаны на кодах, исправляющих ошибки, использующих вэйвлетные разложения. Разработанные вэйвлетные AMD коды и AMD коды на основе функции Маорана-МакФарланда обеспечивают более высокий уровень целостности арифметических блоков векторного сопроцессора, кэш-памяти и управляющих инструкций (более 73 %). Разработаны методы анализа влияния различных типов программных ошибок, в том числе ошибок умножения и комбинированных ошибок, на анализируемые методы обеспечения целостности. С целью изучения характеристик построенной системы обеспечения целостности для защиты кэш-памяти были созданы программные модели блока обнаружения ошибок и системы кодирования на основе вейвлетных кодов. В разработанных программных моделях был проанализирован процент верно обнаруженных ошибок. Результаты экспериментов по внедрению ошибок, полученные для AMD кодов на основе функции Маорана-МакФарланда, имеют наилучший процент обнаруживаемых ошибок, поскольку являются конструкциями на основе PN функций. Разработаны методы повышения основных исследуемых параметров криптостойкости, вероятности пропуска ошибки, сложности программной реализации для целевых методов. В основу методов повышения основных исследуемых параметров криптостойкости и вероятности пропуска ошибки положены коды, основанные на вэйвлет разложениях, коды на основе функции Майорана-МакФарланда, код на основе мультипликативного обратного. Разработаны методы оценки аппаратных реализаций векторного сопроцессора к атакам по побочным каналам. Проведено тестирование разработанных методов с параметрами, соответствующими защищаемому сопроцессору, на устойчивость к атакам на основе внедрения ошибок, а также к изменению распределения входных значений. По сравнению с AMD кодами на основе функций Майорана-МакФарланда, реализация на основе вейвлетных AMD кодов имеет на 5% меньшие площадь чипа и энергопотребление как для кодирования, так и для декодирования информации. Разработан метод оценки стандартных параметров (ограничения на входные и выходные параметры, вычислительная сложность, вероятность маскировки и обнаружения ошибок) для наилучших методов, подходящих под структуру сопроцессора. Разработаны высокопроизводительные аппаратно-ориентированные алгоритмы численного моделирования динамических систем, использующие векторный принцип организации вычислений и превосходящие по вычислительной эффективности известные методы. В качестве опорного метода при создании высокопроизводительных моделей динамических систем были выбраны геометрические полуявные алгоритмы интегрирования, модифицированные для выполнения с использованием векторных умножителей. В отличие от классических рекуррентных формул интегрирования, параллельные методы позволяют реализовывать аппаратные структуры с построчной передачей значений переменных состояния в N параллельных процессоров решения. Разработаны как одношаговые, так и многошаговые версии аппаратно-ориентированных методов. Проведен анализ вычислительной эффективности, показывающий превосходство предложенных методов над известными версиями алгоритмов, использующих скалярные вычисления. Для реализации основных задач проекта были разработаны высокопроизводительные алгоритмы рекуррентного, фазового и бифуркационного анализа нелинейных сигналов и систем, адаптированных для реализации на векторных вычислителях. Для распараллеливания вычислений при построении рекуррентных и бифуркационных диаграмм использовалось свойство естественного параллелизма данных задач, возникающее при условии старта решения с общих начальных условий. Для решения задач обнаружения фазового джиттера был создан специализированный инструмент – диаграммы фазового джиттера, отражающих динамику изменения координат локальных экстремумов в зависимости от параметра нелинейности. Разработаны рекомендации по использованию инструментальных средств при выполнении профилирования алгоритмов для вычисления предложенных метрик. Разработаны средства сбора статистики обращений в память от команд MSA для эмулятора QEMU. При сборе статистикой информации учитываются такие параметры обращений в память, как ширина, выравненность, пространственная (распределение по массиву памяти) и временная (частота обращений к одной области памяти) локализация. Проведенные исследования по результатам профилирования позволили локализовать текущие узкие места производительности процессорных элементов, а также сформулировать перечень наиболее ресурсоёмких вычислительных операций. На основе статистической обработки результатов вычисления введённых метрик на эмуляторе QEMU для различных векторных архитектур процессоров предложена модель архитектуры векторного сопроцессора на основе ядра MIPS для заданного набора задач обработки данных, включающая основные аппаратные блоки процессора. Исследована её эффективность. В результате работы по проекту были исследованы существующие подходы к построению классификаторов объектов не остове визуальных данных. Исследование наиболее перспективных из них выявило тенденции и преимущества глубоких конволюционных сетей для решения этих проблем. С учетом выявленных особенностей, была построена теория, предложены методы и алгоритмы, позволяющие реализовать непрерывное онлайн обучение с априорными гарантиями и оценками на качество финальной системы. Теория, методы, и алгоритмы применимы для широкого класса нелинейных классификаторов, включая глубокие нейронные сети. Основное отличие предложенных результатов от известных подходов заключаются в том, что вычислительная сложность результирующих алгоритмов оказывается сублинейной по размеру данных, а реальные затраты на имплементацию ограничиваются вычислением 10 – 100 скалярных произведений.

 

Публикации

1. Каплун Д.И., Тутуева А.В., Бутусов Д.Н., Каримов А.И., Томинг Я. Memristive Circuit Simulation Using the Semi-Implicit Multistep Method Proceedings of the 42nd International Conference on Telecommunications and Signal Processing, TSP 2019, Номер статьи 8769117, страницы 98-101 (год публикации - 2019).

2. Каплун Д.И., Червяков Н.И., Ляхов П.А., Ионисян А.С., Валуева М.В., Гульванский В.В., Рангабабу П. Hardware Implementation of Video Processing Device using Residue Number System Proceedings of the 42nd International Conference on Telecommunications and Signal Processing, TSP 2019, Номер статьи 8769117, страницы 98-101 (год публикации - 2019).

3. Левина А., Мостовой Р., Цветков Л. Physical model of sensitive data leakage from PC-based cryptographic systems Journal of Cryptographic Engineering, Том 9, выпуск 4, стр.393-400 (год публикации - 2019).

4. Левина А.Б., Кадыков В.Ю., Каплун Д.И. New direction in Cryptography: Homomorphic Encryption Proceedings of the 2nd International Conference on Advances in Electrical, Electronic and System Engineering, 2019, ICAEESE 2019, - (год публикации - 2019).

5. Мария Валуева, Георгий Валуев, Наталья Семёнова, Павел Ляхов, Николай Червяков, Дмитрий Каплун, Данил Богаевский Construction of Residue Number System Using Hardware Efficient Diagonal Function Electronics, 8(6), номер статьи 694 (год публикации - 2019).

6. Тюкин И.Ю., Горбань А.Н., Макиван А., Мешкинфамфард С. Bringing the Blessing of Dimensionality to the Edge Proceedings of the 1st International Conference on Industrial Artificial Intelligence, IAI 2019, Номер статьи 8850825 (год публикации - 2019).


Аннотация результатов, полученных в 2020 году
Разработана архитектура сверточной нейронной сети, разделенная на аппаратную и программную части для улучшения производительности и снижения ресурсных затрат на ее реализацию. Аппаратная часть нейронной сети была реализована с использованием вычислений в системе остаточных классов (СОК) для сверточных слоев. Программное моделирование разработки в MATLAB продемонстрировало успешное обучение предложенной нейронной сети. Аппаратное моделирование сверточных слоев на FPGA Kintex7 xc7k480tffg901-2 позволило продемонстрировать, что применение вычислений в СОК позволяет сократить аппаратные затраты на 7,86%-37,78% по сравнению с известными аналогами в двоичном дополнительном коде. Кроме того, предложенная гетерогенная реализация сверточной нейронной сети с интерфейсом взаимодействия AXI4 между FPGA и настольным компьютером позволила сократить время распознавания изображений в среднем на 41,17%. Было проведено исследование возможности оптимизации сверточных слоев глубокой нейронной сети за счет использования в системе обработки различных методов предварительной обработки изображений (адаптивных медианных фильтров, предварительно настроенных фильтров выделения контуров). Предложен алгоритм генерации СОК с тремя и четырьмя модулями, обладающих диагональной функцией с удобной формой реализации на микроэлектронных устройствах для эффективного выполнения таких немодульных операций, как деление, определение знака, сравнение и обратное преобразование чисел в позиционную систему счисления. Рассмотренные специальные случаи диагональной функции СОК позволили значительно упростить реализацию операции деления с остатком на диагональный модуль системы. Было продемонстрировано, что существует ровно 5573 СОК с тремя модулями, не превосходящими 10000 с диагональной функцией, не превышающей 27 бит. В то же время, количество СОК с четырьмя модулями и диагональной функцией удобного вида оказалось значительно меньшим. Была найдена всего 31 СОК с модулями, меньшими 4000. Была предложена мера баланса для нахождения идеально сбалансированных систем СОК среди найденных троек и четверок. Аппаратное моделирование проводилось на Xilinx Artix 7 xc7a200tfbg484-2 и подтвердило преимущества более сбалансированных СОК. Разработан метод обратного преобразования чисел в позиционную систему счисления из двухступенчатой СОК с модулями специального вида в каждой из ступеней. Предложенный подход основан на использовании Китайской теоремы об остатках с дробными величинами и методе оптимизации модулярного умножения на константу за счет использования сжатия операндов. Моделирование разработки на FPGA Xilinx xc7k480t3ffg901 показало преимущество в скорости выполнения операции по сравнению с известными методами на основе вычислений по модулю диапазона системы. Полученный результат открывает новые возможности для применения многоступенчатых СОК на практике, например в системах обработки и передачи информации, подверженных шумовым воздействиям, требующих использования корректирующих кодов с обнаружением и исправление ошибок. Разработан новый алгоритм для выполнения деления чисел в СОК на основе Китайской теоремы об остатках с дробными величинами, использующий только операции сдвига и вычитания на каждой итерации. Предложенный алгоритм позволяет избежать использования таких вычислительно-сложных операций, как обратное преобразование, преобразование в обобщенную позиционную систему счисления, расширение набора оснований путем их замены на значительно более простую операцию вычитания. Кроме того, была оптимизирована процедура определения старшего значащего бита делителя за счет использования простой операции сдвига. Указанные улучшения алгоритма деления позволили реализовать операцию деления в СОК значительно проще и быстрее известных на сегодняшний день аналогов. Экспериментальное моделирование разработки с целевым устройством Kintex-7 KC705 XC7K70T-2FBG676 без использования блоков DSP48E1B показало увеличение скорости в 7,6 раз по сравнению с алгоритмами на основе традиционной формы Китайской теоремы об остатках и увеличение скорости в 10,1 раз по сравнению с подходами на основе преобразования чисел в обобщенную позиционную систему счисления и использующими стандартные функции из последних версий библиотеки IEEE для реализации арифметических операций на FPGA. Дальнейшим направлением исследований в данной области является внедрение разработанного алгоритма в проблемно-ориентированные приложения, использующие вычисления в СОК, включающие операцию деления. Был предложен метод преобразования позиционных кодов в коды алгебры конечного поля, обладающий рядом преимуществ перед существующими методами. Показаны возможности и преимущества оптимизации структуры вычислительного канала для работы цифрового фильтра на основе кодов алгебры конечных полей. Представлена модифицированная структура вычислительного канала. Он отличается от традиционной структуры тем, что в нем нет явного преобразователя кода. Основной принцип состоит в том, что в качестве входных отсчетов используются «эталонные» значения входных отсчетов, не содержащие погрешности аналого-цифрового преобразователя. Предлагаемый подход позволяет добиться более высокого качества обработки сигналов в современных цифровых фильтрах. Разработаны кодовые конструкций для защиты средств хранения, использующих технологию NAND-флэш. Проведено сравнение различных кодовых конструкций для защиты средств хранения, использующих технологию NAND флэш, выявлены кодовые конструкции, обеспечивающих наивысший уровень защиты. Кодовые конструкции представляют новый класс AMD кодов (кодов, детектирующих алгебраические манипуляции) построенный на вэйвлетных разложениях. Проведено сравнение разработанных конструкций с кодами Хэмминга, Рида-Соломона, БЧХ кодами, классическими AMD кодами. Разработаны методы защиты линейных частей криптоалгоритмов при атаках на основе внедрения ошибок. Выявлены наиболее перспективные методы защиты линейных частей криптоалгоритмов при атаках на основе внедрения ошибок. Рассмотрены и оценены уязвимости линейных частей криптоалгоритмов к атакам на основе внедрения ошибок в облачных вычислениях. Наиболее эффективными способом для защиты линейных частей криптоалгоритмов являются использование бент-функций в переключаемых операциях, еще одним способом защиты криптоалгоримтов может являться использование White Box Cryptography (WBC). Разработаны векторные алгоритмы и программные средства построения фазовых портретов непрерывных динамических систем, а также их дискретных отображений. Проведена сравнительная оценка разработанных алгоритмов при их реализации на ЭВМ традиционной архитектуры и ЭВМ с векторным принципом вычислений. Показано, что применение векторных вычислений позволяет повысить производительность расчетов решений нелинейных динамических систем, описываемых обыкновенными дифференциальными или алгебраическими уравнениями во временной области в несколько раз. Разработаны алгоритмы и программные средства для бифуркационного и рекуррентного анализа динамических систем различной природы, поддерживающие векторный принцип вычислений. Экспериментальная оценка производительности предложенных алгоритмов показывает существенное преимущество в вычислительной эффективности над традиционными скалярными процедурами анализа. Создана аппаратная реализация алгоритмов построения рекуррентных диаграмм и динамических карт в FPGA XilinX. Данная реализация была синтезирована путем трансляции целочисленных программ среды LabVIEW в целевую платформу ПЛИС FPGA путем автоматической генерации кода. Проведена дополнительная оптимизация полученных решений с целью снижения аппаратных затрат. Показано, что разработанные решения позволяют существенно ускорить традиционные процедуры анализа нелинейных систем и процессов за счет применения векторных вычислителей с параллельной архитектурой. Показано, что аппаратная реализация процедур рекуррентного и бифуркационного анализа на ПЛИС позволяет дополнительно ускорить исследование динамики нелинейных систем и процессов. Разработана архитектура аппаратных генераторов псевдослучайных последовательностей, оптимизированная для исполнения на вычислительных платформах с параллельной архитектурой. В основе созданных генераторов лежат пары связанных дискретных хаотических отображений с функционально управляемой симметрией, в том числе, с управлением посредством внешнего сигнала. Данная особенность позволяет сконструировать генераторы псевдослучайных чисел с высокой криптостойкостью и производительностью, что особенно актуально в контексте решения задач потокового шифрования данных. Синтезированы аппаратные прототипы генераторов псевдослучайных чисел (ПСЧ) с параллельной архитектурой. Для синтеза битовой карты использовался пакет автоматической генерации кода FPGA Module с последующей оптимизацией в NI FPGA Compile Farm. Показано, что генерируемые последовательности удовлетворяют требованиям к случайности, предъявляемым современными алгоритмами шифрования данных. Экспериментально подтверждена высокая производительность полученных аппаратных решений по сравнению с программными генераторами ПСЧ. В ходе выполнения проекта был разработан новый метод уменьшения размерности данных для пост-классических задач классификации на основе двухстадийной полу-супервизорной фильтрации с помощью нейронной сети нового типа прямого распространения с «концептными» нейронами с последующей проекцией результата фильтрации на главные компоненты для дальнейшей классификации. Результаты были протестированы в задаче диагностики астмы на реальных медицинских данных. В этой части проекта был предложен новый подход к оснащению периферийных или близких к периферии устройств возможностями быстрого обучения на рабочем месте и постоянного улучшения с течением времени при наличии большого количества ошибок. Подход основан на теоремах стохастического разделения и явлениях концентрации меры. Было показано и подтверждено экспериментально, что эти новые возможности могут быть реализованы на периферийных устройствах с ограниченными вычислительными способностями и развернуты полностью автоматизированным способом. Экспериментально исследована чувствительность алгоритма к изменению его мета-параметров, таких как количество используемых кластеров и проекций. Результаты напрямую отвечают фундаментальной задаче устранения ошибок ИИ в промышленных приложениях при минимальных вычислительных затратах. Выявлено и проанализировано новое состояние мультиагентных систем, включая системы искусственного интеллекта – свирлон. Он состоит из завихрений, образованных группами активных частиц, вращающихся вокруг своего общего центра масс. Эти квазичастицы демонстрируют удивительное поведение: в ответ на внешнюю нагрузку они движутся с постоянной скоростью, пропорциональной приложенной силе, как объекты в вязкой среде. Вихри притягиваются друг к другу и сливаются, образуя более крупный совместный вихрь. В отличие от молекулярных систем жидкое и газообразное состояния активного вещества не сосуществуют. Это необычное явление может объясняться отсутствием быстрых частиц в активном веществе. Для анализа явления было проведено как численное моделирование, так и теоретический анализ. Предсказания теории качественно и количественно согласуются с результатами моделирования. Мы предлагаем использовать внедренные счетчики производительности в QEMU, предоставляющую значительный набор современных процессорных платформ, чтобы относительно легко фиксировать динамическое поведение программы. Предлагаемая нами методика состоит в том, чтобы идентифицировать классы программ, и для каждого класса мы строим хорошую последовательность оптимизации либо вручную, либо с помощью итерационной техники компиляции. Затем мы можем использовать алгоритм классификации программ для идентификации метки класса для каждой новой программы и использовать соответствующую последовательность оптимизации при ее компиляции. Трудность здесь заключается в определении особенностей программы и модели классификации программ. Еще одна проблема при построении хороших последовательностей для каждого из классов программ заключается в идентификации критерия выбора метрических характеристик класса программы для построения хорошей последовательности компиляции. Предлагаемая методика полностью обходит эту проблему, начиная с последовательностей оптимизации и затем определяя метрики программ, которые они охватывают. По сути, мы полностью меняем метод выбора последовательности, используя классификацию программ. Исследованы способы векторизации кода для моделей реализации алгоритмов на MIPS c расширением MSA: ассемблерные вставки, интринсики, SIMD-директивы компилятора, языковые расширения и библиотеки. Разработан подход к реализации блоков кодека h.264 в СОК для векторного процессора с расширением MSA. В рамках предложенного подхода была исследована эффективность реализации элементов кодека на эмуляторе QEMU с использованием введённых в проекте метрик (степень векторизации, выравнивание данных, временная и пространственная локализация) для СОК с трёмя и четырьмя модулями, выполнена аппаратная реализация на FPGA Kintex Ultra Scale xcku035-ffva1156-2-e. Проведены исследования зависимости значений метрик от меры сбалансированности СОК, предложенной в рамках данного проекта.

 

Публикации

1. Бергельман М.В., Ляхов П.А., Вознесенский А.С., Богаевский Д.В., Каплун Д.И. Designing reverse converter for data transmission systems from twolevel RNS to BNS Journal of Physics: Conference Series, 1658 (2020), 012005 (год публикации - 2020).

2. Бойваленков П., Червяков Н.И., Ляхов П.А., Семёнова Н.Ф., Назаров А.С., Валуева М.В., Бойваленков Г., Богаевский Д.В., Каплун Д.И. Classification of Moduli Sets for Residue Number System With Special Diagonal Functions IEEE Access, vol. 8, pp. 156104-156116 (год публикации - 2020).

3. Боргес В., Непомусена Е.Г., Тутуева А.В., Каримов А.И., Дюк К., Каримов Т.И. Analysis of IIR Filters by Interval Response Proceedings of the 2020 Moscow Workshop on Electronic and Networking Technologies (MWENT), pp. 1-5 (год публикации - 2020).

4. Бриллиантов Н.В., Абутайа Х., Тюкин И.Ю., Матвеев С.А. Swirlonic state of active matter Scientific Reports, 10, Article number: 16783 (год публикации - 2020).

5. Валуева М.В., Нагорнов Н.Н., Ляхов П.А., Валуев Г.В., Червяков Н.И. Application of the residue number system to reduce hardware costs of the convolutional neural network implementation Mathematics and Computers in Simulation, 177 (2020), 232–243 (год публикации - 2020).

6. Каплун Д.И., Аряшев С.И., Велигоша А.В., Дойникова Е.В., Ляхов П.А., Бутусов Д.Н. Improving Calculation Accuracy of Digital Filters Based on Finite Field Algebra Applied Sciences, 10(1), 45 (год публикации - 2019).

7. Левина А.Б., Каменев И., Зикратов И. Implementation White Box Cryptography in Substitution-Permutation network Proceedings of the 9th Mediterranean Conference on Embedded Computing (MECO-2020), pp. 1-3 (год публикации - 2020).

8. Левина А.Б., Молдовян Н.А., Ряскин Г., Зикратов И. Switchable Controlled Operations with Bent Functions Proceedings of the 9th Mediterranean Conference on Embedded Computing (MECO-2020), pp. 1-5 (год публикации - 2020).

9. Червяков Н.И., Ляхов П.А., Бабенко М.Г., Лавриненко И.Н., Дерябин М.А., Лавриненко А.В., Назаров А.С., Валуева М.В., Вознесенский А.С., Каплун Д.И. A Division Algorithm in a Redundant Residue Number System Using Fractions Applied Sciences, 10(2), 695 (год публикации - 2020).

10. Юрьева Р.А., Таранов С.В., Пенской А.В., Кремлев А.С. Ensuring Confidentiality of Information When Processing Operational Production Plans in Cloud Services Proceedings of the 17th International Conference on Informatics in Control, Automation and Robotics (ICINCO 2020), pages 167-173 (год публикации - 2020).