Многокритериальный алгоритм дифференциальной эволюции для поиска функции потерь в нейронных сетях

Описание

Тип публикации: статья из журнала

Год издания: 2024

Ключевые слова: neural networks, loss function, polynomial approximation, multi-objective optimization, differential evolution, дифференциальная эволюция, многокритериальная оптимизация, нейронные сети, полиномиальная аппроксимация, функция потерь

Аннотация: В работе предлагается подход к автоматической настройке коэффициентов функции потерь, выраженной в виде полинома, с помощью многокритериального алгоритма дифференциальной эволюции. Настройка коэффициентов в функции потерь происходит с целью повышения качества распознавания валидационной выборки по двум критериям: точности и f-мере.Показать полностьюНайденная функция потерь дополнительно протестирована на ряде других архитектур сверточных нейронных сетей. Целью данной работы являются исследование множества альтернатив и построение фронта Парето для задачи настройки коэффициентов полиномиальной аппроксимации функции потерь в нейронных сетях. Для достижения указанной цели были решены следующие задачи: спроектирован и реализован многокритериальный алгоритм дифференциальной эволюции с сортировкой по недоминированию, реализована полиномиальная аппроксимация функции потерь, проведены эксперименты на задачах распознавания изображений с различными архитектурами. In this study, an approach to automatic tuning of loss function coefficients is proposed, with loss function being implemented as a polynomial and optimized with multi-objective differential evolution algorithm. The tuning of the coefficients in the loss function is performed in order to improve the recognition quality on the validation sample according to two criteria - accuracy and f-measure. The found loss function is additionally tested on a set of other architectures of convolutional neural networks. The purpose of this study is to explore a set of alternatives and build a Pareto front for the problem of tuning the coefficients of the polynomial approximation of a loss function in neural networks. In order to achieve this goal, the following tasks were set and completed: the multi-objective differential evolution algorithm with non-dominated sorting was designed and implemented, polynomial approximation of the loss function was implemented, and the experiments on the problems of image recognition were performed with different architectures.

Ссылки на полный текст

Издание

Журнал: Наука и бизнес: пути развития

Выпуск журнала: 3

Номера страниц: 20-24

ISSN журнала: 22215182

Место издания: Москва

Издатель: Межрегиональная общественная организация "Фонд развития науки и культуры"

Персоны

  • Морозов Э.В. (ФГБОУ ВО «Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева»)
  • Становов В.В. (ФГБОУ ВО «Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева»)

Вхождение в базы данных