Метод обучения интеллектуального агента с помощью сетей Double DQN, путевых точек и функции вознаграждения : научное издание

Описание

Тип публикации: статья из журнала

Год издания: 2024

Идентификатор DOI: 10.18413/2518-1092-2024-9-3-0-7

Ключевые слова: self-driving car, lane following, intelligent control, agent, neural network, deep Q-learning, simulation, беспилотный автомобиль, полоса движения, интеллектуальное управление, агент, нейронная сеть, глубокое Q-обучение, симуляция

Аннотация: Рассмотрены задачи повышения эффективности управления автономных транспортных средств. Выделена проблема снижения требуемых вычислительных ресурсов для интеллектуального модуля управления автомобилем. Предложен алгоритм обучения нейронной сети для архитектуры Double DQN с модифицированной функций вознаграждения. Основой предлагаемоПоказать полностьюго решения является использование сегментации полосы движения, функции вознаграждения и использования дополнительных путевых точек при обучении. Разработана программная модель и выполнено моделирование процесса обучения. Полученные результаты сравнительного анализа с известными решениями показывают стабильное повышение длительности эпизода, и эффективное обучение в реалистичной городской симуляции. Исследование указывает на возможность уменьшения необходимости в высокой вычислительной мощности, что даст возможность использовать центральные процессоры (CPU) для основных функций беспилотных автомобилей вместо графических процессоров (GPU). The problems of increasing the control efficiency of autonomous vehicles are considered. The problem of reducing the required computational resources for the intelligent vehicle control module is highlighted. A neural network training algorithm for Double DQN architecture with modified reward functions is proposed. The basis of the proposed solution is the use of lane segmentation, reward function and the use of additional waypoints in training. A software model has been developed and simulation of the learning process has been performed. The results obtained from a comparative analysis with known solutions show a stable increase in episode duration, and effective training in a realistic urban simulation. The study points to the possibility of reducing the need for high computing power, which will enable the use of central processing units (CPUs) for basic functions of unmanned vehicles instead of graphics processing units (GPUs).

Ссылки на полный текст

Издание

Журнал: Научный результат. Информационные технологии

Выпуск журнала: Т. 9, 3

Номера страниц: 63-72

ISSN журнала: 25181092

Место издания: Белгород

Издатель: Белгородский государственный национальный исследовательский университет

Персоны

  • Тихонов Максим Константинович (Сибирский федеральный университет)
  • Непомнящий Дмитрий Олегович (Сибирский федеральный университет)
  • Хайдукова Валерия Николаевна (Сибирский федеральный университет)

Вхождение в базы данных