Мультиагентное обучение с подкреплением применительно к дорожной сети города Красноярска : доклад, тезисы доклада

Описание

Перевод названия: MULTIAGENT REINFORCEMENT LEARNING FOR INTEGRATED NETWORK: APPLYING TO A PART OF THE ROAD NETWORK OF KRASNOYARSK CITY

Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций

Конференция: Системы управления, информационные технологии и математическое моделирование; Омск; Омск

Год издания: 2023

Ключевые слова: Marlin, IDM, q-learning, MDP, traffic light control system, система управления светофорами

Аннотация: В статье исследуется модель процесса выбора фаз светофорных объектов участка дорожной сети. Данная модель основывается на предположении, что каждый светофорный объект является агентом, который выбирает определенную фазу светофора в зависимости от текущей дорожной ситуации. В качестве математической модели используется управляемый мПоказать полностьюарковский процесс с конечным числом действий и состояний. Цель управления - минимизировать время проезда транспортных средств через участок дорожной сети - сводится к задаче мультиагентного обучения с подкреплением для координированных агентов (MARLIN). Для оптимального управления агентами-светофорами был реализован алгоритм Q-обучения. Для симуляции дорожного трафика использовалась микроскопическая модель IDM. Для исследования модели был разработан комплекс программных средств и произведена серия вычислительных экспериментов. The article examines a mathematical model of the selecting phases process of traffic light facilities of the road network section. This model is based on the assumption that each traffic light object is an agent that selects a certain traffic light phase depending on the current traffic situation. A Markov decision process with a finite number of actions and states is used as a mathematical model. The decision process is to minimize the delay in vehicle traffic. The minimization problem is reduced to the Multiagent Reinforcement Learning for Integrated Network (MARLIN) problem. A Q-learning algorithm was implemented for optimal agent control. Microscopic Intellectual Driver Model (IDM) was used to simulate traffic. To study the model, a set of software tools was developed and a series of computational experiments were conducted.

Ссылки на полный текст

Издание

Журнал: Системы управления, информационные технологии и математическое моделирование

Номера страниц: 115-122

Место издания: Омск

Издатель: Омский государственный технический университет

Персоны

  • Тисленко Т.И. (Сибирский федеральный университет)

Вхождение в базы данных