Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций
Конференция: ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ (ИТММ-2021); Томск; Томск
Год издания: 2022
Ключевые слова: marl, Q-learning, MDP, система управления светофорами
Аннотация: Рассматривается проблема оптимизации планов координаций на основе управления выбором задержки сигнала для светофорных объектов участка дорожной сети. В качестве математической модели светофорной сети используется управляемый марковский процесс с конечным числом действий и состояний, а задача минимизации задержек движения транспортнПоказать полностьюых средств сводится к задаче мультиагентного обучения с подкреплением (MARL). Для исследования представленной модели была разработана программа имитационного моделирования в системе AnyLogic и проведены серии вычислительных экспериментов.
Журнал: ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ (ИТММ-2021)
Номера страниц: 380-385
Место издания: Томск