Тип публикации: статья из журнала
Год издания: 2018
Ключевые слова: учебная деятельность, активный агент, вознаграждение, конечный автомат, educational activity, active agent, reward, finite state machine
Аннотация: Рассмотрена математическая модель научения активного агента в электронной проблемной среде, в условиях институциональной оценочной обратной связи. Институциональная оценочная обратная связь обеспечивается конечным автоматом «Ликвидатор». В приближении Марковских конечных цепей найдено распределение вероятностей состояний конечного Показать полностьюавтомата «Ликвидатора». Получены численные оценки вознаграждений действий активного агента и приведены примеры реализации траекторий суммарного вознаграждения. Построена гистограмма распределения суммарного вознаграждения целевых состояний активного агента.
Журнал: Математические методы в технике и технологиях - ММТТ
Выпуск журнала: Т. 5
Номера страниц: 86-90
ISSN журнала: 25879049
Место издания: Саратов
Издатель: Федеральное государственное бюджетное образовательное учреждение высшего образования "Саратовский государственный технический университет имени Гагарина Ю.А."