Адаптивное управление светофорным объектом с использованием машинного обучения с подкреплением

Остапенко П. В.; Сапрыкин О. Н.

Отрывок: В исследовании использовался марковский алгоритм принятия решений Q- learning [3]. Для этого мы вводим функцию Q, отражающую ценность каждого возможного действия агента а (в нашем случае – светофора) для текущего состояния моделирования s, в котором он находится Секция 4. Проектирование, производство, эксплуатация авиационной техники и организация транспортных процессов 236 𝑄(𝑠, 𝑎) (1) ...

Название :	Адаптивное управление светофорным объектом с использованием машинного обучения с подкреплением
Авторы/Редакторы :	Остапенко П. В. Сапрыкин О. Н.
Дата публикации :	2019
Библиографическое описание :	Остапенко, П. В. Адаптивное управление светофорным объектом с использованием машинного обучения с подкреплением / П. В. Остапенко, О. Н. Сапрыкин // XV Королевские чтения [Электронный ресурс] : междунар. молодеж. науч. конф., посвящ. 100-летию со дня рождения Д. И. Козлова : сб. тр. : 8-10 окт. 201 / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т) ; [науч. ред. М. А. Шлеенков]. - 2019. - Т. 1. - С. 235-236
Другие идентификаторы :	RU\НТБ СГАУ\431048
Ключевые слова:	адаптивное управление светофорами оптимизация работы светофора методы машинного обучения микросимуляторы движения транспортная инфраструктура городов управление дорожным движением
Располагается в коллекциях:	Королевские чтения

Файлы этого ресурса:

Файл	Размер	Формат
XV Королевские чтения 2019 Том 1-235-236.pdf	747.98 kB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса Просмотр статистики
Поделиться:

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий Самарского университета