Отрывок: В исследовании использовался марковский алгоритм принятия решений Q- learning [3]. Для этого мы вводим функцию Q, отражающую ценность каждого возможного действия агента а (в нашем случае – светофора) для текущего состояния моделирования s, в котором он находится Секция 4. Проектирование, производство, эксплуатация авиационной техники и организация транспортных процессов 236 𝑄(𝑠, 𝑎) (1) ...
Название : | Адаптивное управление светофорным объектом с использованием машинного обучения с подкреплением |
Авторы/Редакторы : | Остапенко П. В. Сапрыкин О. Н. |
Дата публикации : | 2019 |
Библиографическое описание : | Остапенко, П. В. Адаптивное управление светофорным объектом с использованием машинного обучения с подкреплением / П. В. Остапенко, О. Н. Сапрыкин // XV Королевские чтения [Электронный ресурс] : междунар. молодеж. науч. конф., посвящ. 100-летию со дня рождения Д. И. Козлова : сб. тр. : 8-10 окт. 201 / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т) ; [науч. ред. М. А. Шлеенков]. - 2019. - Т. 1. - С. 235-236 |
Другие идентификаторы : | RU\НТБ СГАУ\431048 |
Ключевые слова: | адаптивное управление светофорами оптимизация работы светофора методы машинного обучения микросимуляторы движения транспортная инфраструктура городов управление дорожным движением |
Располагается в коллекциях: | Королевские чтения |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
XV Королевские чтения 2019 Том 1-235-236.pdf | 747.98 kB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.