Использование алгоритма PPO для обучения с подкреплением в средах с дискретным и непрерывным пространством действий

Баранов И. С.; Савельев Д. А.

Отрывок: Информационные технологии и анализ данных 451 Было уменьшено количество сверточных слоев в базовой нейронной сети [5], а затем постепенно увеличивалось. Исследование показало, что при увеличении количества сверточных слоев до определенного момента увеличивается награда, получаемая агентом за эпизод. На рисунке 3 представлены графики зависимости награды агента за эпизод от шага обучения, при этом график красного цвета показывает зависимость при 3 сверточных слоя...

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.author	Баранов И. С.	ru
dc.contributor.author	Савельев Д. А.	ru
dc.coverage.spatial	базовая нейронная сеть	ru
dc.coverage.spatial	алгоритмы РРО	ru
dc.coverage.spatial	игровые среды	ru
dc.coverage.spatial	обучение с подкреплением	ru
dc.coverage.spatial	обучение тестирующего агента	ru
dc.coverage.spatial	обучение в визуальной среде	ru
dc.coverage.spatial	тестирование игр	ru
dc.coverage.spatial	сверточная нейронная сеть	ru
dc.creator	Баранов И. С., Савельев Д. А.	ru
dc.date.issued	2021	ru
dc.identifier	RU\НТБ СГАУ\471605	ru
dc.identifier.citation	Баранов, И. С. Использование алгоритма PPO для обучения с подкреплением в средах с дискретным и непрерывным пространством действий / И. С. Баранов, Д. А. Савельев // XVI Королевские чтения : междунар. молодеж. науч. конф., посвящ. 60-летию полета в космос Ю. А. Гагарина : сб. материалов : 5-7 окт. 2021 г. : в 3 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т) ; [науч. ред. М. А. Шлеенков]. - 2021. - Т. 1. - С. 450-451	ru
dc.relation.ispartof	XVI Королевские чтения : междунар. молодеж. науч. конф., посвящ. 60-летию полета в космос Ю. А. Гагарина : сб. материалов : 5-7 окт. 2021 г. : в 3 т.	ru
dc.source	XVI Королевские чтения. - Т. 1	ru
dc.title	Использование алгоритма PPO для обучения с подкреплением в средах с дискретным и непрерывным пространством действий	ru
dc.type	Text	ru
dc.citation.epage	451	ru
dc.citation.spage	450	ru
dc.citation.volume	1	ru
dc.textpart	Информационные технологии и анализ данных 451 Было уменьшено количество сверточных слоев в базовой нейронной сети [5], а затем постепенно увеличивалось. Исследование показало, что при увеличении количества сверточных слоев до определенного момента увеличивается награда, получаемая агентом за эпизод. На рисунке 3 представлены графики зависимости награды агента за эпизод от шага обучения, при этом график красного цвета показывает зависимость при 3 сверточных слоя...	-
Располагается в коллекциях:	Королевские чтения

Файлы этого ресурса:

Файл	Размер	Формат
978-5-7883-1668-0_2021-450-451.pdf	681.75 kB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики
Поделиться:

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий Самарского университета