Отрывок: Информационные технологии и анализ данных 451 Было уменьшено количество сверточных слоев в базовой нейронной сети [5], а затем постепенно увеличивалось. Исследование показало, что при увеличении количества сверточных слоев до определенного момента увеличивается награда, получаемая агентом за эпизод. На рисунке 3 представлены графики зависимости награды агента за эпизод от шага обучения, при этом график красного цвета показывает зависимость при 3 сверточных слоя...
Полная запись метаданных
Поле DC Значение Язык
dc.contributor.authorБаранов И. С.ru
dc.contributor.authorСавельев Д. А.ru
dc.coverage.spatialбазовая нейронная сетьru
dc.coverage.spatialалгоритмы РРОru
dc.coverage.spatialигровые средыru
dc.coverage.spatialобучение с подкреплениемru
dc.coverage.spatialобучение тестирующего агентаru
dc.coverage.spatialобучение в визуальной средеru
dc.coverage.spatialтестирование игрru
dc.coverage.spatialсверточная нейронная сетьru
dc.creatorБаранов И. С., Савельев Д. А.ru
dc.date.issued2021ru
dc.identifierRU\НТБ СГАУ\471605ru
dc.identifier.citationБаранов, И. С. Использование алгоритма PPO для обучения с подкреплением в средах с дискретным и непрерывным пространством действий / И. С. Баранов, Д. А. Савельев // XVI Королевские чтения : междунар. молодеж. науч. конф., посвящ. 60-летию полета в космос Ю. А. Гагарина : сб. материалов : 5-7 окт. 2021 г. : в 3 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т) ; [науч. ред. М. А. Шлеенков]. - 2021. - Т. 1. - С. 450-451ru
dc.relation.ispartofXVI Королевские чтения : междунар. молодеж. науч. конф., посвящ. 60-летию полета в космос Ю. А. Гагарина : сб. материалов : 5-7 окт. 2021 г. : в 3 т.ru
dc.sourceXVI Королевские чтения. - Т. 1ru
dc.titleИспользование алгоритма PPO для обучения с подкреплением в средах с дискретным и непрерывным пространством действийru
dc.typeTextru
dc.citation.epage451ru
dc.citation.spage450ru
dc.citation.volume1ru
dc.textpartИнформационные технологии и анализ данных 451 Было уменьшено количество сверточных слоев в базовой нейронной сети [5], а затем постепенно увеличивалось. Исследование показало, что при увеличении количества сверточных слоев до определенного момента увеличивается награда, получаемая агентом за эпизод. На рисунке 3 представлены графики зависимости награды агента за эпизод от шага обучения, при этом график красного цвета показывает зависимость при 3 сверточных слоя...-
Располагается в коллекциях: Королевские чтения

Файлы этого ресурса:
Файл Размер Формат  
978-5-7883-1668-0_2021-450-451.pdf681.75 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.