Отрывок: Информационные технологии и анализ данных 451 Было уменьшено количество сверточных слоев в базовой нейронной сети [5], а затем постепенно увеличивалось. Исследование показало, что при увеличении количества сверточных слоев до определенного момента увеличивается награда, получаемая агентом за эпизод. На рисунке 3 представлены графики зависимости награды агента за эпизод от шага обучения, при этом график красного цвета показывает зависимость при 3 сверточных слоя...
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Баранов И. С. | ru |
dc.contributor.author | Савельев Д. А. | ru |
dc.coverage.spatial | базовая нейронная сеть | ru |
dc.coverage.spatial | алгоритмы РРО | ru |
dc.coverage.spatial | игровые среды | ru |
dc.coverage.spatial | обучение с подкреплением | ru |
dc.coverage.spatial | обучение тестирующего агента | ru |
dc.coverage.spatial | обучение в визуальной среде | ru |
dc.coverage.spatial | тестирование игр | ru |
dc.coverage.spatial | сверточная нейронная сеть | ru |
dc.creator | Баранов И. С., Савельев Д. А. | ru |
dc.date.issued | 2021 | ru |
dc.identifier | RU\НТБ СГАУ\471605 | ru |
dc.identifier.citation | Баранов, И. С. Использование алгоритма PPO для обучения с подкреплением в средах с дискретным и непрерывным пространством действий / И. С. Баранов, Д. А. Савельев // XVI Королевские чтения : междунар. молодеж. науч. конф., посвящ. 60-летию полета в космос Ю. А. Гагарина : сб. материалов : 5-7 окт. 2021 г. : в 3 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т) ; [науч. ред. М. А. Шлеенков]. - 2021. - Т. 1. - С. 450-451 | ru |
dc.relation.ispartof | XVI Королевские чтения : междунар. молодеж. науч. конф., посвящ. 60-летию полета в космос Ю. А. Гагарина : сб. материалов : 5-7 окт. 2021 г. : в 3 т. | ru |
dc.source | XVI Королевские чтения. - Т. 1 | ru |
dc.title | Использование алгоритма PPO для обучения с подкреплением в средах с дискретным и непрерывным пространством действий | ru |
dc.type | Text | ru |
dc.citation.epage | 451 | ru |
dc.citation.spage | 450 | ru |
dc.citation.volume | 1 | ru |
dc.textpart | Информационные технологии и анализ данных 451 Было уменьшено количество сверточных слоев в базовой нейронной сети [5], а затем постепенно увеличивалось. Исследование показало, что при увеличении количества сверточных слоев до определенного момента увеличивается награда, получаемая агентом за эпизод. На рисунке 3 представлены графики зависимости награды агента за эпизод от шага обучения, при этом график красного цвета показывает зависимость при 3 сверточных слоя... | - |
Располагается в коллекциях: | Королевские чтения |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
978-5-7883-1668-0_2021-450-451.pdf | 681.75 kB | Adobe PDF | Просмотреть/Открыть |
Показать базовое описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.