Метод ансамблирования алгоритмов обучения с подкреплением на основе иерархичности

Козлов Д. А.

Отрывок: 3. Обновление параметров каждого алгоритма. IX Международная конференция и молодёжная школа «Информационные технологии и нанотехнологии» (ИТНТ-2023) Секция 4. Искусственный интеллект 040602 4. Получение действия от каждого алгоритма и мета-действия. На основе дискретного мета- действия производится выбор одного из действий алгоритмов ансамбля в качестве выходного. Рис. 1. Рассматриваемый алгоритм 4. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ В эксп...

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.author	Козлов Д. А.	ru
dc.coverage.spatial	randomized ensembled double q-learning	ru
dc.coverage.spatial	soft actorcritic	ru
dc.coverage.spatial	deep q-learning	ru
dc.coverage.spatial	машинное обучение	ru
dc.coverage.spatial	мета-алгоритм	ru
dc.coverage.spatial	обучение с подкреплением	ru
dc.creator	Козлов Д. А.	ru
dc.date.accessioned	2023-10-03 15:45:51	-
dc.date.available	2023-10-03 15:45:51	-
dc.date.issued	2023	ru
dc.identifier	RU\НТБ СГАУ\541234	ru
dc.identifier.citation	Козлов, Д. А. Метод ансамблирования алгоритмов обучения с подкреплением на основе иерархичности / Д. А. Козлов // Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - Фил. Федер. науч.-исслед. центра "Кристаллография и фотоника" Рос. акад. наук. - Самара : Изд-во Самар. ун-та, 2023Т. 4: Искусственный интеллект / под. ред. А. В. Никонорова. - 2023. - С. 040602.	ru
dc.identifier.uri	http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Metod-ansamblirovaniya-algoritmov-obucheniya-s-podkrepleniem-na-osnove-ierarhichnosti-105727	-
dc.description.abstract	Предлагается алгоритм ансамблирования нескольких алгоритмов обучения с подкреплением. Предложенный подход действует в среднем эффективнее чем каждый из алгоритмов в ансамбле по отдельности. В статье рассматривается ансамбль из алгоритмов REDQ и SAC. Выходом из ансамбля является выход алгоритма, выбранного с помощью DQN. Возможно ансамблирование других алгоритмов и в другом количестве. Обучение с подкреплением является перспективной областью в машинном обучении. Важной нерешенной задачей обучения с подкреплением является обобщение сложных задач, и решение их при помощи мета-алгоритмов. Предлагаемый метод возможно использовать в сложных задачах, состоящих из многих подзадач, эффективные решения для которых могут предложить различные алгоритмы из ансамбля.	ru
dc.language.iso	rus	ru
dc.relation.ispartof	Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6	ru
dc.source	Информационные технологии и нанотехнологии (ИТНТ-2023). - Т. 4 : Искусственный интеллект	ru
dc.title	Метод ансамблирования алгоритмов обучения с подкреплением на основе иерархичности	ru
dc.type	Text	ru
dc.citation.spage	040602	ru
dc.citation.volume	4	ru
dc.textpart	3. Обновление параметров каждого алгоритма. IX Международная конференция и молодёжная школа «Информационные технологии и нанотехнологии» (ИТНТ-2023) Секция 4. Искусственный интеллект 040602 4. Получение действия от каждого алгоритма и мета-действия. На основе дискретного мета- действия производится выбор одного из действий алгоритмов ансамбля в качестве выходного. Рис. 1. Рассматриваемый алгоритм 4. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ В эксп...	-
Располагается в коллекциях:	Информационные технологии и нанотехнологии

Файлы этого ресурса:

Файл	Размер	Формат
978-5-7883-1920-9_2023-040602.pdf	297.12 kB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики
Поделиться:

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий Самарского университета