Отрывок: 37 3 ɂɋɋɅȿȾɈȼȺɌȿɅɖɋɄȺə ɑȺɋɌɖ 3.1 ɋɩɟɰɢɮɢɤɚɰɢɹ ɫɪɟɞɵ ɢɫɩɵɬɚɧɢɣ ȼ ɤɚɱɟɫɬɜɟ ɫɪɟɞɵ ɢɫɩɵɬɚɧɢɹ ɚɥɝɨɪɢɬɦɨɜ ɛɵɥ ɜɵɛɪɚɧ ɫɢɦɭɥɹɬɨɪ ɢɝɪ Atari 2600 (ɩɪɨɝɪɚɦɦɧɵɣ ɞɨɫɬɭɩ ɤ ɧɟɦɭ ɨɫɭɳɟɫɬɜɥɹɥɫɹ ɩɨɫɪɟɞɫɬɜɨɦ ɛɢɛɥɢɨɬɟɤɢ OpenAI Gym). Atari 2600 – ɷɬɨ ɞɨɦɚɲɧɹɹ ɜɢɞɟɨɢɝɪɨɜɚɹ ɩɪɢɫɬɚɜɤɚ, ɜɵɩɭɳɟɧɧɚɹ ɜ 1977 ɝ ɢ ɛɵɫɬɪɨ ɡɚɜɨɟɜɚɜɲɚɹ ɩɨɩɭɥɹɪɧɨɫɬɶ. ɋɢɦɭɥɹɬɨɪ ɜɤɥɸɱɚɟɬ 55 ɢɝɪ. ...
Название : | Исследование подходов к мета-обучению с подкреплением на примере игр Atari 2600 |
Авторы/Редакторы : | Никитин И. В. Лезин И. А. Министерство образования и науки Российской Федерации Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) |
Дата публикации : | 2017 |
Библиографическое описание : | Никитин, И. В. Исследование подходов к мета-обучению с подкреплением на примере игр Atari 2600 : вып. квалификац. работа по спец. "Информатика и вычислительная техника" / И. В. Никитин ; рук. работы И. А. Лезин ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Фак-т информатики, Каф. информ. систем и технологий. - Самара, 2017. - on-line |
Другие идентификаторы : | RU\НТБ СГАУ\ВКР20170703160524 |
Ключевые слова: | асинхронный актор-критик марковский процесс принятия решений обучение с подкреплением |
Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
Никитин_Иван_Викторович_Исследование_подходов_мета.pdf | 1.09 MB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.