Занятие №15 «Обучение с подкреплением»

Занятие №15 «Обучение с подкреплением» Пятнадцатое занятие курса «Нейронные сети и их применение в научных исследованиях» для группы НС204. Преподаватель: Дмитрий Иванов. Таймкоды: 00:00 Reinforcement Learning 02:29 MDP 31:22 Давайте теперь искать наилучшую политику или наилучший способ поведения 48:39 Bellman 01:16:25 Библиотека OpenAI Gym 01:20:24 MDP practice 01:24:21 Разбор практики и вопросы Официальный сайт: ​
Back to Top