Пятнадцатое занятие на курсе «Нейронные сети и их применение в научных исследованиях» для группы НС262 шестого потока обучения.
Преподаватель: Артём Васильев
Дата:
00:00 Заставка
01:04 Reinforcement learning (RL)
05:00 Обучение с подкреплением
11:53 Примеры задач, решаемых с использованием RL
22:03 Устоявшаяся терминология
23:20 Stateless environment in RL
24:02 Задача о многоруких бандитах
29:07 Gymnasium framework
35:40 Поиск оптимальной стратегии решения
50:52 Cross-entropy method (CEM)
51:29 Пример оптимизации недифференцируемого функционала
59:51 Пример CEM в gym
01:14:45 Марковский процесс принятия решений (Markov decision process, MDP)
01:16:49 Markov property
01:17:37 Markov process
01:31:07 Проблема поиска оптимальной политики
01:56:37 Поиск оптимальной политики Беллмана для MDP (решение “MDP“)
02:36:59 Пример c CartPole DQN
Материалы лекции:
Открыть в Colab:
Открыть в HTML-формате:
298 views
698
195
2 weeks ago 00:09:12 1.1K
КАК убрать тягу к еде на ночь, сладкому и ПЕРЕКУСАМ?
2 weeks ago 07:53:37 3
Ср. ().
2 weeks ago 00:00:00 1
Онлайн-лекции «Иду на лекцию в колледж/вуз с российским ПО»
2 weeks ago 01:22:03 878
Проблема кашля у детей — подходы к дифференциальной диагностике
2 weeks ago 00:52:23 836
Алексей Савватеев об образовании, путешествиях и супе
2 weeks ago 01:57:46 1
Личный бренд с Еленой Степановой. Часть 1
2 weeks ago 01:15:26 2K
ПРИВЕТ, БИЗНЕС! | Павел Серяков ✖ Алексей Кенда | ПОДКАСТ
2 weeks ago 00:34:55 1
Лекция “Есть такая наука – иммунология“. Место проведения: ГПНТБ СО РАН, ул. Восход, 15
2 weeks ago 00:43:46 351
Гауридас Киртания дас, лекция по Шримад Бхагаватам, ()
2 weeks ago 01:22:29 5
Артамонов
2 weeks ago 01:17:29 15
Нейросети в маркетинге: успехи, фейлы и реальные кейсы
2 weeks ago 01:28:05 178
Мостовой С.Д.-Диаграммы Фейнмана в статистической физике-11. Электронный газ: теория возмущений
2 weeks ago 00:13:24 2.7K
Мастер-класс по вшиванию декоративной молнии
2 weeks ago 00:18:53 39
Веришь ли ты в ОСОЗНАННОСТЬ?
2 weeks ago 01:34:56 570
128 :: Открытая лекция :: Белые Облака - “Искусство создания и управления своим пространством”
2 weeks ago 01:16:55 5
Степаньянц К.В. - Суперсимметрия в ФЭЧ - 12.Объединение бегущих констант связи в МССМ
2 weeks ago 00:47:51 512
Новейшая история. #16. Страны Латинской Америки во второй половине ХХ – начале XXI века. Часть I