DeepHack RL Михаил Павлов (5vision)

Недавно в Москве проходил очередной хакатон DeepHack по обучению с подкреплением, в котором надо было написать универсального агента для игр Atari. Михаил Павлов рассказал решение своей команды 5vision, с которым они заняли второе место. Из видео вы сможете узнать: - Как задача обучения с подкреплением может быть превращена в задачу обучения с учителем - Откуда набирать обучающую выборку - Как решается проблема наличия случайности в среде - Какой подход применять на этапе обучения модели по готовой выборке - Какие существуют проблемы в обучении с учителем и как их можно решать - Как можно улучшить использованный подход DeepHack RL: Слайды: Код: и Узнать о текущих соревнованиях можно на сайте Узнать о новых тренировках и видео можно из групп: ВКонтакте Facebook

1 view

174