TD Learning и Q-learning // Демо-занятие курса Reinforcement Learning

Вместе с экспертом погрузимся во временно-разностное обучение и Q-learning. Поговорим об основных идеях обучения с подкреплением, которые делают алгоритм RL более гибким и эффективным. Разберем алгоритм SARSA с различными примерами реализации. Обсудим сильные и слабые стороны каждого решения. Для кого: DS/ML/DL специалисты, IT-специалисты, которые хотят погрузиться в обучение с подкреплением «Reinforcement Learning» - Преподаватель: Андрей Маргерт - исследователь Машинного Обучения в Wageningen Research, работает над технологиями для улучшения качества, безопасности и доступности продуктов Пройдите опрос по итогам мероприятия - Следите за новостями проекта: - Telegram: - ВКонтакте: - LinkedIn: - Хабр:

1 view