Embodied AI Reading Club | Построение стратегии поведения по языковой инструкции в сложных мультимодальных средах
В докладе рассматриваются идеи, предложенные в статьях “Game On: Towards Language Models as RL Experimenters“ () и “Instruction Following with Goal-Conditioned Reinforcement Learning in Virtual Environments“ ().
В первой работе авторы используют большую языковую модель для построения учебного плана обучения RL-агента в задаче следования инструкциям, что позволяет автоматически генерировать последовательность подзадач для эффективного обучения. Во второй статье языковая модель предсказывает высокоуровневый план по языковой инструкции, а RL-агент обучается с помощью учебного плана на различных списках возможных задач
Недостатком этих подходов является необходимость иметь заранее определенный список подзадач, на основе которого языковая модель формирует план. Однако хотелось бы, чтобы модель самостоятельно строила план, не полагаясь на заданный перечень возможных задач
Рассматриваются подходы, которые позволяют:
– строить стратегию поведения в сложных мультимодальных средах по языковой инструкции
– формировать автономные учебные планы с помощью языковых моделей для обучения RL-агента
– создавать гибкие планы действий без фиксированного списка подзадач
Статьи:
1. Game On: Towards Language Models as RL Experimenters:
2. Instruction Following with Goal-Conditioned Reinforcement Learning in Virtual Environments:
Не пропускайте анонсы новых мероприятий и будьте в курсе новостей:
▪️Телеграм-канал AIRI:
▪️Комьюнити AIRI: g57c7ytnSY9jYzUy
▪️Телеграм-канал Embodied AI Reading Club:
38 views
1090
296
2 days ago 00:09:44 1
Cosmo World , Minato Mirai vlog^
4 days ago 00:51:13 371
Co-Evolving Teaching Practices in the AI Age | IEW2024
6 days ago 00:02:12 8
Picture this: ‘Ming dynasty official’ Elon Musk tackling laziness one kick at a time
1 week ago 00:48:48 257
Embodied AI Reading Club | Новые подходы в области RL агентов с памятью
2 weeks ago 00:01:13 5
Birch Grove of Fear
2 weeks ago 00:01:52 1
Bitcoin Holders | Power in Crypto 4K
3 weeks ago 00:01:53 502
[Royal Trailer] The Legend of Zelda (2025) - Teaser Trailer | Tom Holland, Anya Taylor-Joy
3 weeks ago 00:55:50 38
Embodied AI Reading Club | Построение стратегии поведения по языковой инструкции в сложных мультимодальных средах
3 weeks ago 00:03:28 29
[Poltan] БАЙДЕН - Я РУССКИЙ (AI COVER)
4 weeks ago 01:12:34 62
Embodied AI Reading Club | Vision-and-Language Navigation
4 weeks ago 01:07:05 34
Embodied AI Reading Club | Rep’n’plan-подходы к построению и коррекции плана действий с помощью LLM для Embodied AI
4 weeks ago 01:17:43 44
Embodied AI Reading Club | Применение трансформерных моделей для Embodied AI
4 weeks ago 00:38:37 82
Embodied AI Reading Club | Методы определения неопределённости языковых моделей
4 weeks ago 00:25:48 1
What do tech pioneers think about the AI revolution? - BBC World Service
1 month ago 00:00:55 1
Meet ENGINEAI Flagship SE01 Humanoid AI Hardware.
1 month ago 00:01:00 1
COUNTRIES AS WARRIORS 💀 #countries #Warriors #Warrior #ai #fast_ai
1 month ago 00:02:17 1
Introducing Unitree Go2 - Quadruped Robot of Embodied AI from $1600
1 month ago 00:06:31 1
Pink Floyd- Dark Side of the moon - Money- Video Animation for Competition
1 month ago 00:01:00 4
COUNTRIES AS WARRIORS 💀 #countries #Warriors #Warrior #ai #fast_ai #midjourney #chatgpt
1 month ago 00:08:06 1
Mystery of The Ancient Greek City Bizarrely Located in Afghanistan
1 month ago 00:01:01 1
Ai Draws Countries As Like Animals Part 5!
1 month ago 00:03:20 1
Retro Future Visions - 1950s Simplicity Reimagined - Dreams of the 1950s.
1 month ago 02:00:00 1
Pilgrimage of the Knights Templar - Chants of the Holy Mission
1 month ago 02:04:57 1.7K
AIJ Contest 2024: разбор задачи Embodied AI (вебинар 2)