Reinforcement Learning 6. Часть 2

Прочитаем и обсудим вместе статью от deepmind. Гипотеза «награды достаточно» предполагает, что агенты с мощными алгоритмами обучения с подкреплением, помещенные в богатую среду с простыми наградами, могут развить широкий, многоатрибутный интеллект, который составляет искусственный общий интеллект. Ссылка на статью в описании. Let’s read and discuss together the article from deepmind. The reward-is-enough hypothesis suggests that agents with powerful reinforcement learning algorithms when placed in rich environments with simple rewards could develop the kind of broad, multi-attribute intelligence that constitutes an artificial general intelligence.
Back to Top