Прочитаем и обсудим вместе статью от deepmind. Гипотеза «награды достаточно» предполагает, что агенты с мощными алгоритмами обучения с подкреплением, помещенные в богатую среду с простыми наградами, могут развить широкий, многоатрибутный интеллект, который составляет искусственный общий интеллект.
Ссылка на статью в описании.
Let’s read and discuss together the article from deepmind.
The reward-is-enough hypothesis suggests that agents with powerful reinforcement learning algorithms when placed in rich environments with simple rewards could develop the kind of broad, multi-attribute intelligence that constitutes an artificial general intelligence.