Genius智能体：用10%的数据和2小时训练击败人类玩家

近日，Verses 团队开发的 Genius 智能体在经典游戏《Pong》中取得了令人瞩目的成绩。仅用 10% 的数据和 2 小时的训练时间，Genius 就超越了顶尖人类玩家和其他 AI 模型。这一成果不仅标志着 AI 技术的又一里程碑，也为未来智能体的发展提供了新的方向。

Genius 智能体的成功归功于其创新的设计理念。与传统的大规模模型相比，Genius 的规模仅为当前 SOTA 模型 IRIS 的 4%，并且能够在普通的 M1 芯片 MacBook 上高效运行。这一灵感来源于四年前的一项实验，科学家们发现培养的“盘中大脑”仅需 5 分钟就能学会《Pong》游戏，这激发了研究人员模仿人脑工作方式的思路。

Genius 智能体：用 10% 的数据和 2 小时训练击败人类玩家

Verses 团队指出，传统的大模型 AI 智能体在逻辑推理方面存在明显不足。这些模型更多依赖于记忆训练数据中的推理步骤，缺乏真正的主动性和好奇心。而 Genius 智能体引入了认知引擎的概念，不仅具备认知、推理和决策能力，还赋予了智能体主动学习的能力。

在与 IRIS 和其他 AI 模型的对比测试中，Genius 展现出了卓越的学习能力。研究者仅用 2 小时和 1 万步的游戏数据对 Genius 进行训练，结果显示其表现超过了训练两天的 IRIS。Genius 的成功不仅在于其快速学习能力，更在于其在游戏中的主动表现。例如，在《Pong》比赛中，Genius 即使在落后的情况下也能逆转获胜，这种现象在 IRIS 的训练中从未出现。

然而，研究者也提醒，尽管 Genius 的表现令人振奋，但目前仍缺乏一个能够全面衡量 AGI（通用人工智能）表现的统一标准。因此，需要通过多样化的测试来验证其在不同领域的适应性和可靠性。

这一成果不仅推动了 AI 智能体的发展，也为未来的机器智能探索提供了新的思路和方法。

感兴趣的读者可以查阅相关论文：https://arxiv.org/pdf/2410.05229。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}}已认证

Genius智能体：用10%的数据和2小时训练击败人类玩家

谷歌“Titans”模型：仿生设计实现200万Token超长上下文的突破

在 AI 版权案中，扎克伯格以 YouTube 的内容管理为例为 Meta 辩护

{{userData.name}}已认证

相关文章：

谷歌“Titans”模型：仿生设计实现200万Token超长上下文的突破

在 AI 版权案中，扎克伯格以 YouTube 的内容管理为例为 Meta 辩护

McAfee推出AI诈骗检测工具，助力用户防范网络骗局

中国生成式 AI 蓬勃发展，用户规模突破2.49亿，多维度彰显强劲态势

全球首个太空AI数据中心模块成功部署，Lumen Orbit联合SpaceX开启零碳算力新时代

百万年薪抢人！DeepSeek开启人才争夺战