Genius智能体:用10%的数据和2小时训练击败人类玩家

近日, 团队开发的 智能体在经典游戏《Pong》中取得了令人瞩目的成绩。仅用 10% 的数据和 2 小时的训练时间,Genius 就超越了顶尖人类玩家和其他 AI 模型。这一成果不仅标志着 AI 技术的又一里程碑,也为未来智能体的发展提供了新的方向。

Genius 智能体的成功归功于其创新的设计理念。与传统的大规模模型相比,Genius 的规模仅为当前 SOTA 模型 IRIS 的 4%,并且能够在普通的 M1 芯片 MacBook 上高效运行。这一灵感来源于四年前的一项实验,科学家们发现培养的“盘中大脑”仅需 5 分钟就能学会《Pong》游戏,这激发了研究人员模仿人脑工作方式的思路。

Genius 智能体:用 10% 的数据和 2 小时训练击败人类玩家

Verses 团队指出,传统的大模型 AI 智能体在逻辑推理方面存在明显不足。这些模型更多依赖于记忆训练数据中的推理步骤,缺乏真正的主动性和好奇心。而 Genius 智能体引入了认知引擎的概念,不仅具备认知、推理和决策能力,还赋予了智能体主动学习的能力。

在与 IRIS 和其他 AI 模型的对比测试中,Genius 展现出了卓越的学习能力。研究者仅用 2 小时和 1 万步的游戏数据对 Genius 进行训练,结果显示其表现超过了训练两天的 IRIS。Genius 的成功不仅在于其快速学习能力,更在于其在游戏中的主动表现。例如,在《Pong》比赛中,Genius 即使在落后的情况下也能逆转获胜,这种现象在 IRIS 的训练中从未出现。

然而,研究者也提醒,尽管 Genius 的表现令人振奋,但目前仍缺乏一个能够全面衡量 AGI(通用人工智能)表现的统一标准。因此,需要通过多样化的测试来验证其在不同领域的适应性和可靠性。

这一成果不仅推动了 AI 智能体的发展,也为未来的机器智能探索提供了新的思路和方法。

感兴趣的读者可以查阅相关论文:https://arxiv.org/pdf/2410.05229。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
人已打赏
行业动态

谷歌“Titans”模型:仿生设计实现200万Token超长上下文的突破

2025-1-21 18:39:45

行业动态

在 AI 版权案中,扎克伯格以 YouTube 的内容管理为例为 Meta 辩护

2025-1-21 18:51:57

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索