近日,Verses 团队开发的 Genius 智能体在经典游戏《Pong》中取得了令人瞩目的成绩。仅用 10% 的数据和 2 小时的训练时间,Genius 就超越了顶尖人类玩家和其他 AI 模型。这一成果不仅标志着 AI 技术的又一里程碑,也为未来智能体的发展提供了新的方向。
Genius 智能体的成功归功于其创新的设计理念。与传统的大规模模型相比,Genius 的规模仅为当前 SOTA 模型 IRIS 的 4%,并且能够在普通的 M1 芯片 MacBook 上高效运行。这一灵感来源于四年前的一项实验,科学家们发现培养的“盘中大脑”仅需 5 分钟就能学会《Pong》游戏,这激发了研究人员模仿人脑工作方式的思路。
Verses 团队指出,传统的大模型 AI 智能体在逻辑推理方面存在明显不足。这些模型更多依赖于记忆训练数据中的推理步骤,缺乏真正的主动性和好奇心。而 Genius 智能体引入了认知引擎的概念,不仅具备认知、推理和决策能力,还赋予了智能体主动学习的能力。
在与 IRIS 和其他 AI 模型的对比测试中,Genius 展现出了卓越的学习能力。研究者仅用 2 小时和 1 万步的游戏数据对 Genius 进行训练,结果显示其表现超过了训练两天的 IRIS。Genius 的成功不仅在于其快速学习能力,更在于其在游戏中的主动表现。例如,在《Pong》比赛中,Genius 即使在落后的情况下也能逆转获胜,这种现象在 IRIS 的训练中从未出现。
然而,研究者也提醒,尽管 Genius 的表现令人振奋,但目前仍缺乏一个能够全面衡量 AGI(通用人工智能)表现的统一标准。因此,需要通过多样化的测试来验证其在不同领域的适应性和可靠性。
这一成果不仅推动了 AI 智能体的发展,也为未来的机器智能探索提供了新的思路和方法。
感兴趣的读者可以查阅相关论文:https://arxiv.org/pdf/2410.05229。