共计 651 个字符,预计需要花费 2 分钟才能阅读完成。
无论是围棋还是《DOTA2》,AI 总喜欢通过玩游戏来展示实力。然而,当谷歌的 Gemini 2.5 Pro 成功独立通关初代《宝可梦》时,这不再是简单的炫技,而是一次意义深远的技术突破。
游戏中的复杂挑战
十年前,AlphaGo 在围棋领域展现了惊人的能力,但那时的 AI 大多依赖于强化学习和预设规则。相比之下,《宝可梦》则完全不同。这款游戏看似简单,但其中涉及的属性克制、随机事件和模糊目标,对 AI 来说却是巨大挑战。
美国公司 Anthropic 曾尝试让 Claude 3.7 Sonnet 通关《宝可梦》,结果却屡屡受挫。一年的努力仅让 Claude 获得了三个徽章,而更早的版本甚至无法离开初始小镇。
感知与决策的双重考验
Claude 的失败并非偶然。它需要通过游戏画面获取信息,而像素化的图像对 AI 来说犹如迷宫。此外,属性克制系统的复杂性也让 Claude 难以应对,但它依然展示了独特的思维逻辑,比如主动选择“认输”以回到安全地带。
相比之下,Gemini 的表现更为亮眼。它在更少的步骤内完成了游戏,但两者的测试条件并不相同,因此无法直接对比。Gemini 的优势在于其代理执行框架,它能更好地解析地图并优化操作。
通往通用智能之路
让 AI 玩《宝可梦》的意义在于,它不仅考验了 AI 的学习能力和适应性,还展示了未来通用人工智能的可能性。正如开发者所说,这不仅仅是技术的炫耀,更是迈向复杂现实问题解决方案的重要一步。
《宝可梦》的冒险旅程不仅是玩家的成长之旅,更是 AI 理解世界规则的起点。或许,未来的 AI 不仅能通关游戏,还能解决现实生活中的难题。