智能体崛起：如何颠覆未来计算方式

201次阅读

共计 2097 个字符，预计需要花费 6 分钟才能阅读完成。

最近备受瞩目的 OpenAI 新项目再度传来好消息。内部消息人士透露，OpenAI 正在酝酿一款代号为「草莓（Strawberry）」的新 AI，计划在今年秋天推出。这款 AI 拥有卓越的推理能力，能够处理复杂的数学和编程任务，甚至可以帮助解决一些非技术问题。

据报道，这项技术对未来的 AI 产品，尤其是那些要解决多步骤任务的「智能体（Agent）」，意义重大。自从 2022 年底 ChatGPT 风靡后，「智能体」这一概念迅速从学术讨论走向行业前沿，引爆了广泛关注。从开源项目 AutoGPT 到 OpenAI 的 GPTs 和 GPT 商店，这些都是 AI 智能体潜力逐渐显现的结果。

可以说，2023 年，人工智能领域的竞争和发展大多集中在大模型本身，但智能体的探索才刚刚起步。而到 2024 年，国内外的科技公司，像 Google、百度、阿里巴巴、字节跳动和 OpenAI，都在加速智能体的落地。大家都在谈论「智能体」，但它究竟是什么呢？

关注 AI 的朋友们一定听过「智能体」这个词，但很多人对其定义可能模糊不清。事实上，微软创始人比尔·盖茨在 1995 年就提到过「智能体」的概念，但近三十年中，这一概念已经经历了很大变化，尤其是自 ChatGPT 以来，基于大模型的智能体才真正进入大众视野。

目前，学术界对「智能体」并没有统一的定义，不过普遍认为，「智能体」是能够自主感知环境、制定计划并执行任务的智能实体，区别于「副驾驶」，它更像是「主驾驶」。

可以用一个简单的公式来理解：Agent（智能体）= LLM（大模型）+ Planning（规划）+ Feedback（反馈）+ Tool use（工具使用）。以人类通过 ChatGPT 写一篇文章为例，首先要确定选题，然后让 AI 辅助生成大纲，再利用 AI 的搜索能力进行分析与调研，接着生成初稿，并通过不断反馈来优化内容，直到得到最终版本。而 AI 智能体正是通过自主的规划、反馈与工具使用，减少了人类的介入。

说白了，AI 智能体通过反复迭代和对话的方式进行工作，不再是简单的指令执行工具，而是能够自我反思、规划及修正的参与者。智能体被认为是大模型上生长出的全新角色。

如比尔·盖茨所言，智能体不仅将改变我们与计算机的互动方式，还可能颠覆整个软件行业，将带来自从我们用键盘输入命令以来最大的计算革命。

不仅仅是盖茨看好智能体的发展，斯坦福大学的吴恩达教授在今年 3 月也提到，他们基于 GPT-3.5 推出的智能体工作流在应用中表现出色，有望在 2024 年推动 AI 的大规模发展，甚至可能超越下一代基础模型的影响力。

在今年 7 月的世界人工智能大会上，智能体已经成为了瞩目的焦点。蚂蚁集团的 CEO 井贤栋在演讲中表示，专业智能体是将大模型应用到实际产业中的有效路径。百度创始人李彦宏也认可智能体作为未来人工智能发展的重要方向。

与此同时，谷歌推出了 AI 智能体平台 Oscar，使开发者可以通过简单配置生成多种 AI 智能体。值得注意的是，并非谷歌一家在此布局，百度有自己的 AgentBuilder，字节跳动则推出了扣子（Coze）与 HiAgent，阿里巴巴有百炼智能体和钉钉智能体，腾讯的微信也在发展云开发 AI 智能体……智能体平台正逐渐成为大模型厂商的标配，百度甚至提出「人人都是开发者」的口号。

可以说，经过 2023 年的思考与实验，智能体在 2024 年已成为人工智能行业的新共识。这种智能体让 AI 从单纯的技术概念向实际场景应用迈出了重要一步。

去年底，OpenAI 推出了 GPTs 和 GPT 商店，用户无需编码就能创建自己的 GPT 版本，但这些 GPT 在功能上仍然类似于「副驾驶」，缺乏将任务拆解及分步执行的能力。目前许多自称为 AI Agent 的「智能体」，其实多还是聊天机器人，而真正接近智能体的，反而是钉钉的 AI 助理。

判断一个智能体的实用程度，关键在于其任务过程中需要人工介入的程度以及大模型在规划与决策中的参与程度，这决定了它是更像真正的智能体，还是传统的聊天机器人。

虽然智能体的技术上还有许多改进空间，还未能颠覆现有体验，但展望未来，AI 要想更深入地融入人们的生活，必须具备更强的自主决策能力。例如在制定旅行计划时，智能体应该能够自主搜索交通、住宿和旅游信息，并根据用户的历史偏好进行个性化推荐。

再比如，夏天晚上，当用户下班回家时，智能体可以提前根据位置信息智能调控空调、扫地机器人和灯光等设备，真正做到无缝衔接生活。

正如盖茨所设想的那样，未来我们无需在不同应用间切换，只需用自然语言告诉设备我们的需求，智能体会根据用户的数据智能作出反应。

总的来说，智能体在 AI 的基础上借鉴了人类的思维方式，从而建立更专业的推理和决策能力，为用户提供更智能的体验。在某种程度上，这比 ChatGPT 更进一步。当然，单一智能体无法满足所有人的需求，井贤栋提到未来的智能化体验需要多个专业智能体共同协作，而李彦宏则认为未来可能会出现数百万个智能体。

接下来的平台竞争不容小觑。正如移动时代的 App Store，伴随智能体的崛起，AI Agent Store 也逐渐成为新的竞争焦点。因此，不仅是场景的竞争，对于拥有基础大模型的企业而言，生态建设也是智能体发展过程中的核心课题，未来竞争将更加激烈。

正文完