编者按： 当身边的人都在谈论 AI Agent 时，你是否会困惑：究竟什么才是真正的智能体？为什么 OpenAI、IBM 和各大技术领袖给出的智能体定义都不相同？

我们今天为大家带来的这篇文章，作者的观点是：当前流行的智能体定义要么过于复杂，要么严重偏离核心要义，真正的智能体应该被定义为"具备自主性和行为能力，能在所处环境中实现一个或多个目标的系统"。

本文系原作者观点，Baihai IDP 仅进行编译分享

作者 | Steven Willmott

编译 | 岳扬

2025 年显然将成为智能体元年[1]。大语言模型（LLMs）的快速发展让文本生成、图像生成甚至视频生成等不断突破，但现在大家的兴奋点已经转向那些超越单纯的生成能力、能够在数字或现实世界中执行具体操作的系统。

产生这种兴奋确实有其合理性。如果 AI 能够"基于环境输入或内部决策机制，主动执行具体操作以达成目标。"，其实用性将呈指数级提升。虽然软件自动化（software automation）已发展多年，但其中多数方案仍显僵化、脆弱。尽管要做到尽善尽美非常困难，但是将其与更敏捷的决策机制相结合必将带来巨大的收益（后续我们会深入探讨）。

核心问题自然是："究竟什么是智能体？[2]" 是指 OpenAI 对智能体的定义[3]？还是 IBM 的定义[4]？还是 Simon Willison[5] 通过集思广益收集的六大热门定义之一（感谢 Swyx[6] 在 AI Engineer Conference 上提供）：

又或是其他定义？

我的观点可能不会让你意外：虽然这些定义中的某些部分是正确的，但都存在缺陷。 更不必说前人早已提出过各种智能体定义，且存在专门研究多智能体系统的完整学术领域（我早期的重要研究成果之一，就发表在 2000 年在波士顿召开的第四届国际多智能体系统大会上，该会议后来与另两个会议合并成为延续至今的 AAMAS 会议[7]）。

01 让时光倒流，回顾智能体定义的历史

若要全面梳理智能体定义的演变史，恐怕需要鸿篇巨制才能完成，不过可以肯定的是，学术界从未形成过统一定义。学术文献中记载的智能体类型就包含：

具备完整感知能力的实体机器人（可自主探索环境）
商业实战模拟中用于预测价格波动的独立行为主体简化模型
拥有内部知识表征（internal knowledge representations）与世界模型（world models）的复杂软件实体（通过标准化的智能体语言进行通信，KQML[8] 与 FIPA-ACL[9] 是当时最主流的两种协议）
由非常简单的个体组成的集群，他们通过自行组织实现超复杂行为

当年在各类 AI 会议上，"如何准确定义智能体"曾是学者们最热衷的晚宴话题。

02 如今智能体的各种定义

到如今，该领域已经涌现出大量关于智能体的定义，这并不令人意外。我们现在拥有了一套强大的新工具来构建智能体，大家的兴奋程度可想而知。然而，我认为当前的这些智能体定义中存在着诸多错误，要么过于复杂，要么严重偏离了核心要义。

存在多种不同定义的问题在于，它们可能模糊了构建智能体系统所面临的底层挑战（进而延伸至构建多智能体系统这一更为艰巨的挑战！）。

基于前文提到的那些智能体现代定义（这些是我见过的当代最佳智能体定义）（译者注：应当指的是 OpenAI、IBM 等对智能体的定义），系统梳理这些定义中反复出现的共性要素：

"智能体是配备指引行为的指令、能访问可以扩展能力的工具的模型，并封装在具有动态生命周期的运行时环境中。"（需要指令吗？必须是模型吗？模型的本质含义究竟是什么？）
"能够自主学习、适应并执行操作以实现既定目标的应用程序。"（学习能力是关键吗？必须被指定目标吗？由谁指定？）
"能在现实世界中执行并完成长期的、开放式任务的人工智能系统。"（任务必须长期运行吗？必须完成吗？）
"智能体 = 大语言模型 + 记忆能力 + 规划能力 + 工具 + While 循环。"（需要记忆能力吗？必须有大语言模型吗？规划能力是必需的吗？用 FOR 循环后优雅退出不行吗？）
"一个值得信赖的系统，能代表用户做出有影响力的决定"（必须代表用户吗？代表它自己可以吗？人类算智能体吗？）
"应用程序的智能体化程度越高，其程序执行逻辑的走向就越由大语言模型决定。"（必须是大语言模型吗？智能体属性是从"完全脚本化"到"完全自主"的连续过渡，还是要么是智能体，要么不是的二元状态？）
"执行非简单、多步骤操作（这些操作以往需要人类完成）的人工智能系统组件。"（必须是非简单任务吗？人类原本就无法完成的任务呢？杀毒软件算智能体吗？）

撰写这些内容的重点并非要否定这些定义。智能体的概念确实难以界定，而所有定义提出者都在进行有价值的尝试。

实际上，我甚至可以说：我热爱这些智能体定义中的每一个，因为它们从不同角度捕捉了智能体的关键特征，又融入了当前技术浪潮的时代精神。

过去往往将智能体的定义简化，因为在当时难以想象软件系统能像今天用大语言模型构建的这般强大。现代定义某种程度上陷入了相反的问题 ------ 它们默认必须使用 LLM 这样复杂的系统才能构建智能体。

03 "Agent"（智能体）的本质到底是什么？

不太可能有一个定义能满足所有人的需求，但我认为，基于一个相对稳健的核心定义，然后再进行扩展，这是很有帮助的。

现在的智能体定义包含很多核心要素，但大多数都至少遗漏了过去的智能体定义中反复出现的一个关键点（即强调智能体与其所在环境的不可分割性）。 现在的智能体定义还（非常自然但并非必要地）将 LLM（大语言模型）作为核心要素。实际上构建智能体并不需要像 LLM 这样强大的技术。

这个定义并非我的原创，它本质上是对过去智能体定义的整合以及当下智能体定义的补充，但可以说这是最接近本质的阐述：

Agent（智能体）是：

具备自主性（autonomy）和行为能力，能在所处环境中实现一个或多个目标的系统。

它可以是软件系统（软件智能体），也可以是人工智能系统（AI 智能体），还可以是生物智能体（比如刚咬断你家电线的老鼠）。

分解一下这个定义的关键要素：

我们讨论的是一个单独的实体（系统）。
具有自主性，能根据某些评判标准选择是否采取行动（这是所有智能体定义中最麻烦的部分，但正如后文所述，这其实是一个比较关键的属性）
具有行为能力，换句话说，它拥有可在周遭环境中执行的一套行为操作。这些能力可以是与生俱来的、可以是一套工具、可以是改变物理世界的行为（如破坏电缆）或单纯收集信息的行为（如间谍智能体）
智能体位于其运行的环境中。这个环境可以是物理的，也可以是数字的，可以是静态的，也可以是快速演变的。智能体运行的环境（environment）是持续影响智能体决策的动态场域（Context）。
智能体具有可选择是否实现的目标。这些目标可以是内置的（预设的程序）、被其他智能体（人或软件）赋予的，也可以是动态生成的（甚至是随机生成的或基于环境的某些特征生成的）

除了核心定义外，可能还需要补充一些附加条件：

大多数有用的智能体可能需要具备长期运行或持久存在的特性，也就是说，它们需要持续运行，坚持完成任务。但这并非严格意义上的必要条件 ------ 只要具备自主性，并拥有某种身份，使他们成为一个实体，理论上完全可以存在一次性的智能体：在完成某一个任务后（甚至启动后即刻）自动销毁。
大多数有用的智能体可能都有某种感知循环（sensing loop），监测环境中的触发条件与变化。同样，这也并不是严格意义上的必要条件 ------ 可将大量智能体投入环境以暴力覆盖目标达成路径（就像无需复杂感知的暴力拒绝服务攻击）。

尽管如此，即使补充上述条件，当前的智能体定义仍缺失不少东西：大语言模型、While 循环、模型、规划、外部指令、学习能力、记忆等。这些要素对某些类型的智能体确实有价值，但很难论证它们是智能体概念的核心。

要理解这一点，我们不妨思考一下多智能体系统的构成 ------ 这正是下文要探讨的内容。

在结束智能体定义的讨论之前，让我们回到"自主性"这个最棘手的概念上来。系统具备自主行动能力究竟意味着什么？是否意味着无需人类指令？是否意味着无需人类触发？甚至无需其他智能体的触发？

这是一个深奥的哲学问题，与"意识是什么？"有异曲同工之妙：

推特/ X 机器人若仅在用户提及某些关键词时才群发垃圾信息，算智能体吗？
病毒算是智能体吗？单个生物病毒呢？
按钮触发式系统（如使用按键启动）仍是智能体吗？抑或只是应用程序的一个函数？

虽然难以达成共识，但有一个实用的工程学定义：只要系统具备内部逻辑来决定是否响应外部请求，就允许来自人类、其他智能体或环境的外部触发。这可以是对相关操作成功几率的复杂评估，也可以是执行相关操作前简单的安全检查或身份验证。

同样重要的是，触发器通常不会导致立即采取行动。例如：安全扫描系统可能长期被动收集信息，直到侦测到入侵企图才突然启动，阻止攻击行为。Unix 系统的守护进程早在"智能体"概念流行前就已践行这一理念。

至此，我们是否得到了第 15 个智能体的定义？

XKCD Standards[10]

太好了，现在我们有了新的"智能体"定义。毫无疑问，未来会出现更多新定义，最终哪种胜出并不重要，但思考"智能体的定义对智能体系统的实际影响"确实很有价值。

我之所以更喜欢上一节中的简单定义，是因为它能帮助我们聚焦智能体系统的几个关键特性：

自主性真的很重要。 不论是长期运行的 For 循环，还是能被环境条件触发（如安全扫描器）的系统，智能体系统都是异步的，几乎可以随时激活运作。若你正在构建长流程的、复杂的工作流，请慎重考虑是否真正需要智能体。若系统需响应环境变化，且各流程间松耦合协作，智能体可能是理想选择。
环境是核心要素。 必须将智能体看作是嵌入在环境中的。例如，一个具备强大且多样化的操作能力且可访问几乎所有个人数据的系统，必然面临严峻的安全管理挑战。在过去的六个月里，苹果公司可能已经深刻认识到这一点，导致其大肆宣传的 Siri AI 升级版被迫推迟[11]。
Environment × abilities = Power。 我欣赏为智能体开发"工具"的理念（如 exa.ai[12] 和browserbase.com[13]）。此类基础设施将开放的网络环境转化为智能体的运作环境。工具效能与环境"强度"，既决定着智能体可能达成的效果范围，也左右着错误操作发生的风险等级。
目标（Goals）可能来自任何地方。 有些目标可能是硬编码的，有些可能是随机的。在设计智能体时，必须全面考虑并妥善管理所有潜在的目标来源。智能体是否会在网络上搜索信息并制定搜索计划？传入的外部信息会多大程度影响新目标的生成？在算力无限供给的情况下，智能体的目标迭代是否会陷入无限循环？
许多"多智能体"系统实际上是单智能体系统。 近期涌现的许多所谓多智能体系统，本质上是完全决定所有后续操作的系统链，或者是每个系统都生成一个结果以便选出最佳结果的系统集合。这些架构都不符合真正的多智能体系统的标准。真正的多智能体系统需要每个智能体都具备自主性，换句话说，它需要有自己的独立目标，以及是否实现这些目标的一些标准。从广义上讲，只有当每个"智能体"代表不同利益主体（包括其它们自身）时，才能构成真正的多智能体系统。将系统功能拆解到多个子模块的架构本身没有问题，但若各子系统之间不存在相互冲突的可能性，本质上仍是在搭建一个"单智能体"系统。
多智能体系统通过环境实现交互（无论你是否喜欢）。 这些冲突发生的速度远超我们想象。即使智能体之间没有直接的信息联系，只要能够操作同一资源就会产生交互（例如共同修改代码库的两个编程智能体，在同一服务器集群上调度任务的两个调度智能体，或五十个向同一数据库写入数据的搜索智能体）。这些交互行为需要显性的或隐性的协调机制予以管理。

用智能体还是不用智能体，这是一个问题......

一个看起来很简单的话题，却写成了一篇这么长的博文，你可能会觉得要彻底远离智能体系统才是上策，这也情有可原。又或许是因为"智能体热"的炒作实在令人应接不暇。

这两种想法都可以理解，但你可能无法逃避。一旦你开始构建能在某个环境中"行动"的人工智能系统，你就已经踏上了构建智能体的征途。当你走上这条道路，特别是如果你还添加了一点自主性（长期运行进程、触发规则等），你的系统就值得被视为一个智能体。

通过审视智能体的系统设计，你可以开始明确环境是什么、有哪些可用的动作/工具、如何设计决策机制等。这些思考通常都会帮你实现更优秀的系统设计。

About the author

Steven Willmott

Leading product and engineering at http://SafeIntelligence.AI. Writes at https://steampunkai.com. Also @njyx@hachyderm.io (mastodon) and njyx.eth.

END

本期互动内容 🍻

❓你认为智能体的核心要素是什么？自主性、目标导向、环境交互------如果必须舍弃一个，你会选哪个？为什么？

文中链接

[1]https://www.youtube.com/watch?v=kHPXbo2OkzA&ref=steampunkai.com