AI Agent是什么？AI Agent跟大型语言模型有什么关系？

AI Agent中文是AI代理，它被视为实现通用型人工智能（AGI）的一小步，最大不同就是拥有完成任务的「弹性」、「感知」与「调整」。

什么是AI Agent？

长久以来，通用型人工智能（Artificial General Intelligence，AGI）一直是AI界的圣杯，指的是未来AI可以模仿人类的思维和行为，应对挑战任何复杂的任务。

而AI Agent（AI代理）被视为有机会实现通用型人工智能的载体。 AI大师吴恩达在今年3月的一场演说中就提到，「在迈向通用型人工智能的漫长旅程中，AI Agent可以帮助我们迈出一小步。」

到底什么是AI Agent？跟现有的大型语言模型又有什么关系？

AI Agent（AI代理）的定义是什么？

AI Agent的定义，指的是能用感测器感知周围环境，然后采取相对应的行动，做出决策的人工智能。

对比现在的大型语言模型可以更清楚了解，现在大家使用大型语言模型，不论是ChatGPT或是其他类型，大多处于「一问一答」的形式，你请它翻译、它给你答案；你请它总结某篇论文，最终获得一段结论。

但是现实世界中的人类，可以处理多步骤的复杂工作。举例来说，记者日常生活中的专访邀约，必须先知道主题、邀请受访者、了解受访者可以接受访问的时间、选定访问地点⋯⋯。在这个过程中，如果受访者突然临时有事，就必须重新调整时间；或是最后专访的题目大转弯，也要调整访问的方向。

这跟一问一答的状况完全不一样。

为了完成更复杂的任务，AI Agent要拥有更多能力，包含4个要素：计画、记忆、工具与行动。其中计画、记忆能力要能随时因应环境状态的不同修正，使用的工具、行动的方式也会视目标来调整。

修正、调整、选择适当的行动方式（或工具），就是最大的关键。

复旦大学自然语言处理实验室，借用《原神》的世界观解释AI Agent。图/ Fudan NLP Group

上图是由复旦大学自然语言处理实验室提出的AI Agent场景：在厨房中有一个负责点餐的AI Agent，而另外一个AI Agent负责规划和解决烹饪任务；在音乐会上，3个AI Agent合作进行演出；户外也有2个AI Agent在制作灯笼，会自己规划所需要的材料与财务。

而AI Agent之所以被认为是实现通用型人工智能的关键一步，就是因为它用近乎人类的模式，来处理复杂的任务。

AI Agent跟大型语言模型有什么关系？

现阶段，大型语言模型被视为是AI Agent的大脑。

根据《彭博》的报导，OpenAI把AI的发展阶段分为5级：

聊天机器人（chatbots）：具有对话功能的AI

推理者（Reasoners）：能像人类一样解决问题

代理（Agents）：可以正确地采取行动（重点在于使用工具）

创新者（Innovators）：可以帮助发明的AI

组织（Organizations）：AI可以执行人类组织的工作

根据OpenAI发言人的说法，该公司认为它目前处于第1级，不过非常接近第2级，可以像人类一样解决问题，但还没有办法直接地使用工具。

也就是说，大型语言模型就像是一颗可以对话的大脑，慢慢进化成可以解决问题、使用工具，最终执行所有人类的工作。

AI Agent其实现在就可以做得到？

其实现在就可以做到部分AI Agent的展望，靠的就是把任务拆分出来，交给不同的大型语言模型去执行。同样以「邀约专访」来举例，你可以有一个约时间的AI、一个确认时间的AI、一个写访纲的AI⋯⋯.，这个工作流程被称为代理工作流程（Agentic Workflow），重点在于上述提到的：计画与记忆能够修正、使用的工具与行动能够调整。

「如果你期待GPT-5、Claude4、Gemini 2.0（泛指最新一代大型语言模型），现在透过代理工作流程或许就可获得接近的表现。」吴恩达说。

所以现阶段有许多拥有「垂直能力」的AI，也许目前只有工程师有能力把它们串接在一起，在不久后，或许一般人也可以享受类似AI Agent的服务，只是就像是LangChain共同创办人暨执行长哈里森．却斯（Harrison Chase）所说：「人类现在还是要介入，因为AI Agent还不够可靠；但是介入的太多，代表AI Agent还不够有用。」但相信在没有那么远的未来，就会有更多成熟的AI Agent出现。

如果想要尝试一些雏形，现有主打只要下指令就好的AutoGPT、复制自己工作流程的AgentGPT等工具，虽然褒贬不一，也是一窥未来的一道窗口。

另外，最让人兴奋的不只是「虚拟世界」的AI Agent，这一整套系统也可以被放在机器人身上。把任务交给机器人，它可以透过感测器（文字、触觉、视觉、听觉）感知环境状况，去产生完成任务的计画，然后用文字、图像，甚至是机械手臂来完成任务，这也是AI近期能带动机器人产业发展未来的重点原因。

本文链接地址：https://www.wwsww.cn/hqfx/26664.html
郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

什么是AI Agent？

AI Agent（AI代理）的定义是什么？

AI Agent跟大型语言模型有什么关系？

AI Agent其实现在就可以做得到？

相关文章阅读