AI Agent中文是AI代理,它被视为实现通用型人工智能(AGI)的一小步,最大不同就是拥有完成任务的「弹性」、「感知」与「调整」。
什么是AI Agent?
长久以来,通用型人工智能(Artificial General Intelligence,AGI)一直是AI界的圣杯,指的是未来AI可以模仿人类的思维和行为,应对挑战任何复杂的任务。
而AI Agent(AI代理)被视为有机会实现通用型人工智能的载体。 AI大师吴恩达在今年3月的一场演说中就提到,「在迈向通用型人工智能的漫长旅程中,AI Agent可以帮助我们迈出一小步。」
到底什么是AI Agent?跟现有的大型语言模型又有什么关系?
AI Agent(AI代理)的定义是什么?
AI Agent的定义,指的是能用感测器感知周围环境,然后采取相对应的行动,做出决策的人工智能。
对比现在的大型语言模型可以更清楚了解,现在大家使用大型语言模型,不论是ChatGPT或是其他类型,大多处于「一问一答」的形式,你请它翻译、它给你答案;你请它总结某篇论文,最终获得一段结论。
但是现实世界中的人类,可以处理多步骤的复杂工作。举例来说,记者日常生活中的专访邀约,必须先知道主题、邀请受访者、了解受访者可以接受访问的时间、选定访问地点⋯⋯。在这个过程中,如果受访者突然临时有事,就必须重新调整时间;或是最后专访的题目大转弯,也要调整访问的方向。
这跟一问一答的状况完全不一样。
为了完成更复杂的任务,AI Agent要拥有更多能力,包含4个要素:计画、记忆、工具与行动。其中计画、记忆能力要能随时因应环境状态的不同修正,使用的工具、行动的方式也会视目标来调整。
修正、调整、选择适当的行动方式(或工具),就是最大的关键。
复旦大学自然语言处理实验室,借用《原神》的世界观解释AI Agent。图/ Fudan NLP Group
上图是由复旦大学自然语言处理实验室提出的AI Agent场景:在厨房中有一个负责点餐的AI Agent,而另外一个AI Agent负责规划和解决烹饪任务;在音乐会上,3个AI Agent合作进行演出;户外也有2个AI Agent在制作灯笼,会自己规划所需要的材料与财务。
而AI Agent之所以被认为是实现通用型人工智能的关键一步,就是因为它用近乎人类的模式,来处理复杂的任务。
AI Agent跟大型语言模型有什么关系?
现阶段,大型语言模型被视为是AI Agent的大脑。
根据《彭博》的报导,OpenAI把AI的发展阶段分为5级:
- 聊天机器人(chatbots):具有对话功能的AI
- 推理者(Reasoners):能像人类一样解决问题
- 代理(Agents):可以正确地采取行动(重点在于使用工具)
- 创新者(Innovators):可以帮助发明的AI
- 组织(Organizations):AI可以执行人类组织的工作
根据OpenAI发言人的说法,该公司认为它目前处于第1级,不过非常接近第2级,可以像人类一样解决问题,但还没有办法直接地使用工具。
也就是说,大型语言模型就像是一颗可以对话的大脑,慢慢进化成可以解决问题、使用工具,最终执行所有人类的工作。
AI Agent其实现在就可以做得到?
其实现在就可以做到部分AI Agent的展望,靠的就是把任务拆分出来,交给不同的大型语言模型去执行。同样以「邀约专访」来举例,你可以有一个约时间的AI、一个确认时间的AI、一个写访纲的AI⋯⋯.,这个工作流程被称为代理工作流程(Agentic Workflow),重点在于上述提到的:计画与记忆能够修正、使用的工具与行动能够调整。
「如果你期待GPT-5、Claude4、Gemini 2.0(泛指最新一代大型语言模型),现在透过代理工作流程或许就可获得接近的表现。」吴恩达说。
所以现阶段有许多拥有「垂直能力」的AI,也许目前只有工程师有能力把它们串接在一起,在不久后,或许一般人也可以享受类似AI Agent的服务,只是就像是LangChain共同创办人暨执行长哈里森.却斯(Harrison Chase)所说:「人类现在还是要介入,因为AI Agent还不够可靠;但是介入的太多,代表AI Agent还不够有用。」但相信在没有那么远的未来,就会有更多成熟的AI Agent出现。
如果想要尝试一些雏形,现有主打只要下指令就好的AutoGPT、复制自己工作流程的AgentGPT等工具,虽然褒贬不一,也是一窥未来的一道窗口。
另外,最让人兴奋的不只是「虚拟世界」的AI Agent,这一整套系统也可以被放在机器人身上。把任务交给机器人,它可以透过感测器(文字、触觉、视觉、听觉)感知环境状况,去产生完成任务的计画,然后用文字、图像,甚至是机械手臂来完成任务,这也是AI近期能带动机器人产业发展未来的重点原因。
本文链接地址:https://www.wwsww.cn/hqfx/26664.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。