什么是 AI Agent?定义和类型2025年7月10日 | 阅读 6 分钟 人工智能被定义为对理性 Agent 的研究。理性 Agent 可以是人、公司、机器或软件的形式来做出决策。它在考虑了过去的和现在的感知(Agent 在给定时刻的感知输入)后,会产生最佳结果。一个AI 系统由 Agent 及其环境组成。Agent 在它们的环境中工作,而环境可能包含其他 Agent。 Agent 是任何可以被视为尊敬的读者!请不要停止学习。以学生可负担的价格,通过 DSA 自学课程掌握所有重要的 DSA 概念,为进入行业做好准备。如果您想参加专家指导的现场课程,请查看针对在职专业人士的 DSA 现场课程以及针对学生的现场编程竞赛。
注意:每个 Agent 都能感知到它的动作(但不总是感知到动作的效果)![]() 要理解智能 Agent 的结构,我们必须熟悉*架构*和*Agent 程序*。架构是 Agent 执行的机器。它是一个带有传感器和执行器的设备,例如,一辆机器人汽车、一台相机、一台 PC。Agent 程序是 Agent 函数的实现。Agent 函数概念是从序列(Agent 到目前为止已考虑的所有内容的序列)到动作的映射。 Agent = 架构 + Agent 程序 Agent 示例软件 Agent 的传感器是键盘输入、文件内容、接收的网络数据包,执行器是在屏幕上显示、文件、发送的网络数据包。 人类 Agent 的传感器是眼睛、耳朵和其他器官,执行器是手、脚、嘴巴和其他身体部位。 机器人 Agent 由充当传感器的摄像头和红外线测距仪,以及充当执行器的各种电机组成。 ![]() Agent 类型根据其感知智能和能力,Agent 可以分为四类:
简单反射 Agent简单反射 Agent 只基于当前感知来行动,而忽略了其他历史信息。感知历史是 Agent 到目前为止所考虑的所有内容的历史。Agent 函数基于条件-动作规则。条件-动作规则是将状态(即条件)映射到动作的规则。如果条件为真,则执行动作;否则不执行。这种 Agent 函数仅在环境完全可观测时才能成功。对于在部分可观测环境中运行的简单反射 Agent,无限循环通常是不可避免的。如果 Agent 可以随机化其动作,那么就有可能避免无限循环。 简单反射 Agent 的问题是:
![]() 基于模型的反射 Agent它通过搜索其位置与当前状态匹配的规则来工作。基于模型的 Agent 可以使用关于世界的模型来处理部分可观测的环境。Agent 必须跟踪内部状态,该状态会根据感知历史根据每次感知进行调整。当前状态存储在 Agent 内部,它维护着一个描述世界中看不见的部分的结构。 更新状态需要以下信息:
![]() 目标导向 Agent这类 Agent 根据它们当前与目标的距离(期望状态的详细信息)来做决策。它们的每一个动作都旨在缩短与目标的距离。这为 Agent 提供了一种从多个可能性中选择以达到目标位置的方法。支持其决策的知识清晰呈现并且可以修改,这使得这些 Agent 更具灵活性。它们通常需要探索和规划。目标导向 Agent 的行为很容易改变。 ![]() 效用导向 Agent将最终用途作为构建块开发的 Agent 称为效用导向 Agent。当存在多个可能的选择时,为了决定哪个是最佳的,会使用效用导向 Agent。它们根据每个状态的*偏好(效用)*来选择动作。有时,仅仅达到期望的目标还不够。我们可能希望找到一种更快、更安全、更便宜的旅行方式来到达目的地。Agent 的满意度应该被考虑在内。 效用描述了 Agent 的*“满意度”*如何。由于世界的不确定性,效用 Agent 会选择最大化预期效用的动作。效用函数将一个状态映射到一个实数,该实数描述了相关的满意度程度。 ![]() 学习 AgentAI 中的学习 Agent 是一种可以从过去的经验中学习或具有学习能力的 Agent。它以基本知识开始行动,然后能够通过学习自动行动和适应。 学习 Agent 主要有四个概念组成部分:
![]() 环境的性质有些程序在完全人为的环境中运行,这些环境仅限于键盘输入、数据库、计算机文件系统和屏幕上的字符输出。 相比之下,一些软件 Agent(软件机器人或 softbot)存在于丰富、不受限制的 softbot 领域中。模拟器具有非常详细、复杂的环境。软件 Agent 需要在实时环境中从大量任务中进行选择。 一个旨在扫描客户在线偏好并向客户展示有趣物品的 softbot 在真实和人为环境之间运行。 最著名的人为环境是图灵测试环境,在该环境中,人类 Agent 和其他人为 Agent 在平等的基础上进行测试。这是一个非常具有挑战性的环境,因为软件 Agent 很难与人类并驾齐驱。 图灵测试可以通过图灵测试来衡量系统智能行为的成功。 在测试中,两个人和一个待评估的机器参与其中。两个人中的一个扮演考官的角色。他们每个人都坐在不同的房间里。考官不知道谁是机器,谁是人。他通过输入问题并发送给两个智能体来提问,并收到打字回复。 这个测试的目的是愚弄测试者。如果测试者无法区分机器的回答和人类的回答,那么这台机器就被认为是智能的。 环境的属性环境具有多重属性:
|
我们请求您订阅我们的新闻通讯以获取最新更新。