什么是 AI Agent?定义和类型

2025年7月10日 | 阅读 6 分钟

人工智能被定义为对理性 Agent 的研究。理性 Agent 可以是人、公司、机器或软件的形式来做出决策。它在考虑了过去的和现在的感知(Agent 在给定时刻的感知输入)后,会产生最佳结果。一个AI 系统由 Agent 及其环境组成。Agent 在它们的环境中工作,而环境可能包含其他 Agent。

Agent 是任何可以被视为

尊敬的读者!请不要停止学习。以学生可负担的价格,通过 DSA 自学课程掌握所有重要的 DSA 概念,为进入行业做好准备。如果您想参加专家指导的现场课程,请查看针对在职专业人士的 DSA 现场课程以及针对学生的现场编程竞赛。

  • 通过传感器了解您的环境,并
  • 通过执行器作用于该环境

注意:每个 Agent 都能感知到它的动作(但不总是感知到动作的效果)

What is the composition for agents in Artificial Intelligence

要理解智能 Agent 的结构,我们必须熟悉*架构*和*Agent 程序*。架构是 Agent 执行的机器。它是一个带有传感器和执行器的设备,例如,一辆机器人汽车、一台相机、一台 PC。Agent 程序是 Agent 函数的实现。Agent 函数概念是从序列(Agent 到目前为止已考虑的所有内容的序列)到动作的映射。

Agent = 架构 + Agent 程序

Agent 示例

软件 Agent 的传感器是键盘输入、文件内容、接收的网络数据包,执行器是在屏幕上显示、文件、发送的网络数据包。

人类 Agent 的传感器是眼睛、耳朵和其他器官,执行器是手、脚、嘴巴和其他身体部位。

机器人 Agent 由充当传感器的摄像头和红外线测距仪,以及充当执行器的各种电机组成。

What is the composition for agents in Artificial Intelligence

Agent 类型

根据其感知智能和能力,Agent 可以分为四类:

  • 简单反射 Agent
  • 基于模型的反射 Agent
  • 目标导向 Agent
  • 基于效用的智能体
  • 学习 Agent

简单反射 Agent

简单反射 Agent 只基于当前感知来行动,而忽略了其他历史信息。感知历史是 Agent 到目前为止所考虑的所有内容的历史。Agent 函数基于条件-动作规则。条件-动作规则是将状态(即条件)映射到动作的规则。如果条件为真,则执行动作;否则不执行。这种 Agent 函数仅在环境完全可观测时才能成功。对于在部分可观测环境中运行的简单反射 Agent,无限循环通常是不可避免的。如果 Agent 可以随机化其动作,那么就有可能避免无限循环。

简单反射 Agent 的问题是:

  • 智能非常有限。
  • 对状态的非感知部分没有了解。
  • 通常太大,难以生成和存储。
  • 如果环境发生变化,规则集需要更新。
What is the composition for agents in Artificial Intelligence

基于模型的反射 Agent

它通过搜索其位置与当前状态匹配的规则来工作。基于模型的 Agent 可以使用关于世界的模型来处理部分可观测的环境。Agent 必须跟踪内部状态,该状态会根据感知历史根据每次感知进行调整。当前状态存储在 Agent 内部,它维护着一个描述世界中看不见的部分的结构。

更新状态需要以下信息:

  • 世界如何独立于 Agent 而发展,以及
  • Agent 的动作如何影响世界。
What is the composition for agents in Artificial Intelligence

目标导向 Agent

这类 Agent 根据它们当前与目标的距离(期望状态的详细信息)来做决策。它们的每一个动作都旨在缩短与目标的距离。这为 Agent 提供了一种从多个可能性中选择以达到目标位置的方法。支持其决策的知识清晰呈现并且可以修改,这使得这些 Agent 更具灵活性。它们通常需要探索和规划。目标导向 Agent 的行为很容易改变。

What is the composition for agents in Artificial Intelligence

效用导向 Agent

将最终用途作为构建块开发的 Agent 称为效用导向 Agent。当存在多个可能的选择时,为了决定哪个是最佳的,会使用效用导向 Agent。它们根据每个状态的*偏好(效用)*来选择动作。有时,仅仅达到期望的目标还不够。我们可能希望找到一种更快、更安全、更便宜的旅行方式来到达目的地。Agent 的满意度应该被考虑在内。

效用描述了 Agent 的*“满意度”*如何。由于世界的不确定性,效用 Agent 会选择最大化预期效用的动作。效用函数将一个状态映射到一个实数,该实数描述了相关的满意度程度。

What is the composition for agents in Artificial Intelligence

学习 Agent

AI 中的学习 Agent 是一种可以从过去的经验中学习或具有学习能力的 Agent。它以基本知识开始行动,然后能够通过学习自动行动和适应。

学习 Agent 主要有四个概念组成部分:

 

  1. 学习组件:它负责通过从环境中学习来做出改进。
  2. 评论家:学习组件从评论家那里获取反馈,评论家描述了 Agent 在固定性能标准方面的表现如何。
  3. 性能组件:它负责选择外部动作。
  4. 问题生成器:该组件负责建议将导致新颖和信息性体验的动作。
What is the composition for agents in Artificial Intelligence

环境的性质

有些程序在完全人为的环境中运行,这些环境仅限于键盘输入、数据库、计算机文件系统和屏幕上的字符输出。

相比之下,一些软件 Agent(软件机器人或 softbot)存在于丰富、不受限制的 softbot 领域中。模拟器具有非常详细、复杂的环境。软件 Agent 需要在实时环境中从大量任务中进行选择。

一个旨在扫描客户在线偏好并向客户展示有趣物品的 softbot 在真实和人为环境之间运行。

最著名的人为环境是图灵测试环境,在该环境中,人类 Agent 和其他人为 Agent 在平等的基础上进行测试。这是一个非常具有挑战性的环境,因为软件 Agent 很难与人类并驾齐驱。

图灵测试

可以通过图灵测试来衡量系统智能行为的成功。

在测试中,两个人和一个待评估的机器参与其中。两个人中的一个扮演考官的角色。他们每个人都坐在不同的房间里。考官不知道谁是机器,谁是人。他通过输入问题并发送给两个智能体来提问,并收到打字回复。

这个测试的目的是愚弄测试者。如果测试者无法区分机器的回答和人类的回答,那么这台机器就被认为是智能的。

环境的属性

环境具有多重属性:

  • 离散/连续 - 如果存在有限数量的清晰定义的、不同的环境条件,那么环境就是离散的(例如,国际象棋);否则它是连续的(例如,驾驶)。
  • 可观测/部分可观测 - 如果在每个时间点都可以根据可观测的假设来确定环境的整体状态;否则它是部分可观测的。
  • 静态/动态 - 如果在 Agent 工作时环境不改变,那么它是静态的;否则它是动态的。
  • 单 Agent/多 Agent - 环境中可能存在其他 Agent,这些 Agent 可能是相同类型或不同类型的 Agent。
  • 可访问/不可访问 - 如果 Agent 的感知系统能够访问环境的整个状态,那么该环境对该 Agent 是可访问的。
  • 确定性/非确定性 - 如果环境的下一个状态完全由当前状态和 Agent 的动作决定,那么环境是确定性的;否则它是非确定性的。
  • 情景性/非情景性 - 在情景性环境中,每个情景都涉及 Agent 的理解和随后的行动。其行动的质量仅取决于该情景。后续情景不依赖于前一个情景中的动作。情景性环境要简单得多,因为 Agent 不需要提前思考。