人工智能中的感知是什么?

2025年4月2日 | 阅读 12 分钟

感知表征是人工智能范式中的一个基本概念,因为它通过代理感知环境中的输入,将 AI 代理与其环境联系起来。因此,它使 AI 系统能够处理和理解来自单一来源或多个来源的信息,无论是视觉、听觉、触觉还是其他任何感官。因此,AI 代理能够识别模式,理解复杂的场景并相应地对其环境做出反应。

感知在人工智能中的作用不仅仅是解释数据;它赋予代理根据不断变化的情况做出决策或反应的能力,以及与环境进行有意义交互的能力。例如,在计算机视觉中,这种感知能力使 AI 系统能够分辨物体、跟踪运动并检测空间关系。自然语言处理是使系统能够像人类语言一样读写文本所必需的。与语音识别类似,基于感知的语音识别和检测依赖于解释口语的含义和背景噪声。

这种基础能力驱动了广泛的应用,从自动驾驶汽车在大型道路网络上的导航到能够准确解释医学影像以进行诊断的医疗保健系统。感知使 AI 代理能够从静态计算转向与现实世界的动态交互,从而在处理无数挑战时变得更智能、更具适应性、反应更灵敏。

人工智能中的代理

人工智能中的代理是旨在通过传感器感知其环境并通过执行器在其上执行操作以实现特定目标的计算机程序。它们是 AI 系统的一个运行单元,驱动其与周围世界的交互。

更实际的比喻是人工智能的感知,就像人脑一样,代理就是它们的附属物,包括手、腿和其他部件。然而,与仅仅是执行中央命令的工具的身体部位不同,AI 代理,取决于类型,可以独立执行特定的操作。所有这些独立操作的聚合会产生可以完成更大型任务的结果。

代理与环境和其他代理进行交互,可能创建动态和协作的系统。有几种类型的代理,每种代理都有其为特定类型设计的性能。这些包括简单反射代理、基于目标的代理、基于模型的代理和基于效用的代理,仅举几例。

以下是人工智能中代理的一些示例

  1. 互联网购物代理使用 HTMLXHTML 页面作为传感器来收集信息和数据,并应用执行器在用户浏览或购买商品时显示 URL。
  2. 聊天机器人代理利用人类输入作为传感器来解释查询,并通过显示答案或提供相关 URL 作为执行器来响应。

人工智能中的感知

感知是使 AI 代理能够吸收、理解和解释其环境中信息的最基本过程之一,目的是做出决策并采取行动以实现其目标。它表示 AI 代理通过各种感官输入感知和理解环境的能力:摄像头,代表视觉信息;麦克风,代表听觉输入;甚至用于其他类型信息的传感器,例如温度、运动或压力。这种能力对于人工智能代理获取有关其周围环境的信息、识别模式、分类和区分物体以及理解其运行的细微语境至关重要。例如,计算机视觉是 AI 代理分析图像或视频的能力,以便能够实际识别物体、跟踪运动,甚至提取空间关系。对于语音识别,它有助于将口语解码为语境。在处理和解释感官输入后,代理会根据输入决定采取行动,以帮助实现其分配的目标。这可能涉及自主机器人在物理空间中的导航,或者在 电子商务 网站上推荐特定产品。

与 AI 代理感知相关的关键术语

与 AI 代理的感知相关的几个关键术语

  1. 感知 (Percept):这是指代理在某个时刻接收到的感官输入,作为其行动或反应的基础。例如,如果一个人类代理听到一个音乐音调,他可能会将其感知为跳舞的邀请,从而将感知转化为身体行动。类似地,像 Siri 这样的虚拟助手以语音命令的形式接收一些听觉输入,并将其用于某些特定任务,例如打电话。这两种情况都需要代理的感知成为理解刺激和据此做出决策的重要一步。这需要正确获取和处理感官输入,以实现智能行为。
  2. 感知序列 (Percept Sequence):这是指代理在某个时间点接触到的所有感官输入的集合。感知的顺序很大程度上影响了特定代理的选择,尤其是如果它是一个学习代理的话。如果对事件的累积历史进行分析和解释,代理将能够得出模式和趋势,从而做出正确的决定。例如,自动驾驶系统依赖于其感知序列,该序列连续记录道路状况、交通模式和沿途障碍物的感官数据,并利用这些历史输入动态地改变行为,以确保安全高效的驾驶。这就是为什么感知序列在 AI 代理表达适应性和智能行为方面如此有价值的基础。

为人工智能代理创建感知的步骤

步骤 1 - 感知 (Sensing):代理通过使用特殊的传感机制来观察其环境与其环境进行交互。因此,重点在于开发专门用于感知特定类型输入——视觉、听觉、触觉或基于运动的信号等——的传感器的机制。例如,摄像头可用于图像识别应用;麦克风可用于收听音频信号;键盘可识别文本输入;甚至运动探测器也能感知运动。例如,摄像头可以识别和解释人类手势;它可以据此执行动作,也许是通过激活智能设备上的某个操作或在基于手势的系统中进行交互。代理的认知和决策过程以及其从周围环境中获取意义以执行任务和有意义地交互的能力都将基于感官数据。这决定性地影响了所用传感器的质量,从而影响了代理感知和适当响应其环境中刺激的能力。

步骤 2 - 数据收集 (Data Collection):代理提取感官数据,然后收集并存储以供进一步分析。此过程有时从预处理阶段开始,其中原始感官输入被清理和格式化,以删除噪声或与分析无关的信息,从而确保数据适合分析。然后,使用特征提取,将用于决策或任务学习的最相关数据方面作为关键属性或模式提取出来。一旦提取了这些信息,就会以适当的格式表示,例如向量、矩阵或符号结构,从而使代理能够高效地处理和分析。例如,在面部识别系统中,预处理可能涉及对图像中的光照条件进行标准化,特征提取将侧重于识别脸部的独特地标,最后的表示可以是用于比较的数值特征的嵌入。

步骤 3 - 处理 (Processing):代理处理收集到的数据,以查找重要的模式,消除异常,并提取与其任务相关的信息。它始于在数据中发现重复出现的模式,从而使代理能够学习可用于指导其行动的信息。发现数据中的异常和不规则性,并相应地处理它们。这意味着确保用于决策的信息的完整性和可靠性。然后根据代理的具体目标进行评估,使其专注于最相关的细节以实现其目的。

步骤 4 - 行动 (Action):在数据处理之后,代理继续进行下一个关键步骤。这是选择将导致期望的设定目标得以实现的行动。选择是基于找到高效实现此目标所需的最优步数。选择是基于代理对环境中模式和期望结果的学习。为了执行这些行动,代理依赖于执行器——专门用于将决策转化为物理或虚拟行动的硬件组件。执行器的例子包括用于声音的扬声器、用于机械运动的电机以及用于视觉反馈的 LED。

感知是 AI 代理的极其基础的基石,因为它使它们能够理解和感知周围环境。代理能够意识到它们的环境,这使它们能够自行决定并适当地采取行动。这将为理解世界提供基础,甚至使代理能够做出良好决策并据此采取适当行动。通过解释感官输入及其有意义的提取,感知使 AI 系统能够动态地适应情况。此外,感知使代理具有适应性,这样它们就可以相应地响应不断变化的情况,而不会失去对目标的关注,从而以高效率和目标导向的方式执行任务。

人工智能代理中的感知类型

人工智能代理的感知能力根据感官输入的性质以及代理旨在执行的任务分为几种类型。这种分类与定义代理如何感知其环境以及如何从其周围环境中收集或解释信息有关。感知使 AI 代理能够智能地响应世界。它允许代理感知物体并根据它们做出反应以解决现实世界的问题。以下是一些最常用且高度有效的 AI 系统感知类型,它们适合于这些问题的适用性和挑战。

  1. 视觉感知 (Visual Perception):AI 中的视觉感知与通过摄像头或其他成像传感器分析和解释视觉信息的过程有关,这些传感器用于提取信息。这种能力使代理能够检测物体并识别与其周围环境相关的模式、运动和空间关系。应用包括物体检测、面部识别、场景理解和手势解释,这使得视觉感知在自动驾驶、机器人技术和增强现实等领域变得重要。
  2. 听觉感知 (Auditory Perception):听觉感知是通过麦克风和其他音频传感器收集的声音感知。这种处理有助于 AI 代理识别语音、解释其环境中的声音以及识别任何声音的来源。
  3. 触觉感知 (Touch Perception):触觉或触觉感知是使用触摸屏或触觉传感器等传感器从触觉或压力数据中获得的结果。代理可以感知物理接触、纹理和压力变化。这在操作物体和在物理环境中导航等任务中可能很有用。
  4. 多模态感知 (Multimodal Perception):多模态感知也称为整合来自多个传感器通道的各种输入,以提高物体识别或语音识别等能力。来自多种模态的数据的这种组合为代理生成了对环境的丰富而更全面的感知,以提高准确性和可解释性,即使在它们可能同时听到喇叭声和交通信号的复杂环境中,或者虚拟助手同时产生手势和语音命令。

这些类型的感知使人工智能代理能够智能地与其周围环境交互,读取传感器输入,并有效地做出智能决策以实现其目的。根据 AI 系统的功能或应用,可以单独或组合实现不同的感知模式。

感知在人工智能代理中的作用

感知是 AI 代理运行的基础;因此,它使它们能够理解其环境是什么,并对其进行适当的操作。这将为理解世界提供基础,甚至使代理做出良好决策以及据此采取适当行动。通过解释感官输入及其有意义的提取,感知使 AI 系统能够动态地适应情况。以下是感知在 AI 中扮演的一些关键角色

  1. 环境理解 (Understanding of Environment):感知使 AI 代理能够获取有关其周围环境的详细信息,这些环境包含物体、实体和事件。这种能力对于有效的代理至关重要,因为它确保它们能够理解和识别某些模式,这些模式也可以使它们专注于对导航或有效交互重要的特征或特性。
  2. 数据采集 (Data Acquisition):AI 代理从其周围环境中获取信息的本质模式是感知。通过视觉、听觉或其他感官设备(如触觉)获取的这些输入构成了代理与环境之间的核心交互界面。对感官信号的解释和进一步处理使 AI 代理了解其周围环境,并导致决策和适当的响应。无论是通过视觉数据模式检测、声音识别,还是感知物理交互,感知构成了 AI 系统适应性和学习能力的基础,能够有效地应对动态和复杂环境。
  3. 模式识别 (Pattern Recognition):感知使 AI 代理能够分析和理解它们接收到的数据,以识别复杂的模式并发现有意义的关联。先进的处理技术可以使这些代理识别视觉数据中的物体、理解手势和运动,以及解释口语。此外,它们还可以识别环境中的异常或趋势,适用于面部识别、语音转录、环境监测或预测分析等应用。正是通过感知,原始的感官输入才被 AI 系统转化为可操作的见解,从而能够以智能的方式与其周围环境进行交互,并以极高的精度和效率适应不断变化的情况。
  4. 决策制定 (Decision Making):感知通过提供关于其环境的关键、情境感知信息,在 AI 代理的决策制定过程中发挥最重要作用。这些感官输入,无论是视觉、听觉还是来自任何其他模态,都允许代理构建其周围环境的全景视图。对这些感知数据的分析使 AI 代理能够比较可能的行动方案并确定可能的结果,从而做出明智的决策以实现目标。因此,这项任务需要通过导航、解决问题的能力和实时调整来执行。简而言之,感知充当了情境意识的基础来源,使 AI 代理能够有效地应对周围环境的变化,并始终朝着其预期目标努力。
  5. 适应变化 (Adapting to Changes):AI 代理对环境变化的感知是动态的。连续的感官数据传感和分析有助于检测与计划不符的变化、趋势甚至事件。这种持续的过程可以实时调整行动、策略或决策,以便在不可预测或变化的情况下保持有效性和目标。
  6. 用户交互 (User Interactions):感知使 AI 代理能够与用户有意义地互动,并与他们环境中的其他实体进行交互。通过解释用户输入,无论是通过语音命令、手势、面部表情还是书面文本,代理都可以返回能够反映用户操作的最佳意图或上下文的响应。这将使代理能够自然直观地沟通,提供相关的帮助、有见地的反馈或适当的行动。对环境线索的感知以及与其他系统的协作增加了 AI 代理的功能,并提供了更连贯和更具交互性的体验。

感知在定义 AI 代理对其环境的理解和有意义且有影响力的交互能力方面发挥着非常重要的作用。AI 代理可以感知其周围环境,识别模式,并从感知数据中获取可操作的见解,使其能够以精确的方式穿越复杂和动态的环境,做出明智的决策,并以高效的方式执行任务以实现期望的目标。此外,感知使 AI 代理更具适应性,因为它们可以应对不可预见的挑战,并与用户或其他系统无缝交互。作为 AI 功能的支柱之一,感知系统使代理能够在现实世界场景中自主有效地行动。

结论

感知对 AI 代理至关重要,因此,它们构成了它们有效理解和与环境交互能力的基础。它们可以通过收集来自视觉、声音和触觉等来源的感官数据来收集重要信息并识别模式。它们根据其知识做出决定,并对条件的变化做出反应。感知能力将使代理能够理解用户输入,导航复杂环境,并自主执行任务。随着 AI 技术的进步,先进的感知系统将对于开发 AI 代理的功能以准确有效地解决日益复杂的现实世界问题至关重要。