人工智能中的知识表示

2025年6月10日 | 阅读 9 分钟

人类最擅长理解、推理和解释知识。人类知道事物,这就是知识,并基于他们的知识,他们在现实世界中执行各种行动。但机器如何做到这一切,就属于知识表示和推理的范畴。因此,我们可以这样描述知识表示:

知识表示与推理(KR,KRR)是人工智能的一个分支,它关注AI 智能体的思考方式以及思考如何促进智能体智能行为的贡献。

它负责表示关于现实世界的信息,以便计算机能够理解并利用这些知识来解决复杂的现实世界问题,例如诊断医学状况或用自然语言与人类交流。

它也是一种描述我们如何在人工智能中表示知识的方式。知识表示不仅仅是将数据存储在数据库中,它还能够使智能机器从知识和经验中学习,以便像人类一样进行智能行为。

需要表示什么?

以下是需要在人工智能系统中表示的知识类型:

  • 对象:关于我们世界领域中所有对象的事实。例如,吉他有琴弦,铜管乐器是铜制乐器。
  • 事件:事件是我们世界中发生的动作。
  • 性能:它描述了涉及如何做事知识的行为。
  • 元知识:它是关于我们所知道的知识。
  • 事实:事实是关于现实世界的真相以及我们所表示的内容。
  • 知识库:基于知识的智能体的核心组成部分是知识库。它表示为 KB。知识库是一组句子(这里,“句子”作为技术术语使用,并非与英语中的句子相同)。
  • 知识:知识是通过事实、数据和情况获得的经验意识或熟悉度。以下是人工智能中的知识类型:

知识的类型

以下是各种类型的知识:

Knowledge Representation in AI

1. 陈述性知识

  • 陈述性知识是关于某事物的知识。
  • 它包括概念、事实和对象。
  • 它也称为描述性知识,并以陈述性句子表达。
  • 它比程序性语言更简单。

2. 程序性知识

  • 它也称为命令性知识。
  • 程序性知识是一种负责知道如何做某事的知识。
  • 它可以直接应用于任何任务。
  • 它包括规则、策略、过程、议程等。
  • 程序性知识取决于它可以应用的任务。

3. 元知识

  • 关于其他类型知识的知识称为元知识。

4. 启发式知识

  • 启发式知识代表某个领域或学科专家的知识。
  • 启发式知识是基于先前经验和方法意识的经验法则,它们效果好但并非万无一失。

5. 结构化知识

  • 结构化知识是解决问题的基础知识。
  • 它描述了各种概念之间的关系,如“一种”、“一部分”和“某物的分组”。
  • 它描述了概念或对象之间存在的关系。

知识与智能的关系

对现实世界的知识在智能中起着至关重要的作用,在创建人工智能方面也是如此。知识在展示 AI 智能体的智能行为方面发挥着重要作用。当一个智能体拥有关于输入的知识或经验时,它才能准确地对该输入做出反应。

假设你遇到一个说你听不懂的语言的人;那么你将如何做出反应?智能体的智能行为也是如此。

正如我们在下图中看到的,有一个决策者通过感知环境并利用知识来采取行动。但是,如果缺少知识部分,它就无法展现智能行为。

Knowledge Representation in AI

AI 知识周期

人工智能系统具有以下用于展现智能行为的组件:

  • 看法
  • 学习
  • 知识表示和推理
  • 规划
  • 执行
Knowledge Representation in AI

上图展示了 AI 系统如何与现实世界交互以及哪些组件有助于其展现智能。AI 系统具有一个感知组件,通过该组件从环境中检索信息。它可以是视觉、听觉或其他形式的感官输入。学习组件负责从感知组件捕获的数据中学习。

在整个周期中,主要组件是知识表示和推理。这两个组件都参与展现机器类人智能。这两个组件是相互独立的,但也耦合在一起。规划和执行取决于对知识表示和推理的分析。

知识表示的方法

知识表示主要有四种方法,如下所示:

1. 简单关系知识

  • 这是最简单的存储事实的方法,它使用关系方法,一组对象的每个事实都系统地列在列中。
  • 这种知识表示方法在数据库系统中很常见,用于表示不同实体之间的关系。
  • 这种方法推断的机会很小。

示例

以下是简单的关系知识表示。

玩家权重年龄
玩家16523
玩家25818
玩家37524

2. 可继承知识

  • 在可继承知识方法中,所有数据都必须存储在类的层次结构中。
  • 所有类都应以泛化形式或分层方式排列。
  • 在此方法中,我们应用继承属性。
  • 元素从类的其他成员继承值。
  • 这种方法包含可继承知识,它显示了实例与类之间的关系,称为实例关系。
  • 每个单独的框架都可以表示属性及其值的集合。
  • 在此方法中,对象和值在框状节点中表示。
  • 我们使用指向对象到其值的箭头。

示例

Knowledge Representation in AI

3. 推理知识

  • 推理知识方法以形式逻辑的形式表示知识。
  • 此方法可用于推导更多事实。
  • 它保证了正确性。

示例

假设有两个陈述:

  1. 马库斯是一个男人
  2. 所有男人都会死

然后可以表示为:

4. 程序性知识

  • 程序性知识方法使用小的程序和代码来描述如何做特定事情以及如何进行。
  • 在此方法中,使用一个重要规则,即 If-Then 规则。
  • 有了这些知识,我们可以使用各种编程语言,如 LISP 和 Prologue。
  • 我们可以轻松地使用此方法表示启发式或领域特定的知识。
  • 然而,并非所有情况都可以用此方法表示。

知识表示系统的要求

一个好的知识表示系统必须具备以下特性:

1. 表示准确性:KR 系统应具备表示所有必需知识种类的能力。

2. 推理充分性:KR 系统应具备操纵表示结构以生成与现有结构相对应的新知识的能力。

3. 推理效率:通过存储适当的指南,将推理知识机制导向最有效方向的能力。

4. 获取效率:使用自动方法轻松获取新知识的能力。

知识表示的挑战

处理歧义和不确定性

  • 歧义:换句话说,语言、符号、概念和其他指示符号可以根据上下文赋予多个含义。在这种情况下,“bank”一词可以指金融机构,也可以指河岸。
  • 不确定性:然而,毫不奇怪,信息不完整、不精确或相互矛盾是事实。例如,预测股市趋势受到经济数据、地缘政治因素以及人类行为不确定性的影响。

它们通常用于在不确定的情况下进行表示和推理,系统基于通过所谓的贝叶斯网络和概率图模型进行合理猜测。

表示的可伸缩性

  • 知识量:例如,存在大量涉及大量数据的高维领域需要 AI 系统来管理,这些数据需要及时可用以用于回答问题(例如,医疗保健或自动驾驶汽车)。

随着我们在大规模存储和检索知识,我们可以使用知识图谱和分布式存储系统(如 Neo4j)来实现,从而高效地存储和检索知识。

  • 相互关系的复杂性:随着知识的增加,但在达到计算效率的阈值之前,实体之间的关系数量会增加。

聚类以及分层表示和模块化本体可以减少复杂关系方面的复杂性,而不会破坏复杂性。

平衡表达能力与效率

表达能力

当需要丰富而详细时,最好知道并获取大量知识,但这可能在计算上效率低下。例如,解释如此复杂的法律框架所需的本体将阻碍推理算法。

然而,在解决问题时,它们通过同时为问题提供符号表示和子符号表示来平衡符号和子符号。例如,它作为一种框架,将逻辑框架与机器学习模型结合起来,以获得高表达能力而没有效率低下。

效率

计算速度非常快,但会牺牲一些可能导致信息丢失的细节,并可能导致次优决策或推理错误。基于启发式的机制、优化算法以及当然的缓存机制将有助于高效处理丰富的知识表示。

动态知识更新与维护

动态更新

当领域快速变化时(如天气预报或社交媒体分析),在不破坏现有结构的情况下集成新知识的需求变得紧迫。这些系统可以增量学习和在线学习(无需从头重新训练即可更新其知识库)。

维护

如此庞大的知识库是一个持续的过程,并且融合了许多数据源,这使得保持一致性和准确性变得困难。合并多家医院的医疗保健数据库会包含冗余或冲突的信息。通过定期审计、冲突解决框架以及用于重复数据删除和验证知识库质量的自动工具,可以降低出错的风险。

知识表示的应用

问题解决与决策

  • 结构化问题分析:AI 系统可以使用逻辑或逻辑系统和生产规则等框架将问题分解成更容易管理的子问题。
  • 决策支持系统:通常,知识图谱和本体用于这些系统来评估多种场景,找到最佳解决方案,并提出建议。

机器人和自主系统

  • 环境映射:一是机器人使用语义网络来理解空间关系,以实现路径规划和导航;二是所有常用导航应用领域都可以用语义网络进行建模。
  • 任务自动化:通过允许机器人表示程序性知识,可以使组装部件、清洁或运送货物等任务更加自主。
  • 人机协作:本体使机器人能够理解人类试图说什么以及他们的意图,从而在共享空间中实现自然的人机交互。
  • 自动驾驶汽车:通过将道路网络、交通规则和环境上下文词语表示出来,车辆可以做出实时决策以安全导航。

医疗保健和工业中的基于知识的系统

  • 临床决策支持系统 (CDSS):这些系统通过以本体和规则的形式表示医学知识,在帮助诊断、推荐治疗和预测患者预后方面发挥作用。
  • 药物发现:识别药物靶点和研究疾病机制的理想工具是分子和遗传数据的表示。
  • 预测性维护:通过知识图谱,机器可以自我诊断并预测机器何时会发生故障,从而节省停机时间和成本。
  • 过程优化:关于生产流程工作流的知识可以编码到系统中,然后系统可以找到并提出改进建议。

搜索引擎和推荐系统

  • 搜索引擎中的知识图谱:当您将网页内容表示为连接的实体(实体是连接的单元)时,搜索网络会变得容易。例如,输入“列奥纳多·达·芬奇”会同时显示网页以及关于他的生平、作品和时代的事实。
  • 基于内容的过滤:通过考虑数据属性和对相似项目进行建模,可以帮助用户了解他们的偏好并推荐首选项目。
  • 协同过滤:将系统用户的人口统计和社会历史数据表示为关系,并用于推荐其他相似用户喜欢的项目。

下一个主题知识表示技术