人工智能中的部分顺序规划

2025年7月10日 | 阅读12分钟

人工智能利用偏序规划 (POP) 来寻找高效且灵活的移动以实现目标。而其他规划技术要求所有动作都按顺序进行,POP 只在需要时才强制执行顺序,这体现了“最小承诺原则”。这意味着在情况发生变化时,计划可以更容易地进行调整。

由于其在机器人技术、自动化代理和工作流管理中的应用,偏序规划有助于有效解决事物不断变化的问题。要设计能够应对复杂或不确定情况并做出良好组织和决策的智能系统,对 POP 的良好理解是必不可少的。

偏序规划的核心概念

表示法

在该方法中,一个计划通常被视为一个动作列表、这些动作的(仅部分,非完整)排列以及一组显示它们因果关系的链接。POP 不像状态空间规划那样按部就班地执行动作步骤,而是仅在情况需要时才保持动作的顺序。由于这种方法,执行步骤可以很灵活,可以一起或分别执行以满足不同的需求。

通常将计划想象成有向无环图,其中每个节点代表需要完成的事项,而边则指示必须发生的事件顺序,这有助于计划的管理和更新。

动作、前提和效果

POP 中的任何动作都有一组需求(前提条件)和结果(效果),这决定了它的使用。规划器从一个单一动作开始,然后添加额外的动作,始终检查早期动作的结果是否满足每个后续动作的需求。为此,动作需要相互连接,并且计划的结构需要更新。通过前提条件和效果来陈述动作,使 POP 能够以一致的方式处理复杂问题,并确保动作不会在适当时间之前执行。它使最终计划更清晰、更准确。

Partial Order Planning in Artificial Intelligence

问题和威胁

POP 的独特之处在于因果链接,当动作 B 需要动作 A 成功时就会形成。然而,这也意味着可能出现潜在的危险(威胁)——其他可能断开 A 和 B 链接的事物。可以通过改变计划的结构来处理威胁,例如将威胁动作放在 A 之前或 B 之后。在具有挑战性的领域中构建全面的计划需要 POP 来处理因果关系和危险。

假设

POP 中最重要的概念是“最小承诺原则”,鼓励团队等到最后一刻才下订单。不选择固定的动作序列可以使计划保持灵活性,并简化必要的调整。遵循这一原则,如果情况发生变化,您无需从头开始;您可以处理变化,只需移动或调整计划的各个部分。由于 POP 高效且灵活,因此当计划需要在真实情况下快速更改时,它就变得非常有价值。

分析潜在属性

使用偏序规划,规划器会在计划的选项中进行搜索,而不是尝试找到世界状态。规划器从一个基本方案(仅初始动作和结束动作)开始,然后通过插入更多动作和链接来改进它,以确保子目标得到处理,并处理威胁。

每次细化一步,计划就更接近完成,并且每次处理需求和威胁直到满足前提条件时都会继续。将计划作为焦点进行处理与基于状态的搜索不同,因为它允许处理复杂且相关目标的网络。

偏序规划算法

开始规划过程

POP 算法首先构建一个最小计划,包括“开始”和“结束”,其中“开始”表示问题开始,“结束”表示目标。在这里,规划器会发现“结束”所需的目标,并提出任何现有动作中缺失的需求,使其成为开放式前提条件。由于这些,进一步的规划任务可以有效地进行。开始和结束步骤都充当标记,因此状态之间的转换定义明确,并且目标清晰地达成。

选择开放式前提条件

识别开放式前提条件允许规划器在它们之间进行选择以提供支持。当某个前提条件未得到满足时,算法会尝试 (a) 找到一个已定义的动作,其结果将满足该前提条件,或 (b) 从列表中引入一个符合需求的新动作。

将动作链接到开放式前提条件会建立一个排序规则,要求支持动作先发生。通过这种实践,每个子目标都可以通过对整个计划的逐步增加来实现。

计划一致性

一旦包含动作和排序限制,算法就会管理计划产生的每个约束。规则涉及事件发生的顺序以及确保因果关系得到遵循。算法需要监控顺序是否存在循环(这会导致执行失败)并确保所有链接都遵循因果模式。

确保所有工作流程一致非常重要——如果它们不一致,则意味着新兴计划在激活时可能无法正常工作。只有通过智能处理和沟通这些约束,POP 才能保持可处理性。

动作和结果

在制定计划的过程中,一些新动作可能会通过破坏所需的前提条件来破坏既定顺序。算法会检查每个新动作,以发现针对当前行为的潜在威胁。如果出现威胁,可以通过将相关消息移至“if”部分之前(提升)或移至最后一个动作之后(降低)来解决。这样,所选路径得以维持,并且额外的步骤不会弄乱计划,有助于在具有挑战性或有争议的情况下构建稳健的计划。

规划和寻找解决方案

您将继续选择合适的开放式前提条件,处理支持、约束和未解决的威胁,直到所有开放式前提条件和问题都得到解决。当所有目标都达成,所有顺序都排好(如有必要),并且所有威胁都得到处理时,计划就完成了。这为您提供了一个半形成的计划:一组任务和规则,显示了可能完成功能的各种方式。当按照偏相关性对步骤进行拓扑排序时,可以获得有效的完整排序或调度。

变体和扩展

条件偏序计划

条件偏序规划借鉴了经典 POP 的思想,但它是为可能不按计划进行的情况而设计的。该变体通过为每次预期的障碍或意外情况在执行过程中创建多个分支或应急计划来工作。通过条件动作和观察点,规划器可以根据游戏世界或环境设置代理应该做什么,从而使他们的响应适应多种情况。

这在机器人技术和真实情况中最为重要,因为环境在使用计划时会不断提供反馈。

时间约束

它们将时间管理和持续时间规划纳入创建和遵循计划的过程中。在这种情况下,时间约束或持续时间与每个动作相关联,因此规划器必须处理因果约束以及在特定时间限制内使用动作的要求。在此框架中,您可以编程同时发生的动作,这对于制造、物流或项目管理至关重要。

因此,时间计划可以显示所有动作是否将在截止日期前完成,以及它们必须根据其他正在发生的事情何时开始和停止。

分层 POP

这项技术通过引入高级动作来增加抽象性,这些高级动作可以进一步分解为更小的子动作。该扩展通过使用分层任务网络 (HTN) 等方法,按步骤处理任务,从而支持复杂的规划。系统的大致概述可以使用 POP 原则来稳步完善,从而影响系统的细节。由于这种分层规划,元素可以在各种情况下保存和使用,例如多代理系统以及大型业务工作流。

状态树遍历规划

在有多名代理或机器人存在的情况下,该方法汇集了必须协同行动并可能共享资源的各种规划器。它监督代理之间的并发工作,并确保它们的计划同步,从而防止潜在的冲突和死锁。通信技术、资源共享策略和威胁管理系统得到改进,以支持多个同时进行的流程。它在分布式人工智能和机器人团队中发挥着重要作用,有助于轻松实现团队目标。

基于学习的 POP

机器学习已被添加到 POP 中,因此规划代理可以通过经验或历史数据发现有效的动作。通过强化学习、案例推理或模式识别,这种混合 POP 系统可以提高其规划能力并适应新环境。

带有学习功能的 POP 在现有规则不可用或手动创建规则过于缓慢时非常有用。系统会根据有效的方法和无效的方法自动更改计划。

偏序规划的应用

自动故事生成

为视频游戏和互动小说进行自动故事和叙事创作广泛使用偏序规划。POP 通过让玩家自由更改主要事件的顺序来支持非线性叙事。因此,故事情节、情节线和环境可以增长和适应,吸引玩家并让他们有兴趣多次玩游戏。

由于 POP 通过限制所需事件来使故事变得灵活,因此为玩家提供了多种多样的可能性,而无需详细规划所有可能的结局。

Partial Order Planning in Artificial Intelligence

业务流程自动化

在业务流程管理中,POP 有助于创建和自动化包含相互依赖但也可以灵活安排的任务的过程。保险索赔中的某些任务(例如,检查和分析数据)可以同时完成,但其他任务则需要一个接一个地执行。

组织使用 POP 来快速设计和自动化其工作流,并且可以轻松处理更改或例外情况,而无需过多的重新编码。由于偏序,更容易为并行处理安排数据,确保在不断变化的环境中的敏捷性和适应性。

任务规划

在可能发生意外情况的地方,机器人和无人驾驶车辆被频繁使用,任务包括例如协助救援、探索或运送补给。POP 使这些系统能够制定灵活的行动计划,处理依赖关系,但执行顺序通常可以变化。这也意味着系统更能应对中断,并且无需频繁调整计划。

生物信息学

在生物信息学和实验室自动化中,管理协议通常需要理解程序、试剂和设备的相互依赖性。POP 能够路由实验室测试,控制步骤使其即时可用,并允许更灵活的工作,不相关的动作独立完成。

这将使实验更顺利地进行,同时支持实验计划的更新、所需设备的更换或紧急更改,而不会损害实验的主要目的。

POP 的优势

灵活的执行方式

使用偏序规划 (POP) 时,执行具有更高的灵活性,因为只需要排序一小部分动作,而大多数动作都可以保持不变。因此,代理可以根据其周围环境的新、不期望的变化或它们没有的东西来调整下一步行动。这在机器人技术和应急响应中非常重要,因为在实时环境中保持灵活性和快速响应对于实现成功和可靠的操作至关重要。

优化并行性

由于 POP,不受因果关系约束的动作可以并行处理,这使得任务更有效率。通过利用并行性,团队或自动化代理可以在更短的时间内完成编程任务,并更好地利用他们有限的资源。

这在工业自动化、多代理系统和协作机器人领域非常有帮助,因为这类系统通常会同时运行多个动作。通过并行处理,公司可以更快地工作,并有更多资源来应对高峰需求或大型运营。

Partial Order Planning in Artificial Intelligence

POP 的挑战

大型和复杂的问题

在复杂、庞大或快速变化的环境中扩展偏序规划时会出现问题。随着步骤、原因和可能性的增加,找到计划并管理威胁变得更加困难。可能出现的场景数量如此之大,以至于规划者很难在物流或人工智能等领域使用这些想法。研究人员正在研究复杂的启发式方法和分解技术来管理可扩展性,尽管在大型系统中使用 POP 仍需大量研究。

动态和变化的环境

总的来说,POP 假定世界不发生变化,这使得它在情况不断变化的情况下无效。实际上,当事情出错或最终结果不确定时,计划需要进行调整。在 POP 框架中添加概率处理、传感器输入活动或即时重新规划非常困难,因为在不确定的情况下跟踪连贯的计划既耗时又麻烦。

学习和适应过程

使用 POP 和机器学习或自适应算法才刚刚开始。目前,通常依赖领域专家来定义可用的动作以及它们需要满足的条件(前提条件)。将学习无缝集成,并且规划器能够适应、从错误中学习或不断改进计划仍然是一个难题。如果可能,POP 将能更好地处理新的、复杂的和动态的任务,而无需被告知该做什么。

管理协调和解决冲突

POP 必须应对多代理环境中的特殊挑战,例如指导代理如何合作、监督有限资源的共享以及确保一切都井然有序。随着来自不同代理的动作相互作用,检测和管理威胁变得更加复杂。用于规划、谈判和管理团队中威胁的高效算法正在积极研究中,但在复杂、开放的情况下尚未解决。

Partial Order Planning in Artificial Intelligence

实时应用

波音

波音公司依靠优化算法和偏序规划来处理飞机组装和维护任务。建造一架飞机所需的所有子任务必须组织起来并协同完成,尽管许多任务可能通过识别它们的依赖关系同时执行。波音公司的灵活系统能够应对时间表中的变化和意外情况,从而最大限度地减少对生产时间的影响,并提高生产力。

波音公司对智能规划系统的投资可以快速改变时间表和流程,这对于满足航空航天行业对质量和安全的高标准至关重要。

亚马逊机器人(仓库自动化)

成千上万的机器人协助亚马逊庞大的履行中心的员工完成每天处理数百万件商品的繁重工作。亚马逊使用基于 POP 的规划系统来安排和控制其机器人的活动。只要检查物品和路径可用性,机器人就可以同时执行不同的任务。该系统能够处理增加的工作量,优化路线,并在只有少量人工帮助的情况下满足随机变化的需求,这已将物流自动化提升到一个新的水平。

西门子(在工业自动化和智能工厂领域)

为了支持工业 4.0,西门子通过使用可以进行部分任务调度的智能规划系统来开发自动化。机器和生产单元以并行形式协同工作,但它们需要使用同一组资源,并且都受到相同约束的影响。

灵活的规划、执行和适应性,任务被自动化和管理,并在需要维护或客户订购产品时进行控制。通过这种方法,工厂可以更高效地运行,停机时间短,对问题响应迅速,这使得它们比其他公司更具竞争力。

SAP

SAP 提供业务流程智能 (BPI) 工具,支持公司中的偏序和动态工作流管理。如果所有必要条件都已到位,企业就可以使用其平台来开发和跟踪执行各种任务的系统,例如招聘、采购或供应职能。当某些重要事项实时中断流程时,SAP 会自动调整其工作流引擎。

这种灵活性,通过偏序得以维持,使大公司能够保持灵活性,遵守新法规,并更好地利用世界各地不同的部门。

Partial Order Planning in Artificial Intelligence

NASA 火星车操作规划喷气推进实验室

NASA 在喷气推进实验室通过部分灵活的方法管理火星车的日常运行。每辆火星车每天都会获得一系列任务要在火星上完成,并且必须根据能源、地形类型和与地球的通信链接来规划时间表。某些活动可以同时进行,但某些活动必须在其他活动之后进行。

由于先进的规划系统,任务团队能够在必要时即时更改他们的计划,在行星探索带来的意外或困难面前保持目标不变。

结论

事实证明,偏序规划是一种可靠且灵活的方式,可以在严酷的环境中创建有用且适应性强的计划。POP 通过仅允许必要的动作序列来实现资源的有效利用和在不断变化的环境中的灵活性。机器人技术、工作流组织、生物信息学和其他领域广泛使用 POP,在需要快速响应的情况下带来重大收益。

尽管在扩展 POP、处理不确定性和处理多个代理方面仍存在困难,但学习和技术集成可能会增加其影响。