代理优化的简介

2025 年 7 月 15 日 | 阅读 7 分钟

代理优化是一种有效的技术,用于解决目标函数评估昂贵或耗时的复杂优化问题。它广泛应用于工程设计、机器学习和科学实验等领域,在这些领域中,由于目标评估的成本高昂,传统的优化方法可能不可行。

在代理优化中,我们不直接优化昂贵的目标函数,而是构建一个“代理”或“近似”模型来逼近目标函数,该模型基于有限次数的评估。然后,使用这个代理模型来指导寻找最优解的搜索,从而更有效地探索解空间。

代理优化的关键概念

  1. 目标函数:目标函数是我们希望优化(最小化或最大化其值)的函数。在代理优化中,这个函数通常评估成本高昂,可能需要复杂的模拟或实验。例如,使用计算流体动力学优化飞机机翼形状需要运行昂贵的模拟。
  2. 代理模型:代理模型是真实目标函数的近似,它基于对昂贵目标函数有限次数的评估构建而成。代理模型的评估成本要低得多,用于指导搜索更优的解决方案。一些常见的代理模型类型包括:
    • 高斯过程(Kriging):一个概率模型,预测目标函数的均值和不确定性。
    • 径向基函数(RBF):一个平滑插值模型,使用加权径向基函数之和来近似目标函数。
    • 多项式回归:一个简单的模型,通过拟合多项式来处理数据。
    • 神经网络:有时也用作代理模型,特别是对于高度非线性或复杂的目标函数。
  3. 探索与利用:在代理优化中,平衡探索与利用至关重要。探索包括在代理模型不确定性较大的搜索空间区域进行采样,有可能发现更好的解决方案。利用则专注于代理模型基于当前知识预测高性能的区域。有效的优化方法需要在这些模式之间切换。
    • 探索寻求潜在解决方案的新区域。
    • 利用提炼已知最佳解决方案。
  4. 采集函数(Acquisition Functions):采集函数根据代理模型帮助确定在搜索空间中下一个采样点的位置。这些函数旨在平衡提高模型准确性(探索)和找到更好解决方案(利用)之间的权衡。一些常用的采集函数包括:
    • 预期改进(EI):预测相对于当前最佳解决方案的预期改进。
    • 改进概率(PI):关注新点超过当前最佳解决方案的可能性。
    • 上限置信界(UCB):平衡预期性能和不确定性,鼓励在不确定性高且预期平均性能也高的区域进行探索。
  5. 初始采样和顺序学习:代理优化通常从目标函数的一组初始样本开始,用于构建初始代理模型。随着更多点的采样(通常以顺序或迭代的方式),代理模型会被更新,从而随时间提高其准确性。这种方法允许优化根据不断变化的代理模型做出明智的采样点选择。
  6. 停止标准:代理优化需要预定义一个停止标准。这可能包括:
    • 最大评估次数。
    • 目标函数精度的所需程度或改进程度。
    • 收敛阈值,即后续评估不再显著改进模型的预测或目标函数。

代理优化利用这些关键概念,使得在目标函数评估成本过高或耗时的情况下,优化成为可能。通过仔细构建和使用代理模型,该技术可以在保证收敛到最优解的同时,减少所需的评估次数。

代理优化步骤

代理优化通常以迭代过程的形式进行,该过程包括构建和改进代理模型以指导最优解的搜索。以下步骤定义了此过程的关键阶段:

1. 初始采样

过程开始时,从搜索空间中选择一组初始点。这些点使用昂贵的目标函数进行评估。可以使用各种采样策略,包括:

  • 随机采样:从搜索空间中随机选择点。
  • 拉丁超立方采样(LHS):一种统计方法,可确保采样点均匀覆盖空间。
  • 网格采样:从搜索空间内的预定义网格中选择点。

在这些点上获得的目标函数值构成了构建初始代理模型的数据集。

2. 构建代理模型

使用初始数据点,构建代理模型来近似目标函数。模型被训练用于预测整个搜索空间的目标函数值。常见的代理模型包括高斯过程(Kriging)、径向基函数、多项式回归神经网络。模型试图捕捉输入变量和目标函数之间的潜在关系。

3. 优化代理模型

一旦构建了代理模型,就使用标准的优化方法(例如,梯度下降、进化算法或其他启发式技术)对其进行优化。目标是根据代理模型的预测,识别搜索空间中有可能改进目标函数的候选点。

4. 选择新的评估点

下一步是在搜索空间中选择新的点来评估真实目标函数。这是通过使用采集函数来实现的,该函数平衡了探索(在代理模型不确定的区域进行搜索)和利用(专注于代理模型预测良好目标值的区域)。常见的采集函数包括:

  • 预期改进(EI)。
  • 改进概率(PI)。
  • 上限置信界(UCB)。

采集函数决定了下一步应该评估哪些点,以提高代理模型的准确性并找到更优的解决方案。

5. 评估目标函数

然后使用真实的、昂贵的目标函数来评估选定的点。这些评估提供了这些点的真实目标函数值。这些新的数据点被添加到先前评估过的点集中,形成一个更大的数据集来更新代理模型。

6. 更新代理模型

使用新的数据点,更新代理模型以提高其准确性。更新后的模型能更好地近似目标函数,尤其是在已完成新评估的区域。优化代理模型、选择新点和评估目标函数的过程会持续迭代。

7. 收敛与停止标准

代理优化过程会一直持续,直到满足预定义的停止标准。停止标准可能包括:

  • 最大目标函数评估次数:对昂贵目标函数可以进行的评估次数设置上限。
  • 收敛阈值:当连续迭代之间的目标函数改进低于某个阈值时。
  • 时间限制:当优化过程在设定的时间内终止时。

一旦过程停止,优化找到的最佳解决方案将作为最终结果返回。

步骤总结

  • 初始采样:使用真实目标函数评估一组点。
  • 构建代理模型:使用初始数据构建目标函数的近似模型。
  • 优化代理模型:使用优化算法查找有希望的候选点以供进一步评估。
  • 选择新点:使用采集函数选择用于评估目标函数的新点。
  • 评估目标函数:在选定的点上执行昂贵的评估。
  • 更新代理模型:使用新的数据点完善模型并重复此过程。
  • 收敛:持续迭代,直到满足停止标准。

通过遵循这些步骤,代理优化能够有效地探索目标函数评估成本高昂的复杂优化问题,最终以更少的评估次数获得最优解。

代理优点的优势

  • 成本效益:代理优化显著减少了昂贵的目标函数评估次数,使其适用于每次评估成本高昂的问题。
  • 灵活性:它可以应用于各种优化问题,包括那些具有非线性、非凸或有噪声目标函数的问题。
  • 可扩展性:代理模型可以处理高维问题,特别是与降维技术结合使用时。

代理优用的应用

  • 工程设计:在航空航天和汽车工程等领域,优化设计(例如,机翼形状或发动机部件)通常需要运行计算成本昂贵的模拟。代理优化有助于减少找到最佳设计所需的模拟次数。
  • 机器学习中的超参数调优:代理优化,特别是贝叶斯优化,广泛用于调优机器学习模型中的超参数。与网格搜索或随机搜索相比,它有助于以更少的训练迭代次数选择最佳超参数集。
  • 药物发现:在制药研究中,代理模型用于指导搜索最优分子结构,通过近似分子特性与生物活性之间的关系。
  • 科学实验:代理优化应用于实验设置,其中执行实际实验成本高昂或耗时。它通过根据代理模型优先考虑要进行的实验来帮助规划高效的实验。

代理优用的挑战

  • 模型准确性:代理模型的质量对于代理优化的成功至关重要。模型构建不当可能导致次优解或浪费评估。
  • 高维空间:虽然代理模型可以处理高维问题,但随着维度的增加,构建准确模型所需的数据量也会增加。这被称为“维度灾难”。
  • 多目标优化:代理优化可以扩展以处理多个目标,但这会增加复杂性,因为代理现在必须同时近似多个目标函数。

结论

代理优化为解决目标函数评估成本高昂的优化问题提供了一个有价值的框架。通过使用代理模型近似目标函数并利用它来指导寻找最优解的搜索,该技术在效率和准确性之间取得了平衡。其在工程、机器学习和科学研究中的广泛应用证明了其作为解决复杂现实世界问题的工具的重要性。