时间序列预测的挑战与方法

2025 年 6 月 17 日 | 阅读 9 分钟

时间序列简介

时间序列数据的应用非常广泛,它存在于人类生活的各个方面。几乎所有行业管理层都可能希望以高精度和有利的方式预测未来趋势。一项能源行业全球调查的受访者透露,95%的数据科学家使用涉及预测的建模技术。

在语言学方面,这种强调有充分的理由。简而言之,时间序列数据包含诸如季节性、趋势、周期性商业周期等重要事实,所有这些都在一个单一的数据流中。所有这些模式都可以在几个时间序列示例中看到。例如,下图中的红线显示了高压变电站的实际历史负荷需求,而“彩色”曲线则表示模型集合提供的预测。

上述讨论的困难仅指单个单变量时间序列。如今,随着智能传感器的普及和物联网时代的到来,时间序列数据几乎无处不在。尽管生成的数据量呈指数级增长,但数据的管理和处理是一个具有挑战性的过程。数据质量在时间序列建模中尤为重要,其传输将在下文讨论。然而,即使拥有高质量的历史数据,在生产中部署预测模型也会带来一些操作挑战。

构建预测系统中的实际挑战

  1. 数据质量:间歇性数据、稀疏性、新序列、缺失时间戳和数据缺失等因素完全支持“垃圾进,垃圾出”的原则。
  2. 预测器依赖性:由于需要为预测模型中使用的预测器生成值,因此在过程中添加了额外的建模步骤。
  3. 数据延迟:新历史数据可用的相对时间框架会延长预测范围并限制近期效应的实现。
  4. 再训练周期和模型监控:模型何时应再训练,是应每周或每月进行计划性再训练,还是当性能严重下降、出现特征漂移等情况时进行再训练,这些都是至关重要的问题。

在模型开发过程中应考虑其中一些实际问题。例如,如果历史记录在早上 8 点提供,那么在预测范围时必须考虑这种延迟。此外,如果给定模型或集合符合要求,那么进一步定义适当的再训练策略(基于时间或基于性能)是良好操作化的关键。

尽管解决这些挑战至关重要,但新的预测方法提供了改进的技术,可用于各种预测场景。下一节将简要概述时间序列预测中这些相对较新的现代趋势。

时间序列的现代主题

在过去的五到十年中,使用机器学习来预测时间序列数据的兴趣日益浓厚。在这里,我们将探讨塑造现代时间序列方法的一些关键主题,从一个永恒但至关重要的话题开始:管理不确定性。

管理不确定性

近年来,与点预测相比,概率预测对于处理波动性变得越来越重要。一些实用方法包括保形预测和分位数回归,它们都已被证明或被认为非常有用。例如,使用分位数而不是平均预测有助于更详细地了解所需历史时间序列数据中可能的值。

分层预测协调

在时间序列预测背景下,另一个有趣的现代主题是旨在协调跨层级预测的方法。以各种形式,层级的持久性因此是时间序列数据的一个普遍特征。例如,产品可以存储在部门中,每个部门的总和构成一个商店的总和,所有商店的总和可以相加。同样,根据传感器数据的类型,它可以进行聚类,这意味着可以在聚类级别聚合数据,同时应用分层预测方法。

也可以在分层尺度上考虑时间,我们也可以找到时间整合的路径。这个研究领域正在兴起,但在不久的将来似乎在实践中会有更多的用途。由于存在越来越多的高频数据,我们可以通过小时到日、月、季度等多个聚合级别实现一步预测。在每个级别,都可以根据不同的模型进行预测,只考虑那些获得最佳结果的模型。

这种分层协调不仅提高了预测精度,还提高了预测的一致性。一致的预测会向上层级传递,使得低层级预测能够适当地累加到高层级预测。这种方法建立在时间序列自然地被分割成不同级别,同时在所有这些级别保持高准确性的事实之上。

Rob Hyndman 及其团队在过去五年中在莫纳什大学进行的新工作描述了在多级系统中提高预测准确性的关键方法,将其作为一种校准形式,无论应用何种预测方法。

统计学与机器学习

当前预测辩论中的一个重要趋势是统计模型与机器学习技术的使用之间的竞争。

这种讨论不限于时间序列,并且在预测建模文本中一直持续存在。预测最引人注目的是可以使用模型误差的定量度量。正是这种清晰的评估框架已被用于大规模预测竞赛,例如由 Spyros Makridakis 教授组织的 M 系列。

在 M4 竞赛中,最佳方法是捆绑每系列指数平滑与全局循环神经网络,而第二佳方法是将 XGBoost 应用于经典技术的平均预测。M5 竞赛出现了一些转变,所有顶尖的世俗表现者都完全利用了即时机器学习技术,尤其是 LightGBM 的魔力。至于所涉及的方法,最近结束的 M6 竞赛应该提供有关这些方法的更多信息。

总而言之,统计和机器学习方法在某些情况下表现出色。然而,实际研究证据总是表明,尝试整合两种方法的最佳特征,往往会带来改进的性能。

全局模型与局部模型

在建模方面,局部模型和全局模型之间始终存在差异。局部模型更特定于已识别的时间序列,而全局模型旨在处理许多时间序列。

然而,随着当今可用的大量数据,特别是通过在电力和水消耗中使用智能电表等设备,时间序列数据的数量猛增。例如,部署在加利福尼亚等地区的智能电表一直在持续收集来自数千万个传感器的高质量信息。

在局部模型和全局模型之间做出选择至关重要,因为选择一个也意味着选择另一个。虽然为每个时间序列拟合单独的模型可以提高模型的准确性和可解释性,但它会消耗大量时间和资源来拟合和管理多个模型。此外,这种方法未能利用不同时间序列比较产生的信息。全局模型可以在这里发挥作用。虽然不是一个特别创新的过程,但全局模型在预测系统中的实现是新的,因为它允许在多个时间序列中仅训练一个选定的模型。

全局模型的主要优势是只有一个模型需要训练和管理。这些模型很大,但深度学习高级神经网络的集成或整合有助于这些模型在时间序列层面自主地进行交叉学习,几乎不需要人工干预,因为它们试图发现对比和相似之处。

时间序列预测中的领域特定用途

  1. 智能电网中的能源消耗预测
    可再生能源和智能电网系统的引入提高了对准确能源需求预测的需求。组织使用时间序列预测技术来预测电力需求,以努力平衡市场中的供需。例如,预测分析可以估算住宅区消费者每小时的电力消耗,从而改善需求管理并减少特定时间间隔内对化石能源的需求。
    分层预测等复杂方法可以从不同区域的智能电表中获取使用数据,用于配电和提前诊断电网故障。
  2. 电子商务销售预测
    对于电子商务而言,准确预测销售至关重要,以便进行库存、需求甚至促销。通过使用时间序列预测模型,可以根据客户和产品在一年中的波动和变化来预测其在市场中的行为。例如,如果一家在线零售商采用概率预测,他们可以估算黑色星期五或假日销售期间缺货的可能性。通过构建用于机器学习的全局模型,公司可以按产品类别分析数据并优化库存管理,以匹配所需需求,从而避免过量库存或库存不足。
  3. 气候变化和天气预测
    时间序列预测的主要实际应用是其在气候科学中的应用,通过分析历史数据得出的特定方案,可以预测天气条件和气候变化的进一步发展。这些用于预测气温、降雨、灾害参数和极端气候,有助于减少灾害风险。
    例如,使用 LSTM 或 Transformer 模型天气数据中的依赖关系相对容易,从而更准确地预测飓风或干旱。此外,这些预测要求政策制定者,特别是农业产业,为新的气候条件做准备,并支持全球变暖背景下的可持续发展。

预测系列中的当代方向

Transformer 和注意力机制在时间序列预测中的作用

最初,Transformer 已被用于处理自然语言,最近,它们在时间序列数据预测方面表现出卓越的性能。它们能够关注训练数据中时间模式和关系的特定特征,使其成为长期和短期分析的理想选择。具体来说,Transformer 不限于处理相等的时间间隔,这与 ARIMA 或 LSTM 等方法不同,并且它们对于多元时间序列具有灵活性。有一些与当前问题相关的模型,专为时间序列预测而开发,包括时间融合 Transformer (TFT),它使用注意力机制来正确加权输入,包括协变量和时间序列数据。

这种能力对于结果依赖于可用性/延迟和时序的行业最为宝贵,例如金融市场预测或能源使用。例如,Transformer 可以通过观察多种因素(例如未来金融基准的变化)来预测股市价格水平,但同时它们可以在市场变化中动态调整。此外,它们易于扩展且足够快,适用于高频数据,这意味着它们适用于实时预测,例如欺诈或供应链管理。

AutoML 工具简化模型选择和优化

AutoML 正在通过作为一组工具来自动化大多数重要步骤(包括数据预处理和特征工程、模型选择和超参数优化)来重塑时间序列预测。它允许对统计容差、方差、概率或编程语言没有深入了解的业务人员生成可靠的预测模型。

出于同样的原因,其他平台,如 Google Cloud AutoML Tables、H2O.ai AutoML 和 PyCaret,都集成了时间序列模块,该模块使用 ARIMA 等统计模型和 LightGBM 或 XGBOOST 等机器学习模型进行自动模型验证。例如,AutoTS 和 Darts 框架在 Python 语言中需求量很大,用于封装预测管道,处理诸如缺失值填充、生成滞后和最佳模型选择等任务。

AutoML 还缩短了实验时间和成本,这有助于企业实施预测系统。这使得相对较小的组织也可以轻松应用更复杂的预测级别,例如预测收入、物流和资源分配。此外,一些 AutoML 工具已开始为其系统构建深度学习架构,无需调整即可将用户引入最先进的技术。

结论

时间序列预测经历了范式转变;它结合了统计技术与改进的机器学习和深度学习技术。数据质量、多重共线性以及再训练等问题领域表明仍需使用概率预测、分层协调和集成模型等新颖技术。