解释时间序列分析的 ACF 和 PACF 图

2025 年 1 月 7 日 | 阅读 9 分钟

引言

时间序列预测是数据分析和预测的关键部分,在金钱、金融和自然科学等不同领域都至关重要。时间序列分析中的一个重要阶段是理解数据中的基本模式和关系。用于此目的的两个有用工具是自相关函数 (ACF) 和偏自相关函数 (PACF) 图。这些图提供了对时间依赖性的重要见解,并有助于为预测选择合适的模型。

理解自相关

自相关是指一个时间序列与其自身过去和未来值之间的关系。它衡量的是观测值之间作为它们之间延迟的函数的相似程度。简单来说,它告诉我们序列的当前值在多大程度上依赖于其过去的值。

滞后 k 的自相关系数 (r_k) 计算如下:

r_k = Cov(Y_t, Y_(t-k))/Var(Y_t)

其中 Cov(Y_t, Y_(t-k)) 是序列与其 k 滞后移位版本之间的协方差,Var(Y_t) 是序列的方差。

自相关函数 (ACF)

自相关函数 (ACF) 是自相关系数相对于滞后 k 的图。它提供了观察值与先前时间步长上的观测值之间关系的直观表示。

ACF 图的关键特征

  1. 滞后 0 的 ACF 始终为 1,因为它表示序列与自身的关联。
  2. 对于平稳序列,随着滞后的增加,ACF 会逐渐衰减至零。
  3. 对于非平稳序列,ACF 衰减缓慢,并且在许多滞后中仍然与零显着不同。

解读 ACF 图

  • ACF 的急剧下降表明只有最近过去的值会影响当前值。
  • 缓慢衰减表明过去的值对当前值有持久的影响。
  • ACF 中的周期性模式表明数据中存在季节性。

偏自相关函数 (PACF)

ACF 衡量观测值与其滞后之间的总相关性,而偏自相关函数 (PACF) 则衡量观测值与其滞后之间的直接相关性,在消除了所有中间滞后的影响之后。

PACF 图显示了相对于滞后 k 的偏自相关系数。它通过显示解释序列自相关结构所需的自回归 (AR) 项的数量来识别自回归 (AR) 模型的阶数。

PACF 图的关键特征

  1. 滞后 0 的 PACF 通常为 1。
  2. 对于 AR(p) 过程,PACF 在滞后 p 处有显着的尖峰,之后会截断。
  3. 对于 MA(q) 过程,PACF 会像 AR 过程的 ACF 一样逐渐衰减。

解读 PACF 图

  • 在特定滞后处出现显着尖峰表明该滞后直接影响当前值。
  • 显着尖峰的数量显示了 AR 模型的可能阶数。

使用 ACF 和 PACF 进行模型识别

ACF 和 PACF 图的结合在识别时间序列的合适 ARIMA(自回归集成移动平均)模型方面特别有用。

  1. 自回归 (AR) 过程
    • ACF:逐渐衰减
    • PACF:对于 AR(p) 过程,在滞后 p 后截断
  2. 移动平均 (MA) 过程
    • ACF:对于 MA(q) 过程,在滞后 q 后截断
    • PACF:逐渐衰减
  3. 混合 ARMA 过程
    • ACF 和 PACF 都会逐渐衰减

分步解释过程

在解读用于时间序列预测的 ACF 和 PACF 图时,请遵循以下步骤:

步骤 1:检查平稳性

在分析 ACF 和 PACF 图之前,请确保时间序列是平稳的。平稳序列在整个时间段内具有恒定的均值、方差和自相关结构。如果序列是非平稳的,则可能需要差分或其他变换方法。

步骤 2:检查 ACF 图

  • 寻找超过置信区间(通常用虚线表示)的任何显着尖峰。
  • 注意自相关衰减的总体模式。
  • 检查任何可能表明季节性的季节性模式。

步骤 3:检查 PACF 图

  • 识别显着尖峰及其滞后。
  • 确定偏自相关是否明显截断。

步骤 4:结合 ACF 和 PACF 信息

  • 比较两个图中的模式,以识别可能的 AR 和 MA 分量。
  • 使用前面提到的规则来确定序列是显示 AR、MA 还是混合 ARMA 特性。

阶段 5:初步模型选择

  • 根据观察到的模式,提出一个初步的 ARIMA(p,d,q) 模型。
  • “p”代表 AR 阶(来自 PACF),“d”是差分阶数(如果适用),“q”是 MA 阶(来自 ACF)。

步骤 6:模型拟合和诊断检查

  • 将提出的模型拟合到数据中。
  • 使用残差的 ACF 和 PACF 图检查残差是否存在任何剩余自相关。
  • 如果残差中仍然存在显着自相关,则调整模型并重复该过程。

常见模式及其解释

  1. 白噪声
    • ACF:除滞后 0 外没有显着尖峰
    • PACF:除滞后 0 外没有显着尖峰
    • 解释:序列是随机的,没有自相关结构。
  2. AR(1) 过程
    • ACF:显着衰减
    • PACF:滞后 1 处有一个显着尖峰,然后截断
    • 解释:序列仅依赖于其最近的过去值。
  3. MA(1) 过程
    • ACF:滞后 1 处有一个显着尖峰,然后截断
    • PACF:急剧衰减
    • 解释:序列依赖于最近的过去误差项。
  4. ARMA(1,1) 过程
    • ACF:滞后 1 后显着衰减
    • PACF:滞后 1 后显着衰减
    • 解释:序列同时具有 AR 和 MA 分量。
  5. 季节性模式
    • ACF:在标准滞后处出现显着尖峰的重复模式
    • PACF:在季节性滞后处出现显着尖峰
    • 解释:序列具有需要建模的季节性分量。

实际考虑

在解释 ACF 和 PACF 图时,请记住这些实用注意事项:

  1. 样本量:ACF 和 PACF 估计值的可靠性随着样本量的增加而提高。对于小样本,请谨慎解释小的波动。
  2. 置信区间:关注图上显示的置信区间(通常为 95%)。这些区间内的尖峰不被认为具有统计学意义。
  3. 过度参数化:不要仅根据 ACF 和 PACF 图选择具有过多参数的模型。考虑简洁原则,并使用信息准则(如 AIC 或 BIC)进行模型选择。
  4. 非线性关系:ACF 和 PACF 图假设线性关系。对于非线性时间序列,可能需要额外的技术。
  5. 异常值和结构性断裂:这些可能严重影响 ACF 和 PACF 图。在解释之前,请调查并解决这些问题。
  6. 差分:如果应用了差分以实现平稳性,请解释差分序列的 ACF 和 PACF。

局限性和高级技术

  1. 虽然 ACF 和 PACF 图是强大的工具,但它们也有局限性:
  2. 它们假设线性关系,可能无法捕捉复杂、非线性的动态。
  3. 它们对序列中的异常值和结构性变化很敏感。
  4. 对于多元时间序列,可能需要更高级的技术,例如互相关函数 (CCF)。
  5. 频谱分析:有助于识别重复模式和隐藏周期。
  6. 小波分析:提供时频分解,适用于非平稳序列。
  7. 神经网络和机器学习:可以捕捉时间序列数据中的复杂非线性关系。

案例研究

为了说明 ACF 和 PACF 解读的实际应用,请考虑以下简短案例研究:

案例研究 1:月度销售数据

背景:本案例涉及零售公司的月度销售数据,旨在了解模式和趋势以改进未来的销售预测。

ACF 分析

  • 逐渐衰减与峰值:ACF 图显示了一个逐渐衰减的模式,在滞后 12、24 和 36 处有显着的峰值。
  • 季节性:这些滞后的峰值表明存在年度季节性,表明一年前、两年前和三年前的销售额与本月的销售额高度相关。

PACF 分析

  • 显着尖峰:PACF 图在滞后 1 和 12 处显示出显着的尖峰。
  • 短期和季节性影响:滞后 1 处的尖峰表明上个月的销售额对本月的销售额有很强的预测作用。滞后 12 处的尖峰证实了 ACF 图中观察到的年度季节性。

解释

  • 模型选择:存在季节性和短期模式表明可能适合使用季节性 ARIMA (SARIMA) 模型。该模型可以解释年度季节性模式以及最近几个月销售额的影响。

案例研究 2:每日股票收益

背景:本案例分析每日股票收益,旨在确定过去的收益是否可以帮助预测未来的收益。

ACF 分析

  • 没有显着尖峰:ACF 图显示除滞后 0 外没有显着尖峰。
  • 缺乏自相关:这表明每日股票收益不显示自相关,这意味着过去的收益对未来收益没有显着影响。

PACF 分析

  • 没有显着尖峰:PACF 图也显示除滞后 0 外没有显着尖峰。
  • 随机性:这表明该序列基本上是随机的,每日收益仅基于过去的价值就具有随机性。

解释

  • 模型选择:由于缺乏显着自相关,可以得出结论,简单的随机游走模型可能适合。该模型假设未来的股票价格与过去的价格无关,这与有效市场假说一致。

案例研究 3:季度 GDP 增长

背景:本案例侧重于季度 GDP 增长,旨在了解数据中的依赖关系以预测未来的 GDP 增长。

ACF 分析

  • 持续衰减:ACF 图显示持续衰减,没有明显的截断,表明 GDP 增长数据中存在潜在的趋势。
  • 趋势:这种模式表明过去的 GDP 增长率会随着时间的推移而逐渐失去影响。

PACF 分析

  • 显着尖峰:PACF 图在滞后 1 和 2 处显示出显着的尖峰。
  • 短期依赖:这些尖峰表明了强大的短期依赖关系,即当前季度的 GDP 增长受到过去几个季度增长的影响。

解释

  • 模型选择:PACF 图中滞后 1 和 2 处的显着尖峰表明 AR(2) 模型可能适合预测 GDP 增长。该模型捕捉了数据中观察到的短期依赖关系,从而可以进行更准确的预测。

在时间序列分析中使用 ACF 和 PACF 图的优势

识别自相关和依赖性

ACF(自相关函数)

  • 检测模式:ACF 图有助于识别数据中的季节性和趋势等模式。它揭示了过去的值在不同滞后期间如何影响当前值。
  • 模型选择:它提供了对所需模型类型的见解。例如,持续衰减表明 AR 过程,而急剧截断表明 MA 过程。

PACF(偏自相关函数)

  • 直接关系:PACF 图突出显示了观测值在特定滞后处的直接关系,消除了中间滞后的影响。这对于识别 AR 模型的正确阶数至关重要。
  • 隔离影响:通过隔离特定滞后的影响,PACF 有助于理解哪些过去的值直接影响当前值。

模型诊断和验证

  • 评估模型拟合:残差的 ACF 和 PACF 图有助于评估所选模型的拟合优度。理想情况下,残差应该看起来像随机噪声,表明模型已经捕捉到数据的结构。
  • 识别过拟合和欠拟合:这些图可以突出显示模型是否过度拟合(过多参数捕获噪声)或欠拟合(遗漏重要模式)。

数据探索和预处理

  • 初步数据见解:在深入进行复杂建模之前,ACF 和 PACF 图可以提供对数据结构和特性的初步见解。这对于理解时间序列的性质至关重要。
  • 去趋势和差分:这些图有助于确定数据是否需要去趋势或差分以实现平稳性,这是许多时间序列模型的一个重要假设。

指导预测和业务决策

  • 提高预测准确性:通过准确识别数据中的依赖关系和模式,ACF 和 PACF 图可以带来更准确、更可靠的预测。这对于业务规划和决策至关重要。
  • 成本效益:准确的预测有助于优化库存,降低成本,并改善各种业务应用中的资源分配。

结论

解读 ACF 和 PACF 图是时间序列分析和预测中的一项关键技能。这些工具提供了对序列中时间依赖性的宝贵见解,并指导适当预测模型的选择。通过仔细检查这些图中的模式,分析师可以识别可能的 AR 和 MA 分量,检测季节性,并提出合适的 ARIMA 或 SARIMA 模型。

然而,请记住,ACF 和 PACF 分析只是模型选择过程中的一个步骤。它应该辅以其他诊断工具、领域知识和彻底的模型验证技术。与任何统计工具一样,解读需要技术知识和业务判断。