ACF 和 PACF 图在时间序列分析中的意义

2025年1月7日 | 阅读 6 分钟

时间序列分析包括研究数据集,其中数据点在明确的时间跨度内收集或记录。这种分析在不同领域中至关重要,包括金融、经济、环境研究和工程。时间序列分析的基本部分之一是识别隐藏的模式、趋势和季节性,这有助于预测未来的数值。自相关函数 (ACF) 和偏自相关函数 (PACF) 图是此逻辑过程中的关键工具。它们在识别模式和诊断合适的模型方面发挥着重要作用,尤其是在 ARIMA(自回归综合移动平均)模型中。

时间序列分析简介

时间序列数据因其时间顺序而独特,这使得标准统计方法不适合分析此类数据。时间序列分析侧重于理解数据的基本结构和功能、识别模式以及进行预测。时间序列数据中的常见组成部分包括:

  • 模式:数据中长期上升或下降的运动。
  • 季节性:在特定时间间隔内重复出现的正常模式,例如每日、每月或每年周期。
  • 循环模式:长期波动,但没有固定周期。
  • 噪声:无法归因于模式、不规则性或周期的不规则变化。

有效的时间序列研究通常涉及将序列分解为这些部分并单独分析它们。然而,准确识别和建模这些部分是一项复杂的任务,ACF 和 PACF 图在此方面特别有用。

自相关函数 (ACF)

定义和目的

自相关函数 (ACF) 衡量时间序列与其滞后值之间的关系。简而言之,它评估某个时间点的值与过去时间点的值之间的关系。ACF 图是时间序列与自身不同滞后版本的相关系数的条形图。

数值表示

对于时间序列 ??,滞后 ? 处的自相关,表示为 ??,计算如下:

Significance of ACF and PACF Plots in Time Series Analysis

其中,

?ˉ 是时间序列的均值,? 是观测值的数量。

解释与应用

  • 识别模式:ACF 图识别不规则性、模式和其他重复模式。例如,在正常间隔处出现显著峰值表明存在偶然部分。
  • 诊断平稳性:平稳性是许多时间序列模型中的重要假设。固定序列随时间具有一致的均值、方差和自相关。如果 ACF 缓慢腐烂,则序列可能不固定,表明可能需要进行差分(减去连续观测值)。
  • 模型识别:ACF 图用于确定 ARIMA 模型中移动平均 (MA) 分量的阶数。对于 MA(q) 过程,ACF 将显示高达滞后 q 的显著峰值,然后降至零。

示例与见解

重复声音:重复声音(只是随机循环),ACF 不会显示任何滞后的显著关系,这意味着以前的质量不会影响未来的质量。

  • AR(1) 交互:对于 AR(1)(自回归过程,阶数为 1),ACF 将显示缓慢的显著腐烂。
  • MA(1) 周期:对于 MA(1) 过程,ACF 将在滞后 1 处显示显著峰值,然后对于更高滞后降至零。

偏自相关函数 (PACF)

定义和目的

偏自相关函数 (PACF) 衡量时间序列与其滞后值之间的关系,控制时间序列在每个更短滞后的值。PACF 图识别 ARIMA 模型中自回归 (AR) 分量的阶数。

数值表示

对于时间序列 ??,滞后 ? 处的非完全自相关,表示为 ϕkk,是 ?? 与 Y t−k 之间的关系,在消除滞后 1 到 ?−1 的影响之后。

解释与应用

  • 模型 ID:PACF 图确定 ARIMA 模型中 AR 分量的阶数。对于 AR(p) 过程,PACF 将显示高达滞后 p 的显著峰值,然后降至零。
  • 消除间接影响:通过控制中间滞后,PACF 可以更清晰地显示由滞后 k 分隔的观测值之间的直接关系。

示例与见解

  • AR(1) 交互:对于 AR(1) 过程,PACF 将在滞后 1 处显示显著峰值,然后对于更高滞后降至零。
  • MA(1) 周期:对于 MA(1) 过程,PACF 将显示类似于 AR(1) 过程的 ACF 的显著腐烂。

ACF 和 PACF 的联合使用

模型选择与诊断

  • ACF 和 PACF 图通常一起用于识别时间序列数据(尤其是 ARIMA 模型)的合适模型。
  • ARIMA 模型:ARIMA 模型是一类模型,它根据自身过去的质量(AR 项)和滞后估计误差(Mama 项)来解释给定的时间序列,并应用差分 (I) 使序列固定。
  • AR 部分 (p):使用 PACF 图确定。如果 PACF 图显示高达滞后 p 的显著峰值,然后降至零,则 ARIMA 模型应包含阶数为 p 的 AR 表达式。
  • Mama 部分 (q):使用 ACF 图确定。如果 ACF 图显示高达滞后 q 的显著峰值,然后降至零,则 ARIMA 模型应包含阶数为 q 的 Mama 表达式。
  • (通过检查序列的平稳性来完全确定。如果序列是非固定的,则应用差分,直到序列变为固定。

实际进展

  • 绘制数据:可视化时间序列以识别清晰的模式、不规则性和例外。
  • 检查平稳性:使用图和统计检验(例如扩展 Dickey-Fuller (ADF) 检验)检查平稳性。如果非固定,则应用差分。
  • 绘制 ACF 和 PACF:生成 ACF 和 PACF 图以识别 AR 和 Mama 项的合适滞后顺序。
  • 拟合模型:利用识别出的边界来拟合 ARIMA 或其他合适的模型。
  • 诊断检查:使用 ACF 和 PACF 分析拟合模型的残差,以确保没有显著模式,表明拟合牢固。

案例研究:使用 ACF 和 PACF 进行预测

为了说明 ACF 和 PACF 图的实际使用,请考虑一个涉及零售公司月度销售数据的案例研究。

步骤 1:可视化数据

绘制时间序列数据揭示了趋势和预期的不规则性。销售额随时间增加,并在特定月份达到顶峰。

步骤 2:检查平稳性

ADF 检验表明序列是非固定的(p 值 > 0.05)。对序列进行一次差分(一阶差分)使其固定(p 值 < 0.05)。

步骤 3:绘制 ACF 和 PACF

  • ACF 图:显示滞后 1、2、3 处的显著峰值,表明可能存在 Mama 部分。
  • PACF 图:显示滞后 1 处的显著峰值,表明 AR 部分的阶数为 1。

步骤 4:拟合模型

根据 ACF 和 PACF 图,选择 ARIMA(1,1,3) 模型。估算边界,并将模型拟合到数据中。

步骤 5:诊断检查

使用 ACF 和 PACF 图分析拟合模型的残差。这两个图均未显示显著模式,表明残差是重复声音,模型拟合牢固。

第 6 阶段:预测

使用拟合的 ARIMA(1,1,3) 模型,可以估算未来的销售额。模型的准确性通过检验数据进行验证,显示出良好的性能。

ACF 和 PACF 中的高级主题

  • 季节性 ARIMA (SARIMA) 模型
    对于具有强季节性部分的<时间序列,使用季节性 ARIMA (SARIMA) 模型。这些模型包含季节性差分和季节性 AR 和 Mama 项。
  • 使用 ACF 和 PACF 进行识别
    • 季节性 ACF:在季节性滞后处显示显著峰值(例如,月度数据为 12、24)。
    • 季节性 PACF:识别季节性 AR 项。

    示例 对于具有年度偶然模式的月度销售数据,ACF 和 PACF 图可能在滞后 12、24 等处显示显著峰值。可以使用 SARIMA 模型,例如 SARIMA(1,1,1)(1,1,1)_12,来显示序列。
  • 多元时间序列
    在同时研究多个时间序列时,使用交叉相关功能 (CCF) 和部分交叉相关功能 (PCCF)。这些功能将 ACF 和 PACF 的概念扩展到多元数据。

结论

ACF 和 PACF 图是时间序列分析中的重要工具。它们提供对数据基本结构的见解,有助于诊断平稳性,并指导选择合适的模型。通过获取和应用 ACF 和 PACF 图,分析人员可以构建准确可靠的时间序列模型,从而实现有效的预测和方向。这些工具与其他统计方法和领域数据结合使用时,极大地促进了时间序列分析领域。