Python中的Pandas Rolling

2025年1月5日 | 阅读 4 分钟

引言

在本教程中,我们将学习 Python 中的 Pandas Rolling。Python 是一种有用的数据分析语言,主要是因为它拥有出色的以数据为中心的 Python 包。Pandas 是一个使导入和分析文件变得容易的软件包。Pandas dataframe.rolling() 函数提供了滚动窗口计算的功能。滚动窗口计算的概念仅用于信号处理和时间序列数据。简而言之,我们每次选择窗口大小 k,并在其上执行一些数学计算。大小为 k 的窗口表示一次连续 k 个值。在最简单的情况下,所有“k”个值都具有相等的权重。

语法

下面给出了 Python 中 pandas rolling 的语法 -

参数

下面给出了 Python 中 pandas rolling 的参数 -

  1. window: 移动窗口的大小。这是用于计算统计信息的观测数量。每个窗口都有一个大小。如果这是一个偏移量,那么这将是每个窗口的时间。每个窗口的大小将根据当时可用的观测值而变化。这仅适用于日期时间类索引。
  2. min_periods = None: 窗口中必须显著的最小观测值数量(否则结果为 None)。对于由偏移量设置的窗口,此值默认为 1。
  3. freq = None: 计算统计信息之前用于格式化数据的频率。表示为频率字符串或 DateOffset 对象。
  4. center = False: 将标签置于窗口的中心。
  5. win_type = None: 它提供窗口类型。
  6. on = None: 它计算 DataFrame 的滚动窗口的列,而不是索引。
  7. axis = 0: 它表示为 int 或 string,其默认值为 None。
  8. closed = None: 在“右”、“左”、“两者”或“两者皆不”端点处关闭范围。偏移量窗口默认为“右”。固定窗口的默认值为“两者”。固定窗口不使用其余情况。

Freq 关键字用于根据迭代数据指定的频率规范来处理时间戳数据。这是使用 resample() 函数的预设参数(即使用平均值)完成的。如果 win_type = none,窗口中的所有值都具有相等的权重。有许多类型的卷帘窗口。有关其他滚动窗口类型的更多信息,请参阅 scipy 文档。

程序代码 1

这里我们给出一个 Python 中 Pandas Rolling 的程序代码。在这里,我们使用一个 CSV 文件,该文件包含苹果公司从 (17-11-13) 到 (18-11-13) 一年的股票价格数据。我们编写了代码来计算股票价格条的滚动总和,窗口大小为 3。代码如下 -

输出

在这里,我们运行上述代码并找到股票价格条的滚动总和的结果。结果如下 -

Pandas Rolling in Python

程序代码 2

在这里,我们给出了 Python 中 Pandas Rolling 的另一个程序代码。在这里,我们使用一个 CSV 文件,该文件包含苹果公司从 (17-11-13) 到 (18-11-13) 一年的股票价格数据。我们编写了代码来滚动窗口,这意味着窗口大小大于 3。我们使用默认窗口类型 None。因此,所有结果都将相等。代码如下 -

输出

在这里,我们运行上述代码并从中找到结果。结果如下 -

结论

在本教程中,我们将学习 Python 中的 Pandas Rolling。因此,我们决定分析师使用移动平均线(称为滚动平均线或移动平均线)来分析时间框架数据。他们计算整个数据集的不同子集的平均值。分析师将这种包括时间平均的技术称为移动平均(MA)或移动均值(MA)。计算移动平均的方法有很多,但一种方法是从整个数字系列中选择一个固定点。我们计算从数字的初始固定子集的平均值计算出的初始平均值。然后,我们沿着子集中的未来值将子集移动到下一个固定子集,同时从序列中排除之前的数字。Pandas Rolling in Python 的参数是 window、min_periods = None、freq = None、center = False、win_type = None、on = None、axis = 0、closed = None。在这里,我们还讨论了一些 Pandas rolling 的程序代码以及输出。