Python中的Pandas Rolling

2025年1月5日 | 阅读 4 分钟

引言

在本教程中，我们将学习 Python 中的 Pandas Rolling。Python 是一种有用的数据分析语言，主要是因为它拥有出色的以数据为中心的 Python 包。Pandas 是一个使导入和分析文件变得容易的软件包。Pandas dataframe.rolling() 函数提供了滚动窗口计算的功能。滚动窗口计算的概念仅用于信号处理和时间序列数据。简而言之，我们每次选择窗口大小 k，并在其上执行一些数学计算。大小为 k 的窗口表示一次连续 k 个值。在最简单的情况下，所有“k”个值都具有相等的权重。

语法

下面给出了 Python 中 pandas rolling 的语法 -

DataFrame.rolling(window, min_periods = None, freq = None, center = False, win_type = None, on = None, axis = 0, closed = None)

参数

下面给出了 Python 中 pandas rolling 的参数 -

window: 移动窗口的大小。这是用于计算统计信息的观测数量。每个窗口都有一个大小。如果这是一个偏移量，那么这将是每个窗口的时间。每个窗口的大小将根据当时可用的观测值而变化。这仅适用于日期时间类索引。
min_periods = None: 窗口中必须显著的最小观测值数量（否则结果为 None）。对于由偏移量设置的窗口，此值默认为 1。
freq = None: 计算统计信息之前用于格式化数据的频率。表示为频率字符串或 DateOffset 对象。
center = False: 将标签置于窗口的中心。
win_type = None: 它提供窗口类型。
on = None: 它计算 DataFrame 的滚动窗口的列，而不是索引。
axis = 0: 它表示为 int 或 string，其默认值为 None。
closed = None: 在“右”、“左”、“两者”或“两者皆不”端点处关闭范围。偏移量窗口默认为“右”。固定窗口的默认值为“两者”。固定窗口不使用其余情况。

Freq 关键字用于根据迭代数据指定的频率规范来处理时间戳数据。这是使用 resample() 函数的预设参数（即使用平均值）完成的。如果 win_type = none，窗口中的所有值都具有相等的权重。有许多类型的卷帘窗口。有关其他滚动窗口类型的更多信息，请参阅 scipy 文档。

程序代码 1

这里我们给出一个 Python 中 Pandas Rolling 的程序代码。在这里，我们使用一个 CSV 文件，该文件包含苹果公司从 (17-11-13) 到 (18-11-13) 一年的股票价格数据。我们编写了代码来计算股票价格条的滚动总和，窗口大小为 3。代码如下 -

 # Here, we import the pandas module as p
import pandas as p

''' Here, by default, the "date" column is in string format, 
we need to change it to date format and to change the "date" 
column to date-time format by using parse_dates = ["date"] '''
 
# Here resampling only works with timed data; so change the "date" column to the index
# Here, the index_col = "date", which makes the "date" column
d = p.read_csv("apple.csv", parse_dates =["date"], index_col ="date")
 
# Here, we print the first 15 rows of the dataframe
d[:15]

输出

在这里，我们运行上述代码并找到股票价格条的滚动总和的结果。结果如下 -

程序代码 2

在这里，我们给出了 Python 中 Pandas Rolling 的另一个程序代码。在这里，我们使用一个 CSV 文件，该文件包含苹果公司从 (17-11-13) 到 (18-11-13) 一年的股票价格数据。我们编写了代码来滚动窗口，这意味着窗口大小大于 3。我们使用默认窗口类型 None。因此，所有结果都将相等。代码如下 -

 # Here, we import the pandas module as p
import pandas as p
 
d = p.read_csv("apple.csv", parse_dates = ["date"], index_col = "date")
 
# Here, close is the column where we use the mean() function to find the average value of each field
d.close.rolling(6).mean()

输出

在这里，我们运行上述代码并从中找到结果。结果如下 -

date
2024-04-05 16:00:00           NaN
2018-11-13 00:00:00           NaN
2018-11-12 00:00:00           NaN
2018-11-09 00:00:00           NaN
2018-11-08 00:00:00           NaN
                          ...    
2017-11-17 00:00:00    172.881667
2017-11-16 00:00:00    172.383333
2017-11-15 00:00:00    171.401667
2017-11-14 00:00:00    170.798333
2017-11-13 00:00:00    170.936667
Name: close, Length: 254, dtype: float64

结论

在本教程中，我们将学习 Python 中的 Pandas Rolling。因此，我们决定分析师使用移动平均线（称为滚动平均线或移动平均线）来分析时间框架数据。他们计算整个数据集的不同子集的平均值。分析师将这种包括时间平均的技术称为移动平均（MA）或移动均值（MA）。计算移动平均的方法有很多，但一种方法是从整个数字系列中选择一个固定点。我们计算从数字的初始固定子集的平均值计算出的初始平均值。然后，我们沿着子集中的未来值将子集移动到下一个固定子集，同时从序列中排除之前的数字。Pandas Rolling in Python 的参数是 window、min_periods = None、freq = None、center = False、win_type = None、on = None、axis = 0、closed = None。在这里，我们还讨论了一些 Pandas rolling 的程序代码以及输出。

下一主题使用 Python 进行股票价格分析

← 上一个下一个 →

Python中的Pandas Rolling

引言

语法

参数

程序代码 1

程序代码 2

结论

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

其他

Python中的Pandas Rolling

引言

语法

参数

程序代码 1

程序代码 2

结论

相关帖子

嵌入IPython

如何在Python中计算平均绝对误差

Python中的.pyc文件是什么

如何在Python中计算嵌套字典的元素数

Python中计算最长递增子序列的数量

Python中的传教士和食人族问题

Python文件的常见标题格式是什么

Python中的trunc()

在Python中按索引查找列表元素

使用Turtle图形在Python中绘制爱心

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器