Pandas 时间序列

2024 年 8 月 29 日 | 阅读 2 分钟

时间序列数据被定义为重要信息来源,它提供了一种在各种业务中使用的策略。从传统的金融行业到教育行业,它包含了很多关于时间的信息。

时间序列预测是机器学习建模,它处理时间序列数据,通过时间序列建模预测未来的值。

Pandas 具有广泛的功能和特性,可用于处理所有领域的时间序列数据。 通过使用 NumPy datetime64timedelta64 dtypes。 Pandas 整合了来自其他 Python 库(如 scikits.timeseries)的不同特性,并创建了大量用于处理时间序列数据的新功能。

例如,pandas 支持从各种来源和格式解析时间序列信息。

导入包和数据

在开始之前,您必须导入一些将使用 numpy、pandas、matplotlibseaborn 的包。

您可以通过在代码中添加 %matplotlib inline 将图像附加到 Jupyter Notebook 中进行绘图,也可以使用 sns.set() 切换到 Seaborn 默认设置

日期和时间

Pandas 提供了许多用于日期、时间、增量和时间段的功能。 它主要用于数据科学应用。

原生日期和时间

我们有两个原生日期和时间可用,它们位于 datetime 模块中。 我们还可以使用 dateutil 函数对日期和时间执行许多有用的功能。 您还可以从各种字符串格式解析日期

示例 1

输出

DatetimeIndex(['2013-05-04 00:00:00', '2013-05-04 00:00:01',
               '2013-05-04 00:00:02', '2013-05-04 00:00:03',
               '2013-05-04 00:00:04', '2013-05-04 00:00:05',
               '2013-05-04 00:00:06', '2013-05-04 00:00:07'],
              dtype='datetime64[ns]', freq='S')

示例 1

输出

2018-12-12 06:25:18
<2 * DateOffsets>

下一主题Pandas Datetime