简单指数平滑17 Mar 2025 | 6 分钟阅读 简单指数平滑是一种用于数据平滑和时间序列预测的基本方法。其基础思想是通过递归地更新历史观测值的加权平均值来达到平滑的目的,给予近期观测值更大的权重。该技术在去除数据中的噪声并识别潜在趋势或模式方面非常有用。 简单指数平滑的两个基本要素是平滑参数(通常用 alpha 表示)和初始平滑值(通常用 S_0 表示)。平滑参数(alpha)决定了最近观测值所占的权重,其值通常在 0 到 1 之间。较小的 alpha 会给予过去观测值更大的权重,而较大的 alpha 则更侧重于近期数据。 ![]() 其中
初始平滑值(S_0)可以设置为时间序列的第一个观测值,或者计算为初始观测值的平均值。 其工作原理是通过反复更新先前数据的加权平均值来创建平滑序列。与更复杂的预测技术相比,它仅依赖于两个因素:初始平滑值和(有时用符号 ? 表示的)平滑参数。平滑参数 ? 决定了最近观测值所占的权重,其值通常在 0 到 1 之间。较小的 ? 表示对先前观测值的加权更强,而较大的 ? 则强调当前数据点的重要性。 简单指数平滑的应用简单指数平滑主要用于数据平滑,即去除时间序列数据中的噪声以揭示潜在趋势或模式的过程。简单指数平滑为分析师提供了数据的平滑视图,以便他们能够识别重要模式并做出明智的决策。SES 也经常用于短期预测任务,因为它能提供快速且计算效率高的预测。 简单指数平滑在现实生活中的各种情况和行业中都很有用。在金融行业,它有助于预测股票价格、货币汇率和经济指标。在供应链管理中,SES 有助于需求预测和库存管理。此外,在环境研究中,简单指数平滑对于建模和预测气候因素也很有用。 代码 为了更好地理解,我们将尝试使用指数平滑来预测销售额。 导入库读取数据集输出 ![]() 输出 ![]() 输出 ![]() 现在我们将合并数据框以创建一个新的数据框。 输出 ![]() 输出 ![]() 现在我们需要根据日期更改索引,因为我们要进行预测,所以关系将基于特定时间段。 我们想要的是使用销售数据进行预测。应该绘制“每周销售额”列。目前,销售信息每周显示一次。一年有 52 周,一个月有 4 周。 输出 ![]() 现在我们需要提取销售数据。 输出 ![]() 输出 ![]() 输出 ![]() 输出 ![]() 分割数据集 现在我们将数据集分为训练集和测试集。 通常,测试集的大小占总样本的 20%。然而,正如你所看到的,我们在这里选择了 40%。因为我们希望预测未来一年,并且有“一年的测试”数据来与模型的准确性进行比较。 换句话说,我的测试数据与我们准备预测的持续时间相匹配。 输出 ![]() 简单指数平滑输出 ![]() 现在我们将预测值与训练集和测试集进行绘制。 输出 ![]() 现在我们将检查模型的准确性。 输出 ![]() 输出 ![]() 我们的模型准确性,均方根误差为 1270。与实际数据的标准差 1047 相比,它相当准确,但并非完全准确。测试结果与预测值在视觉上差异很大。然而,由于趋势随时间的波动,当放大到训练数据时,这似乎是一个合理的预测。对于明年,未来趋势是可能的。数据集有轻微的季节性,但大部分是稳定的。例如,感恩节和圣诞节期间的销售额有所增长。观察到波动的季节性趋势。 下一个主题TF-IDF |
? 评估指标用于计算模型的整体性能。用于评估模型有效性的最常见指标是准确率、精确率、召回率和 F1 分数。这些指标提供了关于模型做出正确预测和避免...的能力的有价值的见解。
7 分钟阅读
蛋白质就像我们体内的超级英雄,在支持我们组织、器官和整体身体功能方面发挥着关键作用。这些不可思议的分子由20种不同的构建块组成,每个构建块都称为氨基酸。想到在我们体内...
阅读 30 分钟
手写数字识别是机器学习和计算机视觉领域一个古老的问题。它需要精确识别手写图像上的数字(0123456789);因此,它被选为测试模型性能的广泛使用的基准,而信息技术(IT)公司一直...
阅读9分钟
机器学习有各种基本的数学结构,其中雅可比矩阵和梯度被认为是用于训练神经网络、对输入敏感的模型以及优化的最突出的结构之一。梯度是标量函数的偏导数组成的向量...
阅读9分钟
引言:人工智能(机器学习)已成为创新领域的非凡力量,为各行业的强劲进步提供了动力,并彻底改变了我们与信息互动的方式。然而,随着机器学习的不断发展,它面临着一系列需要我们关注和创造力的挑战……
阅读 3 分钟
在数字技术中,数据通常被称为“新石油”,机器学习和人工智能 (AI) 的优势不容忽视。这些技术彻底改变了各行各业,实现了个性化推荐、医疗诊断、财务预测等。然而,随着数据越来越丰富,...
7 分钟阅读
一种聚类方法,可以同时在数据矩阵的行和列中查找聚类,称为谱共聚类。这与仅仅对数据矩阵的行和列进行分组的传统聚类方法形成对比。在数据分析方面,谱共聚类是……
7 分钟阅读
数学的一个子领域,涉及数据的收集、汇总、分析、解释和呈现。这是一项工具,将有助于人们和组织团体根据从具体过程中得出的证据做出实证决策。可观察的特征...
5 分钟阅读
简介 ImageNet 大规模视觉识别挑战赛(简称 ILSVRC)是计算机视觉领域的一项极其严峻的挑战。ILSVRC 于 2010 年首次出现,并在改进深度学习和人工智能研究方面发挥了重要作用。ILSVRC 的目标是改进……
阅读 4 分钟
机器学习是人工智能的一个子领域,其创建算法使计算机能够从经验中学习并变得更智能,而无需明确编程。该领域包含广泛的方法,从简单的决策过程到复杂的人工神经网络,...
阅读 12 分钟
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India