Python 统计学2025年1月8日 | 阅读 9 分钟 在本教程中,我们将学习统计学及其组成部分,使用 Python 解决统计问题,并探索其背后的概念。统计学是每个数据科学爱好者都应深入理解的关键概念。 Python 提供了一些全面、广泛使用且功能强大的统计库。这些库有助于我们顺畅地处理数据。 统计学是数据收集、列表化和数值数据插补的一种方法。它允许我们描述、总结和以可视化的方式呈现数据。统计学是一门应用数学领域,涉及插补、数据可视化和数据收集分析。统计学有两种类型——描述性统计和推断性统计。本教程将涵盖描述性统计。 一些 Python 统计库Python 提供了许多可用于统计的库,但我们将介绍一些最重要且广泛使用的库。
集中趋势度量集中趋势度量代表一个单一值,试图定义整个数据集。它包含三个主要的集中趋势。
如何计算平均值平均值代表观测值的总和除以观测值的总数。我们也可以称之为平均数,即总和除以计数。Python 的统计库提供了 mode() 方法来返回平均值,如果传入的参数为空,它会引发 StatisticError。 让我们理解以下示例 - 示例 - 1 输出 The average of list values is: 4.0 解释 - 在上面的代码中,我们导入了 statistics 模块并初始化了一个包含观测值的列表。我们将列表传递给 mean() 方法,该方法返回了列表值的平均值。 我们也可以使用内置的 sum() 方法来计算平均值,该方法接受数值值的可迭代对象并给出它们的总和。len() 方法返回可迭代对象(字符串、列表、元组、字节、字典、集合或范围)的长度。 示例 - 2 输出 The mean is: 4.7 如何计算中位数中位数代表数据集的中间值,它将数据分成两半。中位数是通过计算偶数数据集的两个中心元素的平均值来计算的,否则就是中心元素。 对于奇数 - N+1/2 对于偶数 - n/2, n/2+1 statistics 库提供了 median() 方法来计算数据中位数或中间元素。如果传入的参数为空,它会引发 StatisticError。 让我们理解下面的例子。 示例 - 输出 Median of data-set 1 is 5 Median of data-set 2 is 5.6 Median of data-set 3 is 23/15 Median of data-set 4 is 0.0 如何计算最小值中位数如果数据集是奇数,则使用 median_low() 方法来获取数据的最小值中位数。如果数据集是偶数,它会返回两个中间元素中较小的一个。如果传入的参数为空,它会引发 StatisticError。 让我们理解下面的例子。 示例 - 输出 Median of the set is 3.5 Low Median of the even data set is 3 Low Median of the odd data set is 4 如何计算最大值中位数如果数据集是奇数,则使用 median_high() 方法来获取数据的最大值中位数。如果数据集是偶数,它会返回两个中间元素中较小的一个。如果传入的参数为空,它会引发 StatisticError。 让我们理解下面的例子。 示例 - 输出 Median of the set is 3.5 Low Median of the even data set is 4 Low Median of the odd data set is 4 离散程度度量我们已经学习了集中趋势度量,但这不足以描述数据。我们还需要了解 离散程度度量。离散程度度量表明我们的数据分布得有多好。以下是最常见的离散程度度量。
如何计算极差极差是最大和最小数据点之间的差值。极差越大,数据的散布范围越大,反之亦然。 极差 = 最大数据值 - 最小数据值 让我们理解以下示例 - 示例 - 输出 Maximum is = 50, Minimum is = 10 and Range is = 40 解释 - 在上面的代码中,我们用一些数据分配了一个列表,并使用内置的 max() 方法计算了最大值,使用 min() 方法计算了最小值。 如何计算方差方差是衡量数据集中数字之间散布程度的统计量。要计算方差,我们使用以下公式。 ![]() 其中 -
Python 的 statistics 模块提供了 varience() 方法。让我们通过以下示例来理解。 示例 - 输出 Variance of data1 is: 11.238095238095237 Variance of data2 is: 10.666666666666666 Variance of data3 is: 69.64285714285714 Variance of data4 is: 1277/36000 如何计算标准差它是方差的平方根。要计算标准差,我们可以使用以下示例。 其中 -
Python 的 statistics 模块提供了 stdev() 方法。让我们通过以下示例来理解。 示例 - 输出 Standard Deviation of data1 is: 3.352326839390103 Standard Deviation of data2 is: 3.265986323710904 Standard Deviation of data3 is: 8.345229603962801 Standard Deviation of data4 is: 0.18834070782022197 multimode() 方法此方法返回出现频率最高的数值。它按数据中首次出现的顺序返回数值。如果有多个众数,它可能会返回多个结果。 让我们理解下面的例子。 示例 - 输出 ['d'] 现在,我们将涵盖一些对数据科学很重要的统计学主题,这将帮助我们更精确地理解这个主题。 Python 统计学与概率论Python 统计学与概率论是数据分析和预测的基础。Python 提供了强大的库来处理这些概念。 Python 中的统计学
Python 中的概率论
Python 中的统计建模与拟合统计模型代表了我们数据的生成方式,以及如何在数据分析中使用它们。它有助于我们总结数据、模拟和预测数据。换句话说,我们可以使用生成的数据进行汇总、预测或模拟。 然而,能够确定您的数据是否符合该模型至关重要。 数据估计是提供模型与估计之间最佳拟合的合适方法。 结论本教程包括如何使用 Python 编程语言学习统计学。我们已经涵盖了基本操作,包括统计学类型、如何使用 statistics 库查找均值、中位数和众数。我们还探讨了集中趋势度量,包括如何计算标准差、方差和极差。本教程通过 Python 提供了关于描述性统计的思路。 |
今天使用的大多数个人计算机都具有图形用户界面(GUI)。它为具有不同计算机技能水平的用户提供了简单的体验。由于其点选界面,GUI 应用程序可能需要更多资源,但它们通常更易于使用。其中之一...
阅读 6 分钟
这篇文章将演示如何使用 PyQt5 构建一个颜色游戏。在这个游戏中,玩家必须正确识别所给单词的颜色,以获得最高分。为了进一步迷惑玩家,文本将有多种...
阅读 8 分钟
众所周知,Python 拥有庞大的库,为什么板球不受影响。在本教程中,我们将了解用于获取近期和现场比赛的实时比分、评论和完整记分卡的 Python 库。要使用 Pycricbuzz,我们需要安装...
阅读 23 分钟
Python 程序逆序打印双向链表 在本教程中,我们将编写 Python 程序来逆序打印链表。双向链表是创建一个循环链表的循环链表。为了解决这个问题,我们将使用...
7 分钟阅读
Tkinter 是一个 Python 模块,旨在为从应用程序到网站的任何项目开发 GUI。GUI 代表图形用户界面。Tkinter 是最广泛使用的模块之一,可以更快地创建 GUI。该模块的功能使得工作...
阅读 4 分钟
在以下教程中,我们将了解如何使用 Python 编程语言监控设备。但在我们开始之前,让我们简要讨论一下监控系统资源的重要性。监控系统资源的重要性 监控系统资源使我们能够评估系统的性能...
11 分钟阅读
在本教程中,我们将学习 doctest 模块。它是一个测试框架,可帮助我们同时文档化和测试代码。此模块允许我们文档化和测试我们的代码,这对于编码至关重要。默认情况下,我们可以使用 docstring...
阅读 17 分钟
在本教程中,我们将讨论如何使用 Python 中的第三方库从 Web 下载文件。我们还将探索流数据以将大文件分块下载,并使用线程池实现并行下载。Python 提供了一个全面的...
阅读9分钟
在本教程中,我们将编写 Python 程序来根据另一个给定的数组对一个数组进行排序。在这个问题中,我们给定两个大小分别为 N 和 M 的数组,我们需要对第一个数组进行排序,使得所有元素的相对位置...
5 分钟阅读
在下一个教程中,我们将通过 Python 中的 Semaphore 来理解多线程同步。让我们开始理解。理解 Semaphore Semaphore 是一种同步构造。Semaphore 为线程提供了对有限数量资源的同步访问。Semaphore 可以被视为一个...
阅读 4 分钟
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India