Python 中的众数

17 Mar 2025 | 4 分钟阅读

统计学中的众数介绍

在统计学中,一个给定数据集值中出现次数最多的值称为众数。换句话说,出现频率高或重复出现次数多的数字或值称为众数众数众数集中趋势的三种度量之一。另外两种度量分别是均值和中位数。

例如 -

我们有一个集合 A = {4, 5, 6, 6, 7, 8, 9}。由于数字6的出现频率最高,因此集合 A 的众数是 6。因此,很容易找到有限数量观测值的众数。一个数据集可以有一个众数或多个众数,或者根本没有众数。连续概率分布的众数通常被认为是任何值 x。其概率密度函数具有局部最大值,因此任何峰值都是众数。

Python 中的 mode() 函数

Python 在处理统计数据和大量数据集时,是一个非常强大的编程语言。Python 提供了 statistics 模块,其中包含许多用于处理大型数据集的函数,而 mode() 函数就是其中之一。mode() 函数用于返回给定数据集范围内集中数据点的稳健度量。

mode() 函数是 Python 编程语言标准statistics 库中唯一可以应用于非数字(名义)数据的函数。

让我们看一下 Python 中 mode 函数的语法。

语法

mode() 函数的语法如下所示

Python 中 mode() 函数的参数

mode() 函数的参数是 data。它可以是可迭代对象或序列——例如,列表、元组等。

注意:如果 data 参数为空,mode() 函数将引发 StatisticsError。

Python 中 mode() 函数的返回值

一旦计算了迭代器(例如列表、元组等)中提供的数据的众数,mode() 函数将根据参数中提供的数据返回一个浮点数或非数字(名义)值。

让我们根据 Python 编程语言标准 statistics 库的 mode() 函数来看一些例子。

示例 1:查找下面给定数据集的众数

输出

Mode of given set of data values is 40

说明

在上面的示例中,我们导入了 statistics 库并创建了一个名为 my_set 的集合。然后我们使用 statistics.mode() 函数估算了给定集合的众数,并将其值打印给用户。结果,集合中出现频率最高的值已成功打印。

示例 2:演示 mode() 函数在不同数据类型上的工作原理。

输出

1. Mode of First Data set is 50
2. Mode of Second Data set is 4.5
3. Mode of Third Data set is 1/5
4. Mode of Forth Data set is -7
5. Mode of Fifth Data set is mango

说明

在上面的示例中,我们导入了 statistics 库和 fractions 模块。然后我们创建了不同范围的元组来检查 mode() 函数是否适用于各种数据类型。我们创建了一个包含正整数、浮点数、分数、负整数和字符串的元组。然后我们使用 statistics.mode() 函数计算每个数据集的众数。然后我们将这些估算值打印给用户。

mode() 函数的一些应用

mode() 函数是一个统计函数,通常用于金融行业,以将价格和值与之前的记录进行比较。它还有助于从价格分布集中计算和预测可能未来的价格。mode() 函数不单独使用;而是与统计学的另外两个度量——均值和中位数一起使用。这三者共同构成了一个强大的工具,用于揭示数据的许多方面。