Python 方差函数

17 Mar 2025 | 5 分钟阅读

我们可以利用 statistics 包的强大功能来计算任何与统计相关的任务。其中一个函数就是 variance()。借助此方法,我们可以计算数据样本的方差(样本是总体数据的一小部分)。

我们在计算样本方差时可以使用 variance() 函数。可以使用一个名为 pvariance() 的不同函数来确定总体方差。

在初级统计学中,数量与其均值之差的平方称为方差。本质上,它衡量了随机数据与数据均值或中位数分数的分散程度。较高的数字表明给定数据集与平均值的离散程度较大,而较低的方差分数则表明数据值围绕均值聚集,而不是分散开。

在广泛使用统计数据分析的科学中,方差是一个关键工具。它也被称为给定数据的二阶中心矩,等于数据集标准差的平方。在纯统计学中,它通常表示为 s2、σ2 和 Var()。

数学上,方差是每个数据点与均值之差的平方的平均值。

Python Variance Function

variance 函数的语法

参数

  • [data]:-这是一个包含实数值的数组或任何 Python 可迭代数据结构。
  • xbar (可选):在此参数中,我们需要提供一个实数值,即给定数据集的均值。

返回类型:此函数返回给定数据集的方差。

示例 - 1

代码

输出

The variance of the data sample is:-  0.6397066666666666

示例 - 2

代码

输出

Variance of the Sample_1 is:-  5.238095238095238
Variance of the Sample_2 is:-  3.7666666666666666
Variance of the Sample_3 is:-  61.714285714285715
Variance of the Sample_4 is:-  2549/17280
Variance of the Sample_5 is:-  0.52253

示例 - 3

代码

输出

The variance of the data sample is:-  20.435000000000002

示例 - 4

现在我们将看到,如果 xbar 参数的值与实际均值或平均值不同,方差值将不正确。

代码

输出

The mean of the sample set is:- 
2.5
The correct variance of the sample set is:-  20.435000000000002
The incorrect variance of the sample set is:-  11839.96625

示例 - 5

我们将看到 variance() 函数何时会引发 StatisticsError。

代码

输出

StatisticsError                           Traceback (most recent call last)
<ipython-input-5-d7f3060a7f32> in <module>
      8 
      9 # Passing an empty dataset to the function will raise the StatisticsError
---> 10 print(statistics.variance(sample))

/usr/lib/python3.8/statistics.py in variance(data, xbar)
    739     n = len(data)
    740     if n < 2:
--> 741         raise StatisticsError('variance requires at least two data points')
    742     T, ss = _ss(data, xbar)
    743     return _convert(ss/(n-1), T)

StatisticsError: variance requires at least two data points

计算方差的应用

在统计学中,方差是处理大量数据的一项关键技术。例如,如果样本均值(正确均值)未知,则方差被用作有偏估计量。只能进行有限的现实世界观察,例如一天中所有公司股票的价值变化。因此,方差是从有限的数据集中计算出来的;即使它与以整个总体为计算单位时不匹配,它仍将为用户提供一个足够有效的估计,以便规划进一步的计算。