如何计算标准差

2025年03月17日 | 阅读 9 分钟

标准差是研究变异(离散程度)的最重要和广泛使用的度量。它显示了数据的变异性。标准差的计算有点复杂。犯错的风险很高,因此我们需要高度注意和精确计算。在本节中,我们将学习如何找到标准差。

标准差定义

标准差(SD)是一种量化指标,用于衡量数据集相对于其均值的分布(离散程度)。它被计算为方差的平方根。它由希腊小写字母σ(西格玛)表示。偏差越大,离散程度越大;偏差越小,均匀性越大。

其他一些定义是

  • 标准差是衡量所有值相对于均值的变异程度
  • 标准差是各偏差平方和除以观测值数量的平方根。
  • 它是方差的平方根。

变化

它定义了一个随机变量与其期望值相差多少。它是期望值与单个值之间差异平方的平均值。它永远不会有负值。它用σ2表示。方差的公式是

How to Find Standard Deviation

如何计算标准差

它通过确定每个数据点相对于均值的变异性来计算为方差的平方根。标准差越高,每个数据集与均值之间的方差就越高。

标准差的公式

有两种计算标准差的公式。这两种公式都衡量变异性。但它们之间存在差异。

  • 总体标准差
  • 样本标准差

总体标准差

它是一个参数,从总体中的每个个体计算一个固定值。总体标准差的公式是

How to Find Standard Deviation

其中

σ:总体标准差。

xi:数据集中的每个元素。其中i = 1, 2, 3, ...., N。

集合。其中i = 1, 2, 3, ..., N。

μ:数据集中所有元素的均值。

N:元素的数量。

样本标准差

它是一个统计量。在这种标准差中,只取总体中的一些个体进行计算。它具有更大的变异性,因为它取决于样本。因此,样本的标准差大于总体标准差。

样本标准差的公式是

How to Find Standard Deviation

其中

s:样本标准差。

xi:数据集中的每个元素。其中i = 1, 2, 3, ...., N。

x:数据集中所有元素的均值。

N:元素的数量。

现在,我们将看看这些标准差是如何相互不同的。考虑样本和总体标准差公式;我们发现这两个公式几乎相同。

步骤1:首先,计算平均值。将所有值相加并除以元素的数量。

步骤2:计算与平均值的偏差。为此,从每个值中减去平均值。

步骤3:将偏差平方。

步骤4:将偏差平方并相加。

步骤5:将平方偏差除以观测值的数量。此步骤是总体标准差和样本标准差之间的主要区别。

  • 使用总体标准差时,将平方偏差之和除以N(元素的数量或观测值)。
  • 使用样本标准差时,将平方偏差之和除以N-1(比元素或观测值数量少1)。

步骤6:找到我们上一步得到的商的平方根。

总体和样本标准差的值取决于N。N的值越大,总体和样本标准差越大。

标准差的性质

  • 标准差的值永远不会是负数。
  • 低偏差表示数据点倾向于非常接近均值。
  • 高偏差表示数据点分布在一个较大的值范围上。
  • 如果我们将一个常数添加到所有数据集中,它不会影响标准差。
  • 如果我们将一个常数乘以所有数据集,它会影响标准差。
  • 当且仅当所有观测值具有相同值时,标准差才能为零。

标准差的用途

  • 它广泛用于生物学研究、统计学和金融领域。
  • 它用于将正态曲线拟合到频率分布。
  • 它用于衡量离散度。
  • 它还用于金融领域,以计算金融风险。

标准差的方法

直接法

我们也可以使用直接法找到标准差。当偏差从实际均值中取出时使用它。直接法的公式是

How to Find Standard Deviation

其中

d=(xi-x)

σ:标准差

xi:数据集中的每个元素。其中i = 1, 2, 3, ...., N。

x:数据集中所有元素的均值。

N:元素的数量。

假设平均值法

在这种方法中,我们不计算实际平均值。相反,我们选择一个随机值来计算偏差。假定值必须位于中间值附近。它也称为快捷方法。假定平均值法的公式是

How to Find Standard Deviation

其中,

f:对应频率

d=x-A(A是假设平均值)

N:数据集中元素的数量。

步长偏差法

它是快捷方法的扩展形式。它简化了计算。假定平均值法的公式是

How to Find Standard Deviation

其中,

f:对应频率

d=如何找到标准差(A是假设平均值)

N:数据集中元素的数量。

i:共同类间距

分布类型

在进入示例之前,我们必须了解三种类型的分布。

  • 个体序列:个体序列是单列观测。例如
分数 (x)55347858906781
  • 离散序列:在离散序列中,有两列。第一列包含观测值,第二列包含频率。例如
分数 (x)65865845889035
学生人数 (f)57128421
  • 频率分布:频率分布也有两列。第一列包含观测值,第二列包含频率。观测值进一步分类为称为类的区间。例如
分数 (x)20-3030-4040-5050-6060-7070-8080-90
学生人数 (f)68147392

标准差公式
分发直接法假设平均值或快捷方法步长偏差法
个体序列How to Find Standard DeviationHow to Find Standard Deviation-
离散序列How to Find Standard DeviationHow to Find Standard Deviation-
频率分布--How to Find Standard Deviation

个体序列示例

示例:使用直接法和假设平均值法找到以下数据的标准差。

分数2534212860337255

解决方案

使用直接法

首先,我们将计算平均值。

How to Find Standard Deviation

现在,我们将计算方差 2)

方差的公式是: 如何找到标准差

分数 (x)d=(xi-x)d2=(xi-x)2
25-16256
34-749
21-20400
28-13169
6019361
33-864
7231961
5515225
∑(xi-x)=1∑(xi-x)2= 2485

将值代入方差公式,我们得到

How to Find Standard Deviation

标准差的公式是: σ =√σ2

σ =√310.625=17.624
σ =17.624

使用假设平均值或快捷方法

我们知道个体序列的假设平均值法公式

How to Find Standard Deviation

在上述公式中,d=x-A。其中A是假设平均值。所以,我们假设A = 38

分数 (x)d=(xi-A)d2=(xi-A)2
25-13169
34-416
21-17289
28-10100
6022484
33-636
72341156
5517289
∑(xi-A)=23∑(xi-A)2= 2539

将值代入上述公式,我们得到

How to Find Standard Deviation

离散序列示例

示例:使用直接法和快捷方法找到以下数据的标准差。

分数 (x)3.54.55.56.57.58.59.5
学生人数 (f)37226085328

解决方案

使用直接法

首先,我们将计算平均值。

How to Find Standard Deviation

我们知道离散序列的直接法公式

How to Find Standard Deviation
分数 (x)fd=(xi-x)d2=(xi-x)2fdfd2
3.53-39-927
4.57-24-1428
5.522-11-2222
6.5600000
7.585118585
8.5322464128
9.58392472
∑f=217∑fd2=362

将值代入公式,我们得到

How to Find Standard Deviation

使用快捷方法

我们知道离散序列的快捷方法公式

How to Find Standard Deviation

在上述公式中,d=x-A。其中A是假设平均值。所以,我们假设A = 6.5

分数 (x)fd=(xi-A)d2=(xi-A)2fdfd2
3.53-39-927
4.57-24-1428
5.522-11-2222
6.5600000
7.585118585
8.5322464128
9.58392472
∑f=217∑fd=128∑fd2=362

将值代入公式,我们得到

How to Find Standard Deviation

因此,标准差为1.148。

频率分布示例(分组数据或连续序列)

示例:使用直接法和快捷方法计算以下数据的标准差。

分数 (x)0-1010-2020-3030-4040-5050-6060-7070-80
学生人数 (f)151523222510510

解决方案

使用步长偏差法

我们知道连续序列的步长偏差法公式

How to Find Standard Deviation

在上述公式中,如何找到标准差。其中A是假设平均值。所以,首先,我们将计算每个类区间的平均值(m)。在下表中,我们计算了每个类区间的平均值。其中,我们假设平均值为35

分数 (x)fHow to Find Standard DeviationHow to Find Standard Deviationd2fdfd2
0-10155-39-45135
10-201515-24-3060
20-302325-11-2323
30-402235 (A)0000
40-502545112525
50-601055242040
60-70565391545
70-80107541640160
∑f=N=125∑fd=2∑fd2=488

将值代入公式,我们得到

How to Find Standard Deviation

总体标准差示例

示例:使用总体标准差找到标准差。

12, 2, 45, 23, 55, 8, 11, 19, 57, 3

解决方案

在上述问题中,给出了十名学生的成绩。问题要求应用样本标准差。在这种情况下,我们不会将所有学生的成绩都用于计算。我们将取少量学生的成绩作为样本进行计算。

我们只取了个成绩进行计算,如下所示

12, 45, 23, 11, 19, 3

我们知道样本标准差的公式

How to Find Standard Deviation

现在,我们将找到公式中使用的值。

步骤1:计算样本平均值 (x)

How to Find Standard Deviation

步骤2:对于每个数据元素,减去平均值并平方结果。

x(xi-x)(xi-x)2
12-749
4526676
23416
11-749
1900
3-16256
∑(xi-x)2=1046

步骤3:∑(xi-x)2 除以 N-1。这里共有6个元素,所以将总和除以6-1=5,我们得到

How to Find Standard Deviation

步骤4:取上述结果的平方根。

s =√209.2=14.46

因此,样本标准差为14.46。

样本标准差示例

示例:使用总体标准差找到标准差。

12, 2, 45, 23, 55, 8, 11, 19, 57, 3

解决方案

在上述问题中,给出了十名学生的成绩。问题要求应用总体标准差。在这种情况下,我们将取所有学生的成绩进行计算。

我们知道样本标准差的公式

How to Find Standard Deviation

现在,我们将找到公式中使用的值。

步骤1:计算总体平均值 (μ)。

How to Find Standard Deviation

步骤2:对于每个数据元素,减去平均值并平方结果。

x(xi-μ)(xi-μ)2
12-12144
2-22484
4521441
23-11
5531961
8-16256
11-13169
19-525
57331089
3-21441
∑(xi-μ)2=4011

步骤3:∑(xi-μ)2 除以 N。这里共有10个元素,所以将总和除以10,我们得到

How to Find Standard Deviation

步骤4:取上述结果的平方根。

σ =√401=20.02=20

因此,总体标准差为20。


下一个主题小数到分数