抽样与推断

2025年1月12日 | 阅读17分钟

样本被定义为从总体或大量数据中选择一小部分的方法。从大量数据中抽取样本的过程称为采样。它用于各种应用,例如数学、数字通信等。

重要的是,选定的样本必须是随机选择的,这样每个成员在选择过程中都有均等的机会出现。因此,基于采样的基本假设称为随机采样。

在这里,我们将讨论以下内容

抽样分布

假设检验

显著性水平

两个样本的比较

学生 t 分布

中心极限定理

卡方检验法

F 分布

抽样分布

我们通常计算从总体中抽取的 n 个样本的均值。各种样本的均值是不同的。如果这些不同的均值根据它们的频率进行分组,则称为均值的抽样分布。类似地,如果我们根据它们的频率对这些不同的标准差进行分组,则称为标准差的抽样分布。

简单随机抽样

这是随机抽样的一种特殊情况。在这里,每个事件都有相同的成功概率,并且它们是相互独立的。这意味着一个事件的发生不依赖于另一个事件的发生及其之前的试验。总体的统计参数是均值标准差。

为什么抽样很重要?

抽样旨在在最短的时间、最低的成本和最少的努力内收集最多的信息。它获得最佳可能的值。根据归纳法的抽样逻辑,将特定样本推广到总体。这种从样本到总体的泛化称为统计推断。

抽样的属性

成功概率 = p

失败概率 = q = (1 - p)

假设我们通过 n 次独立试验抽取样本。一个结果的发生不依赖于另一个结果的发生。

二项式表达式 = (p + q)n

均值 = np

标准差 = npq

大小为 n 的样本中成功的期望值为 np,标准误差为npq。

我们来考虑成功的比例。

成功比例的均值 = np/n = p

成功比例的标准误差 = √(n x p/n x q/n) = √(pq/n)

成功比例的精度 = √(n/pq)

精度是标准误差的倒数。

它取决于 √n,因为 p 和 q 是常数。

标准误差

标准误差定义为期望值与观测值之间的差值。如果 n 大于 30,则样本称为大样本。否则,样本称为小样本。均值抽样分布的标准误差称为均值标准误差,标准差抽样分布的标准误差称为标准差标准误差。

假设检验

检验假设意味着检验假设是真还是假。首先,假设该假设是正确的,然后计算概率。当计算出的概率小于预设值时,拒绝该假设。

错误

当假设被拒绝或接受(而不是被接受或拒绝)时,就会出现错误。有两种类型的错误:第一类错误和第二类错误。

第一类错误:如果假设被拒绝而不是被接受,则该错误称为第一类错误。

第二类错误:如果假设被接受而不是被拒绝,则该错误称为第二类错误。

检验假设的目的是最小化第二类错误,并将第一类错误限制在预设的 5% 或 1% 的值。减少这两种错误(第一类和第二类)的最佳方法是增加样本大小。

零假设:用 Ho 表示。基于统计数据接受零假设,表示该假设未被拒绝。这并不意味着该假设为真,也不意味着它为假。

显著性水平

拒绝某个假设的概率水平称为显著性水平。显著性水平接受两个值,即5%1%。允许我们检验假设接受或拒绝的程序称为显著性检验。我们通常检验样本值与总体值之间的差异。

我们知道,对于二项分布的 n 个样本,计算均值和标准差的公式为

均值 = np

标准差 = √npq

其中,

p 是成功的概率

n 是失败的概率

我们有以下检验显著性水平的条件:

|z| < 1.96,差异不显著

|z| > 1.96,在 5% 显著性水平下,差异显著

|z| > 2.58,在 1% 显著性水平下,差异显著

其中,

Z 是标准正态变量

Z = (x - u)/ σ

Z = (x -均值)/标准差

Z = (x - np)/√npq

X 是观察到的成功次数的值。

差异是根据期望的成功次数和观察到的成功次数计算得出的。

数值例子

让我们来讨论一些关于检验显著性水平的数值示例。

示例 1

一枚硬币被抛掷 200 次,出现正面 108 次。在 5% 显著性水平下检验硬币是否失衡的假设?

解决方案

让我们假设这枚硬币是无偏的。

出现正面的概率 = 1/2

n = 1/2

出现反面的概率 = 1/2

p = 1/2

因此,出现正面的概率就是成功的概率。

期望的成功次数 = 1/2 x 200

= 100

观察到的成功次数 = 108

差值 = 观察到的成功次数 - 期望的成功次数

差值 = 108 - 100

差值 = 8

标准差 = npq

= 200 x ½ x ½

= 50

= 7.07

Z = (x - np)/√npq

Z = 8/7.07

Z = 1.13

Z < 1.96

z 值小于 1.96。因此,在 5% 显著性水平下,接受了硬币无偏的假设。

示例 2

一个骰子被投掷 12000 次,得到 2 或 3 的次数为 5400 次?根据随机投掷骰子,这些数据是否表明骰子是失衡的还是无偏的?

解决方案

让我们假设这枚硬币是无偏的。

得到 2 或 3 的概率 = 1/3

n = 1/3

不得到 2 或 3 的概率 = (1 - 1/3)

p = 2/3

期望的成功次数 = 1/3 x 12000

= 4000

观察到的成功次数 = 5400

差值 = 观察到的成功次数 - 期望的成功次数

= 5400 - 4000

= 1400

标准差 = npq

= (12000 x 1/3 x 2/3)

= 51.63

Z = (x - np)/npq

Z = 1400/51.63

Z = 27.11

Z > 2.58

z 值大于 2.58。因此,在 1% 显著性水平下,拒绝了硬币失衡的假设。

两个样本的比较

我们已经讨论了从总体 p 中抽取样本 n 的假设和显著性水平检验。在这里,我们将讨论从总体 p1 和 p2 中抽取的两个大样本,其大小分别为 n1n2。我们将两个样本合并起来计算比例的估计值,该值由下式给出

P = (n1p1 + n2p2)/ (n1 + n2)

标准误差 E1 和 E2 由下式给出

E12 = pq/ n1

E22 = pq/ n2

E2 = E12 + E22

E2 = pq (1/ n1 + 1/n2)

Z = (p1 - p2)/ E

Z 是标准正态变量

如果 z > 3,则差异是真实的

如果 z < 2,则差异是波动的

如果 z 值介于 2 和 3 之间,则 p1 和 p2 之间的差异在 5% 显著性水平下是显著的。

数值例子

让我们来讨论三个基于样本比较的数值示例。

示例 1

在 P 市,1000 名女孩样本中有 25% 患有某种生理缺陷。在另一个城市 Q,800 名女孩样本中有 20% 患有相同的缺陷。两者的比例差异是否显著?

解决方案

n1 = 1000

n2 = 800

p1 = 25% = 25/100 = 1/4

p2 = 20% = 20/100 = 1/5

比例的估计值由下式给出

P = (n1p1 + n2p2)/ (n1 + n2)

P = (250 + 160)/1800

P = 310/1800

P = 0.17

Q = 1 - P

Q = 0.83

E2 = pq (1/ n1 + 1/n2)

E2 = 0.17 x 0.83 (1/1000 + 1/800)

E2 = 0.1411 (0.00225)

E = 0.0178

E = 0.02 (约数)

p1 - p2 = 25% - 20%

= 5%

= 5/100

= 0.05

Z = (p1 - p2)/ E

Z = 0.05/0.02

Z = 2.5

Z 值介于 2 和 3 之间。因此,该值在 5% 显著性水平下是显著的。

示例 2

在 A 市,500 名男孩样本中有 11% 患有某种生理缺陷。在 B 市,600 名男孩样本中有 10% 患有相同的缺陷。两者的比例差异是否显著?

解决方案

n1 = 500

n2 = 600

p1 = 11% = 11/100 = 0.11

p2 = 10% = 10/100 = 0.1

比例的估计值由下式给出

P = (n1p1 + n2p2)/ (n1 + n2)

P = (55 + 60)/1100

P = 115/1100

P = 0.105

Q = 1 - P

Q = 0.89

E2 = pq (1/ n1 + 1/n2)

E2 = 0.11x 0.89 (1/500 + 1/600)

E2 = 0.0979 (0.00367)

E = 0.019

p1 - p2 = 11% - 10%

= 1%

= 1/100

= 0.01

Z = (p1 - p2)/ E

Z = 0.01/0.019

Z = 0.52

Z < 1

Z 值小于 1。因此,比例差异不显著。

示例 3

在两个大的总体中,分别有 35% 和 30% 的人身高较矮。从这两个总体中分别抽取 1000 和 700 个样本,这种差异是否可能被隐藏?

解决方案

p1 = 0.35 或 35%

p2 = 0.30 或 30%

q1 = (1 - p1)

q1 = 0.65

q2 = (1 - p2)

q2 = 0.7

p1 - p2 = 35% - 30%

p1 - p2 = 5%

p1 - p2 = 5/100

p1 - p2 = 0.05

E2 = p1q1 / n1 + p2q2 /n2

E2 = 0.35 x 0.65 /1000 + 0.30 x 0.70/ 700

E2 = 0.0002275 + 0.0003

E2 = 0.0005275

E = 0.02296

Z = (p1 - p2)/ E

Z = 0.05/0.02296

Z = 2.18

真实差异不太可能被隐藏。

中心极限定理

中心极限定理在处理大样本均值分布时很有用。

n 大小的样本的极限分布由下式给出

Z = (x - u)/ (σ /√n)

其中,

u 是均值

σ 是标准差

该分布具有有限的均值和标准差。样本大小大于 25 的样本称为大样本。

中心极限定理是普遍适用的,并且在统计理论中侧重于正态分布。

示例

在这里,我们将讨论两个基于中心极限定理的例子。

示例 1:一个包含 900 瓶的样本平均值为 3.8。它能被视为来自一个平均值为 3.6,标准差为 1.51 的大总体的真实样本吗?

解决方案

x = 3.8

u = 3.6

σ = 1.51

n = 900

Z = (x - u)/ (σ/ √n)

Z = (3.8 - 3.6)/1.51 /(30)

Z = 0.2/1.51/ (30)

Z = 0.2 x 30 /1.51

Z = 3.977

Z > 1.96

Z 值大于 1.96。因此,在 5% 显著性水平下,总体的均值是显著的。

示例 2:一个包含 400 名成员的样本平均值为 2.24。它能被视为来自一个平均值为 2.2,标准差为 0.51 的大总体的真实样本吗?

解决方案

x = 2.24

u = 2.2

σ = 0.51

n = 400

Z = (x - u)/ (σ/ √n)

Z = (2.24 - 2.2)/0.51/ (20)

Z = 0.04/0.51/ (20)

Z = 0.04 x 20 /0.51

Z = 1.57

Z < 1.96

Z 值小于 1.96。因此,总体的均值不显著。

两个大样本均值的显著性检验

在这里,我们将讨论从均值为 u1 和 u2,标准差为 σ1σ2 的总体中抽取的两个大样本,其大小分别为 n1n2

这两个样本的均值标准误差由下式给出

E = σ √(1/ n1 + 1/n2)

Z = x1 - x2/E

Z = x1 - x2/ σ √(1/ n1 + 1/n2)

显著性检验

检验显著性的条件如下

如果 z > 1.96,则在 5% 显著性水平下,差异显著。

如果 z > 3,则抽样不是简单的,或者抽取的样本不是来自同一个总体。

示例

示例 1:大小为 500 和 1000 的样本的均值分别为 45.5 和 46。这些样本可以被视为从标准差为 1.5 的总体中抽取的吗?

解决方案

x1 = 45.5

x2 = 46

n1 = 500

n2 = 1000

Z = x1 - x2/ σ √(1/ n1 + 1/n2)

Z = 0.5/ 1.5 x √(1/500 + 1/1000)

Z = 0.5/ 1.5 x √ (0.003)

Z = 0.5/0.082

Z = 6.09

差异非常大。因此,这些样本不能被视为从总体中抽取的样本。

示例 2:大小为 800 和 1600 的样本的均值分别为 50 和 50.4。这些样本可以被视为从标准差为 3.5 的总体中抽取的吗?

解决方案

x1 = 50

x2 = 50.4

n1 = 800

n2 = 1600

Z = x1 - x2/ σ √(1/ n1 + 1/n2)

Z = 0.4/ 3.5 x √(1/800 + 1/1600)

Z = 0.4/ 3.5 x √ (0.001875)

Z = 0.4/0.152

Z = 2.63

差异大于 1.96 且小于 3。因此,在 5% 显著性水平下,差异是显著的。

学生 t 分布

学生 t 分布中的统计量 t 由下式给出

t = (x - u)/ σ√n

t = (x - u)/ σs√(n - 1)

其中,

u 是均值

σ 是标准差

σs 是样本标准差

学生 t 分布可表示为

Y = yo/(1 + t2/v)(v + 1)/2

其中,

yo 是常数

v = n - 1

t 曲线如下所示

Sampling and Inference

t 曲线下的面积为单位。正态曲线比 t 曲线更快地接近横轴。t 曲线在 t= 0 处达到最大值,以便模式与均值重合。

规定的显著性水平从表 V 中获取。

示例

让我们来讨论两个基于学生 t 分布的例子。

示例 1:12 名患者的随机样本显示血压升高的数据显示为 5, 4, 3, -2, 0, 1, -1, 8, 7, 2, 1, 4。

解决方案

均值 = 5 + 4 + 3 -2 + 0 + 1 -1 + 8 + 7 + 2 + 1 + 4/12

均值 = d' = 2.67

σ 2 = Σd2/n - d'2

σ 2 = 1/12 (25 + 16 + 9 + 4 + 0 + 1 + 1 + 64 + 49 + 4 + 1 + 16) - 2.67

σ 2 = 1/12 (190) - 2.67

σ 2 = 13.16

σ = 3.62

t = (d - u)/ σs√(n - 1)

u = 0

t = (2.67 - 0)/ 3.62 x 11

t = 0.737 x 11

t = 2.45

v = n - 1 = 12 - 1 = 11

v = 11 时,t0.05 等于表 V 中的 2.2。

|t| > t0.05

t 值大于 t0.05。因此,我们的假设被拒绝。

我们可以直接从链接 https://www.sjsu.edu/faculty/gerstman/StatPrimer/t-table.pdf 访问表 C。

示例 2:一个篮子里的九件物品的样本值为 25、27、30、32、28、27、29、33 和 31。这九件物品的均值是否显著偏离假定的均值 27.5?

解决方案

xD = x - 28d2
25-39
27-11
3024
32416
2800
27-11
2911
33525
3139
总和 =1066

均值 = x + Σd/n

均值 = 28 + 10/9

均值 = 29.1

样本标准差 σ s = Σd2/n - (Σd/n)2

σ s2 = 66/9 - 100/81

σ s = 2.47

t = (d - u)/ σs√(n - 1)

t = (29.1 - 27.5)/ 2.47 x 8

t = 0.647 x 8

t = 1.83

v = n - 1 = 9 - 1 = 8

v = 8 时,t0.05 等于表 V 中的 2.31。

|t| < t0.05

t 值小于 t0.05。因此,在 5% 显著性水平下不显著。

示例 3:下表显示了 11 名学生在两次考试中的数据。第二次考试是在第一次考试一个月后进行的。是否发现第二次考试学生的表现有所提高?

学生1234567891011
考试 12526191822201518252628
考试 22629151526221213212725

解决方案

d' = 11/11 = 1

学生x1x2d = x1 - x2d - d'(d - d')2
12526-1-24
22629-3-416
31915439
41815324
52226-4-525
62022-2-39
71512324
818135416
92521439
102627-1-24
112825324
总和 =  11 104

σ s2 = Σ (d - d')2/(n - 1)

σ s2 = 104/10

σ s2 = 10.4

σ s = 3.22

v = n - 1 = 11 - 1 = 10

v = 10 时,t0.05 等于表 V 中的 2.228。

|t| < t0.05

t 值大于 t0.05。因此,我们的假设被拒绝。

卡方检验法

当一枚硬币被抛掷 60 次时,理论期望是 30 次正面和 30 次反面。但实际上,这是不可能的。实验结果与理论结果并不相同。观测值与理论值之间差异的大小定义为卡方,用X2表示。

当 X2 = 0 时,观测结果和理论假设相等。X2 值的增加导致观测值与理论值之间差异的增加。

设 O1, O2, O3, O4 ... 为观测频率,E1, E2, E3, E4 ... 为期望频率,则卡方关系可表示为

X2 = (O1 - E1)2/ E1 + (O2 - E2)2/ E2 + ... (On - En)2/ En

卡方曲线的方程可表示为

Y = yo/e-X2/2(X2)(v - 1)/2

其中,

yo 是常数

v = n - 1

拟合优度

卡方方法用于检查理论观测结果之间的偏差是否显著。它提供了拟合优度,以检查基于结果的假设的有效性。

X2 = (O1 - E1)2/ E1 + (O2 - E2)2/ E2 + ... (On - En)2/ En

规定的显著性水平从表 V 中获取。

检验条件

如果概率小于 0.05 (P < 0.05),则卡方方法的观测值在 5% 显著性水平下是显著的。

如果概率小于 0.01 (P < 0.01),则卡方方法的观测值在 1% 显著性水平下是显著的。

如果概率大于 0.05 (P > 0.05),则卡方方法的观测值不显著。

示例

示例 1:在一项随机实验中,得到了以下编号的硬币。

1 卢比2 卢比5 卢比10 卢比总计
10214325540540

理论预测上述样本的比例应为 8: 4: 4: 2。检查理论与实验之间的关系。

解决方案

基于比例的频率为

8/18 x 540, 4/18 x 540, 4/18 x 540, 2/18 x 540

= 240, 120, 120, 60

X2 = (102 - 240)2/240 + (143 - 120)2/120 + (255 - 120)2/120 + (40 - 60)2/60

X2 = 79.35 + 4.4 + 151.875 + 6.67

X2 = 242.29

对于 v =3,X20.05 的值为 7.815

X2 的值远大于 X20.05。因此,观测值不显著。

示例 2:在一项随机实验中,得到了以下数量的彩色面包。

红色黄色蓝色白色总计
3009510233530

理论预测上述样本的比例应为 9: 3: 3: 1。检查理论与实验之间的关系。

解决方案

基于比例的频率为

9/16 x 530, 3/16 x 530, 3/16 x 530, 1/16 x 530

= 298, 99, 99, 33

X2 = (300 - 298)2/298 + (95 - 99)2/99 + (102 - 99)2/99 + (33 - 33)2/33

X2 = 0.013 + 0.16 + 0.09 + 0

X2 = 0.263

对于 v =3,X20.05 的值为 7.815

X2 的值远小于 X20.05。因此,观测值在 5% 显著性水平下是显著的。

F 分布

在这里,我们考虑从具有相等标准差的总体中抽取的两个独立随机样本。

设两个独立随机样本为

x1, x2, x3, ... xn 和 y1, y2, y3, ... yn

F 分布由关系定义

F = s12/ s22

其中,

s12 和 s22 是两个独立样本的样本方差。

两个方差中较大的一个放在分子中。

s12 = 1/(n1 - 1) (Σ (xi - x)2)

s22 = 1/(n2 - 1) (Σ (yi - y)2)

Y1 = n1 - 1

Y2 = n - 2 是自由度。

示例

示例 1:两个大小分别为 10 和 9 的样本,其离差平方和分别为 140 英寸2 和 80 英寸2。这些样本可以被视为从同一个总体中抽取的吗?

解决方案

s12 = 1/(n1 - 1) (Σ (xi - x)2)

Σ (xi - x)2 = 140

s12 = 140/9

s12 = 15.55

s1 = 3.94

s22 = 1/(n2 - 1) (Σ (yi - y)2)

Σ (yi - y)2 = 80

s22 = 80/8

s22 = 10

s2 = 3.16

F = s12/ s22

F = 15.55/10

F = 1.55

对于 v= 9 和 v= 8,F0.05 的值为 3.39。

F 值小于 F0.05。因此,差异不显著。我们可以认为这些样本是从总体中抽取的。

示例 2:两个大小分别为 15 和 13 的样本,其离差平方和分别为 410 英寸2 和 160 英寸2。这些样本可以被视为从同一个总体中抽取的吗?

解决方案

s12 = 1/(n1 - 1) (Σ (xi - x)2)

Σ (xi - x)2 = 410

s12 = 410/14

s12 = 29.28

s22 = 1/(n2 - 1) (Σ (yi - y)2)

Σ (yi - y)2 = 160

s22 = 160/12

s22 = 13.33

F = s12/ s22

F = 29.28/13.33

F = 2.19

对于 v= 14 和 v= 12,F0.05 的值为 2.64。

F 值小于 F0.05。因此,差异不显著。我们可以认为这些样本是从总体中抽取的。