离散数学中的超几何分布

17 Mar 2025 | 4 分钟阅读

超几何分布可以描述为超几何随机变量的概率分布。在超几何分布中,我们将考虑一个属性和一个总体。这里的属性用于表示两种状态之一,并且这些状态必须是互斥的。这两种状态之一包含总体中的所有成员。例如:“25岁或以上”、“考试不及格或及格”、“是或不是律师”,以及更多可能的属性。总体是无放回抽取的。这意味着抽样不是独立的:每次抽取都会影响下一次。因此,如果有任何抽取,它将减少总体的数量。在超几何分布中,我们通常需要在两组之间进行选择,并且在不放回的情况下进行选择。

假设有一组N个项目,我们从中无放回地随机抽取n个项目。一种项目用K表示(为方便起见,称为成功),第二种项目用N-K表示(为方便起见,称为失败)。在这种情况下,超几何分布将通过随机分布X的概率质量函数来描述。超几何分布的形式为

Hypergeometric Distribution in Discrete Mathematics

其中

N 表示总体的规模。

K 表示总体中成功的数量

x 表示观察到的成功次数

n 表示抽取的数量或次数。

我们可以通过从K个可能的成功中选择x个,然后从(N-K)个可能的失败中选择(n-x)个,最后考虑总共超几何分布在离散数学中种可能的n人抽取,来推导出上述公式。

二项分布和超几何分布之间有许多相似之处。只有当我们抽取总体数量的5%或更少时,二项分布才能被认为是超几何分布的一个很好的近似。因此,为了理解超几何分布,我们应该了解二项分布以及组合的公式。

假设我们有一个包含50个灯泡的集合,其中5个灯泡是坏的,45个灯泡是好的。超几何分布是一种概率分布,我们从中无放回地随机抽取4个灯泡。而二项分布也是一种概率分布,我们从中抽取4个灯泡,并且会放回坏灯泡。在观察到的信息不能重复出现的情况下,二项分布是有用的。例如,扑克牌游戏,观察到的牌意味着我们抽取的牌不能再次出现在我们的手中。二项分布在很多相同的情况下都很有用,比如它被用于统计显著性和风险管理。

超几何分布示例

示例1:在此示例中,我们将假设我们正在玩一副标准的扑克牌。假设我们从牌组中无放回地随机抽取5张牌。我们需要计算恰好抽到2张红牌(可以是红桃或方块)的概率。

解答:此示例是一个超几何试验,包含以下值

N = 52,因为一副牌总共有52张牌。

K = 26,因为一副牌总共有26张红牌。

n = 5,因为从牌组中随机抽取的牌是5张。

x = 2,因为我们抽取了2张红牌。

将这些值代入超几何分布,我们将得到以下值

Hypergeometric Distribution in Discrete Mathematics

因此,我们可以说0.32513是随机抽取2张红牌的概率。

示例2:假设一个袋子里有21个球,其中13个是橙色球,8个是绿色球。如果从袋子里取出5个球,我们需要确定其结果超几何分布。

解决方案

在此示例中,总体总数为13 + 8 = 21。这里我们有13个具有期望属性(橙色)的对象和5次抽取。所以,

N = 52,因为袋子里总共有21张卡片(此处原文有误,应为21个球)。

K = 13,因为袋子里总共有13个橙色球。

n = 5,因为从袋子里抽取了5个球。

x = 0, 1, 2, 3, 4, 5

将这些值代入超几何分布公式,我们将得到以下值

Hypergeometric Distribution in Discrete Mathematics

超几何分布的性质

在此,我们将描述用于提供与超几何分布相关信息的各种重要值,如下所示:

  • 在分布中,期望值均值用于提供关于大量重复试验中一次试验的平均期望值的信息。均值也可以称为平均值。
  • 分布的中位数可以描述为一种集中趋势。它是任何数据集的中间值。它基本上用作一半数据比它大,另一半数据比它小的一个点。
  • 分布的众数用于提供关于数据集中哪个数据具有最高出现概率的粗略 ধারণা(这里保留原文的印度词汇,意为“概念”或“想法”,可理解为“概念”)。
  • 分布的方差可以看作是数据集中数字之间差异的统计测量。方差基本上衡量均值与数据集中每个数字之间的距离。它还找出数据集中每个数字与其他数字之间的距离。方差的平方根可以用标准差来表示。标准差也能找到投资回报的一致性。

均值、众数和方差在超几何分布中大多使用,但众数通常不使用。