超几何分布

分布与统计模型

计算在不放回的情况下,从包含K个特定特征对象的有限总体N中抽取n次,恰好获得k个成功的概率。

实际示例

探索真实场景,了解超几何分布的应用。

扑克中抽取A

扑克牌

从一副标准52张牌中抽取5张,恰好抽到2张A的概率是多少?

N: 52, K: 4

n: 5, k: 2

检测不良品

质量控制

一批100个芯片中有10个不良品。随机抽取8个进行检测,恰好发现1个不良品的概率是多少?

N: 100, K: 10

n: 8, k: 1

鱼群数量研究

遗传学

一个池塘中有200条鱼,其中50条被标记。研究人员捕捞20条鱼,恰好有5条被标记的概率是多少?

N: 200, K: 50

n: 20, k: 5

彩票中奖

彩票

在一次彩票中,从49个号码中抽取6个。若要获奖,需至少匹配3个号码。如果你买了一张票,恰好匹配3个号码的概率是多少?

N: 49, K: 6

n: 6, k: 3

其他标题
理解超几何分布:全面指南
深入了解超几何分布的原理、应用与计算,这是统计学中不放回抽样的重要概念。

什么是超几何分布?

  • 核心概念:不放回抽样
  • 与二项分布的区别
  • 分布的关键参数
超几何分布是一种离散概率分布,描述在不放回的情况下,从包含K个特定特征对象的有限总体N中抽取n次,恰好获得k个成功的概率。这与二项分布不同,后者描述的是有放回抽样下k次成功的概率。
为什么“不放回”很重要
关键区别在于每次抽取后的成功概率会发生变化。例如,从一副牌中抽一张后不放回,第二次抽到A的概率与第一次不同。超几何分布正是考虑了这种概率变化。

关键区别

  • 超几何分布:总体有限,且抽样为不放回。
  • 二项分布:试验相互独立,成功概率恒定(有放回抽样)。

超几何分布计算器使用步骤

  • 正确输入数据
  • 解读概率结果
  • 理解统计指标
使用计算器很简单。你需要四个关键信息:

• 总体大小 (N):你要抽取的总体项目总数。 • 总体中的成功数 (K):具有目标特征的项目总数。 • 样本大小 (n):你抽取的项目数。 • 样本中的成功数 (k):你关心的成功项目具体数量。

解读输出结果
计算器会给出多个结果。'P(X=k)' 是你指定成功数的精确概率。累积概率(如 P(X≤k))表示获得“至多”k个成功的概率。均值、方差和标准差描述了分布的中心、离散程度和典型偏差。

超几何分布的实际应用

  • 制造业质量控制
  • 生态与种群研究
  • 概率游戏与纸牌游戏
超几何分布不仅是学术概念,在实际中有广泛应用。
制造与质量控制
假设工厂生产1000个灯泡,其中50个不良品。检查员随机抽取100个,超几何分布可计算样本中恰好有5个不良品的概率,帮助公司决定是否拒收整批产品。
遗传学与生态学
生物学家用它进行捕获-再捕获法估算动物种群数量。如果他们在森林中捕获、标记并释放100只鹿,之后再捕获50只,发现其中10只是标记的,可以据此估算总鹿群数量。

数学推导与公式

  • 组合的作用
  • 公式分解
  • 均值与方差的计算
超几何分布的威力来自于组合数学的基础——计数。
公式解析
P(X=k) = [ C(K, k) * C(N-K, n-k) ] / C(N, n)

• C(K, k):从K个成功中选出k个的组合数。 • C(N-K, n-k):从N-K个失败中选出n-k个的组合数。 • C(N, n):从N个总体中选出n个样本的组合数。

本质上,公式计算的是期望结果出现方式与所有可能结果方式的比值。

常见误区与正确方法

  • 混淆超几何分布与二项分布
  • “10%规则”指导
  • 避免常见输入错误
主要困惑在于何时用超几何分布,何时用二项分布。关键在于抽样是否放回。
何时可用二项分布近似?
虽然两者有区别,但如果样本量 (n) 小于总体 (N) 的10%,每次抽取概率变化很小,此时二项分布可作为合理且更简单的近似。但为保证准确,尤其在总体较小时,建议使用超几何模型。
请确保输入合理。例如,样本中的成功数 (k) 不能大于样本大小 (n) 或总体中的成功数 (K)。