抽样分布概率

均值与比例

本工具基于中心极限定理,帮助您计算样本均值或比例落在某一区间的概率。

示例

通过实际案例了解如何使用本计算器(均值与比例)。

智商分数(均值)

均值

已知总体均值为100,标准差为15,计算30名学生样本均值大于105的概率。

μ: 100, σ: 15, n: 30

P(X > 105)

制造业(均值)

均值

一台机器生产的螺栓平均长度为50mm,标准差为0.5mm。样本容量为50时,样本均值介于49.9mm和50.1mm之间的概率是多少?

μ: 50, σ: 0.5, n: 50

P(X P(X 介于 49.9 和 50.1)

选民偏好(比例)

比例

如果总体中有60%的人支持某候选人,样本容量为200时,样本比例小于58%的概率是多少?

p: 0.6, n: 200

P( < 0.58)

产品缺陷率(比例)

比例

某工厂产品缺陷率为3%。样本容量为150时,样本缺陷率大于5%的概率是多少?

p: 0.03, n: 150

P( > 0.05)

其他标题
理解正态概率抽样分布计算器
中心极限定理及其在样本均值和比例概率计算中的应用详解。

核心概念:什么是抽样分布?

  • 从总体到样本
  • 中心极限定理(CLT)
  • 为何是推断的基石
在统计学中,我们常常想了解一个庞大群体(总体)的某些特征。但通常无法对所有人收集数据,因此我们抽取一个较小的群体(样本),并用它对总体做出有根据的推断。抽样分布是通过从特定总体中抽取大量样本得到的某一统计量(如样本均值或样本比例)的理论概率分布。它描述了给定样本容量下所有可能样本结果的分布。
中心极限定理的魔力
中心极限定理(CLT)是统计学中的基本原理。它指出,对于足够大的样本容量(通常n>30),样本均值的抽样分布近似服从正态分布,无论总体原始分布如何。对于比例,只要np和n(1-p)都大于等于10,样本比例的抽样分布也近似正态。这非常强大,因为正态分布性质明确,使概率计算变得简单。
为何对统计推断至关重要
抽样分布是我们拥有的样本数据与想要了解的总体数据之间的桥梁。通过了解其形状(近似正态)、中心(总体均值/比例)和离散程度(标准误),我们可以判断观察到的样本统计量出现的可能性。这是假设检验和置信区间构建的基础,是数据驱动决策的核心工具。

计算器使用分步指南

  • 选择分布类型
  • 输入参数
  • 解读结果
步骤1:选择均值或比例
第一步很关键。若处理的是可测量数据(如身高、体重、智商、温度)并可计算平均值,请选择“均值”;若处理的是分类数据(如是/否、合格/不合格、支持/反对)并关注百分比或比例,请选择“比例”。
步骤2:输入所需数值
若选择“均值”,需输入总体均值(μ)、总体标准差(σ)和样本容量(n);若选择“比例”,需输入总体比例(p)和样本容量(n)。然后选择要计算的概率类型(小于、大于或区间),并输入要检验的样本值(均值用x̄,比例用p̂)。
步骤3:计算并理解输出
点击“计算”后,工具会给出三项关键信息:标准误、Z分数和最终概率。标准误表示样本均值/比例与总体均值/比例的典型偏差。Z分数将样本统计量标准化,表示其距离总体参数的标准误数。概率则是正态曲线下对应Z分数的面积,代表观察到同样极端或更极端样本统计量的可能性。

数学推导与公式

  • 均值公式
  • 比例公式
  • Z分数变换
样本均值的抽样分布 (x̄)
根据中心极限定理,x̄的抽样分布近似正态,均值μx̄=μ,标准差σx̄(即标准误)=σ/√n。其中μ为总体均值,σ为总体标准差,n为样本容量。
样本比例的抽样分布 (p̂)
p̂的抽样分布近似正态,均值μp̂=p,标准差σp̂(即标准误)=√[p(1-p)/n]。其中p为总体比例,n为样本容量。只要np≥10且n(1-p)≥10,该近似成立。
Z分数:通用转换器
Z分数公式将样本统计量标准化,使我们可以利用标准正态分布(均值=0,标准差=1)查找概率。均值:Z=(x̄-μ)/(σ/√n);比例:Z=(p̂-p)/√[p(1-p)/n]。计算出Z分数后,可查Z表或用计算函数(本计算器即如此)获得概率。

实际应用与案例

  • 制造业质量控制
  • 政治民调与选举预测
  • 医学研究与临床试验
质量控制
某制造商希望确保一批麦片盒的平均重量接近目标值。他们可利用样本均值的抽样分布,计算样本平均重量过低或过高的概率,从而发现生产线潜在问题。
政治民调
民调机构调查1000名选民,以估计支持某政策的总体比例。他们可利用样本比例的抽样分布,判断样本比例在真实比例的误差范围内的概率,从而增强民调准确性。
医学研究
研究人员测试新药对降血压的效果,抽取样本测量平均降压值。可用样本均值的抽样分布判断观察到的平均降压是否具有统计学意义,或仅为偶然。