卡方拟合优度检验

高级统计检验

输入观察频数和期望频数以进行检验。

示例

探索卡方拟合优度检验的一些常见用例。

公平骰子掷骰

骰子

检测一个六面骰子在180次掷骰后是否公平。

观察值: 25, 35, 28, 32, 29, 31

期望值: 30, 30, 30, 30, 30, 30

α值: 0.05

孟德尔遗传学

遗传学

检查豌豆植株中观察到的表现型比例(315圆/黄,101圆/绿,108皱/黄,32皱/绿)是否符合556株的9:3:3:1理论比例。

观察值: 315, 101, 108, 32

期望值: 312.75, 104.25, 104.25, 34.75

α值: 0.05

客户偏好

市场

一家公司声称40%的客户喜欢产品A,30%喜欢B,20%喜欢C,10%喜欢D。对200名客户的调查显示,分别有85、55、45和15人喜欢。

观察值: 85, 55, 45, 15

期望值: 80, 60, 40, 20

α值: 0.01

均匀分布检验

均匀分布

检测100个随机电话号码的最后一位数字是否均匀分布。

观察值: 8, 11, 9, 12, 10, 10, 7, 13, 11, 9

期望值: 10, 10, 10, 10, 10, 10, 10, 10, 10, 10

α值: 0.10

其他标题
理解卡方拟合优度检验:全面指南
了解卡方拟合优度检验的原理、应用及如何解读本计算器的结果。

什么是卡方拟合优度检验?

  • 核心概念
  • 原假设与备择假设
  • 关键假设
卡方(χ²)拟合优度检验是一种非参数统计假设检验,用于判断观察到的频数分布与期望频数分布的拟合程度。它是检验样本数据是否代表总体或是否符合特定理论模型的基本工具。
核心概念
该检验将收集到的分类数据(观察频数)与原假设为真时应出现的计数(期望频数)进行比较。通过量化这些观察值与期望值之间的差异,检验得出一个卡方统计量,用于判断假设。
原假设与备择假设
拟合优度检验的假设通常为:原假设(H₀):样本数据来自指定分布,观察频数与期望频数一致。备择假设(H₁):样本数据不来自指定分布,观察频数与期望频数不一致。
关键假设
为保证检验结果有效,应满足以下条件:数据必须为分类计数;样本需随机抽取;每个类别的期望频数应至少为5,这是卡方分布近似有效的常用经验法则。

数学推导与公式

  • 卡方公式
  • 自由度 (df)
  • p值与临界值
检验的核心是卡方(χ²)公式,用于衡量观察频数与期望频数之间的差异。
卡方公式
公式为:χ² = Σ [ (Oᵢ - Eᵢ)² / Eᵢ ],其中Oᵢ为第i类的观察频数,Eᵢ为期望频数。对所有类别求和。χ²值越大,说明观察与期望差异越大,原假设越可能为假。
自由度 (df)
自由度表示检验中独立类别的数量。计算公式为:df = k - 1,其中k为类别数。它决定了用于查找p值的卡方分布形状。
p值与临界值
p值是在原假设为真时,观察到当前或更极端卡方统计量的概率。较小的p值(通常≤α)意味着拒绝原假设。临界值是卡方分布的阈值。如果计算得到的χ²大于临界值,则拒绝原假设。

计算器使用步骤指南

  • 输入观察频数
  • 输入期望频数
  • 解读结果
1. 输入观察频数
在“观察频数”栏中,输入每个类别的计数,用逗号分隔。例如,掷骰60次,得到10个1、12个2等,则输入“10, 12, 8, 11, 9, 10”。
2. 输入期望频数
在“期望频数”栏中,输入根据原假设每个类别应有的计数。例如,公平骰子掷60次,每个点数应为10,输入“10, 10, 10, 10, 10, 10”。输入数量需与观察频数一致。
3. 设置显著性水平 (α)
从下拉菜单中选择显著性水平。这是统计显著性的阈值。常用值为0.05(5%)。
4. 解读结果
点击“计算”后,工具会显示卡方统计量、自由度、p值和明确结论。如果p值小于所选α,结论将表明差异具有统计学意义,应拒绝原假设。

实际应用场景

  • 遗传学与生物学
  • 制造与质量控制
  • 市场营销与消费者行为
遗传学与生物学
科学家用拟合优度检验来判断遗传杂交的观察结果是否符合孟德尔遗传理论预测的比例。例如,检验二因子杂交后代是否符合9:3:3:1表现型比例。
制造与质量控制
工厂可用该检验判断每周不同天生产的次品数是否均匀分布。如果某一天次品显著增多,可能表明该天的工艺存在问题。
市场营销与消费者行为
市场研究人员可用该检验判断某产品的偏好分布是否与城市人口分布一致。这有助于了解产品是否更受特定人群欢迎。

常见误区与正确方法

  • 与独立性检验混淆
  • “期望计数”规则
  • 相关性与因果性
与卡方独立性检验混淆
常见错误是将拟合优度检验与卡方独立性检验混淆。前者比较单一分类变量与已知分布,后者检验两个分类变量是否相关。
“期望计数”规则
所有期望计数应≥5是经验法则而非硬性规定。当计数很小时,卡方近似可能不准确,此时可考虑Fisher精确检验(多用于2x2列联表)。
相关性与因果性
即使检验显示数据与期望模型不符(统计学显著),也不能解释原因。卡方检验仅揭示差异,不代表因果。需进一步分析差异原因。