耶茨连续性校正卡方检验计算器

适用于2x2列联表

本工具计算经过耶茨校正的卡方统计量,适合分析2x2表中的关联性,尤其当单元格计数较低时。

实际案例

探索不同场景,了解计算器的用法。

疫苗有效性试验

医学研究

一项小型新疫苗临床试验。A组接种疫苗,B组为安慰剂。结果为“感染”或“未感染”。

a: 3, b: 22

c: 11, d: 14

新教学法对比

教育研究

比较新教学法(A组)与标准方法(B组)的研究。结果为“通过考试”或“未通过考试”。

a: 15, b: 5

c: 8, d: 12

广告文案A/B测试

市场营销

两种广告文案(A和B)的A/B测试。结果为用户“点击”或“未点击”。

a: 25, b: 975

c: 15, d: 985

罕见副作用分析

低频数据

分析药物(A组)与安慰剂(B组)罕见副作用发生率。低频数据使Yates校正尤为重要。

a: 1, b: 49

c: 6, d: 44

其他标题
理解耶茨连续性校正:全面指南
深入了解2x2列联表卡方检验中耶茨校正的理论、应用与重要性。

什么是耶茨连续性校正?

  • 连续性校正的核心概念
  • 为何卡方检验需要校正
  • 校正与未校正卡方的比较
耶茨连续性校正是对传统2x2列联表卡方(χ²)检验的调整。卡方分布是连续的,而列联表中的频数是离散的(整数)。这种差异在样本量或期望频数较小时会导致卡方值被高估。1934年Frank Yates提出该校正,使计算出的卡方分布更好地逼近理论连续分布。
校正原理
校正方法是在标准卡方公式中,对每个单元格的观察值(O)与期望值(E)之差的绝对值减去0.5后再平方。校正后卡方公式为:χ² = Σ (|O - E| - 0.5)² / E。该微小调整降低了整体卡方值,使p值更保守(更大),从而降低I类错误(即错误拒绝原假设)的概率。

何时使用校正

  • 当任一单元格期望频数低于10,尤其低于5时。
  • 分析2x2列联表时。
  • 希望结果更保守以避免I类错误时。

计算器使用步骤指南

  • 准备2x2列联表
  • 输入数据
  • 解读卡方、p值及结果
使用本计算器非常简单。首先需将数据整理为2x2列联表,代表两个分类变量。
1. 整理数据
假设你比较两组(如治疗组与安慰剂组)在二元结局(如康复/未康复)上的差异。表格如下:
a单元格:组1,结果1;b单元格:组1,结果2;c单元格:组2,结果1;d单元格:组2,结果2。
2. 输入数值
将a、b、c、d的整数计数输入对应字段。标签会清晰指引每个值的含义。
3. 结果分析
点击“计算”后,工具会给出关键指标:耶茨校正卡方(χ²)值,自由度(2x2表恒为1),以及p值。解读部分会根据标准α=0.05判断变量间是否存在统计学显著关联。若p < 0.05,则认为存在显著性。

耶茨校正在实际中的应用

  • 临床医学研究中的应用
  • 社会科学与心理学中的用例
  • A/B测试与市场分析中的重要性
耶茨校正不仅是理论概念,在许多领域有实际意义。
医学研究
在小型临床试验中,研究者可能比较新药与安慰剂的阳性反应人数。参与者有限时,期望频数易低于5,此时耶茨校正对有效性分析至关重要。
社会科学
社会学家可能研究性别与投票偏好之间的关系,如比较男性与女性对候选人A/B的投票数。耶茨校正可更准确评估样本中性别与投票选择的关联。

常见误区与正确方法

  • 争议:耶茨校正是否总是必要?
  • Fisher精确检验等替代方法
  • 避免过度校正与效能损失
统计学界对常规使用耶茨校正存在争议。主要担忧是其过于保守,可能增加II类错误(未能发现真实效应)的风险。
过度校正问题
批评者认为校正可能“过度”,导致难以获得统计学显著性,从而错失重要发现。随着总样本量(N)增加,校正的必要性降低。
对于极小样本量,常推荐Fisher精确检验。Fisher检验直接计算观察结果的精确概率,被认为是期望频数极低(如<5)时的“金标准”。它不依赖卡方近似。但带耶茨校正的卡方检验仍被广泛教学和接受。

最佳实践

  • 当期望频数较低(如5-10)时使用耶茨校正。
  • 若任一单元格期望频数极低(<5),建议Fisher精确检验。
  • 若所有期望频数均较高(>10),一般可用未校正的Pearson卡方检验。

数学推导与公式

  • 标准卡方公式
  • 引入0.5校正因子
  • 计算实例
理解校正前,先看2x2表的数据结构:
表格有两行(组1、组2),两列(结果1、结果2),单元格为a、b、c、d。总计N = a+b+c+d。
公式
耶茨校正卡方检验的计算公式为:χ² = N * (|ad - bc| - N/2)² / ((a+b)(c+d)(a+c)(b+d))
其中a、b、c、d为表格单元格频数,N为总频数。|ad - bc|为绝对差,'- N/2'为连续性校正的核心。

计算演示

  • 已知a=5, b=10, c=8, d=12,N=35。
  • 行合计:15, 20。列合计:13, 22。
  • |ad - bc| = |5*12 - 10*8| = |60 - 80| = 20。
  • N/2 = 35/2 = 17.5。
  • 分子:35 * (|20| - 17.5)² = 35 * (2.5)² = 35 * 6.25 = 218.75。
  • 分母:15 * 20 * 13 * 22 = 85800。
  • χ² = 218.75 / 85800 ≈ 0.00255。(注:示例仅供演示,结果极低)