Bonferroni校正计算器

假设检验与统计推断

在进行多重比较时,调整P值以控制家族错误率(FWER)。

实际示例

通过这些样本数据集了解Bonferroni校正的工作原理。

示例1:药物疗效研究

临床试验

一项临床试验测试新药的5种潜在副作用。初始α为0.05。

α: 0.05, n: 5

P值: 0.01, 0.02, 0.03, 0.04, 0.05

示例2:基因表达分析

基因组学研究

分析20个基因在两组间表达是否有差异。显著性水平设为0.01。

α: 0.01, n: 20

P值: 0.0004, 0.001, 0.003, 0.05, 0.1, 0.0001, 0.02, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 0.002, 0.006, 0.008, 0.011, 0.03

示例3:网站优化

A/B测试

某电商网站测试3种不同按钮颜色以提升点击率。

α: 0.05, n: 3

P值: 0.04, 0.09, 0.21

示例4:教育干预

无显著结果

一项研究考察8种教学方法对成绩的提升效果。无方法显示统计学显著提升。

α: 0.05, n: 8

P值: 0.12, 0.34, 0.55, 0.08, 0.23, 0.41, 0.6, 0.19

其他标题
理解Bonferroni校正:全面指南
深入了解多重比较校正,保持科学严谨,避免假阳性发现。

什么是Bonferroni校正?

  • 多重比较问题
  • 家族错误率(FWER)定义
  • Bonferroni解决方案
Bonferroni校正是一种用于应对多重比较问题的统计方法。当你进行多次假设检验时,仅凭偶然出现统计显著结果(假阳性或I类错误)的概率会增加。例如,若α设为0.05,单次检验接受5%的假阳性风险。但若进行20次独立检验,至少出现一次假阳性的概率超过64%。这就是多重比较问题。
控制家族错误率(FWER)
核心思想是控制家族错误率(FWER),即整组检验中至少出现一次I类错误的概率。Bonferroni校正通过对每个单独检验采用更严格的显著性水平来实现这一目标。
简单公式
方法很简单:将初始α除以检验次数n,得到更小的“Bonferroni校正α”(α')。每个检验的P值必须小于等于校正后的α,才被认为统计学显著。

概念示例

  • 若α=0.05,进行10次检验,则校正α为0.05/10=0.005。
  • 要判定结果显著,P值必须小于0.005,而不是原始的0.05。

Bonferroni校正计算器使用指南

  • 输入数据
  • 执行计算
  • 解读结果
1. 输入初始显著性水平(α)
这是整组检验的目标α,也是你愿意接受的I类错误总体风险。最常用的值为0.05。
2. 指定检验次数(n)
输入你所做的所有独立假设检验的总数。
3. 输入P值
在最后一个字段输入每个检验的P值,用逗号分隔。确保P值数量与上一步指定的检验次数一致。
4. 解读输出
计算器会给出“Bonferroni校正α(α')”,并显示每个原始P值及其是否显著(基于校正α)。还会给出汇总统计。

操作示例

  • 输入:α=0.05,n=3,P值=0.01, 0.02, 0.06。
  • 计算:校正α'=0.05/3≈0.0167。
  • 结果:P值0.01≤0.0167(显著);P值0.02和0.06>0.0167(不显著)。

Bonferroni校正的实际应用

  • 医学与药物研究
  • 基因组与生物信息
  • 市场营销与A/B测试
基因组学研究
在分析成千上万个基因(如芯片实验)时,科学家会检验每个基因与疾病的关联。若不校正,可能有数百个基因仅凭偶然被判为显著。Bonferroni校正有助于筛选最有前景的候选基因。
临床试验
新药试验常常关注多个结局(如降血压、降胆固醇、副作用减少等)。Bonferroni校正确保对任何单一结局的有效性主张都具有统计学稳健性。
神经影像(fMRI)
fMRI研究分析大脑成千上万个体素的活动。多重比较校正对于避免对大脑“激活区”的虚假主张至关重要。

应用场景

  • 市场团队测试10个广告标题。要自信地选出优胜标题,必须用Bonferroni等校正方法,避免因偶然波动做出决策。

常见误区与正确方法

  • Bonferroni总是最佳选择吗?
  • 独立性假设
  • Bonferroni替代方案
“过于保守”的批评
Bonferroni校正的主要批评是过于保守。α大幅降低会增加II类错误(假阴性)风险,尤其在检验次数多或检验相关时更明显。
Bonferroni替代方法
因此,出现了其他方法。Sidak校正略更有力,但要求检验独立。控制假发现率(FDR)的方法(如Benjamini-Hochberg)在基因组等探索性领域更常用,因为它们不那么严格,关注所有显著结果中的假阳性比例,而不是完全避免单个假阳性。

何时考虑替代方案

  • 如果你对1万个基因表达数据做检验,Bonferroni校正可能过于严格,导致无基因通过阈值。这时用Benjamini-Hochberg控制FDR更实际。

数学推导与示例

  • Boole不等式
  • 形式推导
  • 数值示例
Boole不等式基础
Bonferroni校正源自概率论中的Boole不等式。它指出,任意一组事件至少发生一个的概率不大于各自概率之和。P(A₁ ∪ A₂ ∪ ... ∪ Aₙ) ≤ P(A₁) + P(A₂) + ... + P(Aₙ)。
推导步骤
设Eᵢ为第i个检验发生I类错误的事件。FWER为至少发生一次此类错误的概率P(∪Eᵢ)。我们希望FWER≤α。由Boole不等式,FWER≤ΣP(Eᵢ)。若将每个检验的显著性水平设为α/n,则ΣP(Eᵢ)=Σ(α/n)=n*(α/n)=α。因此,将单个检验α设为α/n,可保证整体FWER≤α。

数值示例

  • 设α=0.05,n=4,校正显著性水平α'=0.05/4=0.0125。
  • 假设P值为p₁=0.01, p₂=0.03, p₃=0.005, p₄=0.1。
  • 与α'=0.0125比较,p₁和p₃显著,p₂和p₄不显著。