功效分析

高级统计检验

计算研究所需的样本量、统计功效、效应量或显著性水平。

示例

探索不同的功效分析场景。

t检验的前瞻性分析

前瞻性

为独立样本t检验(中等效应量)查找所需样本量。

类型: 前瞻性

检验: t检验

效应量: 0.5

功效: 0.8

Alpha: 0.05

方差分析的事后分析

事后

计算单因素方差分析(3组,90名参与者)的已实现功效。

类型: 事后

检验: 方差分析(ANOVA)

效应量: 0.25

Alpha: 0.05

样本量: 90

组数: 3

卡方检验的前瞻性分析

前瞻性

确定小效应量和2个自由度下卡方检验所需样本量。

类型: 前瞻性

检验: 卡方检验

效应量: 0.1

功效: 0.9

Alpha: 0.01

自由度: 2

t检验的事后分析

事后

查找30名参与者、大效应量的配对t检验统计功效。

类型: 事后

检验: t检验

效应量: 0.8

Alpha: 0.05

样本量: 30

其他标题
理解功效分析:全面指南
学习统计功效、样本量确定及其在严谨研究设计中的重要性。本指南提供详细解释、实际示例和功效分析的数学基础。

什么是功效分析?

  • 核心概念
  • 错误类型
  • 功效分析组成部分
统计功效是指假设检验在原假设为假时能正确拒绝原假设的概率。简单来说,就是研究在存在效应时检测到效应的能力。功效分析可在数据收集前(前瞻性)或后(事后)进行。前瞻性分析帮助确定检测特定效应所需的合适样本量,事后分析则根据效应量和样本量计算已完成检验的功效。
功效分析的四大支柱
功效分析围绕四个相互关联的组成部分:样本量(n)、显著性水平(α)、效应量和统计功效(1 - β)。已知其中任意三个即可推算第四个。这一关系对于设计既具统计稳健性又高效的研究至关重要。
I类与II类错误
在假设检验中,可能出现两类错误。I类错误(α,假阳性)是错误地拒绝真实的原假设。II类错误(β,假阴性)是未能拒绝错误的原假设。统计功效等于II类错误概率的补数(功效 = 1 - β)。

功效分析计算器使用步骤指南

  • 选择分析类型
  • 选择检验
  • 解读结果
本计算器设计直观,但理解每一步可确保结果准确。流程包括选择分析类型、统计检验类型并输入已知参数。
1. 选择分析类型
首先确定是进行‘前瞻性’分析以查找所需样本量,还是‘事后’分析以确定已完成研究的功效。
2. 选择统计检验
根据数据和研究问题选择合适的检验类型(t检验、方差分析、卡方检验)。所需输入会随选择而变化。
3. 输入参数
填写效应量、显著性水平(alpha)及功效(前瞻性)或样本量(事后)的已知值。计算器将自动求解未知参数。
4. 解读输出
结果将显示所需样本量或已实现统计功效。输出还包括检验统计量的临界值,即显著性阈值。

实际计算场景

  • 某研究者计划比较两种教学方法(t检验),预计中等效应量(d=0.5),希望功效为80%,alpha为0.05。计算器将确定所需学生人数。
  • 某临床试验有100名患者,新药未显示显著效果。研究者可用事后分析判断研究是否有足够功效检测临床意义效应。

功效分析的实际应用

  • 临床试验
  • 学术研究
  • 市场调研
功效分析不仅是学术练习,在各领域有重要意义。
确保临床试验有效性
在医学领域,功效不足的研究可能无法检测新药益处,功效过高则可能浪费资源并让参与者承担不必要风险。功效分析确保研究既合乎伦理又具科学性。
科研经费申请中的资源管理
资助机构通常要求功效分析以证明样本量合理。研究者需证明其研究有较高概率得出结论性结果。
商业A/B测试的验证
在市场营销中,功效分析帮助确定A/B测试中每个版本所需用户数,以有信心检测转化率差异,避免因数据不足得出过早结论。

常见误区与正确方法

  • 事后功效谬误
  • 标准化与非标准化效应量
  • 功效‘走过场’
一些误解会导致功效分析被误用。
事后功效的问题
在研究结果不显著后计算功效存在争议。一些统计学家认为事后功效与p值冗余且无新信息。更好的做法是关注效应量的置信区间。但它对未来研究规划仍有参考价值。
选择合适的效应量
效应量应基于既往研究或实际意义的最小效应,而非仅凭‘小’‘中’‘大’等惯例。效应量估计不准是功效分析有效性的最大威胁。
避免‘功效走过场’
功效分析应成为研究设计不可或缺的一部分,而非仅为应付审批。它促使研究者认真思考假设、预期效应和资源。

数学推导与公式

  • 非中心参数的作用
  • t检验公式
  • 近似计算
功效分析的计算依赖于备择假设下检验统计量的分布,通常为非中心分布(如非中心t或F分布)。
非中心参数(NCP)
功效计算的关键是非中心参数(NCP)。NCP使检验统计量分布的中心远离零,反映效应量大小。对于双样本t检验,NCP(δ)约为d * √(n/2),其中d为Cohen's d,n为总样本量。
功效计算
功效是非中心分布落在中心分布临界值之外的面积。具体来说,对于单尾检验,功效 = P(T > t_critical | δ),T服从以δ为NCP的非中心t分布。计算器通过迭代算法求解未知参数(如样本量或功效),即找到满足功效方程的值。

简化公式示例(t检验)

  • 对于单样本z检验,所需样本量n可近似为:n = ((Z_α/2 + Z_β) / d)²,其中Z_α/2为显著性水平的临界值,Z_β为期望功效的临界值,d为效应量。
  • 若d=0.5,α=0.05(Z_α/2 ≈ 1.96),功效=0.8(β=0.2,Z_β ≈ 0.84),则n ≈ ((1.96 + 0.84) / 0.5)² ≈ (2.8 / 0.5)² = 5.6² ≈ 31.36。因此每组约需32名参与者。