样本量计算器

假设检验与统计推断

找到理想的样本量,确保您的调查或研究结果具有统计学意义。调整置信水平、误差范围和总体信息,以获得所需的样本量。

实际案例

查看样本量计算器在真实场景中的应用。

政治调查

政治调查

一位民调员想要了解一座拥有 500,000 人口的城市中某候选人的支持率。他们希望结果的置信水平为 95%,误差范围为 3%。

置信: 95%, 误差: 3%

比例: 50%, 总体: 500000

市场调研

市场调研

一家公司即将推出新产品,想要调查潜在客户。他们不确定市场规模(假设非常大),希望置信水平为 99%,误差范围为 5%。

置信: 99%, 误差: 5%

比例: 50%, 总体:

教育研究

教育研究

一位研究人员正在研究 1,200 名高中生的阅读习惯。他们预计约有 60% 的学生喜欢阅读,需要 90% 的置信水平和 4% 的误差范围。

置信: 90%, 误差: 4%

比例: 60%, 总体: 1200

网站 A/B 测试

网站 A/B 测试

一位开发者想确定新的按钮颜色是否能提高点击率。他们希望极高的置信水平(99.9%)和极小的误差范围(1%)后再做更改。

置信: 99.9%, 误差: 1%

比例: 50%, 总体:

其他标题
理解样本量计算器:全面指南
深入了解样本量计算原理,确保您的研究科学、可靠且具有统计学意义。学习如何平衡各因素,获得适合您需求的样本量。

什么是样本量?

  • 样本在研究中的作用
  • 样本量为何重要
  • 样本量计算的目标
样本量指的是研究中包含的参与者或观察数。在大多数研究场景下,研究整个总体既不现实、又昂贵且耗时。因此,我们选择总体的一个较小、可管理的子集,即样本。目标是利用该样本对整个总体进行推断。这些推断的准确性和可靠性在很大程度上取决于样本对总体的代表性,而样本量是影响代表性的关键因素。
为什么确定合适的样本量至关重要?
选择正确的样本量是研究设计中的关键一步。样本量过小可能导致结果不明确,因为其统计效能不足以检测真实效应或差异。反之,样本量过大则浪费资源、时间,且在伦理上也值得商榷,因为这会让不必要的参与者暴露于潜在风险。因此,样本量计算有助于在科学有效与高效之间取得平衡。

样本量计算器使用分步指南

  • 输入置信水平
  • 设置误差范围
  • 估算总体比例和规模
我们的计算器简化了确定样本量的过程。以下是每个输入项的详细说明及其有效使用方法:
1. 置信水平
这反映了您希望结果落在某一范围内的信心程度。以百分比表示(如 95%)。95% 的置信水平意味着如果您重复调查 100 次,有 95 次结果会落在误差范围内。常见选择有 90%、95% 和 99%。置信水平越高,所需样本量越大。
2. 误差范围
也称为置信区间,误差范围是描述您的调查结果与总体真实值之间可能偏差的百分比。5% 的误差范围意味着结果可能比实际总体高或低 5%。误差范围越小,精度越高,但所需样本量也越大。
3. 总体比例
这是您关注的总体中特定特征的比例。如果有初步数据(如前期研究),可使用该值。如果完全不确定,请用 50%。50%(或 0.5)会使方差最大化,从而得到最保守(即最大)的样本量,确保统计效能。
4. 总体规模(可选)
这是您所研究群体的总人数。如果总体较小,可用有限总体修正公式调整样本量。如果总体很大(如超过 100,000)或不清楚具体规模,可留空,计算器将假定总体无限大。

样本量计算的实际应用

  • 市场调研与问卷调查
  • 医学与临床试验
  • 制造业质量控制
政治民调
在选举前,民调机构需要知道要调查多少选民,才能在一定误差范围内有信心地预测结果。例如,全国性民调可能会计算代表所有合格选民所需的样本量。
客户满意度调查
一家大型电商公司希望衡量客户满意度。与其调查数百万客户,不如计算所需样本量,以获得整体满意度的可靠画像。
A/B 测试
一家科技公司想测试新网站布局。样本量计算可确定每个版本(A 和 B)需要多少用户,才能可靠地检测转化率的统计学差异。

数学推导与公式

  • 无限总体的 Cochran 公式
  • 有限总体修正
  • 理解 Z 分数
样本量的计算基于成熟的统计学公式。对于未知或非常大的总体,主要采用 Cochran 公式。
无限总体公式
计算样本量(n)的公式为:n = (Z² p (1-p)) / E²
其中:Z 为所选置信水平对应的 Z 分数(如 95% 置信水平为 1.96),p 为估计总体比例(小数),E 为误差范围(小数)。
有限总体修正公式
当总体规模(N)已知且较小时,可用有限总体修正公式调整初始样本量(n),得到最终样本量(n'):n' = n / (1 + (n - 1) / N)
该修正因子会减少所需样本量,因为有限总体中样本占比越大,提供的信息也越多。

常见 Z 分数:

  • 95% 置信水平对应的 Z 分数为 1.96。
  • 99% 置信水平对应的 Z 分数为 2.576。

常见误区与最佳实践

  • 样本量 vs. 响应率
  • “黄金比例”迷思
  • 总体比例取 50% 的用法
误区:样本量等于需联系人数
计算出的样本量是您需要获得的有效答卷数。不包括未响应者。您需估算响应率,并联系更多人以达到目标样本量。例如,若需 400 份答卷且预计响应率为 10%,则需联系 400 / 0.10 = 4,000 人。
误区:样本量按总体比例线性增长
所需样本量并不随总体规模线性增长。对于大总体(如 >100,000),在给定置信水平和误差范围下,所需样本量趋于稳定。对于 100 万和 1,000 万人口,1,000 个样本都可能同样具有代表性。
最佳实践:总体比例取 50%
当不确定总体比例(p)时,取 50%(或 0.5)是最保守的选择。公式中的 p * (1-p) 在 p=0.5 时最大化。这确保无论真实比例如何,您的样本量都足够满足精度要求。