抛硬币概率的数学基础包括组合数学、二项分布理论和高级统计概念,为复杂概率场景提供精确分析工具。
二项式系数推导:
二项式系数C(n,k) = n! / (k!(n-k)!)表示从n个中选k个的方式数。在抛硬币中,表示n次抛掷中恰好k次正面的序列数。
例如,C(4,2) = 4!/(2!2!) = 6,表示4次抛掷恰好2次正面的6种方式:正正反反、正反正反、正反反正、反正正反、反正反正、反反正正。
完整的二项分布概率公式P(X = k) = C(n,k) × (0.5)^n,既考虑有利序列数,也考虑每个序列发生的概率。
大样本的正态近似:
当n较大(通常n>30)时,二项分布可近似为正态分布,均值μ = np,方差σ² = np(1-p)。公平硬币时μ = n/2,σ² = n/4。
该近似利用中心极限定理,可用z分数高效计算概率:Z = (X - μ)/σ,其中X为观测到的正面数。
连续性修正可提升近似精度:P(X = k) ≈ P(k-0.5 < X < k+0.5)(正态分布下)。
高级概率计算:
累积概率P(X ≤ k)需对每个概率求和:P(X ≤ k) = Σ(i=0到k) C(n,i) × (0.5)^n。n大时,若无正态近似,计算量很大。
尾部概率P(X ≥ k) = 1 - P(X ≤ k-1),k接近n时更高效。
可用观测比例p̂ = X/n和标准误SE = √(p̂(1-p̂)/n)构建真实概率p的置信区间,给出硬币偏倚的界限。
统计假设检验:
检验硬币公平性时,零假设H₀: p = 0.5,对立假设H₁: p ≠ 0.5。检验统计量Z = (p̂ - 0.5)/√(0.25/n),在H₀下服从标准正态分布。
临界值取决于显著性水平α(常用0.05),拒绝域为|Z| > Z{α/2},α=0.05时Z{0.025} ≈ 1.96。