设总体 X 服从多项分布
我们的任务是对如下假设检验问题 (I) 作显著性检验:
- H0:pi=pi0(i=1,2,⋯,k),
- H1:pi=pi0 不全成立 (i=1,2,⋯,k), 其中 pi0(i=1,2,⋯,k) 已知.
直观上, 若从样本 (X1,X2,⋯,Xn) 出发, 我们统计出其中 ai 出现了 νi 次, i=1,2,⋯,k.
如果原假设 H0 成立, 那么根据 “事件发生的频率稳定于概率” 的事实, 应有 νi/n 接近于 pi0(i=1,2,⋯,k), 从而应有 i=1∑k(nνi−pi0)2 应比较小.
也就是说,若 i=1∑k(nνi−pi0)2 比较大, 就应当拒绝原假设 H0.
为了得到近似分布, 皮尔逊 (Pearson) 构造了统计量
K=i=1∑k(nνi−pi0)2⋅pi0n=i=1∑knpi0(νi−npi0)2,
并证明了, 当 n 充分大时, 近似地有
K=i=1∑knpi0(νi−npi0)2∼χ2(k−1).(8.4.1)
由于 n 和 pi0(i=1,2,⋯,k) 都为常数, 根据以上分析, 当 K 较大时应拒绝原假设 H0. 所以, 假设检验问题 (I) 的显著性水平为 α 的拒绝域为
K=i=1∑knpi0(νi−npi0)2≥χ1−α2(k−1).(8.4.2)