对于一般总体 X 的非参数检验,我们的任务是对如下的假设检验问题 (II) 作显著性检验:
- H0:X∼F0(⋅;θ1,θ2,⋯,θr),
- H1:X∼F0(⋅;θ1,θ2,⋯,θr),
其中 F0 为已知分布, θ1,θ2,⋯,θr 为其参数 (一般情况下未知).
我们先作直观分析.
若样本 (X1,X2,⋯,Xn) 一次的观测值为 (x1,x2,⋯,xn). 根据该观测值取值的情况, 我们人为地将实轴 (−∞,+∞) 分成 k 个区间:
(−∞,a1],(a1,a2],(a2,a3],⋯(ak−2,ak−1],(ak−1,+∞).
且统计出 (x1,x2,⋯,xn) 取值落在第 i 个区间的个数为 νi(i=1,2,⋯,k).
若 F0(⋅;θ1,θ2,⋯,θr) 的参数已知,我们可以计算概率:
p10=F0(a1;θ1,θ2,⋯,θr),
p20=F0(a2;θ2,θ2,⋯,θr)−F0(a1;θ1,θ2,⋯,θr),
p30=F0(a3;θ2,θ2,⋯,θr)−F0(a2;θ1,θ2,⋯,θr),
…
pk−10=F0(ak−1;θ2,θ2,⋯,θr)−F0(ak−2;θ1,θ2,⋯,θr),
pk0=1−F0(ak−1;θ2,θ2,⋯,θr).
那么, 根据 “事件的频率接近于概率” 的事实, 当 i=1∑k(nνi−pi0)2 较大时, 应拒绝原假设 H0.
然而,一般情况下,参数 (θ1,θ2,⋯,θr) 是未知的. 此时,若求出参数的最大
似然估计 (θ1,θ2,⋯,θr),并由此估计概率:
p10=F0(a1;θ1,θ2,⋯,θr),
p20=F0(a2;θ2,θ2,⋯,θr)−F0(a1;θ1,θ2,⋯,θr),
p30=F0(a3;θ2,θ2,⋯,θr)−F0(a2;θ1,θ2,⋯,θr),
…
pk−10=F0(ak−1;θ2,θ2,⋯,θr)−F0(ak−2;θ1,θ2,⋯,θr),
pk0=1−F0(ak−1;θ2,θ2,⋯,θr).
那么可以证明 (皮尔逊 - 费希尔 (Pearson-Fisher) 定理) 近似地有
K=i=1∑knpi0(νi−npi0)2∼χ2(k−r−1).(8.4.3)
从而假设检验问题 (II) 的显著性水平为 α 的拒绝域为
K=i=1∑knpi0(νi−npi0)2≥χ1−α2(k−r−1).(8.4.4)