前已指出, 数理统计的核心任务是 “从局部推断整体”, 具体地讲, 从样本 出发, 推断总体 的统计特性. 在中学教材中,大家学过的频率直方图就是一种用样本观测值近似拟合总体分布密度函数的直观方法. 那么, 从理论上讲,从局部能够推断整体吗? 或者说样本 何时才能近似反映总体 的特性呢?
本节所介绍的经验分布的逼近性质从理论上给出了肯定的答案.
定义 (经验分布函数 样本分布函数)
设总体 的样本 的一次观测值为 , 将其从小到大排列为 . 令
称 为总体 的一个经验分布函数 (或样本分布函数).
Link to original
设总体 的分布函数为 , 利用伯努利大数定律 (参见推论 5.1.1) 容易证明,对任意 ,有
另外,格里汶科 证明了更强的结果,即
以上的事实 (6.2.1) 和 (6.2.2) 都表明,
当样本容量 足够大时,经验分布函数与总体的分布函数差距很小.
这从理论上说明, 当样本容量较大时, 近似推断总体是可能的.