我们知道, 数理统计就是用局部数据推断总体, 推断的结论总会存在偏差. 参数的点估计就是基于某种想法,构造样本的函数 来实现对未知参数 的估计,从而由不同的样本观测值得到的参数估计值总是与实际参数值有偏差, 这一点是无法避免的.
然而, 对于总体的同一个参数, 不同的估计方法也许偏差有所不同, 我们希望找一个比较偏差大小的标准. 最直观和基本的标准是,尽管 有时大于 ,有时小于 ,但平均下来,应与 无差别. 这就是估计量的无偏性.
定义 7.2.1 ((渐近)无偏估计量)
设总体 为 的函数, 为一统计量. 如果
则称 为 的无偏估计量.
如果
则称 为 的渐近无偏估计量.
Link to original
定义 7.2.1 中的 表示在总体的参数真为 时所确定的概率分布下求数学期望,而 则是待估计参数一般表示, 即我们不仅求 本身的估计, 还可能估计 的某个函数.
在例 7.2.1 中, 虽然 不是 的无偏估计量, 但是令 , 则有
即 是 的无偏估计量.
至此,对例 7.1.7 中的总体,我们得到两个无偏估计量 和 . 一个自然的问题是哪一个比较 “好” 呢? 对这两个均值都为 的随机变量, 自然地我们认为, 方差较小的应当是比较 “好” 的.
下面我们来计算它们的方差.
而
可见,只要 ,就有
亦即,我们认为 比 要 “好”.
如果 和 都是待估计参数 的无偏估计,但 ,我们称 比 有效. 一个自然的问题是. 对于待估计参数 ,能否找到最有效的估计量呢? 这个问题引出如下的定义 7.2.2.
定义 7.2.2 (一致最小方差无偏估计量 (UMVUE))
设总体 . 若 为 的无偏估计量,且对 的任意无偏估计量 都有
则称 为 的一致最小方差无偏估计量 (记为 UMVUE,它是 Uniformly Minimum Variance Unbiased Estimate 的缩写).
Link to original
可惜的是,对于一般的总体 ,目前还没有一个寻找 的一致最小方差无偏估计量的普遍可行的、构造性的方法. 已有的研究结果中只是对于一些特殊的总体类型有比较深刻或较为一般的结论或方法. 比如克拉默 - 拉奥 (Cramér-Rao) 定理, 就是对满足某种性质的总体分布类型, 事先得到参数 的无偏估计量方差的下界, 如果找到的无偏估计量 的万差已达到该下界, 那么 就是 的最有效估计量了. 再比如, 对于总体的分布为指数分布族, 通过寻找充分完备统计量, 可以达到寻找一致最小方差无偏估计量的目的. 我们熟悉的分布 和 等都属指数分布族,其参数的最大似然估计量 (对这些分布,矩法估计量与最大似然估计量相同), 都是一致最小方差无偏估计量.
另外, 需要指出的是, 虽然无偏性是对估计量的直观合理的要求. 但是下面的例 7.2.2 表明, 在有些情况下, 一个无偏估计量也许是具有 “很大偏差” 的.
另外一种评价估计量的想法是当样本容量较大时, 考查估计量与待估计参数的差距, 也就是统计量的相合性.
定义 7.2.3 (相合估计量)
设总体 . 并设 为 的估计量,如果对任意 有
则称 为 的相合估计量.
Link to original
显然,若总体 存在 阶矩,则由大数定律 (参见 5.1 节的定理 5.1.1) 和相合性的定义知,样本 阶原点矩 是总体 阶原点矩 的相合估计量, 进而大多矩法估计量都是相合估计量.