第七章 参 数 估 计
本章介绍经典的估计方法, 主要介绍总体参数的估计, 包括参数的点估计和区间估计. 点估计中将介绍矩法估计、最大似然估计和顺序统计量估计等方法可估计(可估计)可估计量优劣的基本标准. 区间估计主要介绍正态总体参数的区分间估计.
7.1 参数的点估计
简单地讲, 所谓参数的点估计, 就是找一个合适的统计量, 将样本观测值代人该统计量得到的值就作为该参数的估计, 而参数的区间估计则是找两个统计其中可以其中一个为左端点、另一个为右端点, 构成一个可能包含该参数的一个随
在不考虑估计量优劣时, 参数的点估计方法都是很直观的, 或者说其思想都是很基本的, 这一点请读者留意体会.
7.1.1 矩法估计
矩法估计的想法来自大数定律 (参见 5.1 节的定理 5.1.1 和定理 5.1.2). 如果总体 存在 阶矩,则由定理 5.1.1 知,对任 有
这说明,当样本容量较大时,样本 阶矩 与总体 阶矩 差别很
所谓矩法估计,就是用样本 阶矩估计总体 阶矩. (7.1.1) 说明这种估计方法是有理论依据的. 另外, 通常总体各阶矩都与总体参数有关, 从而可以通过用样本 阶矩估计总体 阶矩来实现对参数的估计.
设总体 ,通常用 来记 的矩法估计量,它是样本 的一个函数,比如记为 ,从而 是一个随机变量行件不观测值 代入估计量 所得的数值 ,我们称为参数 的矩法估计值.
下面我们通过几个例子, 进一步说明矩法估计.
例 7.1.1 试用参数的矩法估计, 估计一批某种产品的不合格品率.
解 由于一件产品要么为合格品要么为不合格品,所以此时总体 , 抽到不合格品时 取值为 1,否则取值为 0. 即不合格品率 .
现设我们通过抽取,得到了样本 . 由于 ,则由矩法估计的想法,就该用样本均值 来估计 ,亦即 . 也就是说,如果我们抽取了 100 件产品, 发现其中恰有 3 件不合格品, 则认为该批产品的不合格品率为 .
例 7.1.2 长期的生产经验告诉我们, 水泥厂成品打包机装袋的重量服从正态分布, 试用矩法估计来估计一台打包机装袋的重量的均值和标准差.
解 设装袋的重量为 ,样本为 ,由题设 和 ,即
从而, 依矩法估计, 应有
由于 ,所以
在例 7.1.2 中, 我们通过用样本 1,2 阶原点矩分别估计总体 1,2 阶原点矩, 得到的方差 (总体 2 阶中心矩) 的估计量恰好也是样本 2 阶中心矩 . 这一事实不是巧合而是必然的, 容易证明, 如果我们用样本各阶矩估计总体各阶矩, 则必然是用样本各阶中心矩估计总体各阶中心矩. 反之亦然.
例 7.1.3 设总体在某一区间上均匀取值, 试用矩法估计该区间的左、右端点.
解 由题意设 ,则 ,即
从而,依矩法估计,应有 (从此二元一次方程解出 和 ,并用 代替 ,用 代替 ,再用 代替 ,用 代替 )
例 7.1.4 设总体 的分布密度函数为
试求 的矩法估计.
解 先求 ,看看它与参数 的关系. 由于
与参数 无关,我们想到试算 . 由于
即 ,从而,依矩法估计,应有
在例 7.1.4 中, 还可由
得到 的另外一个矩法估计量为 .
由以上的例子, 我们可以总结出如下矩法估计的一般步骤.
设总体 ,先计算 的从 1 到 的各阶矩,得到各阶
矩与参数的关系
由这些关系式中解出
最后, 将 (7.1.3) 右端函数中的总体各阶原点矩用样本各阶原点矩代替, 再将 换成 即得.
7.1.2 最大似然估计
参数的最大似然估计的想法基于大家普遍接受的一个事实, 这个事实为 “小概率事件在一次试验中几乎不可能发生”. 换言之, 在一次试验中发生的事件, 其发生的概率应该比较大. 所以,若总体 ,当我们有了一组样本观测值 时, 的取值应该使得样本观测值 出现的可能性较大. 为确定出 的具体估计量,我们要求 的取值应该使得样本观测值 出现的可能性达到最大.
我们以总体 为连续型随机变量的情形来解释如何得到参数的最大似然估计.
设 的分布密度函数为 ,大家知道,若 在 处取值较大,则 取值为 附近的概率也较大. 于是我们要求 的取值使得 的联合密度函数在样本观测值 处取到最大. 记 的联合密度函数为 ,则由命题 6.1.1 知,
我们称 为 的似然函数.
至此,我们将求参数 的最大似然估计的问题,归结为在已有样本观测值 前提下,寻求 的最大值点 的问题. 记该最大值点为 ,则 的最大似然估计量就为
为了求得 的最大值点,往往通过求它的驻点. 即关于 的导数为 0 的点,但 (7.1.4) 为 个函数的乘积,求导比较繁琐. 通常可利用对数函数 的单调性,将问题转化为求 的最大值点.
例 7.1.5 据经验, 进入稳态期的生产线生产出的液晶电视机的使用寿命服从指数分布, 试用最大似然估计方法估计该厂生产线生产出的液晶电视机的平均寿命.
解 由题意设 ,样本观测值为 ,当 时, 的似然函数为
从而
上式两边关于 求导数,并令其为 0 得
即
最终得 的最大似然估计量为
也就是, 该厂生产线生产出的液晶电视机的平均寿命的最大似然估计量为 .
例 7.1.6 据多年观测记录的经验, 每年广州出现暴雨天气的天数服从泊松分布, 试用最大似然法估计广州每年出现暴雨天气的平均天数.
解 由题意设 ,样本观测值为 ,则 的似然函数为
从而,
上式两边关于 求导数,并令其为 0 得
即
最终得 的最大似然估计量为
也就是,广州每年出现暴雨天气的平均天数的最大似然估计量为 .
例 7.1.7 据产品检验部门的经验, 某便携式电脑的液晶显示屏出现的亮点或黑点, 在从屏幕左侧开始的每个水平线的一段上均匀出现, 试用最大似然法和矩法分别估计该水平线段的最右端点的值.
解 由题意设 ,样本观测值为 ,则 的似然函
数为
显然,为要 取到最大值,就应当是在包含所有的 的区间 中找一个最短的,所以应有
最终得 的最大似然估计量为
也就是,该水平线段的最右端点的值的最大似然估计量为顺序统计量 .
另外, 由于
即
从而得 的矩法估计量为
也就是,该水平线段的最右端点的值的矩法估计量为 .
7.1.3 顺序统计量估计
利用顺序统计量作参数估计,其想法是若对总体 作 次观测 (即抽取容量为 的样本),则 的中位数应近乎在这 个观测值的中间位置,并且这 个观测值越集中,则 的方差应越小.
由于总体为连续型随机变量且分布密度对称时, 总体中位数就是均值. 此时可用样本中位数来估计总体均值, 并用样本极差来估计总体标准差, 即
其中 表示 的估计量,样本中位数 和样本极差 的定义参见 6.1 节.
由于对于一般总体,样本中位数 极差 的精确分布难以得到,从而难以把握其估计的偏差, 用这种方法估计均值和标准差, 只是对总体均值和标准差的一个大概了解, 所以一般少用这种方法.
7.2 估计量优劣性的评价
我们知道, 数理统计就是用局部数据推断总体, 推断的结论总会存在偏差. 参数的点估计就是基于某种想法,构造样本的函数 来实现对未知参数 的估计,从而由不同的样本观测值得到的参数估计值总是与实际参数值有偏差, 这一点是无法避免的.
然而, 对于总体的同一个参数, 不同的估计方法也许偏差有所不同, 我们希望找一个比较偏差大小的标准. 最直观和基本的标准是,尽管 有时大于 ,有时小于 ,但平均下来,应与 无差别. 这就是估计量的无偏性.
定义 7.2.1 设总体 为 的函数, 为一统计量. 如果
则称 为 的无偏估计量. 如果
则称 为 的渐近无偏估计量.
定义 7.2.1 中的 表示在总体的参数真为 时所确定的概率分布下求数学期望,而 则是待估计参数一般表示,即我们不仅求 本身的估计,还可能估计 的某个函数.
例 7.2.1 (例 7.1.7 续) 设总体 . 在例 7.1.7 中我们得到, . 试问这两个估计量是否为无偏估计量.
解 由于
所以, 是 的无偏估计量.
为计算 ,我们先求 的分布密度函数. 由于
所以, 利用 (6.3.19) 有
从而
所以 不是 的无偏估计量,只是 的渐近无偏估计量.
在例 7.2.1 中,虽然 不是 的无偏估计量,但是令 ,
则有
即 是 的无偏估计量.
至此,对例 7.1.7 中的总体,我们得到两个无偏估计量 和 . 一个自然的问题是哪一个比较 “好” 呢? 对这两个均值都为 的随机变量, 自然地我们认为, 方差较小的应当是比较 “好” 的.
下面我们来计算它们的方差.
120 而
可见,只要 ,就有
亦即,我们认为 比 要 “好”.
如果 和 都是待估计参数 的无偏估计,但 ,我们称 比 有效. 一个自然的问题是. 对于待估计参数 ,能否找到最有效的估计量呢? 这个问题引出如下的定义 7.2.2.
定义 7.2.2 设总体 . 若 为 的无偏估计量,且对 的任意无偏估计量 都有
则称 为 的一致最小方差无偏估计量 (记为 UMVUE,它是 Uniformlv Minimum Variance Unbiased Estimate 的缩写).
可惜的是,对于一般的总体 ,目前还没有一个寻找 的一致最小方差无偏估计量的普遍可行的、构造性的方法. 已有的研究结果中只是对于一些特殊的总体类型有比较深刻或较为一般的结论或方法. 比如克拉默 - 拉奥 (Cramér-Rao) 定理, 就是对满足某种性质的总体分布类型, 事先得到参数 的无偏估计量方差的下界,如果找到的无偏估计量 的万差已达到该下界,那么 就是 的最有效估计量了. 再比如, 对于总体的分布为指数分布族, 通过寻找充分完备统计量, 可以达到寻找一致最小方差无偏估计量的目的. 我们熟悉的分布 和 等都属指数分布族,其参数的最大似然估计量 (对这些分布,矩法估计量与最大似然估计量相同), 都是一致最小方差无偏估计量.
另外, 需要指出的是, 虽然无偏性是对估计量的直观合理的要求. 但是下面的例 7.2.2 表明, 在有些情况下, 一个无偏估计量也许是具有 “很大偏差” 的.
例 7.2.2 设总体 ,参数 为其样本,则 是 的无偏估计量.
事实上,
注意到 ,但 却在 为奇数时取负值,可见偏差之大.
另外一种评价估计量的想法是当样本容量较大时, 考查估计量与待估计参数的差距, 也就是统计量的相合性.
定义 7.2.3 设总体 . 并设 为 的估计量,如果对任意 有
则称 为 的相合估计量.
显然,若总体 存在 阶矩,则由大数定律 (参见 5.1 节的定理 5.1.1) 和相合性的定义知,样本 阶原点矩 是总体 阶原点矩 的相合估计量, 进而大多矩法估计量都是相合估计量.
7.3 参数的区间估计
与参数的点估计不同,区间估计是以两个统计量 和 为左右端点构成一个随机区间,并且要求该随机区间包含待估计参数的概率满足一定的要求.
定义 7.3.1 设总体 为 的函数. 若有统计量 和 使得对给定的 有
则称 为 的置信度为 的区间估计 (或估计区间, 置信区间).
由于代入一次具体的抽样得到的样本观测值 计算出的区间
是一个确定的区间,它要么包含 ,要么不包含 ,不能说它包含 的概举为 . 但在寻求统计量 和 时 与 的大小有关,所以我们把 称为的区间估计的置信度.
相联系和比较. 另外,(7.3.1) 右端写为 是便于与第八章介绍的假设检验的相应表达式
本节给出的例子都是简单套用公式的示例,都可以用 软件轻松求解. 有关用 软件实现的实例请读者参见第九章.
7.3.1 单个正态总体参数的区间估计
以关于正态总体的抽样基本定理及其推论 (见 6.3 节) 作基础, 可求出该总体有关统计量或样本函数的精确分布, 从而使得正态总体参数的区间估计很容勿待到.
1. 的区间估计 已知
设总体 ,参数 未知, 已知. 为其样本 我们来寻求 的置信度为 的区间估计.
由推论 6.3.1 知, ,从而
由
查标准正态分布表 (或用 软件的 norm ,得 (例如 ),
亦即
至此,我们得到 的置信度为 的区间估计为
总结一下,我们是如何得到 的区间估计的. 首先我们得到了 (7.3.2),即得到了仅含待估计参数、不含其他未知参数的一个样本函数, 并且求得了它的分布. 其次是利用 (7.3.3) 经查表 (或计算) 得到分位点 . 最后利用 (7.3.4) 作等式变形, 得到所要区间左右端点.
例 7.3.1 已知某厂生产的滚珠直径 . 从某天生产的滚珠中随机地抽取 6 只, 测得直径为 (单位: mm)
试求 的置信度为 0.95 的区间估计.
解 由于
,查表或用 软件计算得 ,用 (7.3.5) 得到 的置信度为 0.95 的区间估计 [14.754, 15.146].
另外,请读者执行如下 程序,看有什么结果.
x←c(14.6,15.1,14.9,14.8,15.2,15.1)
sigma←sqrt(0.06)
alpha<-0.05
$\mathrm{z}1 < - \mathrm{{mean}}\left( \mathrm{x}\right)$
z2<-qnorm(1-alpha/2)*sigma/sqrt(length(x))
list(c.i=c(z1-z2, z1+z2))
2. 的区间估计 未知)
此时,欲模仿 (7.3.2) 寻求待估计参数 的样本函数,但现在 未知,(7.3.2) 的样本函数中有未知参数,将来得不到 的区间估计,于是想到用 的点估计量 代替 ,而此时的分布不再是 了,好在我们有推论 6.3.2,它告诉
我们
对于给定的置信度 ,由
查表或用 软件计算得 ,进而经等式变形得到 的区间估计
由以上推导方法大家看到, 最关键的是要找到一个仅含待估计参数. 不含其他未知参数的样本函数, 并且求得它的分布. 而寻求这样的样本函数的思路很简甲, 就是考虑未知参数的点估计量. 于是对于一个正态总体、两个独立正态总体的有关参数的区间估计,依据 6.3 节的定理 6.3.1 及推论 6.3.1 或 10 。推论 6.3.4 就可知有关样本函数及其分布. 至于接下来要做的求分位点和等式变形就是初等运算 J.
例 7.3.2 在例 7.3.1 中若 未知,试求 的置信度为 0.95 的区间估计.
解 由 和
,查表或用 软件计算的 ,用 (7.3.6) 得到 的置信度为 0.95 的置信区间 [14.713, 15.187].
另外,请读者执行如下两个 程序,看有什么结果.
x<-c(14.6,15.1,14.9,14.8,15.2,15.1)
sigma<-sd(x)
alpha<-0.05
$n < - {length}\left( x\right)$
$\mathrm{z}1 < - \mathrm{{mean}}\left( \mathrm{x}\right)$
z2<-qt(1-alpha/2, n-1)*sigma/sqrt(n)
list(c.i=c(z1-z2, z1+z2))
或者
x←c(14.6,15.1,14.9,14.8,15.2,15.1)
t.test(x,, ) $conf
- 的区间估计 已知
此时由 知,
所以
再令
求出分位点 和 并作等式变形立得 的区间估计为
例 7.3.3 已知某厂生产的零件尺寸 . 从某天生产的零件中随机地抽取 4 只, 测得样本观测值
试求 的置信度为 0.95 的区间估计.
解 由
和 ,查表或用 软件计算的 和 0.4844186,用 (7.3.7) 得到 的置信度为 0.95 的区间估计 .
另外,请读者执行如下 程序,看有什么结果.
x←c(12.6,13.4,12.8,13.2)
mu0<-12.5
alpha<-0.05
n<-length(x)
z1<-sum((x-mu0)^2)
list(c.i=c(z1/qchisq(1-alpha/2, n), z1/qchisq(alpha/2, n)))
4. 的区间估计
此时由抽样分布基本定理 (见定理 6.3.1) 知
经令
求出分位点 和 并作等式变形立得 的区间估计为
请读者用例 7.3.3 的数据,但 未知,求 的置信度为 0.95 的区间估计.
7.3.2 两个正态总体参数的区间估计
设 ,且 与 相互独立,样本分别为 和 . 样本均值与样本方差为
- 的区间估计 已知
由于 ,且由 与 相互独立知 与
独立, 于是有
亦即
由此令
求出分位点 并作等式变形立得 的区间估计
- 的区间估计 未知
由推论 6.3.4 知
由此令
求出分位点 并作等式变形立得 的区间估计
其中 .
例 7.3.4 两台机床生产同一型号的滚珠, 从甲机床和乙机床生产的滚珠中分别抽取 8 个和 9 个, 测得滚珠直径如下 (单位: mm)
甲机床: 15.0 14.8 15.2 15.4 14.9 15.1 15.2 14.8
乙机床: 15.2 15.0 14.8 15.1 15.0 14.6 14.8 15.1 14.5
已知两台机床生产的滚珠的直径都服从正态分布, 试求这两台机床生产的滚珠直径均值差的区间估计, 置信度为 0.90.
(1)已知甲、乙机床生产的滚珠直径的标准差分别为 及 .
(2) 未知,但知 .
解 设甲、乙机床生产的滚珠直径分别为 和 , 由题意, 与 相互独立, . 经计算得
(1) ,查表或用 软件计算的 ,用 (7.3.9) 得到 的置信度为 0.90 的区间估计 .
(2) ,查表或用 软件计算的 ,用 (7.3.10) 得到 的置信度为 0.90 的区间估计 .
另外,请读者执行如下两个 程序,看有什么结果.
$y < - c\left( {{15.2},{15.0},{14.8},{15.1},{15.0},{14.6},{14.8},{15.1},{14.5}}\right)$
sigma1<-0.18; sigma2<-0.24
alpha<-0.10
n1<-length(x); n2<-length(y)
z1<-mean(x)-mean(y)
z2<-qnorm(1-alpha/2)*sqrt(sigma1^2/n1+sigma2^2/n2)
list(c.i1=c(z1-z2, z1+z2))
z3<-qt(1-alpha/2, n1+n2-2)*sqrt((1/n1+1/n2)*((n1-1)*var(x)
$+ \left( {{n2} - 1}\right) * \operatorname{var}\left( y\right) )/\left( {{n1} + {n2} - 2}\right) )$
list(c.i2=c(z1-z3, z1+z3))
128
或者
sigma1←0.18; sigma2←0.24
alpha←0.10
n1←length(x); n2←length(y)
z1←mean(x)-mean(y)
z2←qnorm(1-alpha/2)*sqrt(sigma1^2/n1+sigma2^2/n2)
list(c.i1=c(z1-z2, z1+z2))
t.test(x, y, conf.level=0.90, var.equal=TRUE)$conf
- 的区间估计 已知
由于
所以
从而由 分布的定义有
再令
求出分位点 和 并作等式变形立得 的区间估计为
4. 的区间估计 未知
由推论 6.3.3 知
其中 ,再令
求分位点 和 并作等式变形立得 的区间估计为
我们将 7.3.1 节和 7.3.2 节的结果总结于表 7.1.
表 7.1 正态总体参数的区间估计
总体数目 | 待估计参数 | 用到的样本函数及其分布 | 区间估计 |
一个总体 $X \sim N\left( {\mu,{\sigma }^{2}}\right)$ $\bar{X} = \frac{1}{n}\mathop{\sum }\limits_{{i = 1}}^{n}{X}_{i}$ ${S}_{n}^{2} = \frac{1}{n}\mathop{\sum }\limits_{{i = 1}}^{n}{\left( {X}_{i} - \bar{X}\right) }^{2}$ | $\mu \left( {{\sigma }^{2} = {\sigma }_{0}^{2}}\right.$ 已知 $)$ | $\frac{\bar{X} - \mu }{\sqrt{\frac{{\sigma }_{0}^{2}}{n}}} \sim N\left( {0,1}\right)$ | $\left\lbrack {\bar{X} \pm {u}_{1 - \frac{\alpha }{2}}\sqrt{\frac{{\sigma }_{0}^{2}}{n}}}\right\rbrack$ |
$\mu \left( {\sigma }^{2}\right.$ 未知 $)$ | $\frac{\bar{X} - \mu }{{S}_{n}}\sqrt{n - 1} \sim t\left( {n - 1}\right)$ | ||
${\sigma }^{2}\left( {\mu = {\mu }_{0}}\right.$ 已知 $)$ | $\mathop{\sum }\limits_{{i = 1}}^{n}\frac{{\left( {X}_{i} - {\mu }_{0}\right) }^{2}}{{\sigma }^{2}} \sim {\chi }^{2}\left( n\right)$ | $\frac{\left\lbrack \bar{X} \pm {t}_{1 - \frac{\alpha }{2}}\left( n - 1\right) \frac{{S}_{n}}{\sqrt{n - 1}}\right\rbrack }{\left\lbrack \frac{\mathop{\sum }\limits_{{i = 1}}^{n}{\left( {X}_{i} - {\mu }_{0}\right) }^{2}}{{\chi }_{1 - \frac{\alpha }{2}}^{2}\left( n\right) },\frac{\mathop{\sum }\limits_{{i = 1}}^{n}{\left( {X}_{i} - {\mu }_{0}\right) }^{2}}{{\chi }_{\frac{\alpha }{2}}^{2}\left( n\right) }\right\rbrack }$ | |
${\sigma }^{2}\left( {\mu \text{未知}}\right)$ | $\frac{n{S}_{n}^{2}}{{\sigma }^{2}} \sim {\chi }^{2}\left( {n - 1}\right)$ | $\left\lbrack {\frac{n{S}_{n}^{2}}{{\chi }_{1 - \frac{\alpha }{2}}^{2}\left( {n - 1}\right) },\frac{n{S}_{n}^{2}}{{\chi }_{\frac{\alpha }{2}}^{2}\left( {n - 1}\right) }}\right\rbrack$ | |
两个总体 | ${\mu }_{1} - {\mu }_{2}\left( {{\sigma }_{1}^{2},{\sigma }_{2}^{2}}\right.$ 已知 $)$ | $\frac{\left( {\bar{X} - \bar{Y}}\right) - \left( {{\mu }_{1} - {\mu }_{2}}\right) }{\sqrt{\frac{{\sigma }_{1}^{2}}{m} + \frac{{\sigma }_{2}^{2}}{n}}} \sim N\left( {0,1}\right)$ | $\left\lbrack {\left( {\bar{X} - \bar{Y}}\right) \pm {u}_{1 - \frac{\alpha }{2}}\sqrt{\frac{{\sigma }_{1}^{2}}{m} + \frac{{\sigma }_{2}^{2}}{n}}}\right\rbrack$ |
$X \sim N\left( {{\mu }_{1},{\sigma }_{1}^{2}}\right)$ $\bar{X} = \frac{1}{m}\mathop{\sum }\limits_{{i = 1}}^{m}{X}_{i}$ ${S}_{1m}^{2} = \frac{1}{m}\mathop{\sum }\limits_{{i = 1}}^{m}{\left( {X}_{i} - \bar{X}\right) }^{2}$ $Y \sim N\left( {{\mu }_{2},{\sigma }_{2}^{2}}\right)$ $\bar{Y} = \frac{1}{n}\mathop{\sum }\limits_{{j = 1}}^{n}{Y}_{j}$ ${S}_{2n}^{2} = \frac{1}{n}\mathop{\sum }\limits_{{j = 1}}^{n}{\left( {Y}_{i} - \bar{Y}\right) }^{2}$ | ${\mu }_{1} - {\mu }_{2}\left( {{\sigma }_{1}^{2} = {\sigma }_{2}^{2}}\right.$ 未知 $)$ | $\frac{\left( {\bar{X} - \bar{Y}}\right) - \left( {{\mu }_{1} - {\mu }_{2}}\right) }{{S}_{w}\sqrt{\frac{1}{m} + \frac{1}{n}}}$ $\sim t\left( {m + n - 2}\right)$ | $\left( {\bar{X} - \bar{Y}}\right) \pm {t}_{1 - \frac{\alpha }{2}}\left( {m + n - 2}\right)$ $\times {S}_{w}\sqrt{\frac{1}{m} + \frac{1}{n}}$ |
$\frac{{\sigma }_{1}^{2}}{{\sigma }_{2}^{2}}\left( {{\mu }_{1},{\mu }_{2}\text{ 已知 }}\right)$ | $\frac{n\mathop{\sum }\limits_{{i = 1}}^{m}{\left( {X}_{i} - {\mu }_{1}\right) }^{2}}{m\mathop{\sum }\limits_{{j = 1}}^{n}{\left( {Y}_{j} - {\mu }_{2}\right) }^{2}}\frac{{\sigma }_{2}^{2}}{{\sigma }_{1}^{2}}$ $\sim F\left( {m, n}\right)$ | $\frac{1}{{F}_{1 - \frac{\alpha }{2}}\left( {m, n}\right) }\frac{n\mathop{\sum }\limits_{{i = 1}}^{m}{\left( {X}_{i} - {\mu }_{1}\right) }^{2}}{m\mathop{\sum }\limits_{{j = 1}}^{n}{\left( {Y}_{j} - {\mu }_{2}\right) }^{2}},$ $\left. {\frac{1}{{F}_{\frac{\alpha }{2}}\left( {m, n}\right) }\frac{n\mathop{\sum }\limits_{{i = 1}}^{m}{\left( {X}_{i} - {\mu }_{1}\right) }^{2}}{m\mathop{\sum }\limits_{{j = 1}}^{n}{\left( {Y}_{j} - {\mu }_{2}\right) }^{2}},}\right\rbrack$ | |
$\frac{{\sigma }_{1}^{2}}{{\sigma }_{2}^{2}}\left( {{\mu }_{1},{\mu }_{2}\text{ 未知 }}\right)$ | $\frac{m{S}_{1m}^{2}}{n{S}_{2n}^{2}} \cdot \frac{{\sigma }_{2}^{2}}{{\sigma }_{1}^{2}} \cdot \frac{n - 1}{m - 1} = \frac{{S}_{1m}^{*2}}{{S}_{2n}^{*2}} \cdot \frac{{\sigma }_{2}^{2}}{{\sigma }_{1}^{2}}$ $\sim F\left( {m - 1, n - 1}\right)$ | $\frac{1}{{F}_{1 - \frac{\alpha }{2}}\left( {m - 1, n - 1}\right) }\frac{{S}_{1m}^{*2}}{{S}_{2n}^{*2}},$ $\left. {\frac{1}{{F}_{\frac{\alpha }{2}}\left( {m - 1, n - 1}\right) }\frac{{S}_{1m}^{*2}}{{S}_{2n}^{*2}}}\right\rbrack$ |
例 7.3.5 就例 7.3.4 的假设和数据, 试求这两台机床生产的滚珠直径方差比的区间估计, 置信度为 0.90.
(1)已知甲、乙机床生产的滚珠直径的均值分别为 及 .
(2) 未知.
解 (1) 沿用例 7.3.4 的记号, 经计算得
,查表或用 软件计算的 和 . 用 (7.3.11) 得到 的置信度为 0.90 的区间估计 .
(2) 经计算得
,查表或用 软件计算的 和 . 用 (7.3.12) 得到 的置信度为 0.90 的区间估计 .
另外,请读者执行如下两个 程序,看有什么结果.
$x < - c\left( {{15.0},{14.8},{15.2},{15.4},{14.9},{15.1},{15.2},{14.8}}\right)$
$y < - c\left( {{15.2},{15.0},{14.8},{15.1},{15.0},{14.6},{14.8},{15.1},{14.5}}\right)$
mu1<-15.0; mu2<-14.9
alpha<-0.10
n1<-length(x); n2<-length(y)
z1<-sum((x-mu1)^2); z2<-sum((y-mu2)^2)
list(c.i1=c(n2*z1/(n1*z2*qf(1-alpha/2, n1, n2)),
n2*z1/(n1*z2*qf(alpha/2, n1, n2)))
z3<-var(x)/var(y)
list(c.i2=c(z3/qf(1-alpha/2, n1-1, n2-1), z3/qf(alpha/2, n1-1, n2-1)))
或者
$x < - c\left( {{15.0},{14.8},{15.2},{15.4},{14.9},{15.1},{15.2},{14.8}}\right)$
$y < - c\left( {{15.2},{15.0},{14.8},{15.1},{15.0},{14.6},{14.8},{15.1},{14.5}}\right)$
mu1<-15.0; mu2<-14.9
alpha<-0.10
n1<-length(x); n2<-length(y)
z1<-sum((x-mu1)^2); z2<-sum((y-mu2)^2)
list(c.i1=c(n2*z1/(n1*z2*qf(1-alpha/2, n1, n2)),
n2*z1/(n1*z2*qf(alpha/2, n1, n2)))
var.test(x, y, conf.level=0.9) $conf.int
7.3.3 单个正态总体参数 的联合区间估计
基于抽样分布基本定理 (见定理 6.3.1) 我们还可以得到正态总体 中参数 和 的联合区间估计.
事实上, 若
由于 与 独立,则有
若令
则有
由于
可查表得 . 最终我们得到 的置信度为 联合区间估计,
该联合区间估计在 平面上区域如图 7.1 所示 (图中 .
图 7.1 正态总体 的联合区间估计示意图.
7.3.4 非正态总体参数的区间估计
对于非正态总体, 往往难以得到其有关统计量的精确分布, 一般都是在样本容量较大时, 用近似分布求出参数的区间估计.
一般地,设 ,其样本均值为 和 ,则可以证明. 当样本容量 充分大时,近似地有
例 7.3.6 (两点分布的参数的区间估计) 设总体 ,试求 的置信度为 的区间估计.
解 由于 和 ,利用 (7.3.13) 近似地有
计 对于给定的置信度 ,由标准正态分布表查得 ,就得到 的区间估
第七章小结与注记
(1) 本章中关于参数的点估计, 我们介绍了矩法估计、最大似然估计和顺序统计量估计三种方法, 每种方法的想法都很直观并且各不相同. 其中最能反映概率思想的是最大似然估计. 它一方面基于 “小概率事件在一次试验中近乎不发生” 这样一基本认知. 另一方面, 在求参数的最大似然估计时, 用到总体的分布类型, 从这一点上讲, 它一般比矩法估计和顺序统计量估计的性能好一些, 或者说其统计特性更好把握些. 也正是如此, 一般在作进一步的理论分析时, 往往假定有关参数的估计量为最大似然估计量.
(2)评价一个估计量的优劣,比起想起一种估计方法要难得多. 首先要定义优或劣的标准, 再考证一个统计量在该标准下是否比较优. 应当说, 要求一个统计量做到其均值等于待估计参数 (即无偏性), 是一个最起码的要求, 在此基础上找一个方差是最小的也是最朴素的愿望. 遗憾的是, 目前还没有一个构造性的万法 (比如复合函数求导就是构造性的方法, 而求不定积分就没有构造性的方法), 去求得任意总体的参数的一致最小方差无偏估计, 只能分门别类的讨论, 得到稍有普遍意义的方法.
(3) 与参数的点估计不同, 区间估计要求得到的参数估计的随机区间要满足给定的置信度, 这就要求在构造统计量的同时, 要寻求其概率分布. 这一点, 对于一般分布的总体难以做到, 我们只好介绍正态总体参数的区间估计.
(4)对于正态总体参数的区间估计,虽然我们解释了各种情形下区间估计的由来, 但基本上是死搬硬套的, 试想没有第六章的抽样分布基本定理及其推论, 我们将如何做得到!
第七章习题
7.1. 设总体 的分布密度函数为
其中 为来自总体 的简单随机样本,求未知参数 的矩估计量.
7.2. 假设每升水中大肠杆菌的数目 服从泊松分布 ,其中 . 为了检验某种自来水消毒设备的效果, 现从消毒后的水中随机抽取 60 个样品 (每个样品为 1 升水) 进行化验, 结果如下:
大肠杆菌的个数/升 | 0 | 1 | 2 | 3 | 4 | 5 |
样品数 | 16 | 22 | 10 | 7 | 3 | 2 |
试求未知参数 的矩估计值. 7.3. 设总体 的分布密度函数为 ,其中 是未知参数, 是 的容量为 的样本. 求 的最大似然估计量.
7.4. 设总体 的分布密度函数为
其中 是未知参数, 是 的容量为 的样本. 求 的最大似然估计量.
7.5. 设总体 的分布列为
其中 ,今有样本观测值
1,1,1,3,2,1,3,2,2,1,2,2,3,1,1,2
试求 的最大似然估计值.
7.6. 设总体 ,其中 为未知参数, 为正整数且已知. 是取自总体 的样本,求未知参数 的矩估计量 及最大似然估计量
7.7. 设总体 服从区间 上的均匀分布, 是取自总体 的样本,试求 的矩估计量 及最大似然估计量 .
7.8. 设总体 ,其中 为未知参数,现从总体中抽得容量为 8 的样本观测值分别为
试求 的矩估计值 及最大似然估计值 .
7.9. 设总体 的密度函数为
其中 为未知参数, 是取自总体 的样本,试求 的矩估计量及最大似然估计量.
7.10. 已知某种灯泡的寿命服从指数分布, 现从该种灯泡随机抽取 12 只, 测得寿命分别为 (单位: 小时):
试用最大似然估计方法估计出这种型号灯泡寿命超过 1500 小时的概率.
7.11. 假设总体 服从参数为 的 分布 为来自 的样本. (1) 试求 的无偏估计. (2) 证明: 的无偏估计不存在.
7.12. 若总体 的分布密度函数为
其中 为未知参数, 是取自总体 的样本,试求 的无偏估计量.
7.13. 设总体 在区间 上服从均匀分布,其中参数 未知, 是从该总体抽取的样本. (1) 证明 均为 的无偏估计量. (2) 问哪个估计量更为有效?
7.14. 设 是来自服从区间 均匀分布的一个样本,求 的极大似然估计量,并证明其是 的相合估计.
7.15. 设 是来自泊松分布 的一个样本,证明: 是 的相合估计.
7.16. 设总体 服从二项分布 ,其中 为未知参数, 是来自总体 的一个样本. (1) 求 的最大似然估计量. (2) 证明该估计量是无偏的并且为 的相合估计.
7.17. 设总体 ,其中 未知. 为来自总体 的简单随机样本,则 作为 的置信区间,其置信度为多少并说明原因? 要使置信区间的长度不超过 1, 样本容量至少为多少?
7.18. 设总体 服从 ,其中 为未知参数. 是来自总体 的一个样本观测值. 假定由这组观测值求出 的置信水平为 的置信区间为 ,由这组观测值确定 的置信度为 的置信区间.
7.19. 某自动包装机包装洗衣粉,其重量 ,其中 未知. 今随机抽取 12 袋测得其重量,经计算得样本均值 ,修正样本标准差 ,试求
(1) 总体均值 的置信度为 0.95 的置信区间,
(2) 总体标准差 的置信度为 0.95 的置信区间.
7.20. 为了比较甲、乙两类试验田的收获量, 随机抽取甲类试验田 8 块, 乙类试验田 10 块, 测得亩产量如下 (单位: kg):
甲类 :510,628,583,615,554,612,530,525
乙类:433,535,398,470,560,567,498,480,503,426
假定这两类试验田的亩产量都服从正态分布,且方差相同,求两总体均值之差 的置信度为 的置信区间.
7.21. 有两位化验员 与 独立地对一批聚合物含氯量用同样方法各进行 10 次重复测定,其样本方差分别为 ,若 与 的测量值都服从正态分布,试求总体方差比 的 的置信区间.