第八章 假设检验
假设检验是统计推断的一个重要方面. 在解决实际问题时, 往往可以依据经验大体判断出某种随机变化的量的分布类型, 或者参数的取值在某个范围内. 但无法从数学上说明其正确性或合理性, 此时通过观测样本就可以用假设检验来推断该经验结论是否正确, 或者在哪个置信度下, 该经验的结论是可信的. 假设检验可分为非参数假设检验和参数假设检验, 前者是对总体的分布提出假设 (比如, ,后者是总体的分布类型是已知的,其统计假设是关于参数的 (比如, ),需要我们通过样本 来对假设作出推断 (比如: 拒绝 还是接收 ? 在何种显著性水平下?).
本章在介绍一般假设检验问题的提法和假设检验过程中存在的两类错误的基础上, 分别介绍参数假设和非参数假设的显著性检验. 在参数的显著性检验中, 主要介绍正态总体参数的假设检验, 简单提及其他非正态总体参数的显著性检验的近似方法. 在非参数假设检验中,介绍多项分布的 拟合检验和一般分布的 拟合检验.
8.1 假设检验与两类错误
假设检验的基本思路也是基于大家的一个共识, 那就是 “小概率事件在一次试验中几乎不会发生”. 稍具体点讲,如果某假设 成立时事件 发生的可能性很小. 但样本观测的结果却是 发生了,这说明 不是小概率事件,这个矛盾说明假设 应该是不成立的.
我们先以单个正态总体的均值的假设检验问题为例, 对以上思路作具体解释, 进而介绍一般假设检验问题的提法和做检验时可能会犯的两类错误.
例 8.1.1 设总体 已知. 为其样本,试对假设检验问题:
做检验.
解 由于 是 的一致最小方差无偏估计,若原假设 成立, 应与 比较接近. 换言之,若 较大,则说明原假设 不成立.
由于 ,对于很小的正数 ,可由
查标准正态分布表得分位点 .
由于 很小,也就是说,事件
在一次试验中几乎不会发生. 所以,若一次试验出现的结果为 ,得到样本观测值 使得
我们应拒绝原假设 ,否则接受原假设 .
8.1.1 假设检验问题的提法
假设检验问题一般分为参数假设检验和非参数假设检验两类问题. 一般根据实际问题的需要,都要提出原假设 和备选假设 ,其中的原假设是由经验得到的一个事实或者基于经验的某种猜测而设定的, 而备选假设是当原假设被拒绝时, 可以接受的其他事实. 另外, 假设检验问题的最后答案是要么拒绝 (接受 )、要么接受 (拒绝 ),
在参数的假设检验中,认为总体 的分布类型 是已知的,而参数取自集合 . 此时,原假设和备选假设都是关于参数的. 比如,设 和 ,且 ,可有假设检验问题:
对这一问题作统计推断,就是在 成立的前提下,从样本 构造一个概率不超过 的小概率事件,然后基于一次观测的样本观测值是否使得该小概率事件发生,来决定是否拒绝原假设 .
由于一次样本观测值为 中的一个点,所以假设检验问题的回答. 最终是将 分成互不相交的两部分,一部分是使得小概率事件发生的点的集合. 我们称其为该假设检验问题的拒绝域, 另一部分是拒绝域的余集, 称其为该假设检验问题的接受域. 在例 8.1.1 中, 拒绝域为
对于非参数假设检验问题, 其原假设和备选假设都是关于总体分布的. 例如. 要判断一个 是否服从正态分布,可有
做检验时,要先求出均值 和 这两个参数的最大似然估计.
对于一般总体 ,可有
其中 为一已知的分布类型, 为参数,取值于某参数集 . 一般在做检验时, 要先对参数作最大似然估计, 才便于构造出相应的统计量.
8.1.2 假设检验的两类错误
如前所述,对一个假设检验问题作检验,就是在原假设 成立的前提下构造一个小概率事件,由该事件是否发生,来决定是否拒绝原假设 .
这种作法会出现两种类型的错误判断, 其中第一种错误的判断就是, 本来原假设 是真实的或正确的,此时小概率事件可能发生,也可能不发生. 一旦该事件发生我们就拒绝 ,即认为 不真实或不正确. 这种错误我们称为第一类错误,又称拒真错误. 犯这种错误的概率恰是 ,即
这种作法还会出现另一种错误的判断,那就是原假设 是不真实的或不正确的,此时若小概率事件未发生,我们就不拒绝 ,即认为 是真实的或正确的. 这种错误我们称为第二类错误, 又称受伪错误. 犯这种错误的概率我们记为 , 即
关于犯两类错误的概率 和 ,我们需要说明几点.
(1) 首先, ,并且可以证明,在样本容量 一定时,同时缩小两类错误是不可能的.
(2)当样本容量 一定时,犯第一类错误的概率 越小,则犯第二类错误的概率 就会越大. 这一点,我们可以由下面的例 8.1.2 看出,也与我们的生活经验相符, 那就是, 当你不轻易相信一个消息的真实性时 (犯第二类错误的可能性较小), 就可能犯贸然拒绝的错误 (犯第一类错误的可能性较大). 而轻信 (容易犯第二类错误) 就很少有拒绝错的风险 (不容易犯第一类错误).
(3) 现实中样本容量不可能无限制的大, 从而同时控制两类错误是不可能的. 一般都是在控制第二类错误的概率 不超过某值 的前提下,使犯第一类错误的概率 尽可能小.
(4) 实际应用中有一种检验方法是只控制第一类错误而不控制第二类错误, 这种检验方法称为显著性检验. 也就是说,当原假设 “显著地” 不真或不正确时就拒绝 ,否则不拒绝或勉强接受 . 这里所谓 “显著地” 不真,是指当原假设 成立时,某事件发生的概率很小,几乎不会发生,但是却在一次试验中发生了,这说明原假设 明显是不真的.
对于显著性检验, 需要强调指出的是这种检验方法实际上是 “保护” (不轻易拒绝) 原假设 的,这是因为当小概率事件发生时才拒绝它,但小概率事件通常几乎不发生. 另外,显著性检验的结果如果是拒绝原假设 的,那么该推断的可信性较高,而若检验的结果是不拒绝原假设 ,那么此时接受原假设 的推断对原假设 的成立是没有说服力的,这是因为一个事件发生概率较大, 它在一次试验中发生是应该的. 所以我们说, 当想用显著性检验对某一猜测结论作强有力的支持时, 应将该猜测结论的反面作为原假设.
例 8.1.2 设总体 已知. 为其样本,试对假设检验问题:
做检验 (其中 ),并解释该检验的第一类错误的概率 与第二类错误的概率 之间的关系.
解 与例 8.1.1 的分析类似, 此检验问题的推断结论仍为当
时拒绝原假设 .
由于 ,用 的分布密度函数,我们将此检验的第一类错误的概率 与第二类错误的概率 标于图 8.1 上.
图 8.1 假设检验的两类错误示意图.
图 8.1 的上半部的阴影部分表示当 为真时,拒绝 的概率 . 下半部的阴影部分表示当备选假设 为真时,接受 的概率,即概率 . 从图 8.1 容易看出,要使 变小,必然使得 变大. 反之,要使 变小,必然使得 变大.
8.2 正态总体参数的假设检验
与参数的区间估计类似, 由于正态总体的抽样分布定理及其推论 (见定理 6.3.1 和推论 6.3.1 - 推论 6.3.4),我们可以得到有关统计量的精确分布. 从而可以通过查表或计算得到分位数, 给出较为准确的拒绝域. 而对非正态总体参数的假设检验问题, 只能利用近似分布给出拒绝域.
同时, 我们会看到, 这里对于单个正态总体、两个独立正态总体的有关参数的假设检验问题, 与参数的区间估计问题是相对应的, 而且对应的统计量 (或样本函数) 和分位数都是相同的.
我们通过回顾 7.3.1 节的区间估计和例 8.1.1 来说明区间估计与假设检验的这种联系.
在 7.3.1 节中, 是未知的,我们通过样本函数
由 (7.3.3) 查表或用 软件计算得到分位数 ,进而由等式变形得到 的区间估计.
而在例 8.1.1 中,在假设 下,参数 是已知的,从而统计量
进而由 (8.1.1) 查表也得到分位数 ,这是因为 (7.3.3) 和 (8.1.1) 是同一个式子,这也是我们在区间估计时置信度用 来记的理由.
设总体 已知. 为其样本,我们讨论如何对假设检验问题:
做检验. 我们知道,当真参数为 时, . 但在 下, 的具体取值未确定,从而无法求得样本函数 的值. 另一方面,我们能算出统计量 的值, 却无法确定该统计量的分布.
为克服这一困难,我们注意到当 成立时,有
从而
所以, 当
时拒绝 ,则犯第一类错误的概率不超过 .
对 (8.2.1) 所示的拒绝域,我们还可以给出直观解释. 因为原假设 为 ,而 是 的一致最小方差无偏估计,若原假设 成立,它应与 较为接近,也就是小于或等于 ,而不能使 很大. 所以当 较大时,应该拒绝 . 至于所谓的 “较大” 则是由分位数 来界定的.
受例 8.1.1 和以上讨论的启发, 以及参数的区间估计与参数的假设检验中小概率事件构造方法的联系, 我们容易得到后面的表 8.1 一 表 8.4, 有关样本均值与样本方差的记号参见表 7.1. 并约定用统计量记号的小写表示该统计量在代入样本观测值后的取值.
表 8.1 单个正态总体均值 的假设检验的拒绝域 (显著性水平为 )
序号 | ${H}_{0}$ | ${H}_{1}$ | ${\sigma }^{2}$ 已知 | ${\sigma }^{2}$ 未知 |
I | $\mu = {\mu }_{0}$ | $\mu \neq {\mu }_{0}$ | $\frac{\left| \bar{x} - {\mu }_{0}\right| }{\sigma /\sqrt{n}} \geq {u}_{1 - \frac{\alpha }{2}}$ | $\frac{\left| \bar{x} - {\mu }_{0}\right| }{{s}_{n}/\sqrt{n - 1}} \geq {t}_{1 - \frac{\alpha }{2}}\left( {n - 1}\right)$ |
II | $\mu = {\mu }_{0}$ | $\mu > {\mu }_{0}$ | $\frac{\bar{x} - {\mu }_{0}}{\sigma /\sqrt{n}} \geq {u}_{1 - \alpha }$ | $\frac{\bar{x} - {\mu }_{0}}{{s}_{n}/\sqrt{n - 1}} \geq {t}_{1 - \alpha }\left( {n - 1}\right)$ |
Ⅲ | $\mu \leq {\mu }_{0}$ | $\mu > {\mu }_{0}$ | ||
IV | $\mu = {\mu }_{0}$ | $\mu < {\mu }_{0}$ | $\frac{\bar{x} - {\mu }_{0}}{\sigma /\sqrt{n}} \leq {u}_{\alpha }$ | $\frac{\bar{x} - {\mu }_{0}}{{s}_{n}/\sqrt{n - 1}} \leq {t}_{\alpha }\left( {n - 1}\right)$ |
V | $\mu \geq {\mu }_{0}$ | $\mu < {\mu }_{0}$ |
注: 统计软件在对假设检验问题作显著性检验时, 往往不事先给定显著性水平,而是打印出一个 值,它是拒绝原假设时所犯错误 (即第一类错误) 的概率, 也就是显著性水平.
作为假设检验的示例,这里举几个简单的例子. 这些例子,用 软件的 t.test( ), var.test( ) 和 chisq.test( ) 等很容易实现. 有关较为接近实际的例子及 软件实现参见第九章的相关内容.
例 8.2.1 某砖厂生产的砖的抗拉强度 服从正态分布 . 今从该)产品中随机抽取 6 块砖, 测得其抗拉强度如下 (单位: MPa):
试检验这批砖的平均抗拉强度为 32.50 是否成立,取显著性水平 .
解 依题意,这是一个单个正态总体均值的假设检验问题,其中 为已知.
第一步: 提出假设. 按题目的要求,应将原假设 和备选假设 提为
第二步: 选取统计量. 由表 8.1 的第一行, 选取统计量为
第三步: 求分位点. 令 ,查正态分布表或用 B 软件计算得 .
第四步: 计算统计量的观测值. 经计算
得到
第五步: 作判断. 由于 ,所以拒绝 ,即在显著性水平 下,认为这批砖的平均抗拉强度为 的假设不成立.
另外,请读者执行如下 程序,看有什么结果.
x←c(32.56,29.66,31.64,30.00,31.87,31.03)
mu<-32.50;sigma<-1.1
alpha<-0.05
z<-(mean(x)-mu)/(sigma/sqrt(length(x)))
list(abs.U=abs(z), u.value=qnorm(1-alpha/2))
例 8.2.2 地质勘探中常用热敏电阻测温仪间接测量地热来勘探井底温度, 设测量值 服从正态分布 . 重复测量 7 次,测得温度如下 (单位: ):
现用某种精确方法测得温度的真值为 ,试问用热敏电阻测温仪间接测量的井底温度有无系统偏差? 取显著性水平 .
解 依题意,这是一个单个正态总体均值的假设检验问题,其中 未知.
第一步: 提出假设. 按题目的要求,应将原假设 和备选假设 提为
第二步: 选取统计量. 由表 8.1 的第一行, 选取统计量为
第三步: 求分位点. 令 ,查 分布表或用 软件计算得 .
第四步: 计算统计量的观测值. 经计算
第五步: 作判断. 由于 ,所以不拒绝 . 即在显著性水平 下,用热敏电阻测温仪间接测量的井底温度没有系统偏差.
另外,请读者执行如下 程序,看有什么结果.
x<-c(112.0,113.4,111.2,114.5,112.5,112.9,113.6)
mu<-112.6
alpha<-0.05
t<-(mean(x)-mu)/(sd(x)/sqrt(length(x)))
list(abs.T=abs(t), t.value=qt(1-alpha/2, length(x)-1))
表 8.2 单个正态总体方差 的假设检验的拒绝域 (显著性水平为 )
序号 | ${H}_{0}$ | ${H}_{1}$ | $\mu$ 已知 | $\mu$ 未知 |
I | ${\sigma }^{2} = {\sigma }_{0}^{2}$ | ${\sigma }^{2} \neq {\sigma }_{0}^{2}$ | $\frac{\mathop{\sum }\limits_{{i = 1}}^{n}{\left( {x}_{i} - \mu \right) }^{2}}{{\sigma }_{0}^{2}} \leq {\chi }_{\frac{\alpha }{2}}^{2}\left( n\right)$ 或 | |
II | ${\sigma }^{2} = {\sigma }_{0}^{2}$ | ${\sigma }^{2} > {\sigma }_{0}^{2}$ | ||
III | ${\sigma }^{2} \leq {\sigma }_{0}^{2}$ | ${\sigma }^{2} > {\sigma }_{0}^{2}$ | $\frac{\mathop{\sum }\limits_{{i = 1}}^{n}{\left( {x}_{i} - \mu \right) }^{2}}{{\sigma }_{0}^{2}} \geq {\chi }_{1 - \alpha }^{2}\left( n\right)$ | |
IV V | ${\sigma }^{2} = {\sigma }_{0}^{2}$ ${\sigma }^{2} \geq {\sigma }_{0}^{2}$ | ${\sigma }^{2} < {\sigma }_{0}^{2}$ ${\sigma }^{2} < {\sigma }_{0}^{2}$ | $\frac{\mathop{\sum }\limits_{{i = 1}}^{n}{\left( {x}_{i} - \mu \right) }^{2}}{{\sigma }_{0}^{2}} \leq \lambda$ | $\frac{\mathop{\sum }\limits_{{i = 1}}^{n}{\left( {x}_{i} - \bar{x}\right) }^{2}}{{\sigma }_{0}^{2}} \leq {\chi }_{\alpha }^{2}\left( {n - 1}\right)$ |
例 8.2.3 某涤纶厂生产的涤纶的纤度 (纤维的粗细程度) 在正常生产条件卜,服从正态分布 . 某日随机地抽取 5 根纤维,测得纤度如下:
试问这一天生产的涤纶的纤度的方差是否正常 (取显著性水平 ).
解 依题意,这是一个单个正态总体方差的假设检验问题,其中 已知.
按题目的要求,应将原假设 和备选假设 提为
由表 8.2 的第一行, 选取统计量为
令 ,查 分布表或用 软件计算得 和 .
经计算
由于 ,所以拒绝 ,即在显著性水平 下, 这一天生产的涤纶的纤度的方差不正常.
另外,请读者执行如下 程序,看有什么结果.
x←c(1.32,1.55,1.36,1.40,1.44)
mu0←1.405; sigma0←0.048
alpha←0.05
z←sum((x-mu0^2)/sigma0
list(x2=z, chi.value=c(qchisq(alpha/2, length(x)),
qchisq(1-alpha/2, length(x)))
例 8.2.4 数据与总体假设同例 8.2.3,但 未知. 试问这一天生产的涤纶的纤度的方差是否正常 (取显著性水平 ).
解 依题意,这是一个单个正态总体方差的假设检验问题,其中 未知.
按题目的要求, 提出
由表 8.2 的第一行, 选取统计量为
令 查 分布表或用 软件计算得 和 .
经计算
由于 ,所以拒绝 ,即在显著性水平 下, 这一天生产的涤纶的纤度的方差不正常.
另外,请读者执行如下 程序,看有什么结果.
x<-c(1.32,1.55,1.36,1.40,1.44)
sigma0<-0.048
alpha<-0.05
z<-sum((x-mean(x))^2)/sigma0^2
list(x2=z, chi.value=c(qchisq(alpha/2, length(x)-1),
qchisq(1-alpha/2, length(x)-1)))
表 8.3 两个独立正态总体均值差的假设检验的拒绝域 (显著性水平为 )
序号 | ${H}_{0}$ | ${H}_{1}$ | ${\sigma }_{1}^{2},{\sigma }_{2}^{2}$ 已知 | ${\sigma }_{1}^{2} = {\sigma }_{2}^{2}$ 未知 |
I | ${\mu }_{1} - {\mu }_{2} = \delta$ | ${\mu }_{1} - {\mu }_{2} \neq \delta$ | $\frac{\left| \left( \bar{x} - \bar{y}\right) - \delta \right| }{\sqrt{\frac{{\sigma }_{1}^{2}}{m} + \frac{{\sigma }_{2}^{2}}{n}}} \geq {u}_{1 - \frac{\alpha }{2}}$ | $\frac{\left| \left( \bar{x} - \bar{y}\right) - \delta \right| }{{S}_{w}\sqrt{\frac{1}{m} + \frac{1}{n}}} \geq {t}_{1 - \frac{\alpha }{2}}\left( {m + n - 2}\right)$ |
II | ${\mu }_{1} - {\mu }_{2} = \delta$ | ${\mu }_{1} - {\mu }_{2} > \delta$ | $\frac{\left( {\bar{x} - \bar{y}}\right) - \delta }{\sqrt{\frac{{\sigma }_{1}^{2}}{m} + \frac{{\sigma }_{2}^{2}}{n}}} \geq {u}_{1 - \alpha }$ | $\frac{\left( {\bar{x} - \bar{y}}\right) - \delta }{{S}_{w}\sqrt{\frac{1}{m} + \frac{1}{n}}} \geq {t}_{1 - \alpha }\left( {m + n - 2}\right)$ |
III | ${\mu }_{1} - {\mu }_{2} \leq \delta$ | ${\mu }_{1} - {\mu }_{2} > \delta$ | ||
IV | ${\mu }_{1} - {\mu }_{2} = \delta$ | ${\mu }_{1} - {\mu }_{2} < \delta$ | $\frac{\left( {\bar{x} - \bar{y}}\right) - \delta }{\sqrt{\frac{{\sigma }_{1}^{2}}{m} + \frac{{\sigma }_{2}^{2}}{n}}} \leq {u}_{\alpha }$ | $\frac{\left( {\bar{x} - \bar{y}}\right) - \delta }{{S}_{w}\sqrt{\frac{1}{m} + \frac{1}{n}}} \leq {t}_{\alpha }\left( {m + n - 2}\right)$ |
V | ${\mu }_{1} - {\mu }_{2} \geq \delta$ | ${\mu }_{1} - {\mu }_{2} < \delta$ |
例 8.2.5 设甲、乙两厂生产的灯泡的寿命分别服从正态分布 和 . 现从两厂生产的灯泡中各取 60 只,测得甲厂生产的灯泡的平均寿命为 小时,乙厂生产的灯泡的平均寿命为 小时. 试问在显著性水平 下能否认为甲、乙两厂生产的灯泡的寿命没有显著差异?
解 依题意,这是两个正态总体均值之差的假设检验问题,其中 和 已知,样本容量 .
按题目的要求, 提出
由表 8.3 的第一行, 选取统计量为
令 ,查正态分布表或用 软件计算得 . 经计算
由于 ,所以拒绝 ,即在显著性水平 下认为甲、乙两厂生产的灯泡的平均寿命有显著差异.
另外,请读者执行如下 程序,看有什么结果.
x.bar←1295; y.bar←1230
sigma1←84; sigma2←96
alpha<-0.05
u<-(x.bar-y.bar)/sqrt(sigma1^2/m+sigma2^2/n)
list(abs.U=abs(u), u.value=qnorm(1-alpha/2))
例 8.2.6 某卷烟厂生产两种卷烟, 现分别对两种香烟的尼古丁含量作 6 次测量, 结果为
甲厂:
乙厂:282330352127
若两种香烟的尼古丁含量都服从正态分布, 且方差相等. 试问在显著性水平 下能否认为两种香烟的尼古丁含量没有显著差异?
解 依题意,这是两个正态总体均值之差的假设检验问题,其中 未知,样本容量 .
按题目的要求, 提出
由表 8.3 的第一行, 选取统计量为
令 ,查 分布表或用 软件计算得 2.2281.
经计算
由于 ,所以接受 ,即在显著性水平 下认为甲、乙两厂生产的灯泡的寿命没有显著差异.
另外,请读者执行如下 程序,看有什么结果.
alpha←0.05
t.test(x, y, var.equal=TRUE, conf.level=1-alpha)
表 8.4 两个正态总体方差的假设检验的拒绝域 (显著性水平为 )
序号 | ${H}_{0}$ | ${H}_{1}$ | ${\mu }_{1},{\mu }_{2}$ 已知 | ${\mu }_{1},{\mu }_{2}$ 未知 |
I | ${\sigma }_{1}^{2} = {\sigma }_{2}^{2}$ | ${\sigma }_{1}^{2} \neq {\sigma }_{2}^{2}$ | $\begin{array}{l} \frac{\mathop{\sum }\limits_{{i = 1}}^{m}{\left( {x}_{i} - {\mu }_{1}\right) }^{2}/m}{\mathop{\sum }\limits_{{j = 1}}^{n}{\left( {y}_{j} - {\mu }_{2}\right) }^{2}/n} \leq {F}_{\frac{\alpha }{2}}\left( {m, n}\right) \text{ 或 } \\ \frac{\mathop{\sum }\limits_{{i = 1}}^{m}{\left( {x}_{i} - {\mu }_{1}\right) }^{2}/m}{\mathop{\sum }\limits_{{i = 1}}^{n}{\left( {y}_{i} - {\mu }_{2}\right) }^{2}/n} \geq {F}_{1 - \frac{\alpha }{2}}\left( {m, n}\right) \end{array}$ | $\frac{{S}_{1m}^{*2}}{{S}_{2n}^{*2}} \leq {F}_{\frac{\alpha }{2}}\left( {m - 1, n - 1}\right)$ 或 |
$\frac{{S}_{1m}^{*2}}{{S}_{2n}^{*2}} \geq {F}_{1 - \frac{\alpha }{2}}\left( {m - 1, n - 1}\right)$ | ||||
II | ${\sigma }_{1}^{2} = {\sigma }_{2}^{2}$ | ${\sigma }_{1}^{2} > {\sigma }_{2}^{2}$ | $\frac{\mathop{\sum }\limits_{{i = 1}}^{m}{\left( {x}_{i} - {\mu }_{1}\right) }^{2}/m}{\mathop{\sum }\limits_{{j = 1}}^{n}{\left( {y}_{j} - {\mu }_{2}\right) }^{2}/n} \geq {F}_{1 - \alpha }\left( {m, n}\right)$ | $\frac{{S}_{1m}^{*2}}{{S}_{2n}^{*2}} \geq {F}_{1 - \alpha }\left( {m - 1, n - 1}\right)$ |
III | ${\sigma }_{1}^{2} \leq {\sigma }_{2}^{2}$ | ${\sigma }_{1}^{2} > {\sigma }_{2}^{2}$ | ||
IV | ${\sigma }_{1}^{2} = {\sigma }_{2}^{2}$ | ${\sigma }_{1}^{2} < {\sigma }_{2}^{2}$ | $\frac{\mathop{\sum }\limits_{{i = 1}}^{m}{\left( {x}_{i} - {\mu }_{1}\right) }^{2}/m}{\mathop{\sum }\limits_{{j = 1}}^{n}{\left( {y}_{j} - {\mu }_{2}\right) }^{2}/n} \leq {F}_{\alpha }\left( {m, n}\right)$ | $\frac{{S}_{1m}^{*2}}{{S}_{2n}^{*2}} \leq {F}_{\alpha }\left( {m - 1, n - 1}\right)$ |
V | ${\sigma }_{1}^{2} \geq {\sigma }_{2}^{2}$ | ${\sigma }_{1}^{2} < {\sigma }_{2}^{2}$ |
例 8.2.7 数据和总体假设同例 8.2.6,并设 . 试问在显著性水平 下能否认为两种香烟的尼古丁含量的方差相等?
解 依题意,这是两个正态总体方差比的假设检验问题,其中 27 已知,样本容量 .
按题目的要求, 提出
由表 8.4 的第一行, 选取统计量为
令 ,查 分布表或用 软件计算得 和
经计算
由于 ,所以接受 ,即在显著性水平 下认为两种香烟的尼古丁含量的方差无显著差异.
另外,请读者执行如下 程序,看有什么结果.
mu1←25; mu2←27
alpha←0.05
f←sum((x-mu1)^2)/sum((y-mu2)^2)
list(F=f, f.value=c(qf(alpha/2, length(x),
length(y)), qf(1-alpha/2, length(x), length(y))))
例 8.2.8 数据和总体假设同例 8.2.6,并设 未知. 试问在显著性水平 下能否认为两种香烟的尼古丁含量的方差相等?
解 依题意,这是两个正态总体方差比的假设检验问题,其中 未知, 样本容量 .
按题目的要求, 提出
由表 8.4 的第一行, 选取统计量为
令 ,查 分布表或用 软件计算得 和
经计算
由于 ,所以接受 ,即在显著性水平 下认为两种香烟的尼古丁含量的方差无显著差异.
8.3 非正态总体均值的假设检验
上节我们曾指出, 对于非正态总体参数的假设检验, 一般只能利用近似分布给出拒绝域,此时样本容量 应比较大 (至少要求 ).
由于有了近似分布, 拒绝域的构造方法与正态总体有关参数假设检验拒绝域的构造方法完全雷同, 所以我们只给出有关检验问题用到的近似分布 (有关统计量的记号见表 7.1).
(1) 单个总体 的均值 的假设检验问题:
或 或 .
若方差 已知,当 充分大时,近似地有
若方差 未知,当 充分大时,近似地有
(2) 两个总体 和 的均值差 的假设检验问题:
若方差 和 已知,当 和 充分大时,近似地有
若方差 和 未知,当 和 充分大时,近似地有
8.4 非参数假设检验
本节我们先介绍多项分布的 拟合检验,再介绍一般分布的 拟合检验. 其中所谓的拟合,是用 分布来近似地代替所用统计量的分布.
8.4.1 多项分布的 拟合检验
设总体 服从多项分布
我们的任务是对如下假设检验问题 (I) 作显著性检验:
(I) 不全成立 ,
其中 已知.
直观上,若从样本 出发,我们统计出其中 出现了 次, . 如果原假设 成立,那么根据 “事件发生的频率稳定于概率” 的事实,应有 接近于 ,从而应有 应比较小. 也就是说,若 比较大,就应当拒绝原假设 .
为了得到近似分布, 皮尔逊 (Pearson) 构造了统计量
并证明了,当 充分大时,近似地有
由于 和 都为常数,根据以上分析,当 较大时应拒绝原假设 . 所以,假设检验问题 (I) 的显著性水平为 的拒绝域为
例 8.4.1 7 台机床在相同的条件下, 独立地完成相同的工序. 在一段时间内统计 7 台机床出现故障数的资料如下:
机床代号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
故障次数 | 2 | 10 | 11 | 8 | 13 | 19 | 7 |
试问故障发生的次数是否与机床质量有关 (显著性水平 )?
解 若故障发生的次数与机床质量无关, 则各台机床出现故障的可能性相同,共有 7 台机床,所以各台出现故障的概率为 . 问题可归结为对假设检验问题:
作显著性检验.
按 (8.4.1) 计算得到 ,查 分布表得 . 由于 ,所以应拒绝 ,即不能认为故障发生的次数与机床质量无关.
另外,请读者执行如下 程序,看有什么结果.
v←c(2,10,11,8,13,19,7)
chisq.test(v)
8.4.2 一般分布的 拟合检验
对于一般总体 的非参数检验,我们的任务是对如下的假设检验问题 (II) 作显著性检验:
(II) ,
其中 为已知分布, 为其参数 (一般情况下未知).
我们先作直观分析. 若样本 一次的观测值为 . 根据该观测值取值的情况,我们人为地将实轴 分成 个区间:
且统计出 取值落在第 个区间的个数为 .
若 的参数已知,我们可以计算概率:
…
那么,根据 “事件的频率接近于概率” 的事实,当 较大时,应拒绝原假设 .
然而,一般情况下,参数 是未知的. 此时,若求出参数的最大
似然估计 ,并由此估计概率:
…
那么可以证明 (皮尔逊 - 费希尔 (Pearson-Fisher) 定理) 近似地有
从而假设检验问题 (II) 的显著性水平为 的拒绝域为
例 8.4.2 从维尼纶正常生产线上测得 100 个维尼纶纤度 (表示维尼纶粗细程度的一个量) 数据: 试问可否认为该生产线维尼纶纤度为正态分布. (显著性水平 )?
1.36 | 1.49 | 1.43 | 1.41 | 1.37 | 1.40 | 1.32 | 1.42 | 1.47 | 1.39 |
1.41 | 1.36 | 1.40 | 1.34 | 1.42 | 1.42 | 1.45 | 1.35 | 1.42 | 1.39 |
1.44 | 1.42 | 1.39 | 1.42 | 1.42 | 1.30 | 1.34 | 1.42 | 1.37 | 1.36 |
1.37 | 1.34 | 1.37 | 1.37 | 1.44 | 1.45 | 1.32 | 1.48 | 1.40 | 1.45 |
1.39 | 1.46 | 1.39 | 1.53 | 1.36 | 1.48 | 1.40 | 1.39 | 1.38 | 1.40 |
1.36 | 1.45 | 1.50 | 1.43 | 1.38 | 1.43 | 1.41 | 1.48 | 1.39 | 1.46 |
1.37 | 1.37 | 1.39 | 1.45 | 1.31 | 1.41 | 1.44 | 1.44 | 1.42 | 1.47 |
1.35 | 1.36 | 1.39 | 1.40 | 1.38 | 1.35 | 1.42 | 1.43 | 1.42 | 1.42 |
1.42 | 1.40 | 1.41 | 1.37 | 1.46 | 1.36 | 1.37 | 1.27 | 1.37 | 1.38 |
1.42 | 1.34 | 1.43 | 1.42 | 1.41 | 1.41 | 1.44 | 1.48 | 1.55 | 1.37 |
解 记维尼纶纤度为 ,则问题可归结为检验下面假设.
若 成立,则 和 的最大似然估计分别为样本均值 和样本方差 田效据计算得估计值分别为 和
田具体 100 个数据取值的范围和分布特点, 将数据以组距为 0.03 分为 6 个区间, 并用估计参数查正态分布表得到概率值
并统计数据落在各区间的频数得到: .
区间 $\left( {{a}_{i - 1},{a}_{i}}\right\rbrack$ | 频数 $\left( {\nu }_{i}\right)$ | 估计概率 ${\widehat{p}}_{i}$ |
$( - \infty,{1.355}\rbrack$ | 12 | 0.1446 |
$({1.355},{1.385}\rbrack$ | 22 | 0.1854 |
$({1.385},{1.415}\rbrack$ | 23 | 0.2453 |
$({1.415},{1.445}\rbrack$ | 25 | 0.2157 |
$({1.445},{1.475}\rbrack$ | 10 | 0.1326 |
$\left( {{1.475}, + \infty }\right)$ | 8 | 0.0764 |
因为 ,所以在显著性水平 0.10 下接受 即可以认为维尼纶纤度服从正态分布 .
另外,请读者执行如下 程序,看有什么结果.
$\mathrm{x} < - \mathrm{c}({1.36},{1.49},{1.43},{1.41},{1.37},{1.40},{1.32},{1.42},{1.47},{1.39},{1.41},{1.36}$.
1.40,1.34,1.42,1.42,1.45,1.35,
1.42,1.39,1.44,1.42,1.39,1.42,1.42,1.30,1.34,1.42,1.37,1.36,1.37.
1.34,1.37,1.37,1.44,1.45,1.32,
1.48,1.40,1.45,1.39,1.46,1.39,1.53,1.36,1.48,1.40,1.39,1.38,1.40.
1.36,1.45,1.50,1.43,1.38,1.43,
1.41,1.48,1.39,1.46,1.37,1.37,1.39,1.45,1.31,1.41,1.44,1.44,1.42.
1.47,1.35,1.36,1.39,1.40,1.38,
1.35,1.42,1.43,1.42,1.42,1.42,1.40,1.41,1.37,1.46,1.36,1.37,1.27.
${1.37},{1.38},{1.42},{1.34},{1.43},{1.42},{1.41},{1.41},{1.44},{1.48},{1.55},{1.37})$
$r < - 2$
alpha $< - {0.1}$
$m < - {length}\left( x\right)$
mu.hat<-mean(x); sig.hat<-sd(x)*sqrt((m-1)/m)
a←c(-Inf,1.355,1.385,1.415,1.445,1.475,+Inf)
v←rep(0, length(a)-1)
p←numeric(length(a)-1)
for(i in 1:6)
$\left\{ \begin{array}{l} p\left\lbrack i\right\rbrack = \text{ pnorm ((a[i+1] -mu.hat)/sig.hat) -pnorm ((a[i] -mu.hat)/sig.hat) } \\ \end{array}\right.$
$v\left\lbrack i\right\rbrack < - \operatorname{sum}\left( {a\left\lbrack i\right\rbrack < x\;\& \;x < = a\left\lbrack {i + 1}\right\rbrack }\right)$
\}
$\mathrm{n} < - \operatorname{sum}\left( \mathrm{v}\right)$
$K < - \operatorname{sum}\left( {\left( {v - n * p}\right) \cap 2/\left( {n * p}\right) }\right)$
list(K=K, X2.value=qchisq(1-alpha, length(v)-r-1))
第八章小结与注记
(1) 与参数的区间估计不同, 解决假设检验问题, 首先要针对具体问题提出原假设和备选假设.
(2) 假设检验可以说是概率意义下的反证法. 它基于人们普遍的认知: “小概率事件在一次试验中近乎不发生”. 通过查看构造好的一个 “小概率事件” 是否发生来对假设做出拒绝还是接受的结论. 也正是因为是概率意义下的反证法, 才使得假设检验的结论必然会犯错 (除非样本取完总体的每个个体), 这就是我们所说的两类错误. 在实际应用中, 必须同时控制两类错误, 否则推断的结论是无用的. 比如, 通过抽检判断一批产品是否合格, 若犯了第一类错误, 则使生产万受损: 若犯了第二类错误, 则使使用方受损. 实际应用中, 产品合格检验的国家标准或国际标准, 都是依据在控制第一类错误的前提下, 尽量控制第二类错误的原则, 针对不同的检验问题计算出来的.
限于深度和篇幅的限制, 我们只介绍显著性检验, 并且不涉及检验方法优劣的评价. 需要强调指出的是, 为要显著性检验的结论较为可信或实际中可用, 原假设和备选假设的选取是十分重要的.
(3)与参数的区间估计雷同,对于一般分布的总体,难以得到有关统计量的分布,从而无法找到 “小概率事件”,也就难以作推断. 所以,我们只能介绍正态总体参数的假设检验. 由于假设检验拒绝域的构造与区间估计的构造之间的紧密联系, 假设检验中用到的分布也完全基于第六章的抽样分布基本定理及其推论, 所以正文中我们略去了有关拒绝域的推导, 而留给读者做练习.
(4)分布的拟合检验的思想很简单: “频率的稳定值为概率”, 也就是原假设成立时, 先算出有关概率, 再看对应的频率是否与概率相差不大, 若不是, 则拒绝原假设. 好在皮尔逊已经为我们证明了有关统计量的近似分布 (参见 (8.4.1) 和 (8.4.3)), 我们轻松地得到了拒绝域 (参见 (8.4.2) 和 (8.4.4)).
第八章习题
8.1. 设 是来自正态总体 的样本,考虑检验问题 : . 若检验的拒绝域取为 ,试求该检验犯第一类错误与犯第二类错误的
8.2. 设总体 服从泊松分布,即
其中 是未知的正数, 为来自 的简单随机样本. 对检验问题 ,试求拒绝域为 的检验犯两类错误的概率.
8.3. 设 与 相互独立,分别服从 和 ,其中 已知,对假设检验问题 . 当且仅当 时拒绝原假设 . 试问 为何值时,该检验犯第一类错误的概率为 .
8.4. 根据以往记录,某区域早稻平均亩产为 ,今年选用新早稻品种耕种,收割时, 随机抽取了 10 块,测出每块的实际亩产量为 ,计算得 , 如未知道早稻田产量服从正态分布 ,试在显著水平 下,检验假设 : .
8.5. 设随机地从一批钉子中抽取 10 枚, 测得它们的长度 (单位: cm) 为
设钉子的长度 ,是否可以认为钉子的平均长度 ?
8.6. 从切割机切割所得的金属棒中, 随机抽取 13 根, 测得长度 (单位: cm) 为
设金属棒长度 . 是否可以认为金属棒长度的标准差 (显著水平 ?
8.7. 某种导线的电阻 (单位: ) 服从正态分布,按照规定,电阻的标准差不得超过 0.005 现从一家新厂生产的一批导线中任取 9 根,测得修正样本标准差 ,问这批导线的电阻的标准差,比起规定的电阻的标准差来,是否显著的偏大 (显著水平 )?
8.8. 某电子元件的寿命 (单位: 小时) ,其中 未知,现测得 16 只元件,计算样本均值 ,修正样本标准差 . 试在显著水平 下, 检验下列假设.
(1)元件的平均寿命是否大于 225 小时?
(2) 元件寿命的标准差 是否等于 100 ?
8.9. 甲、乙两公司都生产 的光盘,从甲生产的产品中抽查了 7 张光盘. 从乙生产的产品中抽查了 9 张光盘, 分别测得它们的存储量如下: 现已知甲的光盘储量 . 在显著水平 下,比较甲、乙两家公司生产的光盘的平均储量有无显著差异?
甲(X) | 683 | 682 | 683 | 678 | 681 | 680 | 677 | ||
乙(Y) | 681 | 682 | 671 | 677 | 680 | 677 | 679 | 681 | 683 |
8.10. 为了研究正常成年男、女血液红细胞数 (单位: 万 ) 的差异,随机地抽取正常成年男、女各 26 名、14 名,计算得样本均值分别为 ,修正样本标准差分别为 . 假定正常男、女的红细胞数服从正态分布且方差相等,试位验该地正常成年人的细胞平均数是否与性别有关 ?
8.11. 人们发现在早期酿造啤酒时, 在麦芽干燥过程中形成致癌物质亚硝酸基二甲氨. 到后期开发了一种新的麦芽干燥过程, 下面给出分别在新老两种过程中形成亚硝酸基二甲氨含量 (以 10 亿份中的份数计):
老过程:6,4,5,5,6,5,5,6,4,6,7,4
新讨程:2,1,2,2,1,0,3,2,1,0
假定两样本分别来自正态总体, 且两总体的方差相等, 但参数均未知, 两样本独立, 分别以 记对应于老、新过程的总体均值,试在显著水平 检验假设: 2. .
8.12. 比较甲乙两种棉花品种的优劣, 假设用它们纺出的棉纱强度分别服从正态分布 ,试验者分别从这两种棉纱中抽取样本容量 的样本, 测得样本均值分别为 ,修正样本方差分别为 . 设两样本相互独立. 试分别在下列条件下 (水平 ),检验假设: . (1) ,(2) 未知.
8.13. 应用某药物治疗 9 位高血压病人,治疗前后的舒张压 (单位:p / kPa) 见下表: 设治疗前后的舒张压之差服从正态分布,试在显著水平 下,检验该药物对降低舒张压是否有显著疗效?
病人编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
治疗前 | 12.8 | 13.3 | 13.3 | 14.1 | 13.6 | 14.4 | 13.3 | 13.1 | 13.3 |
治疗后 | 11.7 | 12.3 | 13.1 | 13.6 | 13.1 | 13.6 | 12.8 | 13.1 | 12.5 |
8.14. 某种物品在处理前与处理后分别抽样分析其含脂率如下:
处理前:0.19,0.18,0.21,0.30,0.41,0.12,0.27
处理后:0.15,0.13,0.07,0.24,0.19,0.06,0.08,0.12
设处理前后的含脂率都服从正态分布,试在显著水平 下,检验处理前后含脂率的方差是否有显著差异?
8.15. 甲、乙两台车床生产的某种零件的直径 (单位: ) 都服从正态分布,为了比较两台车床的加工精度有无差别, 现从甲、乙两台车床生产的零件中分别抽取 8 个和 9 个, 测得直径如下:
<table><tr><td>甲车床生产的零件</td><td>15.0,14.5,15.2,15.5,14.9,15.1,15.1,14.8</td></tr><tr><td>乙车床生产的零件</td><td>15.2,15.0,14.8,15.2,15.0,15.1,14.8,15.1,14.8</td></tr></table>
是否可以认为乙车床产品的方差不大于甲车床产品的方差 (显著水平 )?
8.16. 为了比较水稻品种甲与乙的产量, 随机抽选取 18 块环境相近的试验田, 在其中的 8 块试验田种植甲品种, 在其中的 10 块试验田种植乙品种, 测得亩产量如下 (单位: kg):
甲类:910,1028,983,1015,954,1012,930,925,
乙类:833,935,898,870,960,967,898,880,903,826
假设两种水稻产量均服从正态分布,试在显著水平 下,检验两个品种的产量是否服从相同的分布.
8.17. 某工厂 (工作日为周一至周五) 近五年发生了 63 次事故, 按星期几记录如下表:
问在显著水平 下可否认为事故的发生次数与星期几有关?
8.18. 从总体 中抽取容量为 100 的样本,频数分布如下表:
区间 | $\lbrack 0,{0.2})$ | $\lbrack {0.2},{0.4})$ | $\lbrack {0.4},{0.6})$ | $\lbrack {0.6},{0.8})$ | $\left\lbrack {{0.8},1}\right\rbrack$ |
频数 | 3 | 12 | 19 | 28 | 38 |
设能否被接受. 试在显著水平 下,检验该总体的分布密度函数为 的假