第六章 数理统计的基本概念
数理统计是统计学的重要分支, 具有广泛的应用. 大家知道, 现场统计是流水账式的统计, 它记录所有发生的结果, 比如一个生产班组的领取原料的件数或数量、产品件数及各项指标等都一一作记录. 再比如一批产品的各个产品的每项技术指标都作记录. 数理统计有别于现场统计的最本质特征可以概括为 “用局部推断整体”. 比如,从一批产品中抽取 件做检验后,来推断该批产品的合格品率. 这就使得数理统计所作推断的结论不可避免地存在偏差或错误, 而刻画或把握这种偏差的有效方法就是概率论. 概率论通过给出各种各样的统计量所服从的分布或数字特征, 来演绎地评价各种统计方法的优劣或置信程度. 一般来讲, 数理统计的方法大多来自简单的直观想法或概率论的有关基本事实 (比如大数定律、中心极限定理或某些渐近分布), 而要评价这些方法则需要比较艰深的概率论推导或证明.
本章介绍数理统计的基本概念, 包括总体、样本、统计量等, 着重介绍三种重要的分布,即 分布、 分布和 分布,并介绍正态总体的样本均值、样本方差及其有关统计量的分布.
6.1 总体、样本和统计量
6.1.1 总体与样本
前面我们已经提到, 数理统计的基本特征是用局部推断整体. 这个整体在数理统计中我们称之为总体, 也就是为了某一目的而要研究的对象的全体, 而将每个对象称为个体. 但是, 实际中我们往往关心的研究对象某方面的数量特征, 比如灯泡的寿命、一台机器正常工作的持续时间、某种药物的疗效等. 由于在对一个个体进行试验或观测结束之前, 我们无法预知该数量的取值, 这一点类似于我们前节所介绍的随机变量. 所以, 我们可以认为总体就是一个随机变量, 每次试验后, 获得的一个个体的具体取值就是该随机变量的一次观测值. 另外, 若我们准备抽取 个个体进行试验或观测,会得到 个数值,我们称之为样本. 但在试验或观测结束之前, 也无法预知各个的取值, 所以从概率分析的角度讲, 样本是一个随机变量.
总之,我们以后所说的总体,就是一个随机变量 ,通常记 的分布函数为 ,其中 为参数, 称为参数空间,它可能包含多个参数. 样本为 维随机向量 称为样本容量. 样本的一次具体取值 称为样本观测值. 数理统计就是从样本出发,推断总体的分布或数字特征. 为处理方便,初等数理统计中都假定 与 同分布, 且相互独立. 此时我们称 为简单随机样本,简称为样本.
基于以上讨论和随机变量独立性的定义 (定义 3.1.3) 和定理 3.1.2, 我们有命题 6.1.1.
命题 6.1.1 设总体 为其样本,则
其中的 可以是分布函数,也可以是分布密度函数 (对于连续型随机变量) 或概率分布 (对于离散型随机变量).
例 6.1.1 设总体 为其样本,则 , 的联合分布密度函数为
6.1.2 统计量
按上所述,总体 是我们研究的目标,而出发点是样本 , 那么研究的途径或手段就是所谓的统计量. 它的直观意思是要通过对样本观测值的处理, 来回答或推断总体的分布、数字特征、参数等. 所以统计量就是样本 的一个函数,但其中不能含未知参数,否则由观测值得不出任何结果.
常用的统计量有以下几种:
(1) 样本均值: . R 软件中用 mean(x) 来计算,其中 为样本观测值 (下同).
(2) 样本方差: 软件中用 来计算. 修正样本方差: 软件中用 来计算. 显然, .
(3) 样本 阶原点矩: .
(4) 样本 阶中心矩: .
(5) 顺序统计量: ,其中 , ,而 是将 的取值从小到大排列第 位的值.
(6) 样本中位数:
软件中用 median(x)来计算.
(7) 样本极差: 软件中用 来计算.
6.2 经验分布函数
前已指出, 数理统计的核心任务是 “从局部推断整体”, 具体地讲, 从样本 出发,推断总体 的统计特性. 在中学教材中,大家学过的频率直方图就是一种用样本观测值近似拟合总体分布密度函数的直观方法. 那么, 从理论上讲,从局部能够推断整体吗? 或者说样本 何时才能近似反映总体 的特性呢?
本节所介绍的经验分布的逼近性质从理论上给出了肯定的答案.
设总体 的样本 的一次观测值为 ,将其从小到大排列为 . 令
称 为总体 的一个经验分布函数 (或样本分布函数).
设总体 的分布函数为 ,利用伯努利大数定律 (参见推论 5.1.1) 容易证明,对任意 ,有
另外,格里汶科 证明了更强的结果,即
以上的事实 (6.2.1) 和 (6.2.2) 都表明,当样本容量 足够大时,经验分布函数与总体的分布函数差距很小. 这从理论上说明, 当样本容量较大时, 近似推断总体是可能的.
6.3 抽样分布
为了用概率方法来探讨一个统计量在推断总体时的性能或把握推断结论的置信程度, 我们必须要知道统计量的分布或近似分布. 所以我们下面先讨论一些具体统计量的分布, 通常称为抽样分布.
我们先讨论统计量的数字特征.
6.3.1 样本均值与样本方差的数字特征
. 则 命题 6.3.1 设 是来自总体 的样本,
(1)
(2)
证明 (1) .
(2) 由于
所以
6.3.2 三种重要的概率分布
1. 分布
在例 2.4.2 中我们提到,若 ,则
一般地,若 的分布密度为
则称 服从参数为 和 的 分布,记为 软件中的分
布名为 gamma. 此时
利用 3.4 节给出的独立随机变量和的分布密度的卷积公式 (3.4.5), 经简单推导可得 分布的可加性,即若 ,且 与 相互
独立, 则
(6.3.6)
由式 (6.3.3) 和式 (6.3.6) 我们得到命题 6.3.2.
命题 6.3.2 设总体 为其简单随机样本,则
在数理统计中,若 ,则称 服从自由度为 的 分布,记为 软件中的分布名为 chisq,其分布密度函数为
图形如图 6.1 所示.
图 分布密度函数示意图
由式 (6.3.5) 和式 (6.3.6) 容易看出 分布具有如下性质:
(1) 若 ,则 .
(2) 若 ,则 .
另外, 利用命题 6.3.2 和中心极限定理 (定理 5.2.1) 容易看出
(3) 若 分布,则当 趋于无穷时, 近似地服从 .
2. 分布
命题 6.3.3 设 ,且 与 相互独立,令
则 的分布密度函数 为
命题 6.3.3 的证明也是初等的,但需稍繁的积分计算,我们在此从略. 若 的分布密度函数如 (6.3.9),则称 服从自由度为 的 分布,记为 软件中的分布名为 .
分布的密度函数图形如图 6.2 所示,它是关于原点对称的. 简单的求极限可知,当 时, 分布渐近于 . 另外,经简单积分可知,若
,则
图 分布密度函数示意图
- 分布
命题 6.3.4 若 ,且 与 独立. 令
则 的分布密度函数为
命题 6.3.4 的证明中用到的积分计算稍繁,我们在此从略. 若 的分布密度函数如式 (6.3.11),则称 所服从的分布为 第一自由度为 、第二自由度为 的 分布,记为 软件中的分布名为 分布的密度函数如图 6.3 所示,显然 分布具有性质:
图 分布密度函数示意图
若 ,则 .
6.3.3 分位数
在统计推断过程中 (比如后文介绍的参数的区间估计和假设检验中). 已知总体 的分布及某概率值 ,需要知道 小于和等于哪个数的概率为 . 这个数称为 的 分位数,亦即,
设 ( 为某种分布, 为有关自由度), . 称满足
的数 为分布 的 分位数 (或分位点)
几种常用分布的分位数如图 6.4 - 图 6.7 所示.
图 分布分位点示意图.
图 分布分位点示意图.
图 分布分位点示意图.
图 分布分位点示意图.
由于 和 的分布密度函数的积分较为复杂 (或个可能),有关概率的计算只能查表,这些表是经数值计算得到的. 如用 软件则不用查表, 而是调用专门的分位数函数, 它们的格式是 quantile(分位数) 的第一个字母 q 后续分布名及圆括弧 ( ) 内写概率值 和有关参数值,如 qnorm . 等.
如需查表, 我们需要说明几点:
(i) 对于 分布,由于当 趋于无穷时,其极限分布为 ,所以自由度较大时,用标准正态分布的分位数 代替 的分位数.
(ii) 若 分布,则当 趋于无穷时, 近似地服从 ,所以当自由度较大时,近似地有 .
(iii) 对于 分布和 ,有 .
例 6.3.1 查表或用 R 软件,求
(1) 和 .
(2) 和 .
(3) .
解 (1)
查表时,一般查不到 ,而是用正态分布近似,即 .
(2)
查表时,一般查不到 ,而是用正态分布近似,即 .
(3)
查表时,一般查不到 ,而是用 ,
6.3.4 正态总体的抽样分布
定理 6.3.1 (抽样分布基本定理) 设总体 为其样本,则样本均值 ,并且 与 相互独立.
由于篇幅限制, 我们略去定理 6.3.1 的证明, 但从中我们看到正态分布的极
(1) 由于 独立且都服从正态分布,从而 服从 维正态分布. 由命题 3.4.1 知, 服从正态分布.
(2) ,即 是 的函数,二者却相互独立.
从定理 6.3.1 的事实出发, 利用命题 6.3.2、命题 6.3.3 和命题 6.3.4 中给出的 分布、 分布和 分布的定义,容易证明如下四个推论,它们在后文的分析过论中将发挥关键性的作用.
相互独立, 开且 推论 6.3.1 设总体 为其样本,则 与
推论 6.3.2 设总体 为其样本,则
推论 6.3.3 设总体 为其样本. 样本均值为 ,样本方差为 ; 另有与 独立的总体 为具样本,样本均值为 ,样本方差为 . 则
推论 6.3.4 在推论 6.3.3 的假定中,若 ,则
其中 .
对于顺序统计量, 用初等概率论的一般方法, 容易证明命题 6.3.5.
命题 6.3.5 设总体 的分布函数为 ,分布密度函数为 ,则
(6.3.17)特别地,
第六章小结与注记
(1)总体与样本是数理统计最基本的两个概念,其直观意义很明确. 但只有把它们归结为一个随机变量和一个随机向量, 才便于对统计方法和结果作概率上的分析论证. 基于数学工具的限制, 我们不得不限制样本为 “简单随机样本”, 亦即, 各分量间相互独立, 且都与总体同分布. 试想一批产品有 100 件, 从中抽取 10 件做检验, 来推断该批产品的不合格品率. 有放回抽取较为准确还是无放回较为准确?有放回抽取是独立试验还是无放回抽取是独立试验?
我们说, 数理统计就是 “由局部推断整体”. 现在就可以具体化为: 总体是数理统计的研究目标, 而样本是数理统计的出发点.
(2)统计量则是由出发点到目标的途径. 直观上, 统计量就是样本的函数, 也就是要对样本经过处理才能说明总体. 当然, 直观和理论上, 我们都不希望它包含未知参数, 否则就得不出结果, 一切都是徒劳的.
(3)由于我们通过统计量来说明总体,所以把握统计量的统计特性就非常重要. 遗憾的是, 对于一般分布的总体, 其统计量的分布很难得到, 即使对样本均值和样本方差这样简单的统计量也是如此. 对这种总体的处理, 往往用 “大样本埋论”来研究, 即样本容量较大时, 通过求统计量的近似分布来完成对统计方法的
只有对正态总体, 其样本均值、样本方差的分布可以求得, 且二者独立 (见抽样分布基本定理),从而根据几个特殊的分布 分布、 分布和 分布) 的定义, 我们得到了几种重要的样本函数的分布 (参见推论 6.2.1 - 推论 6.3.4), 它们在后续参数的区间估计和假设检验中起到关键作用.
(4)顺序统计量也有直观的应用, 但其分布往往难以求得, 甚至于正态总体的顺序统计量的分布都没有显式表达式. 一般较少用到.
第六章习题
6.1. 设 是来自总体 的样本,并设
试在下列情形下指出哪些随机变量是统计量:
(1) 在 已知, 未知的情形下. (2) 在 均未知的情形下.
6.2. 设 是来自总体 的一个样本,且
问非零常数 取何值时,随机变量 服从 分布?
6.3. 设 是来自总体 的简单随机样本. 求常数 ,使得
服从 分布,并指出其自由度.
6.4. 设 是来自总体 的简单随机样本. 试确定正数 . 使得 服从 分布,并指出其自由度.
6.5. 设 是来自总体 的一个样本,记
确定 服从何种分布,并说明缘由.
6.6. 设 是来自总体 的一个样本,记
试确定 所服从的分布.
6.7. 设总体 ,从 中抽得样本 ,记
确定 服从何种分布,并说明缘由.
6.8. 设总体 ,从 中抽取样本 ,记
求 (1) 和 的分布密度函数. (2) .
6.9. 设总体 的密度函数为
是来自 的简单随机样本,求 (1) 的分布密度函数. (2) .
6.10. 设总体 的概率分布为 为来自 的样本,求 (1) . (2) .
6.11. 设 分别为样本 的均值与方差,而 是第 次观测量, 试证:
(1) .
(2) .
6.12. 设总体 ,而 是来自 的样本,(1) 求 . (2) 求 .
6.13. 设 是来自 分布 的简单随机样本, 分别为样本均值与样本方差.
(2) 求 . (3) 证明: .
6.14. 设总体 为来自 的样本, 分别为样本均值与方差,求 (1) 之值,(2) 之值.
6.15. 请查表或利用 软件给出下列分位数:
(1) (4) . (5) .
6.16. 设 为来自 的样本, . 求
(1) 之值. (2) 之值.
6.17. 设总体 为来自 的样本, , 求 之值.
6.18. 设 为来自 的样本, 为来自 的
样本,且两样本独立,令 ,求 之值.
6.19. 设 为来自 的样本,求
(1) 之值.
(2) .