前面我们已经提到, 数理统计的基本特征是用局部推断整体.
这个整体在数理统计中我们称之为总体, 也就是为了某一目的而要研究的对象的全体, 而将每个对象称为个体. 但是, 实际中我们往往关心的研究对象某方面的数量特征, 比如灯泡的寿命、一台机器正常工作的持续时间、某种药物的疗效等. 由于在对一个个体进行试验或观测结束之前, 我们无法预知该数量的取值, 这一点类似于我们前节所介绍的随机变量. 所以, 我们可以认为
总体就是一个随机变量, 每次试验后, 获得的一个个体的具体取值就是该随机变量的一次观测值.
另外, 若我们准备抽取 个个体进行试验或观测, 会得到 个数值, 我们称之为样本. 但在试验或观测结束之前, 也无法预知各个的取值, 所以从概率分析的角度讲, 样本是一个随机变量.
定义 (总体 样本)
我们以后所说的总体, 就是一个随机变量 ,
Link to original
- 通常记 的分布函数为 ,
- 其中 为参数, 称为参数空间, 它可能包含多个参数.
- 样本为 维随机向量 ,
- 称为样本容量.
- 样本的一次具体取值 称为 样本观测值.
数理统计就是从样本出发, 推断总体的分布或数字特征. 为处理方便,初等数理统计中都假定 与 同分布, 且相互独立. 此时我们称 为简单随机样本,简称为样本.
基于以上讨论和随机变量独立性的定义 (定义 3.1.3) 和定理 3.1.2, 我们有命题 6.1.1.
命题 6.1.1 (样本联合分布的形式与独立同分布假设)
设总体 为其样本,则
其中的 可以是分布函数, 也可以是分布密度函数 (对于连续型随机变量) 或概率分布 (对于离散型随机变量).
Link to original