前面我们已经提到, 数理统计的基本特征是用局部推断整体.

这个整体在数理统计中我们称之为总体, 也就是为了某一目的而要研究的对象的全体, 而将每个对象称为个体. 但是, 实际中我们往往关心的研究对象某方面的数量特征, 比如灯泡的寿命、一台机器正常工作的持续时间、某种药物的疗效等. 由于在对一个个体进行试验或观测结束之前, 我们无法预知该数量的取值, 这一点类似于我们前节所介绍的随机变量. 所以, 我们可以认为

总体就是一个随机变量, 每次试验后, 获得的一个个体的具体取值就是该随机变量的一次观测值.

另外, 若我们准备抽取 个个体进行试验或观测, 会得到 个数值, 我们称之为样本. 但在试验或观测结束之前, 也无法预知各个的取值, 所以从概率分析的角度讲, 样本是一个随机变量.

定义 (总体 样本)

我们以后所说的总体, 就是一个随机变量 ,

  • 通常记 的分布函数为 ,
    • 其中 为参数, 称为参数空间, 它可能包含多个参数.
  • 样本为 维随机向量 ,
    • 称为样本容量.
  • 样本的一次具体取值 称为 样本观测值.
Link to original

数理统计就是从样本出发, 推断总体的分布或数字特征. 为处理方便,初等数理统计中都假定 同分布, 且相互独立. 此时我们称 为简单随机样本,简称为样本.

基于以上讨论和随机变量独立性的定义 (定义 3.1.3) 和定理 3.1.2, 我们有命题 6.1.1.

命题 6.1.1 (样本联合分布的形式与独立同分布假设)

设总体 为其样本,则

其中的 可以是分布函数, 也可以是分布密度函数 (对于连续型随机变量) 或概率分布 (对于离散型随机变量).

Link to original

例 6.1.1 (正态分布的样本联合分布)