总体 是指研究对象的某个性能指标的全体,通常用一随机变量 X 代表总体.
个体 是指每一个研究对象.
样本 从总体中取 n 个个体,称作来自总体的容量为 n 的样本.
简单随机样本 是指 n 个相互独立,而且与总体 X 同分布的随机变量 X 1 , X 2 , ⋯ , X n ,简称随机样本,也常以随机向量 ( X 1 , X 2 , ⋯ , X n ) 表示. 它们的一组观察值 x 1 , x 2 , ⋯ , x n 称为样本值.
统计量 称不含未知参数的样本函数 g ( X 1 , X 2 , ⋯ , X n ) 为统计量.
常见统计量
X ˉ = n 1 i = 1 ∑ n X i 为样本均值,
S 2 = n − 1 1 i = 1 ∑ n ( X i − X ˉ ) 2 为样本方差,
S = S 2 称为样本标准差,
A k = n 1 i = 1 ∑ n X i k 为 k 阶样本原点矩,
B k = n 1 i = 1 ∑ n ( X i − X ˉ ) k 为 k 阶样本中心矩,
其中 B 2 = S n 2 = n 1 i = 1 ∑ n ( X i − X ˉ ) 2 = n n − 1 S 2 .
经验分布函数
从总体 X 中抽取一个容量为 n 的样本,将其观察值 ( x 1 , x 2 , ⋯ , x n ) 按大小顺序,重新排列如下 x 1 ∗ ≤ x 2 ∗ ≤ ⋯ ≤ x n ∗ , 对于任意的实数 x ,定义函数 F n ( x ) = ⎩ ⎨ ⎧ 0 , n k , 1 , x < x 1 ∗ x k ∗ ≤ x < x k + 1 ∗ , k = 1 , 2 , ⋯ , n − 1 x n ∗ ≤ x 称 F n ( x ) 为总体 X 由 x 1 , x 2 , ⋯ , x n 所决定的样本分布函数或经验分布函数.
格列汶科定理 当 n → ∞ 时, F n ( x ) 依概率 1 关于 x 均匀地收敛于 F ( x ) . 即说明: 当 n 很大时,样本分布函数 F n ( x ) 近似于总体分布函数 F ( x ) .
χ 2 分布
(1) 定义: 设随机变量 X 1 , ⋯ , X n 相互独立同分布 N ( 0 , 1 ) ,若有 χ 2 = i = 1 ∑ n X i 2 ,则随机变量 χ 2 概率论与数理统计习题精选精解的分布称为 n 个自由度的 χ 2 分布. 即 χ 2 ∼ χ 2 ( n ) . 其概率密度函数为 φ ( x ) = { 2 2 n Γ ( 2 n ) 1 x 2 n − 1 e − 2 x , 0 , x > 0 x ≤ 0
用图形表示其密度函数为图 6-1.
(2) 性质:
E ( χ 2 ( n ) ) = n , D ( χ 2 ( n ) ) = 2 n .
设 X ∼ χ 2 ( m ) , Y ∼ χ 2 ( n ) ,且 X 与 Y 相互独立. 则 X + Y ∼ χ 2 ( m + n ) .
上 α 分位点:对于给定的正数 α ( 0 < α < 1 ) ,称满足条件 P { χ 2 > χ α 2 ( n ) } = α 的点 χ α 2 ( n ) 为 χ 2 分布的上 α 分位点.
t 分布
(1)定义: 设随机变量 X 与 Y 相互独立. X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) ,若 T = n Y X ,则随机变量 T 的分布称为 n 个自由度的 t 分布,即 T ∼ t ( n ) ,其概率密度函数为 φ ( x ) = nπ Γ ( 2 n ) Γ ( 2 n + 1 ) ( 1 + n x 2 ) − 2 n + 1 ( − ∞ < x < + ∞ ) .
用图形表示其概率密度为图 6-2
(2) 性质:
E ( t ( n ) ) = 0 , D ( t ( n ) ) = n − 2 n ( n > 2 ) ;
n → ∞ lim φ ( x ) = 2 π 1 e − 2 x 2 ,故 n 足够大时, t 分布近似于 N ( 0 , 1 ) ;
若 T ∼ t ( n ) ,则 T 2 ∼ F ( 1 , n ) ;
(3)上 α 分位点: t ( n ) 分布的上 α 分位点 t α ( n ) 是指满足 P { T > t α ( n ) } = α ( 0 < α < 1 ) 的点 t α ( n ) . 其中 t 1 − α ( n ) = − t α ( n ) .
F 分布
(1)定义: 设随机变量 X 与 Y 相互独立,且分别服从 χ 2 ( m ) 和 χ 2 ( n ) 分布,若 F = n Y m X ,则 F 服从自由度为 m , n 的 F 分布. 即 F ∼ F ( m , n ) ,其概率密度函数为 φ ( x ) = ⎩ ⎨ ⎧ Γ ( 2 m ) Γ ( 2 n ) Γ ( 2 m + n ) m 2 m n 2 n ( m x + n ) 2 m + n x 2 m − 1 , 0 , x > 0 x ≤ 0
用图形表示其概率密度函数为图 6-3
(2)性质:
若 X ∼ F ( m , n ) ,则
E ( X ) = n − 2 n ( n > 2 ) ,
D ( X ) = m ( n − 2 ) 2 ( n − 4 ) n 2 ( 2 m + 2 n − 4 ) ( n > 4 ) ;
若 X ∼ F ( m , n ) ,则 X 1 ∼ F ( n , m ) ;
上 α 分位点:满足 P { F > F α ( m , n ) } = α ( 0 < α < 1 ) 的点 F α ( m , n ) 称为上 α 分位点, 且 F 1 − α ( m , n ) = F α ( n , m ) 1 .
正态总体的常用结论
若总体 X 服从正态分布 N ( μ , σ 2 ) , X 1 , ⋯ , X n 是其样本, X ˉ 和 S 2 分别为样本均值和方差, 则
X ˉ ∼ N ( μ , n σ 2 ) 或 σ X ˉ − μ n ∼ N ( 0 , 1 ) ;
σ 2 ( n − 1 ) S 2 ∼ χ 2 ( n − 1 ) ;
S X ˉ − μ n ∼ t ( n − 1 ) ;
X ˉ 与 S 2 相互独立.
若 X 1 , X 2 , ⋯ , X n 和 Y 1 , Y 2 , ⋯ , Y m 分别表示取自两个正态总体 N ( μ 1 , σ 1 2 ) 和 N ( μ 2 , σ 2 2 ) 的简单随机样本, X ˉ , Y ˉ 和 S 1 2 , S 2 2 分别表示其样本均值和方差,则有
σ 1 2 S 1 2 / σ 2 2 S 2 2 ∼ F ( n − 1 , m − 1 ) ;
n + m mn ( n + m − 2 ) ( n − 1 ) S 1 2 + ( m − 1 ) S 2 2 ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) ∼ t ( n + m − 2 ) . (当 σ 1 2 = σ 2 2 时)