证明标准化样本均值在大样本下的近似正态性 (方差未知)

目标： 证明一般地，设 $X_{1}, ..., X_{n}$ 是从具有期望 $E [X] = μ$ 和有限方差 $Va r (X) = σ^{2} > 0$ 的分布 $F_{X} (\cdot, θ)$ 中抽取的独立同分布 (i.i.d.) 随机样本。令 $\overset{ˉ}{X} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}$ 为样本均值， $S_{n}^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2}$ 为无偏样本方差（ $S_{n} = S_{n}^{2}$ 为样本标准差）。我们需要证明，当样本容量 $n$ 充分大时，近似地有： $T_{n} = \frac{X ˉ - E [ X ]}{S _{n} / n} \sim N (0, 1) (近似地)$ 更准确地说，我们要证明 $T_{n}$ 在分布上收敛于标准正态分布 $N (0, 1)$ ，即 $T_{n} d N (0, 1)$ as $n \to \infty$ 。

所需关键定理：

中心极限定理 (Central Limit Theorem, CLT): 对于具有有限均值 $μ$ 和有限方差 $σ^{2}$ 的任意分布，其 i.i.d. 样本的均值 $\overset{ˉ}{X}$ 经过标准化后，当 $n \to \infty$ 时在分布上收敛于标准正态分布。即： $Z_{n} = \frac{X ˉ - μ}{σ / n} d Z \sim N (0, 1)$
大数定律 (Law of Large Numbers, LLN): 样本矩依概率收敛于相应的总体矩。具体地，无偏样本方差 $S_{n}^{2}$ 依概率收敛于总体方差 $σ^{2}$ 。 $S_{n}^{2} p σ^{2} as n \to \infty$
连续映射定理 (Continuous Mapping Theorem): 若 $g$ 是连续函数，且 $A_{n} p a$ ，则 $g (A_{n}) p g (a)$ 。若 $A_{n} d A$ ，则 $g (A_{n}) d g (A)$ 。
斯卢茨基定理 (Slutsky’s Theorem): 若 $A_{n} d A$ 且 $B_{n} p b$ (其中 $b$ 是常数)，则：
- $A_{n} + B_{n} d A + b$
- $A_{n} B_{n} d A b$
- $A_{n} / B_{n} d A / b$ (若 $b \neq = 0$ )

证明步骤：

应用中心极限定理:
- 根据题设， $X_{1}, ..., X_{n}$ 是 i.i.d. 样本，具有有限均值 $μ = E [X]$ 和有限方差 $σ^{2} = Va r (X)$ 。
- 由中心极限定理，我们知道： $Z_{n} = \frac{X ˉ - μ}{σ / n} d Z \sim N (0, 1) as n \to \infty$
应用大数定律于样本方差:
- 无偏样本方差为 $S_{n}^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2}$ 。
- 根据大数定律，样本方差依概率收敛于总体方差： $S_{n}^{2} p σ^{2} as n \to \infty$
- 由于函数 $g (x) = x$ 在 $x > 0$ 时是连续的，根据连续映射定理（应用于依概率收敛）： $S_{n} = S_{n}^{2} p σ^{2} = σ as n \to \infty$ (这里我们假设 $σ^{2} > 0$ ，即 $σ > 0$ )。
应用斯卢茨基定理:
- 我们要考察的统计量是 $T_{n} = \frac{X ˉ - μ}{S _{n} / n}$ 。
- 将 $T_{n}$ 进行改写，使其与 $Z_{n}$ 建立联系： $T_{n} = \frac{X ˉ - μ}{S _{n} / n} = \frac{X ˉ - μ}{σ / n} \cdot \frac{σ / n}{S _{n} / n} = (\frac{X ˉ - μ}{σ / n}) \cdot (\frac{σ}{S _{n}})$ $T_{n} = Z_{n} \cdot \frac{σ}{S _{n}}$
- 我们已经知道：
  - $Z_{n} d Z \sim N (0, 1)$ （来自步骤 1）。
  - $S_{n} p σ$ （来自步骤 2）。
- 考虑因子 $\frac{σ}{S _{n}}$ 。由于 $S_{n} p σ$ 且 $σ$ 是一个非零常数，根据依概率收敛的性质以及连续映射定理（对于函数 $g (x) = 1/ x$ ，在 $x = σ \neq = 0$ 处连续）： $\frac{S _{n}}{σ} p \frac{σ}{σ} = 1$ $\frac{σ}{S _{n}} p \frac{σ}{σ} = 1$
- 现在我们有 $T_{n} = Z_{n} \cdot (σ / S_{n})$ ，其中 $Z_{n} d N (0, 1)$ 且 $(σ / S_{n}) p 1$ 。
- 应用斯卢茨基定理（ $A_{n} d A$ , $B_{n} p b ⟹ A_{n} B_{n} d A b$ ）： $T_{n} = Z_{n} \cdot \frac{σ}{S _{n}} d Z \cdot 1 = Z$
- 因为 $Z \sim N (0, 1)$ ，所以我们证明了： $\frac{X ˉ - E [ X ]}{S _{n} / n} d N (0, 1) as n \to \infty$

结论：

该证明表明，即使总体方差 $σ^{2}$ 未知，只要我们用其一致估计量（样本标准差 $S_{n}$ ）来替换中心极限定理中的 $σ$ ，得到的统计量 $T_{n} = \frac{X ˉ - μ}{S _{n} / n}$ 在大样本条件下 ( $n \to \infty$ ) 的极限分布仍然是标准正态分布 $N (0, 1)$ 。

这就是为什么在样本容量 $n$ 充分大时，我们可以近似地认为 $\frac{X ˉ - E [ X ]}{S _{n} / n} \sim N (0, 1)$ ，并基于此进行关于总体均值 $E [X]$ 的假设检验或构造置信区间（此时通常可以直接使用正态分布的临界值，或自由度很大的 t 分布临界值，因为 $t (df) \to N (0, 1)$ as $df \to \infty$ ）。这个结果不要求总体必须是正态分布，只需要均值和方差有限即可，体现了中心极限定理和相关极限定理的强大威力。

Youliang Zhong

Backlinks

Graph View

证明标准化样本均值在大样本下的近似正态性 (方差未知)

Youliang Zhong

Backlinks

Graph View

证明 标准化样本均值在大样本下的近似正态性 (方差未知)

证明标准化样本均值在大样本下的近似正态性 (方差未知)