推论 6.3.4 (两正态总体均值差的t分布检验统计量)
\frac{\left( {\bar{X} - \bar{Y}}\right) - \left( {{\mu }_{1} - {\mu }_{2}}\right) }{{S}_{w}\sqrt{\frac{1}{m} + \frac{1}{n}}} \sim t\left( {m + n - 2}\right), \tag{6.3.16}
合并方差
是合并样本方差 (Pooled Sample Variance),定义为: 这里 和 是各自的无偏样本方差。
证明思路
利用 t 分布的定义。一个自由度为 的 t 随机变量可以表示为 ,其中:
- 是一个标准正态随机变量,。
- 是一个自由度为 的卡方随机变量,。
- 和 相互独立。
我们需要将目标统计量 构造成上述形式,并找出对应的 ,然后证明它们满足条件。
证明步骤
-
构造标准正态部分 (Z):
- 考虑样本均值之差 。
- 由于 ,我们知道 。
- 由于 ,我们知道 。
- 因为两样本独立,所以 和 独立。
- 独立正态变量的线性组合仍服从正态分布:
- 将其标准化,得到标准正态变量 Z:
- 因此,我们找到了满足 的部分。
-
构造卡方部分 (V) 并确定自由度 (k):
- 我们知道,对于来自正态总体的样本,样本方差与总体方差的关系如下:
- 由于两样本独立,所以 和 独立,进而上述两个卡方变量也独立。
- 独立卡方变量的和服从卡方分布,自由度为各自自由度之和。定义 为它们的和:
- 该变量 服从自由度为 的卡方分布。
- 注意到 的分子恰好与 的定义相关:。
- 因此,我们可以将 写为:
- 我们找到了 ,其中 。
-
证明 Z 和 V 的独立性:
- 对于从正态总体抽取的单个样本,样本均值和样本方差是相互独立的。即 独立于 , 独立于 。
- 由于两个样本是相互独立的,因此 这四个统计量是相互独立的(除了均值与各自方差的独立性外,不同样本的统计量之间也独立)。
- 是 和 的函数。
- 是 和 的函数 (通过 )。
- 因为构成 Z 的变量 () 与构成 V 的变量 () 相互独立,所以 和 相互独立。
-
组合 Z 和 V 形成 t 统计量:
- 根据 t 分布的定义 ,代入我们找到的 :
- 简化分母: (这里 取正平方根)
- 将简化的分母代回 T 的表达式:
- 约去 :
- 这正是我们要证明其分布的统计量。