推论 6.3.4 (两正态总体均值差的t分布检验统计量)

Transclude of 推论-6.3.3-(两个正态总体方差比的F分布性质)#list

, 则

其中 .

\frac{\left( {\bar{X} - \bar{Y}}\right) - \left( {{\mu }_{1} - {\mu }_{2}}\right) }{{S}_{w}\sqrt{\frac{1}{m} + \frac{1}{n}}} \sim t\left( {m + n - 2}\right), \tag{6.3.16}

合并方差

是合并样本方差 (Pooled Sample Variance),定义为: 这里 是各自的无偏样本方差。

证明思路

利用 t 分布的定义。一个自由度为 的 t 随机变量可以表示为 ,其中:

  1. 是一个标准正态随机变量,
  2. 是一个自由度为 的卡方随机变量,
  3. 相互独立。

我们需要将目标统计量 构造成上述形式,并找出对应的 ,然后证明它们满足条件。

证明步骤

  1. 构造标准正态部分 (Z):

    • 考虑样本均值之差
    • 由于 ,我们知道
    • 由于 ,我们知道
    • 因为两样本独立,所以 独立。
    • 独立正态变量的线性组合仍服从正态分布:
    • 将其标准化,得到标准正态变量 Z:
    • 因此,我们找到了满足 的部分。
  2. 构造卡方部分 (V) 并确定自由度 (k):

    • 我们知道,对于来自正态总体的样本,样本方差与总体方差的关系如下:
    • 由于两样本独立,所以 独立,进而上述两个卡方变量也独立。
    • 独立卡方变量的和服从卡方分布,自由度为各自自由度之和。定义 为它们的和:
    • 该变量 服从自由度为 的卡方分布。
    • 注意到 的分子恰好与 的定义相关:
    • 因此,我们可以将 写为:
    • 我们找到了 ,其中
  3. 证明 Z 和 V 的独立性:

    • 对于从正态总体抽取的单个样本,样本均值和样本方差是相互独立的。即 独立于 独立于
    • 由于两个样本是相互独立的,因此 这四个统计量是相互独立的(除了均值与各自方差的独立性外,不同样本的统计量之间也独立)。
    • 的函数。
    • 的函数 (通过 )。
    • 因为构成 Z 的变量 () 与构成 V 的变量 () 相互独立,所以 相互独立。
  4. 组合 Z 和 V 形成 t 统计量:

    • 根据 t 分布的定义 ,代入我们找到的
    • 简化分母: (这里 取正平方根)
    • 将简化的分母代回 T 的表达式:
    • 约去
    • 这正是我们要证明其分布的统计量。