比较期望差的区间估计（已知方差 vs 未知方差）

一、引言

背景：我们常常需要比较两个不同总体（例如，两个不同群组、两种不同处理方式）的平均水平是否有差异。
参数：我们关注的是两个总体均值之差 $μ_{1} - μ_{2}$ 。
数据：我们拥有来自两个总体的独立随机样本：
- 样本 1: $X_{1}, ..., X_{n_{1}}$ 来自 $N (μ_{1}, σ_{1}^{2})$ （或 $n_{1}$ 较大），样本均值为 $\overset{ˉ}{X}_{1}$ 。
- 样本 2: $Y_{1}, ..., Y_{n_{2}}$ 来自 $N (μ_{2}, σ_{2}^{2})$ （或 $n_{2}$ 较大），样本均值为 $\overset{ˉ}{X}_{2}$ 。
点估计： $μ_{1} - μ_{2}$ 的自然点估计是样本均值之差 $\overset{ˉ}{X}_{1} - \overset{ˉ}{X}_{2}$ 。
点估计的方差：由于样本独立， $Va r (\overset{ˉ}{X}_{1} - \overset{ˉ}{X}_{2}) = Va r (\overset{ˉ}{X}_{1}) + Va r (\overset{ˉ}{X}_{2}) = \frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}}$
目标：构造 $μ_{1} - μ_{2}$ 的 $1 - α$ 置信区间。构造方法取决于关于总体方差 $σ_{1}^{2}, σ_{2}^{2}$ 的信息。

二、情况一：两总体方差 $σ_{1}^{2}, σ_{2}^{2}$ 均已知

前提假设：
- 两样本独立。
- 两总体均为正态分布，或两样本容量 $n_{1}, n_{2}$ 均足够大。
- 两总体的方差 $σ_{1}^{2}$ 和 $σ_{2}^{2}$ 是已知的常数。
标准误 (Standard Error):
- $SE = Va r (\overset{ˉ}{X}_{1} - \overset{ˉ}{X}_{2}) = \frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}}$ (该值已知)。
枢轴量 (Pivotal Quantity):
- $Z = \frac{( X ˉ _{1} - X ˉ _{2} ) - ( μ _{1} - μ _{2} )}{SE} = \frac{( X ˉ _{1} - X ˉ _{2} ) - ( μ _{1} - μ _{2} )}{σ _{1}^{2} / n _{1} + σ _{2}^{2} / n _{2}}$
枢轴量分布：
- $Z \sim N (0, 1)$ (标准正态分布)。
置信区间推导：
- $P (- u_{1 - α /2} < Z < u_{1 - α /2}) = 1 - α$ 。
- 代入 Z 并整理得到 $μ_{1} - μ_{2}$ 的范围。
$1 - α$ 置信区间公式： $(\overset{ˉ}{X}_{1} - \overset{ˉ}{X}_{2}) \pm u_{1 - α /2} \frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}}$

三、情况二：两总体方差 $σ_{1}^{2}, σ_{2}^{2}$ 均未知

这是实践中更常见的情况。需要用样本方差 $S_{1}^{2}, S_{2}^{2}$ 来估计 $σ_{1}^{2}, σ_{2}^{2}$ 。
处理方式取决于是否能假定两总体方差相等。

1. 子情况 2a：假定 $σ_{1}^{2} = σ_{2}^{2} = σ^{2}$ （方差未知但相等）

前提假设：
- 两样本独立。
- 两总体均为正态分布。
- 两总体方差未知，但有理由相信它们相等 ( $σ_{1}^{2} = σ_{2}^{2} = σ^{2}$ )。
合并方差估计 (Pooled Variance Estimate):
- 为了更好地估计共同的方差 $σ^{2}$ ，将两个样本的信息合并： $S_{p}^{2} = \frac{( n _{1} - 1 ) S _{1}^{2} + ( n _{2} - 1 ) S _{2}^{2}}{n _{1} + n _{2} - 2}$
- $S_{p}^{2}$ 是 $σ^{2}$ 的无偏估计量。
估计的标准误：
- $S E_{p} = \frac{S _{p}^{2}}{n _{1}} + \frac{S _{p}^{2}}{n _{2}} = S_{p} \frac{1}{n _{1}} + \frac{1}{n _{2}}$
枢轴量：
- $T = \frac{( X ˉ _{1} - X ˉ _{2} ) - ( μ _{1} - μ _{2} )}{S E _{p}} = \frac{( X ˉ _{1} - X ˉ _{2} ) - ( μ _{1} - μ _{2} )}{S _{p} 1/ n _{1} + 1/ n _{2}}$
枢轴量分布：
- $T \sim t (n_{1} + n_{2} - 2)$ (t 分布，自由度为 $n_{1} + n_{2} - 2$ )。
$1 - α$ 置信区间公式 (合并 t 区间 / Pooled t-interval): $(\overset{ˉ}{X}_{1} - \overset{ˉ}{X}_{2}) \pm t_{α /2} (n_{1} + n_{2} - 2) S_{p} \frac{1}{n _{1}} + \frac{1}{n _{2}}$

2. 子情况 2b：假定 $σ_{1}^{2} \neq = σ_{2}^{2}$ （方差未知且不等）

前提假设：
- 两样本独立。
- 两总体均为正态分布。
- 两总体方差未知，且没有理由相信它们相等 (或怀疑它们不等)。这是 Behrens-Fisher 问题。
分别估计方差：使用 $S_{1}^{2}$ 和 $S_{2}^{2}$ 分别估计 $σ_{1}^{2}$ 和 $σ_{2}^{2}$ 。
估计的标准误：
- $S E_{u} = \frac{S _{1}^{2}}{n _{1}} + \frac{S _{2}^{2}}{n _{2}}$
近似枢轴量：
- $T^{'} \approx \frac{( X ˉ _{1} - X ˉ _{2} ) - ( μ _{1} - μ _{2} )}{S E _{u}} = \frac{( X ˉ _{1} - X ˉ _{2} ) - ( μ _{1} - μ _{2} )}{S _{1}^{2} / n _{1} + S _{2}^{2} / n _{2}}$
近似枢轴量分布：
- $T^{'}$ 近似服从 t 分布。其精确自由度 $ν$ 比较复杂，通常使用 Welch-Satterthwaite 公式估计： $ν \approx \frac{( S _{1}^{2} / n _{1} + S _{2}^{2} / n _{2} ) ^{2}}{\frac{( S _{1}^{2} / n _{1} ) ^{2}}{n _{1} - 1} + \frac{( S _{2}^{2} / n _{2} ) ^{2}}{n _{2} - 1}}$
- $ν$ 通常不是整数，使用时常向下取整或使用软件精确计算。
$1 - α$ 置信区间公式 (Welch t 区间 / Unpooled t-interval): $(\overset{ˉ}{X}_{1} - \overset{ˉ}{X}_{2}) \pm t_{α /2} (ν) \frac{S _{1}^{2}}{n _{1}} + \frac{S _{2}^{2}}{n _{2}}$

四、总结比较

特征	情况 1: $σ_{1}^{2}, σ_{2}^{2}$ 已知	情况 2a: $σ_{1}^{2} = σ_{2}^{2}$ 未知 (合并)	情况 2b: $σ_{1}^{2} \neq = σ_{2}^{2}$ 未知 (Welch)
方差假设	已知	未知但相等	未知且不等
标准误 (或估计)	$\frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}}$	$S_{p} \frac{1}{n _{1}} + \frac{1}{n _{2}}$	$\frac{S _{1}^{2}}{n _{1}} + \frac{S _{2}^{2}}{n _{2}}$
枢轴量分布	$N (0, 1)$	$t (n_{1} + n_{2} - 2)$	近似 $t (ν)$
自由度 (df)	N/A (Z 分布)	$n_{1} + n_{2} - 2$	Welch-Satterthwaite $ν$
区间公式 (形式)	$(\overset{ˉ}{X}_{1} - \overset{ˉ}{X}_{2}) \pm u_{1 - α /2} SE$	$(\overset{ˉ}{X}_{1} - \overset{ˉ}{X}_{2}) \pm t_{α /2} (df) S E_{p}$	$(\overset{ˉ}{X}_{1} - \overset{ˉ}{X}_{2}) \pm t_{α /2} (ν) S E_{u}$

五、知道方差的价值

当 $σ_{1}^{2}, σ_{2}^{2}$ 已知时，我们可以使用标准正态 (Z) 分布，其临界值 $u_{1 - α /2}$ 小于任何对应的 t 分布临界值 ( $t_{α /2} (n_{1} + n_{2} - 2)$ 或 $t_{α /2} (ν)$ )。
这意味着在其他条件相同的情况下，已知方差会得到一个更窄的置信区间，即对 $μ_{1} - μ_{2}$ 的估计更精确。
避免了估计方差带来的额外不确定性，也避免了判断是否需要合并方差以及计算 Welch 自由度的复杂性。

六、实践建议 (当方差未知时)

虽然可以先进行方差齐性检验（如 F 检验或 Levene 检验）来决定使用合并 t 区间还是 Welch t 区间，但许多统计学家建议：
- 优先考虑使用 Welch t 区间 (情况 2b)。因为它对于方差不等的假设更稳健，即使方差实际上相等，其表现也通常可以接受。合并 t 区间在方差不相等时可能导致错误的结论。

(当前时间: Tuesday, April 29, 2025 at 7:45:47 AM PDT)

Youliang Zhong

Table of Contents

Backlinks

Graph View

比较期望差的区间估计（已知方差 vs 未知方差）

一、引言

二、情况一：两总体方差 $σ_{1}^{2}, σ_{2}^{2}$ 均已知

三、情况二：两总体方差 $σ_{1}^{2}, σ_{2}^{2}$ 均未知

1. 子情况 2a：假定 $σ_{1}^{2} = σ_{2}^{2} = σ^{2}$ （方差未知但相等）

2. 子情况 2b：假定 $σ_{1}^{2} \neq = σ_{2}^{2}$ （方差未知且不等）

四、总结比较

五、知道方差的价值

六、实践建议 (当方差未知时)

Youliang Zhong

Table of Contents

Backlinks

Graph View

比较期望差 的区间估计（已知方差 vs 未知方差）

一、 引言

二、 情况一：两总体方差 σ12​,σ22​ 均已知

三、 情况二：两总体方差 σ12​,σ22​ 均未知

1. 子情况 2a：假定 σ12​=σ22​=σ2 （方差未知但相等）

2. 子情况 2b：假定 σ12​=σ22​ （方差未知且不等）

四、 总结比较

五、 知道方差的价值

六、 实践建议 (当方差未知时)

比较期望差的区间估计（已知方差 vs 未知方差）

一、引言

二、情况一：两总体方差 $σ_{1}^{2}, σ_{2}^{2}$ 均已知

三、情况二：两总体方差 $σ_{1}^{2}, σ_{2}^{2}$ 均未知

1. 子情况 2a：假定 $σ_{1}^{2} = σ_{2}^{2} = σ^{2}$ （方差未知但相等）

2. 子情况 2b：假定 $σ_{1}^{2} \neq = σ_{2}^{2}$ （方差未知且不等）

四、总结比较

五、知道方差的价值

六、实践建议 (当方差未知时)