一、 引言

  • 背景:我们常常需要比较两个不同总体(例如,两个不同群组、两种不同处理方式)的平均水平是否有差异。
  • 参数:我们关注的是两个总体均值之差
  • 数据:我们拥有来自两个总体的独立随机样本:
    • 样本 1: 来自 (或 较大),样本均值为
    • 样本 2: 来自 (或 较大),样本均值为
  • 点估计: 的自然点估计是样本均值之差
  • 点估计的方差:由于样本独立,
  • 目标:构造 置信区间。构造方法取决于关于总体方差 的信息。

二、 情况一:两总体方差 均已知

  • 前提假设:
    • 两样本独立。
    • 两总体均为正态分布,或两样本容量 均足够大。
    • 两总体的方差 是已知的常数。
  • 标准误 (Standard Error):
    • (该值已知)。
  • 枢轴量 (Pivotal Quantity):
  • 枢轴量分布:
    • (标准正态分布)。
  • 置信区间推导:
    • 代入 Z 并整理得到 的范围。
  • 置信区间公式:

三、 情况二:两总体方差 均未知

  • 这是实践中更常见的情况。需要用样本方差 来估计
  • 处理方式取决于是否能假定两总体方差相等。

1. 子情况 2a:假定 (方差未知但相等)

  • 前提假设:
    • 两样本独立。
    • 两总体均为正态分布。
    • 两总体方差未知,但有理由相信它们相等 ()。
  • 合并方差估计 (Pooled Variance Estimate):
    • 为了更好地估计共同的方差 ,将两个样本的信息合并:
    • 的无偏估计量。
  • 估计的标准误:
  • 枢轴量:
  • 枢轴量分布:
    • (t 分布,自由度为 )。
  • 置信区间公式 (合并 t 区间 / Pooled t-interval):

2. 子情况 2b:假定 (方差未知且不等)

  • 前提假设:
    • 两样本独立。
    • 两总体均为正态分布。
    • 两总体方差未知,且没有理由相信它们相等 (或怀疑它们不等)。这是 Behrens-Fisher 问题。
  • 分别估计方差:使用 分别估计
  • 估计的标准误:
  • 近似枢轴量:
  • 近似枢轴量分布:
    • 近似服从 t 分布。其精确自由度 比较复杂,通常使用 Welch-Satterthwaite 公式估计:
    • 通常不是整数,使用时常向下取整或使用软件精确计算。
  • 置信区间公式 (Welch t 区间 / Unpooled t-interval):

四、 总结比较

特征情况 1: 已知情况 2a: 未知 (合并)情况 2b: 未知 (Welch)
方差假设已知未知但相等未知且不等
标准误 (或估计)
枢轴量分布近似
自由度 (df)N/A (Z 分布)Welch-Satterthwaite
区间公式 (形式)

五、 知道方差的价值

  • 已知时,我们可以使用标准正态 (Z) 分布,其临界值 小于任何对应的 t 分布临界值 ()。
  • 这意味着在其他条件相同的情况下,已知方差会得到一个更窄的置信区间,即对 的估计更精确
  • 避免了估计方差带来的额外不确定性,也避免了判断是否需要合并方差以及计算 Welch 自由度的复杂性。

六、 实践建议 (当方差未知时)

  • 虽然可以先进行方差齐性检验(如 F 检验或 Levene 检验)来决定使用合并 t 区间还是 Welch t 区间,但许多统计学家建议:
    • 优先考虑使用 Welch t 区间 (情况 2b)。因为它对于方差不等的假设更稳健,即使方差实际上相等,其表现也通常可以接受。合并 t 区间在方差不相等时可能导致错误的结论。

(当前时间: Tuesday, April 29, 2025 at 7:45:47 AM PDT)