一、 引言
- 背景:我们常常需要比较两个不同总体(例如,两个不同群组、两种不同处理方式)的平均水平是否有差异。
- 参数:我们关注的是两个总体均值之差 。
- 数据:我们拥有来自两个总体的独立随机样本:
- 样本 1: 来自 (或 较大),样本均值为 。
- 样本 2: 来自 (或 较大),样本均值为 。
- 点估计: 的自然点估计是样本均值之差 。
- 点估计的方差:由于样本独立,
- 目标:构造 的 置信区间。构造方法取决于关于总体方差 的信息。
二、 情况一:两总体方差 均已知
- 前提假设:
- 两样本独立。
- 两总体均为正态分布,或两样本容量 均足够大。
- 两总体的方差 和 是已知的常数。
- 标准误 (Standard Error):
- (该值已知)。
- 枢轴量 (Pivotal Quantity):
- 枢轴量分布:
- (标准正态分布)。
- 置信区间推导:
- 。
- 代入 Z 并整理得到 的范围。
- 置信区间公式:
三、 情况二:两总体方差 均未知
- 这是实践中更常见的情况。需要用样本方差 来估计 。
- 处理方式取决于是否能假定两总体方差相等。
1. 子情况 2a:假定 (方差未知但相等)
- 前提假设:
- 两样本独立。
- 两总体均为正态分布。
- 两总体方差未知,但有理由相信它们相等 ()。
- 合并方差估计 (Pooled Variance Estimate):
- 为了更好地估计共同的方差 ,将两个样本的信息合并:
- 是 的无偏估计量。
- 估计的标准误:
- 枢轴量:
- 枢轴量分布:
- (t 分布,自由度为 )。
- 置信区间公式 (合并 t 区间 / Pooled t-interval):
2. 子情况 2b:假定 (方差未知且不等)
- 前提假设:
- 两样本独立。
- 两总体均为正态分布。
- 两总体方差未知,且没有理由相信它们相等 (或怀疑它们不等)。这是 Behrens-Fisher 问题。
- 分别估计方差:使用 和 分别估计 和 。
- 估计的标准误:
- 近似枢轴量:
- 近似枢轴量分布:
- 近似服从 t 分布。其精确自由度 比较复杂,通常使用 Welch-Satterthwaite 公式估计:
- 通常不是整数,使用时常向下取整或使用软件精确计算。
- 置信区间公式 (Welch t 区间 / Unpooled t-interval):
四、 总结比较
特征 | 情况 1: 已知 | 情况 2a: 未知 (合并) | 情况 2b: 未知 (Welch) |
---|---|---|---|
方差假设 | 已知 | 未知但相等 | 未知且不等 |
标准误 (或估计) | |||
枢轴量分布 | 近似 | ||
自由度 (df) | N/A (Z 分布) | Welch-Satterthwaite | |
区间公式 (形式) |
五、 知道方差的价值
- 当 已知时,我们可以使用标准正态 (Z) 分布,其临界值 小于任何对应的 t 分布临界值 ( 或 )。
- 这意味着在其他条件相同的情况下,已知方差会得到一个更窄的置信区间,即对 的估计更精确。
- 避免了估计方差带来的额外不确定性,也避免了判断是否需要合并方差以及计算 Welch 自由度的复杂性。
六、 实践建议 (当方差未知时)
- 虽然可以先进行方差齐性检验(如 F 检验或 Levene 检验)来决定使用合并 t 区间还是 Welch t 区间,但许多统计学家建议:
- 优先考虑使用 Welch t 区间 (情况 2b)。因为它对于方差不等的假设更稳健,即使方差实际上相等,其表现也通常可以接受。合并 t 区间在方差不相等时可能导致错误的结论。
(当前时间: Tuesday, April 29, 2025 at 7:45:47 AM PDT)