分析一个关于方差区间估计的常见误区

主题： 在已知期望 $μ$ 的条件下，能否使用与均值相关的 Z 统计量 $Z = \frac{X ˉ - μ}{σ / n}$ 来构造方差 $σ^{2}$ 的置信区间？

一、问题的提出

我们知道，当总体 $N (μ, σ^{2})$ 的方差 $σ^{2}$ 已知时，可以用枢轴量 $Z = \frac{X ˉ - μ}{σ / n} \sim N (0, 1)$ 来构造均值 $μ$ 的置信区间。
现在考虑相反的情况：假设均值 $μ$ 已知，我们想构造方差 $σ^{2}$ 的置信区间。
一个看似 plausible 的想法是：既然 $Z$ 统计量中含有 $σ$ ，并且当 $μ$ 已知时 $Z$ 的分布 $N (0, 1)$ 也是已知的，我们是否可以直接利用 $Z$ 来反推出 $σ^{2}$ 的区间呢？

枢轴量及其分布 (假设 $μ$ 已知， $σ$ 未知):
- $Z = \frac{X ˉ - μ}{σ / n}$
- 假定总体正态或 $n$ 足够大，则 $Z \sim N (0, 1)$ 。
标准正态分布的概率陈述:
- 对于置信水平 $1 - α$ ，存在临界值 $u_{1 - α /2}$ (满足 $P (Z > u_{1 - α /2}) = α /2$ ) 使得： $P (- u_{1 - α /2} < Z < u_{1 - α /2}) = 1 - α$
代入 Z 统计量表达式: $P (- u_{1 - α /2} < \frac{X ˉ - μ}{σ / n} < u_{1 - α /2}) = 1 - α$
尝试从不等式中分离出 $σ$ :
- 核心不等式为： $- u_{1 - α /2} < \frac{( X ˉ - μ ) n}{σ} < u_{1 - α /2}$ 。
- 考虑其绝对值形式： $\frac{( X ˉ - μ ) n}{σ} < u_{1 - α /2}$
- 假设 $\overset{ˉ}{X} \neq = μ$ (若 $\overset{ˉ}{X} = μ$ ，则无法得到关于 $σ$ 的信息)。由于 $σ > 0$ 且 $u_{1 - α /2} > 0$ ，整理可得： $\frac{∣ X ˉ - μ ∣ n}{σ} < u_{1 - α /2}$ $σ > \frac{∣ X ˉ - μ ∣ n}{u _{1 - α /2}}$

仅得到单侧置信下限：
- 上述推导结果 $σ > \frac{∣ X ˉ - μ ∣ n}{u _{1 - α /2}}$ (或 $σ^{2} > (\frac{( X ˉ - μ ) n}{u _{1 - α /2}})^{2}$ ) 仅仅给出了 $σ$ (或 $σ^{2}$ ) 的一个置信水平为 $1 - α$ 的置信下限。
- 它没有提供置信上限。因此，我们无法形成一个双侧的置信区间。
无法约束 $σ$ 的上限：
- Z 统计量 $Z = \frac{X ˉ - μ}{σ / n}$ 对 $σ$ 的上限不敏感。
- 如果样本均值 $\overset{ˉ}{X}$ 碰巧非常接近已知的总体均值 $μ$ ，则分子 $∣ \overset{ˉ}{X} - μ ∣$ 非常小。
- 即使 $σ$ 非常大，导致分母 $σ / n$ 很大，Z 的绝对值 $∣ \frac{( X ˉ - μ ) n}{σ} ∣$ 仍然可能很小，落在区间 $(- u_{1 - α /2}, u_{1 - α /2})$ 内。
- 因此，Z 统计量无法排除 $σ$ 取非常大值的可能性，无法为其设定一个置信上限。
枢轴量与目标参数的信息不匹配：
- Z 统计量衡量的是样本均值 $\overset{ˉ}{X}$ 相对于总体均值 $μ$ 的标准化偏差。它反映的是均值的抽样误差信息，虽然这个误差的大小与 $σ$ 有关。
- 而估计方差 $σ^{2}$ 需要的是关于数据散布程度的信息。这种信息主要包含在样本观测值 $X_{i}$ 相对于中心（这里是已知的 $μ$ ）的离差平方和 $\sum_{i = 1}^{n} (X_{i} - μ)^{2}$ 中。
- Z 统计量并没有直接利用 $\sum (X_{i} - μ)^{2}$ 这个核心信息。

正确的枢轴量 (当 $μ$ 已知时)：
- $G_{1} = \frac{\sum _{i = 1}^{n} ( X _{i} - μ ) ^{2}}{σ ^{2}}$
- 这个统计量直接基于离差平方和，是衡量方差的核心。
枢轴量的分布：
- 假设总体为 $N (μ, σ^{2})$ ，则 $G_{1} \sim χ^{2} (n)$ (自由度为 $n$ 的卡方分布)。
构造区间：
- $χ^{2}$ 分布是定义在 $(0, \infty)$ 上的分布。我们可以找到两个临界值 $χ_{1 - α /2}^{2} (n)$ 和 $χ_{α /2}^{2} (n)$ 使得： $P (χ_{1 - α /2}^{2} (n) < G_{1} < χ_{α /2}^{2} (n)) = 1 - α$ $P (χ_{1 - α /2}^{2} (n) < \frac{\sum ( X _{i} - μ ) ^{2}}{σ ^{2}} < χ_{α /2}^{2} (n)) = 1 - α$
- 从这个包含 $σ^{2}$ 的双边不等式中，可以成功解出 $σ^{2}$ 的下限和上限： $\frac{\sum ( X _{i} - μ ) ^{2}}{χ _{α /2}^{2} ( n )} < σ^{2} < \frac{\sum ( X _{i} - μ ) ^{2}}{χ _{1 - α /2}^{2} ( n )}$
- 这就给出了 $σ^{2}$ 的一个置信水平为 $1 - α$ 的双侧置信区间。

试图使用 Z 统计量 $Z = \frac{X ˉ - μ}{σ / n}$ 来构造方差 $σ^{2}$ 的置信区间（即使在 $μ$ 已知的情况下）是行不通的。
主要原因是该方法只能提供 $σ^{2}$ 的置信下限，无法提供上限，不能形成区间。
根本原因在于 Z 统计量衡量的是均值的抽样误差，而非直接衡量数据的离散程度。
正确的方法是使用基于离差平方和的统计量 $\frac{\sum ( X _{i} - μ ) ^{2}}{σ ^{2}}$ ，该统计量服从卡方分布 $χ^{2} (n)$ ，其性质允许我们推导出 $σ^{2}$ 的双侧置信区间。