一、 引言

  • 背景:比较两个独立总体的变异程度(方差)的大小关系。
  • 参数:我们关注的是两总体方差之比
  • 数据:拥有来自两个正态总体的独立随机样本:
    • 样本 1: 来自
    • 样本 2: 来自
  • 关键分布:区间估计依赖于 F 分布,它定义为两个独立的卡方随机变量除以各自自由度后的比率。
    • , 独立,则
  • 目标:构造 置信区间。方法取决于总体均值 是否已知。

二、 情况一:两总体均值 均未知 (标准情况)

  • 前提假设:
    • 两样本独立。
    • 两总体均为正态分布
    • 均值 未知。
  • 基础卡方统计量:
    • 需要使用样本方差
    • 已知:
      • ,其中自由度
      • ,其中自由度
    • 相互独立。
  • F 统计量构造:
  • F 统计量分布:
  • 枢轴量:
    • 是一个合适的枢轴量。
  • 置信区间推导:
    • 查找 F 分布的临界值
    • 代入 F 表达式并整理分离出
  • 置信区间公式 (for ):
    • 利用 的性质,区间也可写为:

三、 情况二:两总体均值 均已知

  • 前提假设:
    • 两样本独立。
    • 两总体均为正态分布
    • 均值 是已知的常数。
  • 基础卡方统计量:
    • 直接使用围绕已知均值的离差平方和。定义
    • 已知:
      • ,其中自由度
      • ,其中自由度
    • 相互独立。
  • F 统计量构造:
  • F 统计量分布:
  • 枢轴量:
    • 是一个合适的枢轴量。
  • 置信区间推导:
    • 查找 F 分布的临界值
    • 代入 F’ 表达式并整理分离出
  • 置信区间公式 (for ):
    • 利用 F 分布性质,区间也可写为:

四、 总结比较

特征情况 1: 均值 未知情况 2: 均值 已知
均值假设未知已知
F统计量中比率的分子样本方差 基于已知均值的估计
F统计量中比率的分母样本方差 基于已知均值的估计
分子自由度 ()
分母自由度 ()
F 分布自由度
区间计算依赖

五、 知道均值的价值

  • 主要区别在于 F 分布使用的自由度。当均值已知时,构造 F 统计量所依赖的两个(独立的)卡方分布的自由度分别为 ;而当均值未知时,需要先估计均值,导致自由度损失,分别为
  • 更高的自由度意味着使用了更多的样本信息。在均值已知的情况下,我们利用了 个完全独立的(关于 的)信息片段(即 )。而在均值未知时,由于 的约束,我们实际上只利用了 个自由度的信息。
  • 拥有更高的自由度通常使得 F 分布更加“集中”,这可能导致(虽然不保证区间宽度直接比较)基于更充分信息的、更精确的关于方差比 的推断
  • 知道均值 避免了使用样本均值 带来的估计误差,使得对总体方差的衡量(离差平方和)是围绕真实的中心进行的。

总结:

知道总体均值 允许我们在构造方差比 的置信区间时,利用具有更高自由度 () 的 F 分布,而不是自由度为 () 的 F 分布。这代表了对样本信息的更充分利用,可能带来更精确的区间估计。然而,在实际应用中,总体均值通常是未知的,因此基于 的方法是标准和更常用的。

(当前时间: Tuesday, April 29, 2025 at 8:24:05 AM PDT)