• 承接与对比:

    • 在前面的讨论中( 已知),我们使用 作为枢轴量,因为它服从已知的标准正态分布
    • 然而,在绝大多数实际应用中,如果总体均值 是未知的,那么总体方差 (或标准差 ) 通常也是未知的。假设 已知往往是不现实的。
    • 问题:当 未知时,我们应该怎么办?
  • 解决方案:用样本估计总体

    • 自然的想法是用样本标准差 来估计未知的总体标准差
      • 回顾: 的无偏估计。
    • 我们尝试将 统计量中的 替换为它的估计值 ,得到新的统计量:
    • 关键问题:这个新的统计量 还服从标准正态分布 吗?
      • 答案:不服从。因为分母上的 本身是从样本计算出来的,它是一个随机变量,具有抽样波动性。这种来自估计 的额外不确定性,使得 的分布与 不同。
  • 引入 t 分布 (Student’s t-distribution)

    • W.S. Gosset (笔名 Student) 在 1908 年研究了当总体服从正态分布 时,统计量 的精确分布。
    • 这个分布被称为学生 t 分布 (或简称 t 分布)。
    • t 分布的特点:
      • 它由一个参数决定:自由度 (degrees of freedom, df),对于单样本估计 的问题,
      • 图像:关于 0 对称,形状类似标准正态分布,但尾部更“厚” (fatter tails)。这意味着 t 分布认为出现极端值的可能性比正态分布要大,这恰好反映了用 替代 所引入的额外不确定性。
      • 随着自由度 的增大,t 分布逐渐逼近标准正态分布 。当 很大时 ( 或更大), 的估计非常精确,t 分布与 Z 分布几乎没有差别。
  • 利用 t 分布构造置信区间

    • 枢轴量:在总体 的假设下, 服从自由度为 的 t 分布,记作 。这是一个理想的枢轴量,因为它包含 ,其分布已知且不依赖未知参数 ()。
    • 构建概率不等式:对于给定的置信水平 ,查找 t 分布的上 分位数 ,使得
    • 推导置信区间:将 的表达式代入并解出
    • 置信区间公式 ( 未知时): 或者简写为
  • 例子:

    • 这些例子更符合实际,因为我们不再需要假设 已知。

    • 例子 1: 新教学方法的效果评估

      • 场景:研究者想估计采用某种全新教学方法后,学生在某项能力测试上的平均得分
      • 未知原因:因为是新方法,没有历史数据可以提供该方法下学生得分的标准差 都需要从样本数据中估计。
      • 数据:随机抽取 名学生接受新方法教学并参加测试。计算得到样本均值 和样本标准差
      • 区间需求:构造 的 95% 置信区间,以评估新方法的平均效果。
      • 解析:使用 t 分布,自由度 。查找 ,计算区间
    • 例子 2: 游客日均消费估计

      • 场景:某城市旅游局想了解游客在该市的日均消费金额
      • 未知原因:不同游客的消费习惯差异很大,无法预先知道消费金额的标准差
      • 数据:随机调查 名游客,记录其日均消费。计算样本均值 和样本标准差
      • 区间需求:构造 的 90% 置信区间,为旅游经济规划提供参考。
      • 解析:使用 t 分布,自由度 。查找 ,计算区间
    • 例子 3: 新药疗效评估

      • 场景:制药公司研发了一种新降压药,想估计该药能使患者的收缩压平均降低多少 ()。
      • 未知原因:新药对不同患者的效果可能不同,其引起的血压降低值的标准差 是未知的。
      • 数据:选取 名高血压患者服用该药一段时间,记录每人收缩压的降低值。计算这些降低值的样本均值 和样本标准差
      • 区间需求:构造 的 95% 置信区间,判断该药的平均降压效果。
      • 解析:使用 t 分布,自由度 。查找 ,计算区间
  • 总结与对比:

    • 未知时,使用样本标准差 代替 ,并使用 t 分布(自由度 )代替 Z 分布来构造均值 的置信区间。
    • t 分布的临界值 通常大于对应的 值(尤其在 较小时),这使得未知方差情况下的置信区间通常比已知方差情况下的区间要 。这反映了因为需要估计 而带来的额外不确定性,使得估计的精度有所下降。
    • 计算出的区间 提供了对未知总体均值 的一个估计范围,并附加了 的置信度。