-
承接与对比:
- 在前面的讨论中( 已知),我们使用 作为枢轴量,因为它服从已知的标准正态分布 。
- 然而,在绝大多数实际应用中,如果总体均值 是未知的,那么总体方差 (或标准差 ) 通常也是未知的。假设 已知往往是不现实的。
- 问题:当 未知时,我们应该怎么办?
-
解决方案:用样本估计总体
- 自然的想法是用样本标准差 来估计未知的总体标准差 。
- 回顾: 是 的无偏估计。
- 我们尝试将 统计量中的 替换为它的估计值 ,得到新的统计量:
- 关键问题:这个新的统计量 还服从标准正态分布 吗?
- 答案:不服从。因为分母上的 本身是从样本计算出来的,它是一个随机变量,具有抽样波动性。这种来自估计 的额外不确定性,使得 的分布与 不同。
- 自然的想法是用样本标准差 来估计未知的总体标准差 。
-
引入 t 分布 (Student’s t-distribution)
- W.S. Gosset (笔名 Student) 在 1908 年研究了当总体服从正态分布 时,统计量 的精确分布。
- 这个分布被称为学生 t 分布 (或简称 t 分布)。
- t 分布的特点:
- 它由一个参数决定:自由度 (degrees of freedom, df),对于单样本估计 的问题,。
- 图像:关于 0 对称,形状类似标准正态分布,但尾部更“厚” (fatter tails)。这意味着 t 分布认为出现极端值的可能性比正态分布要大,这恰好反映了用 替代 所引入的额外不确定性。
- 随着自由度 的增大,t 分布逐渐逼近标准正态分布 。当 很大时 ( 或更大), 对 的估计非常精确,t 分布与 Z 分布几乎没有差别。
-
利用 t 分布构造置信区间
- 枢轴量:在总体 的假设下, 服从自由度为 的 t 分布,记作 。这是一个理想的枢轴量,因为它包含 ,其分布已知且不依赖未知参数 ()。
- 构建概率不等式:对于给定的置信水平 ,查找 t 分布的上 分位数 ,使得 。
- 推导置信区间:将 的表达式代入并解出 :
- 置信区间公式 ( 未知时): 或者简写为 。
-
例子:
-
这些例子更符合实际,因为我们不再需要假设 已知。
-
例子 1: 新教学方法的效果评估
- 场景:研究者想估计采用某种全新教学方法后,学生在某项能力测试上的平均得分 。
- 未知原因:因为是新方法,没有历史数据可以提供该方法下学生得分的标准差 。 和 都需要从样本数据中估计。
- 数据:随机抽取 名学生接受新方法教学并参加测试。计算得到样本均值 和样本标准差 。
- 区间需求:构造 的 95% 置信区间,以评估新方法的平均效果。
- 解析:使用 t 分布,自由度 。查找 ,计算区间 。
-
例子 2: 游客日均消费估计
- 场景:某城市旅游局想了解游客在该市的日均消费金额 。
- 未知原因:不同游客的消费习惯差异很大,无法预先知道消费金额的标准差 。
- 数据:随机调查 名游客,记录其日均消费。计算样本均值 和样本标准差 。
- 区间需求:构造 的 90% 置信区间,为旅游经济规划提供参考。
- 解析:使用 t 分布,自由度 。查找 ,计算区间 。
-
例子 3: 新药疗效评估
- 场景:制药公司研发了一种新降压药,想估计该药能使患者的收缩压平均降低多少 ()。
- 未知原因:新药对不同患者的效果可能不同,其引起的血压降低值的标准差 是未知的。
- 数据:选取 名高血压患者服用该药一段时间,记录每人收缩压的降低值。计算这些降低值的样本均值 和样本标准差 。
- 区间需求:构造 的 95% 置信区间,判断该药的平均降压效果。
- 解析:使用 t 分布,自由度 。查找 ,计算区间 。
-
-
总结与对比:
- 当 未知时,使用样本标准差 代替 ,并使用 t 分布(自由度 )代替 Z 分布来构造均值 的置信区间。
- t 分布的临界值 通常大于对应的 值(尤其在 较小时),这使得未知方差情况下的置信区间通常比已知方差情况下的区间要 宽。这反映了因为需要估计 而带来的额外不确定性,使得估计的精度有所下降。
- 计算出的区间 提供了对未知总体均值 的一个估计范围,并附加了 的置信度。