以下是一些用以引入和解析 “总体期望 的区间估计 (当总体方差 已知时)” 的例子,侧重于解释为何 可能已知而 未知,并引出区间估计的需求。
-
引言问题:
- 我们通过样本均值 估计总体均值 。
- 是点估计,但它的可靠性如何?
- 能否给出一个范围,并说明有多大的把握(置信度)认为 在此范围内?
-
例子 1: 精密仪器的校准
- 场景:校准一台日常使用的工作基准温度计。该仪器用于对照一个绝对准确的标准温度源(温度为 )。
- 已知 :长期使用表明,该工作基准仪器单次测量的随机误差服从正态分布,且标准差 摄氏度。这个 代表仪器固有的、稳定的测量波动性。
- 未知 :需要确定该仪器当前是否存在系统偏差,即它的真实平均测量值 是多少,是否偏离了 。
- 数据:对标准源进行 次独立测量,得到样本均值 (例如 摄氏度)。
- 区间需求:点估计 受随机误差影响。需要构造一个区间(例如 95% 置信区间)来估计 的真实值。通过判断该区间是否包含 ,来评估仪器是否需要重新校准。
- 解析引出:已知 。 的抽样分布为 。可以利用此性质构造 的置信区间。
-
例子 2: 标准化考试的“特长班”
- 场景:评估某学校“数学特长班”学生的平均 IQ 水平。
- 已知 :已知某标准化 IQ 测试在普通人群中得分服从正态分布 ,即 是测试设计好的、稳定的参数。假设该特长班学生 IQ 的离散程度与普通人群相同。
- 未知 :需要估计这个特定“特长班”全体学生的真实平均 IQ 分数 。
- 数据:随机抽取 名特长班学生进行测试,得到样本平均分 (例如 )。
- 区间需求:点估计 不能完全代表全体特长班学生的平均水平。需要构造一个区间(例如 99% 置信区间)来估计 ,并判断该区间是否显著高于普通人群的平均值 100。
- 解析引出:已知 。假设 的抽样分布为 。利用此性质构造 的置信区间。
-
例子 3: 老配方的“稳定性” vs 新原料的“均值”
- 场景:一家药厂评估使用新原料对药片有效成分含量的影响。
- 已知 :基于多年使用旧原料和稳定工艺的数据,已知药片有效成分含量的标准差为 毫克。假设更换原料不改变生产过程的稳定性,即 保持不变。
- 未知 :需要确定使用新原料后,药片有效成分的真实平均含量 是多少,是否与旧工艺的目标值 (例如 100mg) 不同。
- 数据:用新原料试生产,随机抽取 片检测,得到样本均值 (例如 mg)。
- 区间需求:点估计 低于目标值。这是否是实质性差异,还是抽样波动?需要构造 的置信区间,判断其是否包含 。
- 解析引出:已知 。根据中心极限定理( 较大), 的抽样分布近似为 。利用此性质构造 的置信区间。