核心概念回顾:假设检验中的两类错误

错误类型定义符号别称/相关概念
第一类错误原假设 为真,但错误地拒绝了 弃真错误、显著性水平
第二类错误备择假设 为真,但错误地未能拒绝 取伪错误、功效 (1-)

关键关系 (固定样本量 ):


常见的统计实践:如何控制两类错误?

  • 首要原则: 优先控制第一类错误的概率

    • 预先设定一个可接受的 上限 (显著性水平),例如 0.05 或 0.01。
    • 这意味着我们严格控制“冤枉好人”(错误地宣称有效应/差异)的风险。
  • 次要目标: 在已控制 的前提下,尽可能减小第二类错误的概率 (即提高检验的功效 )。

    • 通过优化实验设计(如增加样本量 )、选择更合适的检验方法等来实现。
    • 目标是提高“发现真相”(正确地检测到真实存在的效应/差异)的能力。
  • 理论依据:

    • 费雪 (R.A. Fisher) 的显著性检验思想: 强调对原假设的怀疑,需要强有力的证据才能拒绝它。
    • 内曼-皮尔逊 (Neyman-Pearson) 引理: 在给定 的条件下,构建最强功效检验。

法律上的“无罪推断”原则

  • 核心内容: 任何被控犯罪的人,在未经依法判决有罪之前,应当被推定为无罪。
  • 举证责任: 控方(检察机关)承担证明被告有罪的责任,且需达到法定证明标准(如“排除合理怀疑”)。
  • 被告权利: 被告无需自证其罪,并享有辩护权等一系列权利。
  • 错误权衡的倾向:
    • 法律体系更倾向于避免“错判无辜”(将无罪的人判定为有罪)。
    • 名言:“宁可错放十个(有罪的),也不可错判一个(无辜的)”(尽管可能有夸张成分,但反映了基本精神)。

统计实践与无罪推断的【联系与相似之处】

方面统计实践 (控制 ,减小 )法律上的无罪推断
默认状态原假设 (无效应、无差异) 被假定为真被告被假定为无罪
首要避免的错误第一类错误 ():错误地拒绝真实的 (弃真)错判无辜:将无罪者判定为有罪
对该错误的控制设定较小的 值 (如0.05)高证明标准 (如排除合理怀疑)、程序正义
证据的角色收集数据以寻找足够强的证据来推翻 控方提供证据以足够强的证明力来推翻无罪推定
保守性对宣称“有发现/有效应”持谨慎态度对“判定有罪”持极其谨慎的态度

统计实践与无罪推断的【区别】

方面统计实践法律上的无罪推断
目标科学推断、知识发现、指导决策实现个案正义、保护公民权利、维护社会秩序
“假设”来源研究者基于理论或观察提出法律预设的状态
错误后果的性质结论错误、资源浪费、科研方向误导等; 为概率对个人自由/生命/名誉的损害、社会安全、司法公信力等
错误的量化与权衡 可量化,成本效益分析可能后果的伦理和社会权重极高,难以简单概率化
决策者研究者/数据分析师法官/陪审团
灵活性与场景 的选择可根据研究领域和风险承受能力调整基本原则固定,但证明标准可能因罪行类型略有不同

讨论:另一种错误控制策略?

用户提及:“一般都是在控制第二类错误的概率 不超过某值 的前提下, 使犯第一类错误的概率 尽可能小.”

  • 与常见统计实践对比:

    • 常见的做法是:先固定 ,再最小化
    • 该提法是:先固定 (或其上限 ),再最小化
  • 如果这种策略应用于法律类比:

    • 优先控制 意味着优先避免“未能发现罪行”(放过有罪的人)。
    • 这将导致一种更倾向于“宁可错判,也不可错放”的逻辑。
    • 这与“无罪推断”的核心精神(优先保护无辜者)截然相反
  • 这种策略的适用场景 (统计学中):

    • 某些筛选场景:如产品缺陷检测、重大疾病初步筛查。目标是尽可能“不漏掉”任何一个阳性/缺陷案例 (低 ),即使可能导致较多误报 (高 ),后续可通过更精密的检测来纠正。
    • 当“漏检”的代价远大于“误报”的代价时

总结

  • 主流统计实践 (控 ,降 ) 与法律无罪推断在“保守性”和“优先避免特定严重错误”的理念上高度相似,都体现了对推翻默认状态的谨慎。
  • 两者都强调需要强有力的证据才能做出“拒绝默认状态”的判断。
  • 主要区别在于目标、错误后果的性质与量化、以及操作层面。
  • 颠倒错误控制优先级的策略(如优先控制 )在特定统计场景下有其合理性,但其哲学基础与无罪推断的精神相悖。