• 算法家族:

    • 受到SRM方法的启发
    • 基于正则化的算法家族
  • 假设集:

    • 选择复杂的家族 :
    • 嵌套假设集
      • 不可数并集
  • 选择标准:

    • 通常选为:
    • 上的连续函数空间中稠密
    • 示例:
      • 所有线性函数的集合(高维空间)
      • 函数子集 :
        • 范数被 限制
    • 密度证明:
      • 对于某些 的选择和高维空间:
      • 可以证明 上的连续函数空间中稠密
  • 扩展SRM方法:

    • 给定标记样本
    • 选择 的优化问题:

    \mathop{\operatorname{argmin}}{\gamma > 0, h \in {H}{\gamma}} \widehat{R}{S}(h) + \Re{m}(\mathcal{H}_{\gamma}) + \sqrt{\frac{\log \gamma}{m}}

  • 惩罚项:

    • 其他惩罚项 可替代特定选择:
  • 约束优化问题:

    • 存在函数 :
    • 对于任何 ,约束优化问题可以等价为无约束优化问题:
  • 正则项和超参数:

    • 对于某些 :
    • 被称为正则项
    • 被视为超参数(最优值通常未知)
  • 正则项选择:

    • 通常选为 的增函数
    • 对于某些范数 的选择
    • 是希尔伯特空间的子集时
  • 正则化参数:

    • 变量 被称为正则化参数
    • 较大的 值会惩罚更复杂的假设
    • 接近或等于零的 时,正则项没有效果
    • 算法与ERM相一致
  • 实践中的选择:

    • 通常通过交叉验证或 -折交叉验证选择
  • 正则项选择:

    • 选择 :
      • 对于某些范数和 的选择
      • 的凸函数
      • 原因: 任何范数都是凸的
  • 零一损失:

    • 目标函数的第一项为非凸
    • 使得优化问题在计算上变得困难
  • 实践中的解决方案:

    • 大多数基于正则化的算法:
      • 使用零一损失的凸上界
      • 用该凸替代的实证值替换实证零一项
  • 得到的优化问题:

    • 是凸的
    • 比SRM更有效的解决方案
  • 未来研究:

    • 下一节将研究这类凸替代损失的属性