-
算法家族:
- 受到SRM方法的启发
- 基于正则化的算法家族
-
假设集:
- 选择复杂的家族 :
- 嵌套假设集
- 不可数并集
-
选择标准:
- 通常选为:
- 在 上的连续函数空间中稠密
- 示例:
- 所有线性函数的集合(高维空间)
- 函数子集 :
- 范数被 限制
- 密度证明:
- 对于某些 的选择和高维空间:
- 可以证明 在 上的连续函数空间中稠密
-
扩展SRM方法:
- 给定标记样本
- 选择 的优化问题:
\mathop{\operatorname{argmin}}{\gamma > 0, h \in {H}{\gamma}} \widehat{R}{S}(h) + \Re{m}(\mathcal{H}_{\gamma}) + \sqrt{\frac{\log \gamma}{m}}
-
惩罚项:
- 其他惩罚项 可替代特定选择:
-
约束优化问题:
- 存在函数 :
- 对于任何 ,约束优化问题可以等价为无约束优化问题:
-
正则项和超参数:
- 对于某些 :
- 被称为正则项
- 被视为超参数(最优值通常未知)
-
正则项选择:
- 通常选为 的增函数
- 对于某些范数 的选择
- 当 是希尔伯特空间的子集时
-
正则化参数:
- 变量 被称为正则化参数
- 较大的 值会惩罚更复杂的假设
- 接近或等于零的 时,正则项没有效果
- 算法与ERM相一致
-
实践中的选择:
- 通常通过交叉验证或 -折交叉验证选择
-
正则项选择:
- 选择 :
- 对于某些范数和 的选择
- 是 的凸函数
- 原因: 任何范数都是凸的
- 选择 :
-
零一损失:
- 目标函数的第一项为非凸
- 使得优化问题在计算上变得困难
-
实践中的解决方案:
- 大多数基于正则化的算法:
- 使用零一损失的凸上界
- 用该凸替代的实证值替换实证零一项
- 大多数基于正则化的算法:
-
得到的优化问题:
- 是凸的
- 比SRM更有效的解决方案
-
未来研究:
- 下一节将研究这类凸替代损失的属性