经验 Rademacher 复杂度

  • 为从 映射到区间 的函数族
  • 为包含 中元素的固定大小为 的样本。 那么, 关于样本 经验 Rademacher 复杂度 定义为: {\widehat{\mathfrak{R}}}_{S}\left( \mathcal{G}\right) = \underset{\mathbf{\sigma }}{\mathbb{E}}\left\lbrack {\mathop{\sup }\limits_{{g \in \mathcal{G}}}\frac{1}{m}\mathop{\sum }\limits_{{i = 1}}^{m}{\sigma }_{i}g\left( {z}_{i}\right) }\right\rbrack \tag{3.1} 其中,
  • 是取值于 的独立均匀随机变量。
    • 这些随机变量 被称为 Rademacher 变量
  • 表示函数 在样本 上取值的向量:
  • 则经验 Rademacher 复杂度可以重写为:
    • 内积 衡量了 与随机噪声向量 的相关性。
    • 上确界 是一个度量函数类 在样本 上与 相关性的指标。
    • 因此,经验 Rademacher 复杂度平均衡量了 函数类 在样本 上与随机噪声的相关性
  • 这描述了函数族 的丰富性:
    • 更丰富或更复杂的函数族 能够生成更多的向量
    • 因此能够平均上更好地与随机噪声相关。

Rademacher 复杂度

  • 表示用于抽取样本的分布。
  • 对于任意整数 ,函数族 的 Rademacher 复杂度是:
    • 根据分布 抽取的大小为 的所有样本上
    • 经验 Rademacher 复杂度的期望值: {\mathfrak{R}}_{m}\left( \mathcal{G}\right) = \underset{S \sim {\mathcal{D}}^{m}}{\mathbb{E}}\left\lbrack {{\widehat{\mathfrak{R}}}_{S}\left( \mathcal{G}\right) }\right\rbrack \tag{3.2}