在这里,我们引入 VC 维度(Vapnik-Chervonenkis 维度)的概念。
- VC 维度也是一个纯粹的组合性质的概念,
- 但通常比生长函数(或 Rademacher 复杂度)更容易计算。
- 正如我们将看到的,
- VC 维度是学习中的一个关键量,
- 并且与生长函数直接相关。
-
为了进一步说明这一概念,我们将检查一系列假设集的例子,并确定每种情况的 VC 维度。
-
为了计算 VC 维度,我们通常会
- 先展示一个下界,
- 然后给出一个匹配的上界。
-
为了给出 VC 维度 的下界 ,
- 只需展示一个大小为 的集合 可以被 打碎。
-
为了给出上界,我们需要证明
- 没有一个大小为 的集合 可以被 打碎,
- 这通常更加困难。
- 没有一个大小为 的集合 可以被 打碎,
-
许多其他假设集合的 VC 维度可以通过类似的方式确定或上界(参见本章的练习)。
- 特别地,任何维度为 的向量空间的 VC 维度最多为 (练习 3.19)。
-
接下来的结果称为 Sauer 引理,它阐明了增长函数与 VC 维度之间的联系。
-
Sauer 引理的重要性可以通过推论 3.18 看出,它惊人地表明增长函数只表现出两种行为:
- 要么 ,此时 ,
- 要么 ,此时 。
刚刚建立的 VC 维度与增长函数之间的明确关系,再结合 推论 3.9,立即导出了基于 VC 维度的以下泛化界。