考虑一个输入空间 ,它是 的子集,具有 ,输出或目标空间 ,设 为目标函数。 给定一个从 映射到 的函数假设集 ,二分类任务可以表述如下。 学习者接收到一个大小为 的训练样本 ,该样本独立同分布地从 中根据某种未知的分布 , 抽取,对于所有 问题在于确定一个假设 ,一个二分类器,具有较小的泛化误差:

对于这个任务,可以选择不同的假设集 。 鉴于第3章中呈现的结果,该结果形式化了 奥卡姆剃刀原则 (Occam’s Razor principle),具有较小复杂度的假设集 在所有其他条件相同时提供更好的学习保证。

  • 例如,较小的VC维数或Rademacher复杂度

一个具有相对较小复杂度的自然假设集是线性分类器或超平面的集合, 其定义如下:

然后,该学习问题被称为 线性分类问题。 在 中超平面的通用方程是 其中

  • 是一个非零向量,
  • 垂直于超平面并且 一个标量。

形如 的假设因此

  • 将所有落在超平面一侧的点标记为正,
  • 将所有其他点标记为负