内容
介绍
在这一节中,我们假设训练样本 可以线性分离,也就是说,我们假设存在一个超平面,能够完美地将训练样本分离成两个分别标记为正负的点集,如 ^fig-5-1 左侧面板所示。
fig 5.1 两个可能的分隔超平面。 右侧的图形显示了一个最大化边缘的超平面。
这等同于存在 使得
但如 ^fig-5-1 所示,存在无限多个这样的分离超平面。 学习算法应该选择哪一个超平面呢? SVM 解决方案的定义基于 定义5.1 几何边缘 的概念。
线性分类器 对于样本 的几何边缘 是样本点上的最小几何边缘 即定义 的超平面到最近样本点的距离。
SVM解决方案是具有最大几何间隔的分隔超平面,因此被称为 最大间隔超平面。 ^fig-5-1 右面板展示了在可分情况下 SVM 算法返回的最大间隔超平面。
在本章后面,我们将介绍一个理论,为这个解决方案提供有力的证明。 然而,我们目前已经可以观察到,SVM 解决方案也可以被视为在以下意义上 “最安全” 的选择:
- 即使测试点落在与具有相同标签的训练样本的距离 内,分隔超平面也能以几何间隔 正确分类测试点;
- 对于 SVM 解决方案, 是最大几何间隔,因此是最“安全”的值。