回到 优化问题 (5.7),我们注意到约束是仿射的,因此是合格的。 目标函数以及仿射约束是凸的且可微的。 因此,定理B.30 Karush-Kuhn-Tucker定理 的要求成立,KKT条件在最优解处适用。 我们将使用这些条件来分析算法,并证明它的几个关键性质,然后推导出与 SVM 相关的对偶优化问题,在 5.2.3 对偶优化问题 中给出。
我们引入
- 拉格朗日变量 与 约束相关,
- 并用 表示向量 。
拉格朗日函数
拉格朗日函数可以定义为所有 和 的函数
KKT条件是通过将拉格朗日函数对原变量 和 的梯度设为零,并写出互补条件得到的。
- 由方程(5.9),在SVM问题解中的权重向量 是训练集向量的 的线性组合。
- 一个向量 出现在该展开中当且仅当 。
- 这样的向量被称为 支持向量。
- 由互补条件 (5.11),如果 ,那么
- 因此,支持向量位于边缘超平面上
支持向量完全定义了最大间隔超平面或SVM解,这证明了该算法名称的合理性。 按照定义,不在边缘超平面上的向量不影响这些超平面的定义 - 在它们缺失的情况下,SVM问题的解仍然不变。
Remark
注意,尽管SVM问题的解 是唯一的,但支持向量不是。 在 维度中,点足以定义一个超平面。因此,当超过 个点位于边缘超平面上时,对于 支持向量的选择是可能的。