深度学习的支持向量机：简单理解支持向量机SVM

在介绍过贝叶斯之后，今天尝试着给大家介绍支持向量机SVM。

在机器学习中，SVM试图找到一个最佳的超平面，该平面可以最佳地分割来自不同类别的观察结果。一个在N-1维的超平面可以分割Ñ维的特征空间。例如，二维特征空间中的超平面是一条线，而三维特征空间中的超平面是一个面。最佳超平面即不同特征空间中离该超平面最近的点的距离最大，这些最近的点就是所谓的支持向量。如下图：一定理解：支持向量是离最佳超平面最近的点

深度学习的支持向量机：简单理解支持向量机SVM(1)

SVM的原理

根据前面提到的SVM定义，其实我们可以有无限多个可行的超平面。我们如何确定最佳选择？让我一步步来说明

认识超平面

首先，我们需要了解什么才是一个合格的超平面。在以下示例中，超平面C是唯一正确的，因为它成功地按其标记将观察结果分开，超平面A和B却失败了。我们可以从数学上来看：

在二维空间中，一条线可以由一个斜率向量w（二维）和一个截距b来定义。类似地，在n维空间中，超平面可以由n维向量w和截距b定义。超平面上的任何数据点x都满足

深度学习的支持向量机：简单理解支持向量机SVM(2)

如果一个超平面满足以下2点，则为合格的超平面：

对于来自一类的任何数据点x，它都满足

深度学习的支持向量机：简单理解支持向量机SVM(3)

对于来自另一个类的任何数据点x，它都满足

深度学习的支持向量机：简单理解支持向量机SVM(4)

深度学习的支持向量机：简单理解支持向量机SVM(5)

只有C为合格的超平面

w和b可能有无数种可能。因此，接下来我们探讨如何在可能的超平面中确定最佳的超平面

确定最佳超平面

在以下实例中，ABC都是合格的超平面，但C才是最佳超平面，为什么呢？因为C使正侧最近的数据点与其自身之间的距离与负侧最近的数据点与其自身之间的距离的和最大。此时正侧的最近点可以构成一个平行于决策超平面的超平面，我们称其为正超平面。另一方面，负侧的最近点构成负超平面。正负超平面之间的垂直距离称为余量，其值等于上述两个距离的总和。如果余量最大化，则决策超平面是最佳的。

深度学习的支持向量机：简单理解支持向量机SVM(6)