我的数学之美（三） —— 使用支持向量机进行预测

grunt1223

浏览: 419792 次
性别:
来自: 杭州

最近访客更多访客>>

yymm_1234

lazy_luo

asdface

cnyoky

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

图像识别、机器学习、数据挖掘

VC++ITeye 生活

现实生活中充满着预测问题，即对未知世界的大胆猜测。我们基于什么根据来推测呢？最多的当然是已有的经验，即之前所做的一些已知结果的推测，这就是所谓的“有监督的学习”。

这里，我举一个最简单的例子，就是公务员考试中那种最常见的数字推理题：1,4,9,16,?

当然，你一眼就看出了这是一个平方序列，下一个数字一定是25，但是，这是唯一的答案吗？

应该说，平方序列只是一个模型，比方说，我们可以假定这样一个多项式模型，

引用

a * x * x * x + b * x * x + c * x + d

其中a、b、c、d为未知数，而x分别为1、2、3、4，采用初中数学所学的待定系数法，就可以算得abcd的值，从而得到符合上述规律一个模型。对于上面我给出的多项式模型，由于我们有四个未知数和四个方程，因此解是唯一的。但是如果我们变换模型的样式（比如说采用更高阶或低阶或是指数或是对数的模型），总的来说，其解是无限的。

如果上述例子还不够有说服力的话，请看下面的例子：

这是一个回归的例子，即根据已有的数据点得出合理的模型，并预测新数据点的问题。由上图看出，我们可以使用sin函数完美拟合所有的已知点，但是，得出的模型却和真实函数大相径庭，预测出来的结果也肯定是有问题的。

那么，既然存在着多种可能的解释，我们如何来确保，所选用的模型一定是正确的呢？很遗憾，不存在一定的答案，除非模型是已知的，但如果是这样的话，有何必需要预测呢？

两个可能的努力方向，一是提高样本数量，这是显而易见的，可供训练的数量越多，模型一定是越可靠。另一点是降低模型的复杂度（VC维），这一点或许比较难以理解，但是我们可以这样去思考，越是复杂的模型或者分类器，输入的变化引起输出的波动也就越大。

下面再来细谈一下VC维。考虑平面内的N个点，需要进行简单的“是或否”的分类，总共会有2的N次方种划分方式。对于任何一种分类模型来说，其N的最大值就是该模型的VC维。例如对于直线来说，其VC维等于3，可以如下证明：假设平面内有四个点，而直线无法将处于对角的点两两分开。

接下来谈谈SVM，通常来说，它采用直线模型将数据分类，并且只有处于分界线附近的支撑向量才会对最后的分类结果又贡献，因此特别适合于处理高维向量分类问题（比如说文本分类等等）。