一.什么是贝叶斯
贝叶斯是数学统计分类发放.可以预测类成员关系的可能性.如果直接说起贝叶斯.那么他就是一个数学模型.
数学模型我的理解就是.将显示生活中的一些现象通过.数学公式予以表示.
二.关于贝叶斯朴素分类
我们希望得出P(C|D) D=document(文档) C=category(类别) 如果八股一点可以这么陈述.在条件C下.D的后验概率.
那么完整的贝叶斯公式就是 P(C|D) = P(D|C)*P(C)/P(D)
下面我们分别讲述每一个概率的含义
我们做个大胆的假设.每篇文章只有一个单词.那么就认为是一个term(向量) T
于是我么的公式可以改写为 P(C|T) = P(T|C)*P(C)/P(T)
其中
P(C|T) 是这个T(向量,单词) 属于C类别的概率
P(T|C) 是这个分类中T出现的概率
P(C) 是这个分类在总体情况下所占的比例
P(T) 是这个单词在所有情况下所占的比例
Ok.解释清楚了现在我们套用这个做个例子
有如下结构
C1(0.4) |
C2(0.6) |
IOS:30, JAVA:10 |
Android:30,JAVA:20 |
D:用户输入的document 中假设只有一个词 java 那么让我们来计算这篇文章应该属于哪个分类
假设 当用户发表一个文章.属于C1的概率为0.4 属于C2的概率为0.6
将'java'(单词)认为为T
P(T|C1) = 10/40 = 0.25
P(T|C2) = 20/50 = 0.4
P(C1) = 0.4
P(C2) = 0.6
P(T)=P(T|C1)*P(C1)+P(T|C2)*P(C2)=0.25*0.4+0.4*0.6=0.34
P(C1|T) = P(T|C1)*P(C1) /P(T) :这个就是这篇文章属于分类1的概率
带入公式 P(C1|T) = 0.25*0.4/0.34=0.29411764705882352941176470588235
计算属于C2的概率如下
P(C2|T) = P(T|C2)*P(C2) /P(T) :这个就是这篇文章属于分类1的概率
带入公式 P(C2|T) = 0.4*0.6/0.34= 0.70588235294117647058823529411765
可以看出P(C1|T)<P(C2|T) 那么这个文章应该属于分类2
恩介绍完了.
分享到:
相关推荐
朴素贝叶斯学习笔记完整版
机器学习入门。朴素贝叶斯学习过程中遇到的问题,记录下来,可以说是学习笔记,希望能给大家带来帮助。由于手写难免会有一些错误察觉不到,广泛讨论,共同进步。
朴素贝叶斯算法学习笔记
朴素贝叶斯算法学习笔记。
本资源为《机器学习实战》第四章基于概率论的分类方法:朴素贝叶斯学习笔记,资源中总结和输入的所有例程代码,并给出注释。资源免费下载
朴素贝叶斯学习笔记,和文本分类代码实现。可用于不明白朴素贝叶斯算法或者不知道改如何调用python的sklearn实现朴素贝叶斯算法的初学者
最近学习了一下朴素贝叶斯,看了相关文档等资料,在自己理解的基础上整理如下笔记。
1. 人工定义:根据先前对研究事物的统计研究,完全由人工定义网络结构和参数 2. 部分学习:根据先前的研究定义网络的结构,包括节点(变量)和有向边(因果关系),
贝叶斯机器学习笔记本 该存储库是有关贝叶斯机器学习的笔记本的集合。 以下链接通过显示了一些笔记本,以确保正确呈现公式。 依赖关系在子目录中的requirements.txt文件中指定。 。 贝叶斯线性回归简介。 用普通的...
朴素贝叶斯
贝叶斯机器学习笔记本本资料库是有关贝叶斯机器学习的笔记本的集合。 以下链接通过nbviewer显示笔记本,以确保正确呈现公式。 更新:PyMC3和贝叶斯机器学习笔记本该存储库是有关贝叶斯机器学习的笔记本的集合。 以下...
学习了机器学习的基础以及相关理论,颇有收获,并做了相关笔记,对于机器学习有了更为深入的理解,为以后的学习以及研究打下基础。 主要内容包含以下相关主题: - 模型的评估与选择 - 神经网络 - 支持向量机 - ...
贝叶斯算法实例——文本分析,具体代码可详见‘[学习笔记]机器学习——算法及模型(五):贝叶斯算法’
贝叶斯实例:拼写检查所需的观测样本;代码可见“[学习笔记]机器学习——算法及模型(五):贝叶斯算法”
《机器学习》贝叶斯分类器学习笔记前半部分实现代码,包含“朴素贝叶斯分类器”和“半朴素贝叶斯分类器”。从数据集正、反样例各挑选3例,“半朴素贝叶斯分类器”判断结果完全正确。“朴素贝叶斯分类器”仅对1例正例...
BL笔记本贝叶斯学习教材的笔记本。
《机器学习笔记(2)——使用朴素贝叶斯算法过滤(中英文)垃圾邮件》 一文中的邮件数据
Jim Liang的机器学习700+页PPT,机器学习入门介绍,含最近邻,SVM,线性回归,逻辑回归,神经网络,梯度下降,朴素贝叶斯,K-means,主成分分析,决策树,AdaBoost,随机森林
R语言与机器学习学习笔记(分类算法)(3)朴素贝叶斯算法-附件资源
贝叶斯深度学习(BDL)的更新调查 这是针对贝叶斯深度学习(BDL)的更新调查,贝叶斯深度学习(BDL)是手稿“的”的不断更新和扩展的版本,已发布在 2020中。 贝叶斯深度学习是一个强大的框架,可用于跨多种应用...