全文搜索算法
全文搜索算法是最重要的集体智慧算法之一。工作原理是通过搜索软件到因特网上的各网站收集信息,找到一个网站后可以从这个网站链接到另一个网站,像蜘蛛爬行一样。然后按照一定的规则建立一个很大的在线数据库供用户查询。用户在查询时只要输入关键词,就从已经建立的索引数据库上进行查询。目前,最著名的全文搜索算法应用是google的PageRank算法。PageRank算法是把整个互联网当作了一个整体对待,检查整个网络链接的结构,并确定哪些网页重要性最高。
贝叶斯分类器
贝叶斯分类器是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,就是该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。换句话说,贝叶斯分类器是最小错误率意义上的优化。目前研究较多的贝叶斯分类器主要有四种,分别是:Naive Bayes、TAN、BAN和GBN。
说明:贝叶斯网络是一个带有概率注释的有向无环图,在图中的每一个结点都表示一个随机变量,图中两结点间若存在着一条弧,则表示这两结点相对应的随机变量是概率相依的,反之则说明这两个随机变量是条件独立的,互不相关。网络中任意一个结点X 均有一个相应的条件概率表(Conditional Probability Table,CPT),用以表示结点X 在其父结点取各可能值时的条件概率。若结点X 无父结点,则X 的CPT 就是先验概率分布。贝叶斯网络的结构及各结点的CPT 定义了网络中各变量的概率分布。
优化技术
优化算法的背景是受多种变量的影响,存在许多可能解的问题,以及结果因这些变量的组合而产生很大变化的问题,但又不能一个一个解这样的求解出。优化算法是通过尝试许多不同题解并给出这些题解打分以确定其质量的方式来找到一个问题的最优解的。优化算法最简单也是最低效的求解方法,一般是求解出N个可行解,并从中找出最佳解来。而优化方法则是以一种对题解可能有改进的方式来对其进行智能化地修正。优化算法就是智能化尝试许多不同题解并给这些题解赋权值以确定其质量的方式来找到一个问题的最优解。主要算法有随机搜索、爬山法等经典方法,也有模拟退火、遗传算法等智能算法。
相关推荐
集体智慧编程-python算法应用pdf.7z
集体智慧编程-python算法应用!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
讲解了几个重要的算法并用python进行了实现(附代码)
集体智慧编程的电子书,很好的讲述基础算法实现的书籍
EM算法&Learn Python the Hard Way(第三版)&PYTHON自然语言处理中文版&集体智慧编程&自然语言处理综论 第二版
集体智慧编程,数据挖掘、机器学习入门知识,包含有推荐、搜索、优化、分类、聚类等机器学习算法
根据《集体智慧编程》实现的一个小型的搜索引擎,包括page rank算法和BF 神经网络算法的实现
一本实战案例很多的Python书籍,适合算法与Python结合。帮助感兴趣的人更深的了解。
《集体智慧编程》由美国计算机专家西格兰编著,以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来...
本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈...
适合希望了解数据挖掘技术的程序员,这本书讲述了数据挖掘里面的很多实用的算法
前言 第1章 集体智慧导言 什么是集体智慧 什么是机器学习 机器学习的局限 真实生活中的例子 学习型算法的其他用途 第2章 提供推荐 协作型过滤 搜集偏好 寻找相近的用户 推荐物品 匹配商品 构建一个基于del.icio.us...
集体编程智慧这本书是学习推荐系统的利器,里边有详细协同的代码,也有机器学习类的算法
集体智慧编程(中文版),对建模、推荐算法、搜索、文档过滤很有帮助
《集体智慧编程》由美国计算机专家西格兰编著,以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来...
《集体智慧编程》由美国计算机专家西格兰编著,以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来...
《集体智慧编程》由美国计算机专家西格兰编著,以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来...