`
liuxinglanyue
  • 浏览: 546837 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

垂直搜索引擎深度分析

阅读更多

1.何为垂直搜索引擎

所谓垂直搜索引擎(Vertical Search Engine),是针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩。它是与通用搜索引擎截然不同的引擎类型。垂直搜索引擎专注具体、深入的纵向服务,致力于某一特定领域内信息的全面和内容的深入,这个领域外的闲杂信息不收录。
从竞争的角度来讲,垂直搜索引擎要做通用搜索引擎无法做到的事情,或者说,要做得更胜一筹。通用搜索引擎像一堵大墙,而墙上有很多裂纹,垂直搜索引擎就是要去补这些墙上的裂纹。

2.为什么要垂直搜索引擎
从2005以来,越来越多的人在谈论垂直搜索引擎,在关注它。为什么?焦点来自与需求。大家不约而同的看到了互联网一块新的领地,而这块领地中正是群雄割据,大家在等待下一个王者的到来。
这里为什么只谈垂直搜索,而不是通用搜索引擎,原因有三:(1)搜索引擎的技术门槛很高。Google的创始人是超级名校Stanford计算机系的PHD,Baidu的Robin Li也是领了多项搜索技术专利才敢切入搜索领域。可以说,没有3年以上的搜索技术积累,请不要涉及搜索领域。(2)搜索引擎的资金投入非常大,Google光是爬虫服务器就数万之巨,再加上网络带宽的购买,相信这些投入非一般人可以承受。可以说,没有千万级别的资金在手,请不要进入搜索引擎领域。(3)通用搜索引擎经过多年的发展已经非常成熟,各个巨头都已经占山为王, 在快鱼吃慢鱼的互联网里,落后就意味着无法生存。
因此,垂直代表含义是,第一,门槛低,第二,做得更专更深,第三,信息展现力更强。

3.垂直搜索引擎的突破与创新

垂直搜索引擎的优势,将决定它在互联网的一席之地。那么垂直搜索的突破点和创新的东西在哪里?

3.1 实时性

垂直搜索引擎需要获取的信息来自于某一特定领域的,这比起通用搜索引擎漫无边际的信息抓取,有一个非常大的优势,那就是信息的实时性。由于互联网上的信息量非常巨大,通用搜索引擎的数据更新周期短则十几天,长则几个月,而垂直搜索引擎的数据更新完全可以以秒为单位。酷讯的火车票搜索就是典型的实时性垂直搜索。

3.2数据挖掘分析,BI,报表

行业的历史发展、最新动向、趋势都是行业从业人员非常关注的话题。垂直搜索引擎集中了行业海量的信息和数据,基于这些信息和数据的商务智能分析,将为行业创造非常有价值的信息增值服务。
目前,各个垂直搜索引擎开始加强数据分析功能,分析的结果尚未向公众免费开放,毕竟,这也是一个非常好的盈利点。

3.3 个性化,社会化

查询服务只是垂直搜索引擎的一部分,垂直搜索引擎在用户的个性化方向的发展非常重要。垂直搜索引擎不能只提供一个窗口,它应该是一个用户高度参与交互的社会化平台。这不光是用户粘度,忠诚度的问题,更为重要的是,垂直搜索引擎需要能够获取并且分析用户的偏好信息,从而提供更加完善而且准确的数据服务。
关于这点,职友集可以说走在了前面,其职友圈为找工作的人提供了参与性很高的平台。

3.4智能化语义网

语义网(Semantic Web)将有可能成为下一代互联网,这样网络上的数据和信息将被计算机程序所理解。这将为垂直搜索引擎提供一个巨大的机会,爬虫程序如果能理解网络上的数据,将对信息的收集和整理更加准确和专业,搜索服务的查全率和查准率将更高。国外的Pluggd正在向这个方向努力。

3.5多元化查询
目前的搜索引擎,都只局限于关键字搜索,其中主要的原因是,对用户的查询需求无法建模,无法模式化。而关键字搜索带来的问题是,搜索结果过多,并且不准确。互联网信息量越大,这种情况越严重,可以说是灾难。多元化查询服务的提供,将会成为对竞争对手的杀手锏。Riya正在这方面尝试,它提出了可视化查询(Visual Search)的概念。


4.国内外优秀的垂直搜索引擎

4.1中国垂直搜索引擎名单
电子商务搜索引擎
http://www.hengzhe.com亨者搜索
餐饮搜索引擎
http://www.gudumami.cn咕嘟妈咪
旅行搜索引擎
http://www.qunar.com/去哪儿
户外结伴搜索引擎
http://www.Goofymob.com
求职搜索引擎
http://www.Jobui.com职友集
http://www.01hr.com/数字英才
生活信息搜索引擎
http://www.kooxoo.com酷讯
论坛搜索引擎
http://www.qihoo.com奇虎
http://www.daqi.com大旗
医疗搜索引擎
http://www.120so.com放心
娱乐资讯搜索引擎
http://www.sougou.com搜狗
http://www.sokiki.com搜齐集
房屋搜索引擎
http://www.yougedi.com/有个地
http://www.foloda.com房老大
人际搜索引擎
http://www.linkist.com/联络家
购物搜索引擎
http://www.askyaya.com丫丫

4.2 国外垂直搜索引擎名单
www.Technorati.com
www.Pluggd.com
www.live.com
www.riya.com
www.Retrevo.com
www.zoominfo.com
www.linkedin.com
www.Farecast.com
www.kosmix.com
www.biggerboat.com
www.seedic.com

分享到:
评论

相关推荐

    TRS 垂直搜索引擎白皮书

    什么是垂直搜索引擎? 搜索引擎的出现,整合了互联网上众多的网页资源,并提供信息导航和信息查询服务, 使信息的价值得到了网民和厂商的普遍认可。但是,搜索引擎的发展格局是多方面的,市场 需求的多元化也导致了...

    基于Elastic Search的电影垂直搜索引擎服务端技术研究1

    摘要:垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等缺点提出来的新的搜索引擎服务模式。通过针对某一特定领域、某一特定人群或某一特定需求提供的有

    垂直搜索与Web实体提取和关系分析

    其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。 垂直搜索的技术  垂直搜索引擎大体上需要以下技术  1.搜索引擎爬虫:抓取互联网上...

    软工管网球垂直搜索引擎爬虫和写入elasticsearch.zip

    这些URL可以通过链接分析、站点地图、搜索引擎等方式获取。 请求网页: 爬虫使用HTTP或其他协议向目标URL发起请求,获取网页的HTML内容。这通常通过HTTP请求库实现,如Python中的Requests库。 解析内容: 爬虫对...

    龙蛛搜索引擎 v2.1.2596.17577.rar

    提供用户企业级的搜索引擎服务。 4提供对站内页面搜索的支持,确保行业搜索的相关性。提供网页关键词、网址关键词等的筛选和屏蔽,可灵活的抓取网站的各类信息。为局域网、行业、垂直搜索提供最大限度的企业级支持。...

    龙蛛搜索 v2.2.rar

    龙蛛搜索是一套在行业局域网中建立搜索引擎系统的最佳选择,适合石油、教育院校、煤矿、金融、法律等系统内部局域网络的搜索引擎门户网站的建立,使用.net 2.0 mssql 环境搭建。目前程序免费使用,开放全部功能。 ...

    diana是一个基于Java的垂直爬虫框架,目的是通过封装垂直爬虫常用流程,来简化垂直爬虫开发.zip

    这些URL可以通过链接分析、站点地图、搜索引擎等方式获取。 请求网页: 爬虫使用HTTP或其他协议向目标URL发起请求,获取网页的HTML内容。这通常通过HTTP请求库实现,如Python中的Requests库。 解析内容: 爬虫对...

    使用深度学习方法解析问题 知识图谱存储 查询知识点 基于医疗垂直领域的对话系统.zip

    例如,在搜索引擎中,知识图谱可以提升搜索结果的相关性和准确性,为用户提供直接的答案而非仅仅是网页链接。同时,知识图谱还能支撑高级的人工智能应用,比如问答系统、推荐系统、决策支持等领域。 构建知识图谱的...

    轻量级爬虫工具,快速部署、断点续爬、操作简单,用于垂直爬取需求多百万量级的场景,达到事半功倍的效果。.zip

    这些URL可以通过链接分析、站点地图、搜索引擎等方式获取。 请求网页: 爬虫使用HTTP或其他协议向目标URL发起请求,获取网页的HTML内容。这通常通过HTTP请求库实现,如Python中的Requests库。 解析内容: 爬虫对...

    2_路径规划_地址编码_公交换乘_本地搜索_热点地图

    SSE4J(Spatial Search Engine for Java)是针对地理信息数据源构建的垂直搜索引擎应用接口,是基于Lucene+JTS Topology Suite开源库设计的框架。 规划的SSE4J包含: 1)SSE4J应用开发包 2)SSE4J Webservice应用...

    1_路径规划_地址编码_公交换乘_本地搜索_热点地图

    SSE4J(Spatial Search Engine for Java)是针对地理信息数据源构建的垂直搜索引擎应用接口,是基于Lucene+JTS Topology Suite开源库设计的框架。 规划的SSE4J包含: 1)SSE4J应用开发包 2)SSE4J Webservice应用...

    3_路径规划_地址编码_公交换乘_本地搜索_热点地图

    SSE4J(Spatial Search Engine for Java)是针对地理信息数据源构建的垂直搜索引擎应用接口,是基于Lucene+JTS Topology Suite开源库设计的框架。 规划的SSE4J包含: 1)SSE4J应用开发包 2)SSE4J Webservice应用...

    ElasticSearch5.2全网最全技术视频

    (1)涵盖Elasticsearch目前最核心的两个应用领域,垂直搜索引擎,实时数据分析 (2)开发出2个企业级的大型复杂项目,是完全真实的大型企业项目,电商搜索引擎,电商实时数据分析平台 (2-1)大型电商搜索引擎,...

    2018年人工智能行业深度分析报告.pdf

    和前两次不同,在这一波人工智能热潮中,人 工智能的技术已经开始广泛地渗入和应用于诸多领域, 包括社交媒体、 搜索引擎、 工业自动化、电子商务平台、交通出行和物流、安防、医疗和教育等,展现出巨 大的潜力。...

    SEO实战密码pdf

    第 9、10 两章讨论不好归类的一些专题,包括 SEO 观念、垂直搜索的排名等。 第 11 章介绍常用的 SEO 工具。 第 12 章简单讨论 SEO 项目管理中需要注意的问题。 第 13 章是 Google 和百度排名因素调查及列表,供 SEO ...

    结合本地计分和全局聚合以对深层Web查询排名实体

    但是当前的Web搜索引擎进行页面级别的排名,对于面向实体的垂直搜索来说,这已经不足。 在本文中,我们提出了一种基于本地评分和全局聚合的,用于深度Web查询的名为LG-ERM的实体级排名机制。 与传统方法不同,LG-...

    MallBuilder多用户网上商城 3.0.zip

    专业级搜索引擎化,快速提高网站排名及PR值 城市分站,自助建站,二级域名绑定,顶级域名绑定 模块化开发,不断加入实用的功能,自由安装 支持支付宝/财付通/PayPal等第三方支付平台 支持大规模应用,读写分离,...

    数据智能行业报告:SDK基础篇

    随着互联网和智能硬件的... 是基于大数据引擎,通过大规模机器学习和深度学习等技术,对海量数据进行处理、分析和挖掘,提取数据中所包含的信息和知识,使数据智能化,并通过建立模型寻求解决方案以及实现预测。从业

Global site tag (gtag.js) - Google Analytics