垂直搜索引擎大体上需要以下技术
1.Spider
2.网页结构化信息抽取技术或元数据采集技术
3.分词、索引
4.其他信息处理技术
垂直搜索引擎的技术评估应从以下几点来判断
1.全面性
2.更新性
3.准确性
4.功能性
垂直搜索引擎的三个特点:
1、垂直搜索引擎抓取的数据来源于垂直搜索引擎关注的行业站点:
2、垂直搜索引擎抓取的数据倾向于结构化数据和元数据:
3、垂直搜索引擎的搜索行为是基于结构化数据和元数据的结构化搜索:
垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各
类信息都可以进一步细化成各类的垂直搜索引擎。
抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、
……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。
垂直类网站用户的覆盖人数第一是博客,第二是在线视频,在线视频网站从流量上看,可以说是一种媒体级别的网站,但是它的媒体价值可能还没能被广告主
所认可。接下来是网上购物、IT类网站、新闻门户类(指新华网,千龙网等纯新闻的垂直网站)、财经网站、网络游戏、B2B网站、房产网站、汽车网站。这
些细分类别很多已经成为门户网站的一个频道,甚至核心频道。为什么呢?因为这些细分类别的线下产业成熟度比较高,对网站媒体性的需求也比较大,所以
更倾向网站媒体化。
分享到:
相关推荐
垂直搜索浅析ppt 垂直搜索浅析ppt 垂直搜索浅析ppt 垂直搜索浅析ppt
垂直搜索引擎的选型;网页库级垂直搜索引擎技术(二)如何做好一个垂直搜索引擎;信息抽取的资料文档
搜索引擎是目前互联网信息服务的主要工具, 它...本文从信息服务的角度出发, 通过对综合搜索引擎与垂直搜索引擎在信息服 务各个要素方面的比较, 找出它们之间的竞争与合作的关系, 为当前的搜索引擎发展做出初步的 分析。
论文研究了搜索引擎的相关技术,通过分析基于查询串方式的搜索引擎和分类目录式搜索引擎的整体结构,设计了垂直搜索引擎的系统结构,并对其中涉及的关键技术:触b搜集器、信息抽取技术、中文分词和检索技术进行了深入...
垂直搜索引擎研究垂直搜索引擎研究垂直搜索引擎研究垂直搜索引擎研究
基于lucene的垂直搜索引擎研究,开题报告
DDH垂直搜索引擎系统是一个Java实现的垂直搜索引擎系统,是一套整合了Nutch/UCI/SOLR的网络信息整合系统。借助DDH你可以快速构建多领域的垂直搜索引擎系统。目前DDH整合了Nutch2.2.1+UCI1.0+SOLR4。
垂直搜索论文及技术 论文 google算法
Asp.net Sqlserver 垂直搜索网站代码下载
垂直搜索引擎网络爬虫的研究与实现.pdf垂直搜索引擎网络爬虫的研究与实现.pdf垂直搜索引擎网络爬虫的研究与实现.pdf垂直搜索引擎网络爬虫的研究与实现.pdf
介绍了一种垂直搜索引擎的爬虫设计方案,这是主题搜索引擎的核心部分。
垂直搜索引擎,自带爬虫,sql2008数据库,并发高,处理速度快,有web页面查询。dell 1950 可以每秒处理10g的查询,支持上亿的数据。
探讨了Lucene和Heritrix在构建垂直搜索引擎中的应用。 1、垂直搜索引擎的基本介绍 2、基于Java 的全文检索引擎—Jakarta Lucene 3、网络爬虫Heritrix 4、Lucene和Heritrix在构建垂直搜索引擎中的应用(含代码) 5、...
垂直搜索引擎完全开源版 c#开发基于Lucene.net 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,...
我自己从网上淘来的5个关于垂直搜索的实例,大家有兴趣的下载看看,压缩了,但还是很大,有2M多呢
奥搜垂直搜索引擎旅游版
网博垂直搜索引擎完全开源版 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,完全开源,可以与...