本文为solomon@javaeye原创,如有转载,注明出处(作者solomon与链接
http://zolomon.iteye.com).
本专题使用中文分词为ikanalyzer,感谢其作者为java中文事业做出的巨大贡献.
我的个人资料
http://www.google.com/profiles/solomon.royarr
本专题包括9个部分.
前3个部分在实施人员的使用层面,
第4部分提供更详细的nutch配置属性的讲解,
第5部分在开发人员的使用层面,
6到8部分在源码研究层面,
第9部分是在二次开发(zh本地化)之后linux实施与管理员如何使用nutch提供的命令与工具进行大型搜索引擎的部署.
由于笔者比较懒,又要上班,所以文章更新进度不会很快,
预计1~8部分在两个月内完成.
第9部分笔者也没接触过,没有预计时间,也可能会搁浅.
废话说了不少,下面进入正题:
首先介绍一些资源一些资源:
nutch 主页:
http://lucene.apache.org/nutch/
nutch wiki:
http://wiki.apache.org/nutch/
nutch入门教程:
http://lucene.apache.org/nutch/tutorial.html
ikanalyzer的友人:
http://linliangyi2007.iteye.com/
ikanalyzer:
http://linliangyi2007.iteye.com/blog/41014
截止到笔者书写这篇的时候,nutch官方入门教程还没有更新仍然是0.7的内容.
下面各链接为9部分内容.
初稿只写了1~3部分,
阅读者可以根据这1~3步初步运行起nutch的搜索网站与爬虫.
这3部分仍未写全,所以这3步与后面6步都会不断增加,更新与补全.
1)准备工作,nutch 1.0 的下载与抽取
http://zolomon.iteye.com/blog/373079
2)nutch 1.0 web应用部署
http://zolomon.iteye.com/blog/373080
3)nutch 1.0 爬虫配置与运行
http://zolomon.iteye.com/blog/373084
4)nutch 1.0 网站与爬虫的属性配置文件研究
http://zolomon.iteye.com/blog/378871
5)使用nutch 1.0 api 进行定制开发
6)构建eclipse nutch 1.0 工程
7)nutch 1.0 源码研究
8)对nutch 1.0 进行二次开发,nutch 1.0 插件的编写
9)nutch 1.0 高级使用
抱歉读者最近没有及时更新.
前一段时间工作上比较忙,
最近由于个人原因于2009年8月无限期暂时停止更新.
分享到:
相关推荐
索引概述 课程目标 了解 ——索引的分类。 理解 ——索引的概念及作用; 索引概述 索引的概念 索引是一个单独的、物理的数据库结构,是某个表中一列或者若干列的集合以及相应的标识这些值所在的数据页的逻辑指针清单...
oracle 分区索引,本地索引,全局索引的区别
XML数据索引技术发展概述,刘景超,刘先锋,本文深入地讨论了目前XML索引技术的研究现状,对XML索引技术进行了分类,包括基于路径节点记录的XML索引技术、基于结构摘要的XML索引
关于索引的介绍,以及b+树结构图,两种索引性能比较,索引优化建议
SQL Server 索引结构及其使用(聚集索引和非聚集索引)的区别与实例讲解,提高查询速度。
02-VIP-Explain详解与索引最佳实践.pdf
下面是主键和索引的一些区别与联系。 1. 主键一定是唯一性索引,唯一性索引并不一定就是主键。 所谓主键就是能够唯一标识表中某一行的属性或属性组,一个表只能有一个主键,但可以有多个候选索引。因为主键可以唯一...
数据库管理与应用 4.1 索引概述.pdf 学习资料 复习资料 教学资源
C#语言一个最令人感兴趣的地方就是类的索引器(indexer)。简单说来,所谓索引器就是一类特殊的属性, 通过它们你就可以像引用数组一样引用自己的类。...但是,首先让我们概述下属性这个概念以便了解些必要的背景知识。
数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化...
数据存储与索引 数据存储与索引 数据存储与索引
oracle分区与索引
介绍mysql不同的存储引擎 以及 索引技术在mysql中的应用
一、数据库索引概述; 二、数据库索引分类; 三、Mysql数据库管理索引; 四、数据库事务概述; 五、数据库事务特性; 六、Mysqk数据库管理事务;
漫谈数据库索引漫谈数据库索引漫谈数据库索引漫谈数据库索引
一种索引,该索引中键值的逻辑顺序决定了表中相应行的物理顺序。 聚集索引确定表中数据的物理顺序。聚集索引类似于电话簿,后者按姓氏排列数据。由于聚集索引规定数据在表中的物理存储顺序,因此一个表只能包含一...
1. 索引与执行计划 1 1.1. 索引入门 1 1.1.1. 索引是什么 1 1.1.2. 索引得分类 3 1.1.3. 基础语法 3 1.2. 执行计划 3 1.2.1. 什么是执行计划 3 1.2.2. 执行计划的作用 3 1.2.3. 执行计划的语法 4 1.2.4. 执行计划...
oracle索引与分区索引介绍 删除分区 分区合并(从中间删除掉一个分区,或者两个分区需要合并后减少分区数量) 创建新的分区 交换分区