`
zolomon
  • 浏览: 22800 次
  • 性别: Icon_minigender_1
  • 来自: 上海
最近访客 更多访客>>
社区版块
存档分类
最新评论

〇,概述与索引

阅读更多
本文为solomon@javaeye原创,如有转载,注明出处(作者solomon与链接http://zolomon.iteye.com).
本专题使用中文分词为ikanalyzer,感谢其作者为java中文事业做出的巨大贡献.
我的个人资料http://www.google.com/profiles/solomon.royarr

本专题包括9个部分.
前3个部分在实施人员的使用层面,
第4部分提供更详细的nutch配置属性的讲解,
第5部分在开发人员的使用层面,
6到8部分在源码研究层面,
第9部分是在二次开发(zh本地化)之后linux实施与管理员如何使用nutch提供的命令与工具进行大型搜索引擎的部署.
由于笔者比较懒,又要上班,所以文章更新进度不会很快,
预计1~8部分在两个月内完成.
第9部分笔者也没接触过,没有预计时间,也可能会搁浅.

废话说了不少,下面进入正题:
首先介绍一些资源一些资源:
nutch 主页: http://lucene.apache.org/nutch/
nutch wiki: http://wiki.apache.org/nutch/
nutch入门教程: http://lucene.apache.org/nutch/tutorial.html
ikanalyzer的友人: http://linliangyi2007.iteye.com/
ikanalyzer: http://linliangyi2007.iteye.com/blog/41014
截止到笔者书写这篇的时候,nutch官方入门教程还没有更新仍然是0.7的内容.

下面各链接为9部分内容.
初稿只写了1~3部分,
阅读者可以根据这1~3步初步运行起nutch的搜索网站与爬虫.
这3部分仍未写全,所以这3步与后面6步都会不断增加,更新与补全.

1)准备工作,nutch 1.0 的下载与抽取http://zolomon.iteye.com/blog/373079
2)nutch 1.0 web应用部署http://zolomon.iteye.com/blog/373080
3)nutch 1.0 爬虫配置与运行http://zolomon.iteye.com/blog/373084
4)nutch 1.0 网站与爬虫的属性配置文件研究http://zolomon.iteye.com/blog/378871
5)使用nutch 1.0 api 进行定制开发
6)构建eclipse nutch 1.0 工程
7)nutch 1.0 源码研究
8)对nutch 1.0 进行二次开发,nutch 1.0 插件的编写
9)nutch 1.0 高级使用

抱歉读者最近没有及时更新.
前一段时间工作上比较忙,
最近由于个人原因于2009年8月无限期暂时停止更新.
分享到:
评论
3 楼 solomon 2011-06-03  
晕.比我的ID差一个字母.

"本文为solomon@javaeye原创"   没有写过,可不敢窃为己功
2 楼 talangniao 2010-01-15  
???????????????
1 楼 coolasp 2009-05-21  

相关推荐

    MySQL数据库:索引概述.pptx

    索引概述 课程目标 了解 ——索引的分类。 理解 ——索引的概念及作用; 索引概述 索引的概念 索引是一个单独的、物理的数据库结构,是某个表中一列或者若干列的集合以及相应的标识这些值所在的数据页的逻辑指针清单...

    分区索引,本地索引,全局索引的区别

    oracle 分区索引,本地索引,全局索引的区别

    论文研究-XML数据索引技术发展概述 .pdf

    XML数据索引技术发展概述,刘景超,刘先锋,本文深入地讨论了目前XML索引技术的研究现状,对XML索引技术进行了分类,包括基于路径节点记录的XML索引技术、基于结构摘要的XML索引

    索引介绍聚集索引和非聚集索引

    关于索引的介绍,以及b+树结构图,两种索引性能比较,索引优化建议

    SQL Server 索引结构及其使用(聚集索引与非聚集索引)

    SQL Server 索引结构及其使用(聚集索引和非聚集索引)的区别与实例讲解,提高查询速度。

    02-VIP-Explain详解与索引最佳实践.pdf

    02-VIP-Explain详解与索引最佳实践.pdf

    MySQL 主键与索引的联系与区别分析

    下面是主键和索引的一些区别与联系。 1. 主键一定是唯一性索引,唯一性索引并不一定就是主键。 所谓主键就是能够唯一标识表中某一行的属性或属性组,一个表只能有一个主键,但可以有多个候选索引。因为主键可以唯一...

    数据库管理与应用 4.1 索引概述.pdf

    数据库管理与应用 4.1 索引概述.pdf 学习资料 复习资料 教学资源

    C#中索引器的概述

    C#语言一个最令人感兴趣的地方就是类的索引器(indexer)。简单说来,所谓索引器就是一类特殊的属性, 通过它们你就可以像引用数组一样引用自己的类。...但是,首先让我们概述下属性这个概念以便了解些必要的背景知识。

    数据库索引设计与优化

    数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化数据库索引设计与优化...

    SQL数据存储与索引

    数据存储与索引 数据存储与索引 数据存储与索引

    oracle分区与索引

    oracle分区与索引

    mysql存储与索引技术

    介绍mysql不同的存储引擎 以及 索引技术在mysql中的应用

    Mysql事务及索引

    一、数据库索引概述; 二、数据库索引分类; 三、Mysql数据库管理索引; 四、数据库事务概述; 五、数据库事务特性; 六、Mysqk数据库管理事务;

    漫谈数据库索引漫谈数据库索引漫谈数据库索引

    漫谈数据库索引漫谈数据库索引漫谈数据库索引漫谈数据库索引

    聚集索引与非聚集索引的区别

    一种索引,该索引中键值的逻辑顺序决定了表中相应行的物理顺序。  聚集索引确定表中数据的物理顺序。聚集索引类似于电话簿,后者按姓氏排列数据。由于聚集索引规定数据在表中的物理存储顺序,因此一个表只能包含一...

    mysql 索引与执行计划

    1. 索引与执行计划 1 1.1. 索引入门 1 1.1.1. 索引是什么 1 1.1.2. 索引得分类 3 1.1.3. 基础语法 3 1.2. 执行计划 3 1.2.1. 什么是执行计划 3 1.2.2. 执行计划的作用 3 1.2.3. 执行计划的语法 4 1.2.4. 执行计划...

    oracle索引与分区索引介绍

    oracle索引与分区索引介绍 删除分区 分区合并(从中间删除掉一个分区,或者两个分区需要合并后减少分区数量) 创建新的分区 交换分区

Global site tag (gtag.js) - Google Analytics