`
qipei
  • 浏览: 10037 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论
文章列表
本人用(Solr + paoding) 庖丁中文分词需要一套词典,这些词典需要统一存储在某个目录下,这个目录称为词典安装目录。词典安装目录可以是文件系统的任何目录,它不依赖于应用程序的运行目录。将词典拷贝到词典安装目录的过程称为安装词典。增加、删除、修改词典目录下的词典的过程称为自定制词典。 在linux下,我们可以考虑将词典安装在一个专门存储数据的分区下某目录,以笔者为例,笔者将/data作为系统的一个独立分区,笔者便是将词典保存在/data/paoding/dic下。 在windows下,我们可以考虑将词典安装在非系统盘的另外分区下的某个目录,以笔者为例,笔者可能将词典保存在E:/ ...
最近项目中用到htmlparser(1.6) htmlparser的基本用法网上有 不再罗嗦 这里介绍一篇写htmlparser自定义标签的文章: http://www.ibm.com/developerworks/cn/opensource/os-htmlparser/ 下面说下如何注册自己定义的标签:(其实很简单, 只是不熟悉API.....@_@) HTML:      在我的页面中有<Strong>.....</Strong>等htmlparser没有实现的Tag 自定义StrongTag: import org.htmlparser.tags.Com ...
Global site tag (gtag.js) - Google Analytics