资讯月刊下载

第121期(18-03)

2018年03月 - 总第121期
  • Java程序员开发常用的工具
  • 3月全球数据库排名:PostgreSQL 再迎暴涨
点击下载>>

第120期(18-02)

2018年02月 - 总第120期
  • 开源巨献:2017 年 Google 开源了这些超赞的项目
  • 关于区块链,程序员需要了解什么
点击下载>>

第119期(18-01)

2018年01月 - 总第119期
  • 编写高性能Java代码的最佳实践
  • 从15000个Python开源项目中精选的Top30,Github平均star为3707,赶紧收藏!
点击下载>>

更多月刊下载

活跃编辑

资讯编辑

原创新闻 [编程语言] Java分布式中文分词组件word分词v1.3发布

word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵活指定多种分词算法,能使用refine功能灵活控制分词结果,还能使用词频统计、词性标注、同义标注、反 ...
yangshangchuan 评论(0) 有5289人浏览 2015-08-31 1 0

原创新闻 [开源软件] Genius:基于条件随机场算法的python分词组件

Genius Genius是一个开源的python中文分词组件,采用 CRF(Conditional Random Field)条件随机场算法。 Feature 支持python2.x、python3.x以及pypy2.x。 支持简单的pinyin分词 支持用户自定义break 支持用户自定义合并词典 支持词性标注 Source Install 安装git: 1) ubuntu or d ...
hity 评论(7) 有12830人浏览 2013-09-26 1 0

原创新闻 [开源软件] “结巴”分词:做最好的Python分词组件

中文分词是中文文本处理的一个基础性工作,然而长久以来,在Python编程领域,一直缺少高准确率、高效率的分词组件。结巴分词正是为了满足这一需求。 在线演示:http://209.222.69.242:9000/ 特性: 支持两种分词模式: 默认模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来,适合搜索引擎。 用法: 全自动安装:easy_in ...
fxsjy 评论(10) 有32391人浏览 2012-10-08 6 0

原创新闻 [开源软件] snailseg:基于单字位置最大概率的Python分词工具

snailseg是一个使用Python编写的简单的中文分词库。 项目地址:https://github.com/fxsjy/snailseg 在线分词效果展示:https://snailsegdemo.appspot.com/(使用代理访问) 使用方法 将snailseg目录放置于当前目录或者site-packages目录 import snailseg 代码示例 import snails ...
fxsjy 评论(5) 有5024人浏览 2012-09-19 2 0

最近热门TAG

Java(1854) Google(1441) Android(1244) JavaScript(842) Web(669) Linux(648) 框架(605) Windows(591) 浏览器(540) HTML5(533) Firefox(483) jQuery(480) iOS(479) Ruby(427) Chrome(386) HTML(380) 编程(365) 工作(349) Apache(346) Python(328)

热门资讯

Global site tag (gtag.js) - Google Analytics