分词算法和模型 - tianyalinfeng - ITeye博客

`

tianyalinfeng

浏览: 432612 次
性别:
来自: 苏州

最近访客更多访客>>

atianchen

okahns

windmark

sfw0807

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

huguyue1988：怎么样可以判断访问的音乐加载完成了呢？我的界面要加载多个这个的 ...
jPlayer的一些用法
永不悔你： [color=yellow][/c[*][img][/img] ...
MyEclipse 9.0运行速度优化
tianyalinfeng：这个教程里都有吧
jquery 筛选器
mengfei86：你太牛了，我找了半天的问题，你一句代码搞定了，谢了，id^, ...
jquery 筛选器

分词算法和模型

博客分类：

Nlp

阅读更多

维特比算法(Viterbi)

隐马尔可夫模型(Hidden Markov model, HMM)

最大熵模型(Maximum Entropy, ME)

支持向量机(SVM)

线性链条件随机场模型(CRF)

最大间隔马尔可夫网络模型

遗传算法

N-gram模型

有监督机器学习

HMM属于产生式模型（基于联合概率分布），CRF和ME属于判别式模型（基于条件概率）

分享到：

中文信息处理 | 未登录词

2011-11-15 15:56
浏览 1205
评论(0)
分类:行业应用
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

基于标签和语言模型的分词算法: 宗成庆书里面准确率最高的分词算法，代码有点错误，[c t]分母上的统计量应该是统计前几个字出现的字数而不是自身的个数，修改就可以进行分词，细节看里面的标注，参照给出的语料可以使用

一种基于N-gram模型和机器学习的汉语分词算法: 一种基于N-gram模型和机器学习的汉语分词算法，不错的分词算法。

一种基于N-gram模型和机器学习的汉语分词算法.pdf: 一种基于N-gram模型和机器学习的汉语分词算法.pdf

N-gram模型和机器学习的汉语分词算法: 这是一篇关于自然语言处理的论文，介绍了汉语分词的n-gram算法，绝对值得推荐

中文分词工具word-1.0,Java实现的中文分词组件多种基于词典的分词算法: word分词是一个Java实现的中文分词组件，提供了多种基于词典的分词算法，并利用ngram模型来消除歧义。能准确识别英文、数字，以及日期、时间等数量词，能识别人名、地名、组织机构名等未登录词。同时提供了Lucene...

中文分词-隐马尔可夫模型: 参考网上大神给的代码，自己调通了，使用隐马尔可夫模型进行中文分词

HMM模型+维特比算法实现分词词性标注.py: HMM模型+维特比算法实现分词词性标注.py

ngram模型分词与统计算法.zip_NGram 算法_ngram 分词_ngram模型分词与统计算法_n元模型_按n-gram: N-Gram（有时也称为N元模型）是自然语言处理中一个非常重要的概念，通常在NLP中，人们基于一定的语料库，可以利用N-Gram来预计或者评估一个句子是否合理。另外一方面，N-Gram的另外一个作用是用来评估两个字符串之间...

HMM中文分词: 基于HMM的中文分词代码，虽然基于字标注的中文分词借鉴了词性标注的思想，但是在实践中，多数paper中的方法似乎局限于最大熵模型和条件随机场的应用，所以我常常疑惑字标注中文分词方法为什么不采用别的模型和方法呢...

中文分词算法技术分享PPT: 本文档是技术分享的PPT,详解深入讲解了三种中文分词算法，包知ik、mmseg、hanlp。文档中还分析了ik的岐义消除规则相关代码，以及hanlp最短路径算法原理及代码实现。

HMM的维特比算法实现分词: 使用HMM的维特比算法实现分词，采用标注好的人民日报进行统计训练得到HMM模型参数，对新文本实现分词。

使用HMM模型实现的中文分词程序: 该模型使用了HMM(隐马尔可夫)模型建立中文分词程序，使用了词性标注的思想进行中文分词，更加适合自然语言处理方向的新手进行学习！

基于隐马尔科夫模型的分词: 使用隐马尔科夫模型（Hidden Markov Model，HMM）进行分词，并与基于词典的正向最大匹配算法和工业界使用的jieba分词进行对比。采用最大似然估计的方法从带标记样本学习模型参数，并通过维特比算法进行解码。

基于python开发的微型中文分词器附完整代码: 以下几种分词算法: 1.按照词语的频率来利用构建 DAG来分词，使用 Trie Tree 构建前缀字典树 2.使用隐马尔可夫模型来分词 3.融合 DAG 和 HMM 两种分词模型的结果，按照分词粒度最大化的原则进行融合得到的模型 4.正向...

HMM隐马尔科夫模型进行中文文本分词.zip: 使用隐马尔可夫模型对中文文本进行分词

面向文本知识管理的自适应中文分词算法 (2010年): 针对传统字典匹配分词法在识别新词和特殊词处理方面的不足,结合2元统计模型提出了面向文本知识管理的自适应中文分词算法――SACWSA.SACWSA在预处理阶段结合应用有限状态机理论、基于连词的分隔方法和分治策略对输入...

基于Viterbi算法以及预训练模型用于中文分词标注功能实现: 本程序首先实现了对段落的所有的句子进行分句，然后对每个句子进行预训练模型的分词预测，维特比算法(Viterbi)转移矩阵的计算，得到最终的句子的分词。

基于python设计的汉语分词系统: 本次实验目的是对汉语自动分词技术有一个全面的了解，包括从词典的建立、分词算法的实现、性能评价和优化等环节。本次实验所要用到的知识如下：基本编程能力（文件处理、数据统计等）相关的查找算法及数据结构...

基于BiLSTM-CRF的中文分词及命名实体识别.zip: 在实验中实现中文分词处理，可考虑使用课堂讲解过的算法（比如基于统计、基于词典的分词方法等），或者课外学习算法（比如Bi-LSTM+CRF模型等）进行分词，最后对比不同算法分词效果和性能，加深对中文分词算法的理解...

Global site tag (gtag.js) - Google Analytics