- 浏览: 432597 次
- 性别:
- 来自: 苏州
最新评论
-
huguyue1988:
怎么样可以判断访问的音乐加载完成了呢?我的界面要加载多个这个的 ...
jPlayer的一些用法 -
永不悔你:
[color=yellow][/c[*][img][/img] ...
MyEclipse 9.0运行速度优化 -
tianyalinfeng:
这个教程里都有吧
jquery 筛选器 -
mengfei86:
你太牛了,我找了半天的问题,你一句代码搞定了,谢了,id^, ...
jquery 筛选器
相关推荐
基于统计和规则的未登录词识别方法研究.pdf
针对维汉统计机器翻译中未登录词较多的现象和维吾尔语语言资源匮乏这一现状, 结合维吾尔语构词特征以及相应的字符串相似度算法, 提出了一种基于字符串相似度的维汉机器翻译未登录词识别模型。该模型借助短语表和外部...
基于决策树的汉语未登录词识别 基于决策树的汉语未登录词识别
基于位置信息的未登录词识别方法
中文分词是中文自然语言处理的重要任务, 其目前存在的一个重大瓶颈是未登录词识别问题. 该文提出一种非监督的基于改进PMI和最小邻接熵结合策略的未登录词识别方法. 滤除文本中无关识别的标点符号和特殊字符后, 此...
安全技术-网络信息-词对抽取及基于网络的未登录词译文挖掘.pdf
藏文中后接成份出现频率较高,分词中未登录词的后缀单切现象会影响分词的正确率,为此,采用词(语素)+缀归并的方法,将藏文后接成份与前一词(语素)归并为一个切分单位输出。针对藏文中大量人名、地名、单位名等未...
针对维汉统计机器翻译中未登录词较多的现象和维吾尔语语言资源匮乏这一现状, 结合维吾尔语构词特征以及相应的字符串相似度算法, 提出了一种基于字符串相似度的维汉机器翻译未登录词识别模型。该模型借助短语表和外部...
论文参考资料
网络技术-网管软件
网络技术-网管软件
网络技术-网管软件
网络技术-网管软件
针对目前中文分词技术主要依赖于常用词词典,而词典对未登录词识别率较低的问题,提出一种用双词典识别未登录词的方法,即构建一个常用词词典和一个单字词词典,二者相互结合进行分词,有效解决了对未登录词识别效率偏低...
提出了一种基于层叠隐马模型的汉语词法分析方法,旨在将汉语分词、词性标注、切分排歧和未登录词识别集 成到一个完整的理论框架中1在分词方面,采取的是基于类的隐马模型,在这层隐马模型中,未登录词和词典中收录的普 ...
但基于词典的研究依赖于情感词典,由于新的词汇以及未登录词较多,情感 词典的构建难度较大,且词语缺少强度量化。机器学习的方法不能较好解决多个情感 词时引发的情感发散问题。本文提出了结合词典和机器学习的情感...
根据汉字的内码,在内存中以汉字内码的升序建立词典,通过分词碎片的位置信息来识别未登录词,避免了字符串的直接匹配,减少了算法的时间复杂度。
该算法首先利用组合词识别算法极大地改进分词效果,能识别网页上绝大多数的新词、未登录词,为提高关键词自动抽取准确率奠定了坚实的基础;同时利用构造的同义词集,合并同义词的词频,避免了同义词在输出结果中同现...
未登录词模块> 如果还有单词 转 1 否则 结束 Proj 1 实现一个英语单词还原工具 ">英文 词根还原 输入一个单词 如果词典里有该词 输出该词及其属性 转4 否则 转3 如果有该词的还原规则 并且 词典里有还原后的词 ...
在专业领域分词任务中,基于统计的分词方法的性能受限于缺少专业领域的标注语料,而基于词典的分词方法在处理新词和歧义词方面还有待提高。...该方法还可与新词发现等方法结合,改善未登录词的处理效果。