`

再次脱线的Tomoe酱

 
阅读更多

    之前移植了libspark的Tomoe(原版是用AS2实现)到Java上,后来发现她只能识别不含请浊音的平假名。这几天抽时间想补完它,在网上找到了一个开源项目tegaki(手書),它是基于tomoe(巴)和zinnia(百日草)。

 

http://tegaki.org/

 

    它的主要作用是提供跨平台的图形界面(用Python实现)。它的代码仓库里有一个平片假名的训练数据包,格式是XML。

 

https://github.com/tegaki/tegaki/tree/master/tegaki-models/data/train/japanese

 

    我用Java的SAX解释器分析它(虽然标签层次有点不同,但它可以用Tomoe模型数据的XML读取方法读取),然后导出为Java的代码,粘贴到代码中。

    本以为大功告成,谁知Tomoe不能识别原始的片假名模型数据。想了几天,对比原来的AS2版本,后来我放宽了候选字的过滤条件,加大候选字的输出个数,终于可以勉强识别到了。

 

 

分享到:
评论

相关推荐

    tomoe开源手写识别

    tomoe开源手写识别 这是关于手写识别的开源代码

    基于tomoe的QT手写识别

    在tomoe-0.6.0基础上,使用的qt 手写识别程序!

    TOMOE TRITEC三偏心过程阀门.pdf

    TOMOE TRITEC三偏心过程阀门pdf,TOMOE TRITEC三偏心过程阀门

    zinnia-tomoe-0.6.0_20080911-1-src.tar.bz2

    zinnia-tomoe-0.6.0_20080911-1-src.tar.bz2

    在线手写汉字识别源码 Zinnia

    Zinnia: Online hand recognition system with machine learning

    最强Zinnia手写模型汉字库

    此手写模型库是我自己花费近3年时间训练的,包含大量汉字字符,史上最强的Zinnia和Tomoe的汉字手写模型库,当前可支持30000个左右汉字!支持大量生僻字!handwriting-zh_CN.model。对于使用基于zinnia和tomoe算法...

    android手写识别引擎zinna

    官网上有,自己打个包传上来方便自己和大家下载 包含zinnia和zinnia-tomoe 适用于ubuntu 详细安装介绍http://blog.chinaunix.net/uid-25565031-id-3202438.html 欢迎访问www.libaier.net~

    zinnia-demo

    百日草-tomoe-0.6.0 百日草 下载 安装 cd zinnia-0.0.6/ruby ruby extconf.rb make make install cd zinnia-tomoe-0.6.0-20080911 ./configure make make install 蜜蜂 首页/顶部(GET) 主页/分类(GET) 演示版

    TextConverter:通过 AutoHotkey 转换文本

    jNizM 的 TextConverter 通过 AutoHotkey 转换文本 特征 将文本转换为:字符、十进制、八进制、十六进制、二进制 截屏 信息 版本:v0.2 ...感谢 tomoe_uehara 的创意 感谢 AutoHotkey 社区 版权和许可

    xdoj18数字字符.cpp

    1.数字字符 问题描述: 通过键盘输入1个整数a(0),1个数字字符b(’0’’5’),求a+b。 输入说明: 整形数据、数字字符通过键盘输入,输入的整形数据介于0和4之间,输入的数字字符介于‘0’和‘5’之间,二个输入...

Global site tag (gtag.js) - Google Analytics