- text2wfreq < weather.txt | wfreq2vocab > weather.tmp.vocab
最近研究Android上的语音识别,在此记录下遇到的问题。
先引用一篇博文,http://leiwuluan.iteye.com/blog/1287305。根据这篇博文的内容,要是没遇到问题的话,应该可以生成一个apk,在手机上可以运行,能进行识别,但是效率很低,识别率也不咋地。现在我们需要自己来构建识别的库。
根据代码
- c.setString("-dict",
- "/sdcard/Android/data/edu/edu.cmu.pocketsphinx/lm/zh_CN/mandarin_notone.dic");
- c.setString("-lm",
- "/sdcard/Android/data/edu/edu.cmu.pocketsphinx/lm/zh_CN/gigatdt.5000.DMP");
程序会引用到两个文件,第一个是字典文件,第二个是声音模型文件,程序先将输入的声音和声音模型文件对比,生成音节编码,再将音节编码在字典中查找,返回最后的字符结果。Sphinx是个很完善的引擎,除了开源之外,官方还提供了各种工具供开发者构建自己的声音对比模型,字典,记忆语言模型。本文参考http://cmusphinx.sourceforge.net/wiki/tutoriallm,用CMUCLMTK构建自己的语言模型。
1.首先,假设你已经根据本文开头的那篇博文成功编译了PocketSphinx并且成功在手机上运行。
2.下载CMUCLMTK,http://sourceforge.net/projects/cmusphinx/files/cmuclmtk/0.7/cmuclmtk-0.7.tar.gz/download
3.将下载的文件解压到Sphinx根目录,参见开篇引用博文。
4.命令行下进入到CMUCLMTK目录,我的为
- /workspace/VoiceRecognition/cmuclmtk-0.7#
我的电脑系统是linux,如果是windows需要用cgwin
5. ./configure
6.make install
7.cd src
8.make install
9.在4的目录下,新建weather.txt,输入
- <s> generally cloudy today with scattered outbreaks of rain and drizzle persistent and heavy at times </s>
- <s> some dry intervals also with hazy sunshine especially in eastern parts in the morning </s>
- <s> highest temperatures nine to thirteen Celsius in a light or moderate mainly east south east breeze </s>
- <s> cloudy damp and misty today with spells of rain and drizzle in most places much of this rain will be
- light and patchy but heavier rain may develop in the west later </s>
10.命令行下输入,
- text2wfreq < weather.txt | wfreq2vocab > weather.tmp.vocab
这时报错,如下
- text2wfreq: error while loading shared libraries: libcmuclmtk.so.0: cannot open shared object file: No such file or directory
参考error while loading shared libraries解决。
11.输入
- text2idngram -vocab weather.tmp.vocab -idngram weather.idngram < weather.txt
12.输入
- idngram2lm -vocab_type 0 -idngram weather.idngram -vocab weather.tmp.vocab -arpa weather.arpa
如果无误,在目录下会生成weather.tmp.DMP文件。
官网说在http://www.speech.cs.cmu.edu/tools/lmtool.html也可以在线提交txt文件,在服务器生成DMP文件,但是我在试的时候,发现访问不了,可能是太多人用了,CMU把这个服务给关了?
哈哈,在查资料的时候,又发现有这方面的博文,再引用一下,http://www.cnblogs.com/huanghuang/archive/2011/07/14/2106579.html,http://archive.cnblogs.com/a/2111834/,http://www.cnblogs.com/huanghuang/archive/2011/07/18/2109101.html,这三篇应该讲的很全面了。
相关推荐
泛微协同办公平台E-cology9.0版本后台维护手册(X)--建模引擎. 泛微协同办公平台E-cology9.0版本后台维护手册(X)--建模引擎. 泛微协同办公平台E-cology9.0版本后台维护手册(X)--建模引擎. 泛微协同办公平台E-...
2015-2021建模比赛优秀论文汇总 2015-2021建模比赛优秀论文整理 2015-2021建模比赛优秀论文题目 2015-2021建模比赛优秀论文大学生建模比赛优秀论文 2015-2021美国大学生数学建模大赛2015-2021建模比赛优秀论文整理 ...
拟合问题-数学建模拟合问题-数学建模拟合问题-数学建模拟合问题-数学建模拟合问题-数学建模拟合问题-数学建模拟合问题-数学建模拟合问题-数学建模拟合问题-数学建模拟合问题-数学建模
使用多语言深度神经网络(DNN)建模方法探索了不同的基于基本和圆形电话单元的语音识别器。 实验结果表明,所有基于基本电话和基于圆形电话单元的多语言模型均优于相应的单语言模型,相对性能分别提高了5.47%至19....
协同办公平台E-cology9.0版本后台维护手册(X)--建模引擎.docx
泛微9.0--建模引擎
需求工程--软件建模与分析 一课的复习资料 内含: 课上所划所有习题 部分习题答案(半数)
泛微协同办公平台E-cology9.0版本后台维护手册(X)--建模引擎
《MATLAB/Simulink建模与仿真实例精讲》可作为广大在校本科生和研究生的学习用书,也可以作为广大科研人员、学者、工程技术人员的参考用书。全书共分9章。第1章介绍了MATLAB及Simulink仿真基础知识,包括MATLAB简介...
该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含transformer、CBHG,数据集包含stc、primewords、Aishell、thchs30四个数据集。
时间序列分析及Box-Jenkins建模用R语言-复旦,课件+案例数据+代码 时 间序列分析及Box-Jenkins建模用R语言-复旦 时间序列分析及Box-Je nkins建模用R语言-复旦 时间序列分析及Box-Jenkins建模用R语言- 复旦 时间序列...
该方法主要包括了层次化建模方法、TopDown建模方法、面向对象建模技术和YChart建模方法,并采用提出的系统级建模方法,分别使用SystemC语言和POOSL语言成功地对语音识别系统进行了建模;通过模型的仿真进行了...
MATLAB-SIMULINK建模与仿真实例精讲-张德丰(pdf).
可视化面向对象建模技术--标准建模语言UML
2019研究生数学建模比赛B题附件 2019研究生数学建模比赛B题附件 天文导航中的星图识别建模中文版---附件.doc
风控决策引擎 建模案例介绍 金融银行 。 网商银行联合贷业务,为某城商行通过与网商银行合作,利用全线上技术,按照约定的资金比例,基于双方共同认可的规则审批,为符合特定准入标准的淘宝、天猫、口碑、B2B商户、...
uml总结。统一建模语言uml的介绍。 1 UML简介 2 用例建模 3 静态建模 4 动态建模 5 物理架构建模 6 基于UML的统一建模过程——RUP
用遗传算法实现语音识别--基于mfcc参数,包括语音信号的预处理,建模,和识别
张版-数学建模与数学实验.内容覆盖很广,可以作为参考书使用。
该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括 CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含 transformer、CBHG,数据集包含 stc、primewords、Aishell、thchs30 四个数据集。...