TIMIT是1993年由MIT创立的、适用于语音识别、说话人分类等的经典语料库 ,但matlab是不能直接对TIMIT中的音频进行处理,因为是SPHERE文件格式,所以要先进行一定的格式转换。
代码如下:
function wavdata=readTIMITwav(filepath) % author: % 郑睿 % date: % 2013-12-29 % function: % 实现读取TIMIT语料库中音频文件的功能 % filepath: % TIMIT语料库中音频文件的路径 % wavdata: % 音频文件 clc; clear all; fidin=fopen(filepath,'r'); % 打开文件,指定对该文件进行的操作方式为只读 A = fread(fidin,inf,'int16'); % 以二进制形式读取文件的全部数据,精度为16位整型 wavdata=A./(2^15); % SPHERE 文件头1024字节,转换成wav格式 fclose(fidin); % 关闭文件
相关推荐
语音识别经典语料库TIMIT语料库的官方说明,包含语料构成
刚从网上下载的可能不是很全但是希望对大家有用
Brown语料库是世界上第一个计算机可读的语料库,它搜集的语料来自1961年美国英语出版物上的文本,共500篇,每篇大约2000个单词,合计100万单词。LOB语料库是模仿Brown语料库的比例建立起来的英国英语语料库,其预料...
LCMC语料库是一个100万词次(按每1.6个汉字对应一个英文单词折算)的现代汉语书面语通用型平衡语料库。起先建立时,它是作为英国经社研究委员会资助项目Contrasting Tense and Aspect in English and Chinese的部分...
Reuters-21578语料库转成txt脚本(Python)
LOB语料库 创建时间: 1970年代初 创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学 规模层级: 100万词次 基本情况:研究当代英国英语,与美国英语对比,使用了TAGIT系统,以统计方式建立换算几率矩阵,提高标注...
人工智能-项目实践-聊天语料库-中文公开聊天语料库 该库是对目前市面上已有的开源中文聊天语料的搜集和系统化整理工作 该库搜集了包含 chatterbot 豆瓣多轮 PTT八卦语料 青云语料 电视剧对白语料 贴吧论坛回帖...
语料库检索工具,检索语料库
中国学习者英语语料库
微博语料库WeiboNER.zip
用于情感分析案例的语料库,亲测有效。积极、消极各5000条数据。
完整语料库包括600名发音人,发音人覆盖全国不同地区、年龄、性别及文化程度,录音环境覆盖安静、座机、手机、车载、背景音乐及嘈杂声等场景,录音语料覆盖单字、词汇、语句、自然对话及语篇,采样率分8K和44K两种,...
搜狗语料库,经验证非常好用。欢迎下载。搜狗语料库,经验证非常好用。欢迎下载。搜狗语料库,经验证非常好用。欢迎下载。
搜狐新闻分类语料库,主要包含 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事 十个分类,共50多万条记录
人民日报2014年语料库,2014.1.1至2014年1.23日人民日报语料库。
搜狗的新闻中文语料库,可用于word2vec训练用的。。。。。。。。。。。。。。。。。。。。。。。。
这个语料库大概有上万条对话,都是中文的,免费分享给大家。缺点是使用的语法都是最基本的语法,没有一些华丽的对话设置。
隐喻研究与语料库语言学的结合是近年来语言学研究领域的新趋势,语料库研究方法的兴起促进了隐喻的实证转向。近十年来国外学者在隐喻语料库方面的研究成果大致可分为四个方向:隐喻在语料库中的识别和提取;隐喻跨语言...
Text8语料库,自己从ewik8语料库中提取出来的,可以用来训练模型,例如word2Vec模型的训练,注意,只适用于英文!
中文情感分析语料库,包含 酒店、服装、水果、平板、洗发水 等 5 个领域的评价数据,每个领域各包含 5000 条正面和负面评价,数据抓取于 携程网 和 京东 ,仅供科研学习之用,欢迎下载使用!