[0014] 本发明实施例提供的针对儿童的语音识别方法能够在提取全部语音语料的声学特征过程中加入声道长度归一化技术,并以此建立声学模型,避免现有技术中对儿童语音识别不准的问题。本发明实施例中,依次通过全部语音语料中的女性语料和儿童语料作为训练数据来进行反复建模,并在对声学模型进行建立时,针对儿童发音速度变化大、容易出现大段静音的问题,在声学模型中添加建立静音模型以及语气词模型,使得最终得到的声学模型更接近于儿童语音发音特点,合理高效地提高对儿童语音的识别率,达到对儿童语音针对性更强,语音识别率更高,识别结果更加准确的有益效果。另外,本发明实施例中,通过包括有变形文本语料的混合文本语料库建立语言模型,对儿童语音进行识别,使得识别率更高;本发明的语义理解步骤中,能够针对性地对语言模型处理中得到的具有词重复、叠词的词尾重复或者词与词之间具有多余语气词的识别文本进行相应的语义理解处理,以得到正确的语义理解结果。[0015] 综上,本发明实施例提供的针对儿童的语音识别方法能够解决现有技术中对儿童语音识别不准的问题,达到合理高效提高儿童语音的识别率的有益效果。
我先推荐几本,欢迎大家跟帖交流! 第一本:《单韵母好孤单》 这是一本仅针对单韵母和声母拼读、以短语和短句阅读为主的拼音书。 (刚上完大班上学期的宝宝就能用,强烈推荐) 特点 1 :书里只有单韵母和声母(标题除外) 特点 2 :以短语、短句、短文阅读为主 适合 1 :只学习了单韵母和声母的宝贝 适合 2 :希望复习单韵母和声母拼读练习的宝贝 适合 3 :想要比其他人早一点开始自主拼音阅读的宝贝 适合 4 : 阅读拼音长句和故事有困难的宝贝 第二本:《复韵母来作客》 这是一本以短语和短句阅读为主的拼音阅读书。从某种角度来说,它就是一本桥梁书,连接字词到长句阅读的一座桥梁。 特点 :以短语、短句、短文阅读为主 适合 1 : 学习了所有单韵母、声母和复韵母的宝贝 适合 2 :希望复习韵母和声母拼读练习的宝贝 适合 3 : 即将开始自主拼音阅读的宝贝 适合 4 : 阅读拼音长句和故事有困难的宝贝 以上两本书都可以在淘宝和微店买到。
[0034] 在步骤S201中,对语音语料库中的全部语音语料进行特征提取处理。例如,对语音语料中的全部语音语料进行梅尔域倒普系数(Mel Frequency CepstrumCoefficient, MFCC)特征的提取。其中,语音语料库中的全部语音语料包括成人的语音语料以及儿童的语音语料。在对全部语音语料进行特征提取时,在处理过程中加入声道长度归一化(Vocal Tract Length Normalization,VTLN)技术。声道长度归一化技术是语音识别的经典算法,通过该技术能够对语音信号的频谱进行调整,进而修正声道长度,以避免声道长度不同带来的特征差异,进而能够避免后续操作中对儿童语音的识别过程造成不良影响。在对非特定人进行语音识别的过程中,不同的人的语音信号之间的差异主要是声道形状,尤其是声道长度。例如,成年男性的语音信号的声道长度平均值为18厘米,成年女性的语音信号的声道长度平均值为13厘米,而8岁儿童的语音信号的声道长度平均值为10厘米。现有技术中,训练声学模型的语音语料以成人的语音语料为主,这种儿童语音语料的缺乏导致,在使用该种语音语料训练得到的声学模型对儿童的语音信号进行识别时,识别率将会下降,无法保证识别的准确性。为解决儿童与成人声道差异导致的发音变化问题,在对语音提取特征时,采用VTLN技术,通过对声道长度的修整来调节儿童语音的特征,使得儿童的语音信号更容易被识别。
热门查询: 老黄历 周公解梦 周公解梦大全查询 2019放假安排 手机号码测吉凶 百家姓 | 黄道吉日 2019年4月5日黄历 2019年4月6日黄历 2019年4月7日黄历 2019年4月8日黄历 2019年4月黄道吉日 | 家常菜 鲁菜 川菜 苏菜 粤菜 闽菜 浙菜 湘菜 徽菜 沪菜 京菜 渝菜 | 天气预报 北京天气 上海天气 香港天气 广州天气 深圳天气 台北天气 澳门天气 天津天气 沈阳天气 大连天气 南京天气 苏州天气 杭州天气 武汉天气 重庆天气 成都天气 无锡天气 宁波天气 合肥天气 厦门天气 | 周公解梦大全 老黄历 天气预报查询 火车时刻表 手机号码归属地 家常菜谱大全 货币汇率查询 邮政编码查询 万年历 2019年放假安排 生男生女预测表 QQ号码吉凶 安全期计算器 观音灵签 日常生活: 手机号码归属地 邮政编码查询 机构邮政编码查询 货币汇率查询 天气预报查询 家常菜谱大全 PM2.5查询 常用电话号码 快递查询 区号查询 数字大写转换 2019年放假安排 台湾邮编查询 汽车车标大全 大学查询 人民币存款利率表 升降旗时间 国家地区查询 全国社会性组织 (共19个) 站长工具: IP地址查询 下载地址加解密工具 二维码生成器 进程查询 密码强度检测 ASCII码对照表 UNIX时间戳 (共7个) 交通出行: 火车时刻表 北京车牌尾号限行查询 实时路况查询 地铁线路图 机场三字码查询 交通违章查询 车牌号查询 中国电子地图 世界时差查询 (共9个) 休闲娱乐: 疯狂猜图答案 中华谜语大全 脑筋急转弯 绕口令大全 QQ号码吉凶 外星年龄 外星体重 竖排古文 (共8个) 民俗文化: 周公解梦大全 老黄历 百家姓大全 历史上的今天 歇后语大全 十二生肖 万年历 二十四节气表 地母经 名人名言名句大全 民间谚语 解密生日 佛学大辞典 (共13个) 学习应用: 新华字典 汉语词典 成语大全 诗词大全 在线翻译 英语单词大全 英文名 专业英汉汉英词典 百科全书 英文缩写大全 五笔字根表 笔画数查询 汉字部首查询 汉字拼音查询 区位码查询 汉字简体繁体转换 郑码编码查询 仓颉编码查询 四角号码在线查询 中文电码查询 在线编码解码 百万圆周率 摩尔斯电码 科学计算器 在线输入法 (共25个) 身体健康: 安全期计算器 药品查询 绿色食品 民间偏方大全 中草药名方大全 中草药民间验方 酒方大全 食物营养成分查询 中草药大全 中华本草 中医名词辞典 粥谱大全 (共12个) 占卜求签: 二十八星宿算命 六十四卦金钱课 观音灵签 黄大仙灵签 诸葛神算 妈祖天后灵签 关帝灵签 吕祖灵签 车公灵签 王公祖仔灵签 文王神卦 灵棋经 称骨算命 预测吉凶 指纹运势查询 生男生女预测表 姓名缘分测试 (共17个)

其中,步骤S11的前端处理中,预处理的方法中可包括利用FIR低通滤波 器进行滤波,以滤除信号中的高次谐波和随机干扰成分,被滤除的成分是奇异 模态,从而避免了随后EMD筛选中因奇异模态影响造成的模态混叠,以便在被 筛选出的模态信号中得到完整的有用信号。预处理的实现方法亦可使用现有技 术语音识别方法中的预处理通用方法,例如,普通PC机的声卡即可用于实现预 处理。设对每条(句)语音信号,预处理后得到原始语音信号时间序列义(O, HHT变换首先对语音情感信号进行EMD(经验模态分析,Empirical Mode Decomposition)分解,把非平稳的语音情感信号X(O分解成为六个平稳的IMF(固 有模态函数,Intrinsic Mode Functions )窄带信号分量。关于HHT变换的详细内 容可参见文献[l]: Norden E. Huang, Zheng Shen, Steven R. Long, The empirical mode decomposition & the Hilbert spectrum for nonlinear and non-stationary time series analysis, Proceed of the Royal Society of London Series A: Mathematical
1、一种儿童语音情感识别方法,包括训练语音库建立、分类器训练和情感识别,其特征在于,所述分类器训练包括以下步骤: (S10)提取儿童语音情感特征,该步骤包括: 前端处理:对模拟语音信号进行包括采样和去噪等基本信号处理在内的预处理;之后对经过预处理的情感语句做HHT变换,获得情感语音的Hilbert谱; 根据HHT变换和所述情感语音的Hilbert谱进行以下特征提取:音强特征提取、语调特征提取、音色特征提取和节奏特征提取,获得情感特征; (S20)对提取到的情感特征进行降维,获得不同情感空间的四元特征; (S30)四元特征情感转换计算,对训练语音库样本集都做上述计算,得到一系列的自然情感状态的四元特征在情感空间i上的投影,从而构成情感特征投影集; (S40)用所述情感特征投影集中的数据进行SVM/HMM混合系统分类训练。
[0060] 本发明实施例中,由于在训练语言模型的文本语料库做了文本变形处理,因此,在最终的儿童语音识别结果的文本中,通过改进的语义理解模型进行相应的文本变形后处理。优选地,本发明实施例中,对识别文本进行语义理解处理的步骤包括下列至少之一:首先,通过对识别文本进行常规词语法分析,去除识别文本中连续出现重复的词,以获得所述语义理解结果;例如“今天妈妈买的苹果苹果真好吃”变成“今天妈妈买的苹果真好吃”。其次,通过对识别文本进行常规词语法分析,去除识别文本中词尾重复的叠词,以获得语义理解结果。例如,“今天妈妈买的苹果果真好吃”变成“今天妈妈买的苹果真好吃”。最后,通过对识别文本进行常规词语法分析和句法分析,去除识别文本中词与词之间多余的语气词,以获得语义理解结果。例如“今天妈妈买的苹果嗯真好吃”变成“今天妈妈买的苹果真好吃”。本发明实施例中,在对识别文本进行语义理解处理时,对识别文本进行常规语法分析以及基础的句法分析,并找出句法主体结构之外的组词等无意义的词,加以去除,并获得语义理解结果。另外,语义理解模型还可以根据训练语言模型的儿童语料库,分析特征提取模式规则,并结合应用规则和统计模型的方法,对语音识别的文本进行分析和处理,得到准确性更高的语义理解结果,进一步提高儿童的语音识别的准确性。
×