10.一种针对儿童的语音识别装置,包括: 模型建立模块,配置为通过已知的语音语料库和文本语料库分别建立声学模型和语言模型; 接收模块,配置为接收所述儿童的语音信号,并对所述语音信号进行前端处理; 特征提取处理模块,配置为对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征; 识别文本获得模块,配置为通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本; 语义理解处理模块,配置为对所述识别文本进行语义理解处理,以获得语义理解结果;其中 所述模型建立模块还配置为通过以下步骤建立声学模型: 对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征; 根据所述全部语音语料的声学特征进行建模,以获得所述声学模型。

汉语拼音方案草案,经中国文字改革委员会提出后,两年来,由中国人民政治协商会议全国委员会和各地方协商委员会组织了广泛的讨论,并且由国务院组织汉语拼音方案审订委员会加以审核修订,最后又由中国人民政治协商会议全国委员会常务委员会召开扩大会议加以审议,现在由国务院全体会议通过,准备提请全国人民代表大会下次会议讨论和批准,并且决定登报公布,让全国人民事先知道。 应用汉语拼音方案为汉字注音来帮助识字和统一读音,对于改进学校语文教学,推广普通话,扫除文盲,都将起推进作用。对于少数民族制定文字和学习汉语方面,也有重大意义。因此,这个方案草案在提请全国人民代表大会讨论和批准之后,可以在师范、中小学校,成人补习学校,扫盲教育和出版等方面逐步推行,并在实践过程中继续求得完善化。具体办法,将由教育部、文化部及其他有关单位会同中国文字改革委员会分别拟定,报告国务院批准施行。


[0029] 本发明实施例提供的针对儿童的语音识别方法能够在提取全部语音语料的声学特征过程中加入声道长度归一化技术,并以此建立声学模型,避免现有技术中对儿童语音识别不准的问题。本发明实施例中,依次通过全部语音语料中的女性语料和儿童语料作为训练数据来进行反复建模,并在对声学模型进行建立时,针对儿童发音速度变化大、容易出现大段静音的问题,在声学模型中添加建立静音模型以及语气词模型,使得最终得到的声学模型更接近于儿童语音发音特点,合理高效地提高对儿童语音的识别率,达到对儿童语音针对性更强,语音识别率更高,识别结果更加准确的有益效果。另外,本发明实施例中,通过包括有变形文本语料的混合文本语料库建立语言模型,对儿童语音进行识别,使得识别率更高;本发明的语义理解步骤中,能够针对性地对语言模型处理中得到的具有词重复、叠词的词尾重复或者词与词之间具有多余语气词的识别文本进行相应的语义理解处理,以得到正确的语义理解结果。综上,本发明实施例提供的针对儿童的语音识别方法能够解决现有技术中对儿童语音识别不准的问题,达到合理高效提高儿童语音的识别率的有益效果。
7、 根据权利要求1所述的儿童语音情感识别方法,其特征在于,所述音强特征提取方法为:对情感语音的固有模态计算Teager能量算子,然后取模,提取幅度信息,用来表征音强特征;所述语调特征提取方法为:对情感语音的固有模态的Hilbert谱计算Teager能量算子,取模后,根据设定的幅度域值确定出浊音段与清音段,之后对无声段和清音段进行插值,得到基音曲线全局变化趋势,用来表征语调特征;所述音色特征提取方法为:从所述浊音段估计声门波导数信号,由牛顿-高斯型非线性估计方法获得分段函数的LF模型表示声门波导数的粗糙部分,然后从声门波导数估计值中减去次粗糙结构,得到精细结构分量,对精细分量做HHT变换,提取没有被一般的声门波形状所表现的特征,作为音色特征;所述节奏特征提取方法为:对情感语音的固有模态计算语速,用以表征节奏特征。
第二,不同类型的设备产品需求是不一样的。举个例子,儿童手表更多是孩子自己主动调用,但是对于故事机,更多地是家长把它拿过来按键,调出他想给孩子放的歌曲。正是因为有不同的产品差异,必须面向场景做非常精细化的运营才有可能实现更好的体验。我有一个印象深刻的例子,一个家长在后台跟我反馈了一个信息,他在APP里面看到孩子问巴迪龙,说爸爸妈妈离婚了我该怎么办,这个家长刚刚经历了家庭变动,通过这样的问题家长意识到了自己没有顾及孩子的感受,他开始反思自己对孩子的培养。原来我做的这样一个小功能,竟然给了家长这样一个机会,发现他和孩子之间沟通上的不足。另外一点,有一些场景我们做得还不够,我们针对孩子生活场景可以更精细化地运营,把孩子的家庭变故、家庭矛盾包括学习被老师批评等等场景全部做到,从投入产出的角度来说这些场景可能是孩子非常低频的场景,但是这些低频的场景只要涵盖到了,可以给孩子非常大的帮助。这个投入仍然是值得的。
×