[0013]	依据本发明的另一方面,还提供了一种针对儿童的语音识别装置,包括:模型建立模块,配置为通过已知的语音语料库和文本语料库分别建立声学模型和语言模型;接收模块,配置为接收所述儿童的语音信号,并对所述语音信号进行前端处理;特征提取处理模块,配置为对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征;识别文本获得模块,配置为通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本;语义理解处理模块,配置为对所述识别文本进行语义理解处理,以获得语义理解结果;其中所述模型建立模块还配置为通过以下步骤建立声学模型:对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征;根据所述全部语音语料的声学特征进行建模,以获得所述声学模型。

1、一种儿童语音情感识别方法,包括训练语音库建立、分类器训练和情感识别,其特征在于,所述分类器训练包括以下步骤: (S10)提取儿童语音情感特征,该步骤包括: 前端处理:对模拟语音信号进行包括采样和去噪等基本信号处理在内的预处理;之后对经过预处理的情感语句做HHT变换,获得情感语音的Hilbert谱; 根据HHT变换和所述情感语音的Hilbert谱进行以下特征提取:音强特征提取、语调特征提取、音色特征提取和节奏特征提取,获得情感特征; (S20)对提取到的情感特征进行降维,获得不同情感空间的四元特征; (S30)四元特征情感转换计算,对训练语音库样本集都做上述计算,得到一系列的自然情感状态的四元特征在情感空间i上的投影,从而构成情感特征投影集; (S40)用所述情感特征投影集中的数据进行SVM/HMM混合系统分类训练。
7、 根据权利要求1所述的儿童语音情感识别方法,其特征在于,所述音强特征提取方法为:对情感语音的固有模态计算Teager能量算子,然后取模,提取幅度信息,用来表征音强特征;所述语调特征提取方法为:对情感语音的固有模态的Hilbert谱计算Teager能量算子,取模后,根据设定的幅度域值确定出浊音段与清音段,之后对无声段和清音段进行插值,得到基音曲线全局变化趋势,用来表征语调特征;所述音色特征提取方法为:从所述浊音段估计声门波导数信号,由牛顿-高斯型非线性估计方法获得分段函数的LF模型表示声门波导数的粗糙部分,然后从声门波导数估计值中减去次粗糙结构,得到精细结构分量,对精细分量做HHT变换,提取没有被一般的声门波形状所表现的特征,作为音色特征;所述节奏特征提取方法为:对情感语音的固有模态计算语速,用以表征节奏特征。
7、 根据权利要求1所述的儿童语音情感识别方法,其特征在于,所述音强特征提取方法为:对情感语音的固有模态计算Teager能量算子,然后取模,提取幅度信息,用来表征音强特征;所述语调特征提取方法为:对情感语音的固有模态的Hilbert谱计算Teager能量算子,取模后,根据设定的幅度域值确定出浊音段与清音段,之后对无声段和清音段进行插值,得到基音曲线全局变化趋势,用来表征语调特征;所述音色特征提取方法为:从所述浊音段估计声门波导数信号,由牛顿-高斯型非线性估计方法获得分段函数的LF模型表示声门波导数的粗糙部分,然后从声门波导数估计值中减去次粗糙结构,得到精细结构分量,对精细分量做HHT变换,提取没有被一般的声门波形状所表现的特征,作为音色特征;所述节奏特征提取方法为:对情感语音的固有模态计算语速,用以表征节奏特征。
第二,不同类型的设备产品需求是不一样的。举个例子,儿童手表更多是孩子自己主动调用,但是对于故事机,更多地是家长把它拿过来按键,调出他想给孩子放的歌曲。正是因为有不同的产品差异,必须面向场景做非常精细化的运营才有可能实现更好的体验。我有一个印象深刻的例子,一个家长在后台跟我反馈了一个信息,他在APP里面看到孩子问巴迪龙,说爸爸妈妈离婚了我该怎么办,这个家长刚刚经历了家庭变动,通过这样的问题家长意识到了自己没有顾及孩子的感受,他开始反思自己对孩子的培养。原来我做的这样一个小功能,竟然给了家长这样一个机会,发现他和孩子之间沟通上的不足。另外一点,有一些场景我们做得还不够,我们针对孩子生活场景可以更精细化地运营,把孩子的家庭变故、家庭矛盾包括学习被老师批评等等场景全部做到,从投入产出的角度来说这些场景可能是孩子非常低频的场景,但是这些低频的场景只要涵盖到了,可以给孩子非常大的帮助。这个投入仍然是值得的。
×