其中,步骤S11的前端处理中,预处理的方法中可包括利用FIR低通滤波 器进行滤波,以滤除信号中的高次谐波和随机干扰成分,被滤除的成分是奇异 模态,从而避免了随后EMD筛选中因奇异模态影响造成的模态混叠,以便在被 筛选出的模态信号中得到完整的有用信号。预处理的实现方法亦可使用现有技 术语音识别方法中的预处理通用方法,例如,普通PC机的声卡即可用于实现预 处理。设对每条(句)语音信号,预处理后得到原始语音信号时间序列义(O, HHT变换首先对语音情感信号进行EMD(经验模态分析,Empirical Mode Decomposition)分解,把非平稳的语音情感信号X(O分解成为六个平稳的IMF(固 有模态函数,Intrinsic Mode Functions )窄带信号分量。关于HHT变换的详细内 容可参见文献[l]: Norden E. Huang, Zheng Shen, Steven R. Long, The empirical mode decomposition & the Hilbert spectrum for nonlinear and non-stationary time series analysis, Proceed of the Royal Society of London Series A: Mathematical
[0060]	本发明实施例中,由于在训练语言模型的文本语料库做了文本变形处理,因此,在最终的儿童语音识别结果的文本中,通过改进的语义理解模型进行相应的文本变形后处理。优选地,本发明实施例中,对识别文本进行语义理解处理的步骤包括下列至少之一:首先,通过对识别文本进行常规词语法分析,去除识别文本中连续出现重复的词,以获得所述语义理解结果;例如“今天妈妈买的苹果苹果真好吃”变成“今天妈妈买的苹果真好吃”。其次,通过对识别文本进行常规词语法分析,去除识别文本中词尾重复的叠词,以获得语义理解结果。例如,“今天妈妈买的苹果果真好吃”变成“今天妈妈买的苹果真好吃”。最后,通过对识别文本进行常规词语法分析和句法分析,去除识别文本中词与词之间多余的语气词,以获得语义理解结果。例如“今天妈妈买的苹果嗯真好吃”变成“今天妈妈买的苹果真好吃”。本发明实施例中,在对识别文本进行语义理解处理时,对识别文本进行常规语法分析以及基础的句法分析,并找出句法主体结构之外的组词等无意义的词,加以去除,并获得语义理解结果。另外,语义理解模型还可以根据训练语言模型的儿童语料库,分析特征提取模式规则,并结合应用规则和统计模型的方法,对语音识别的文本进行分析和处理,得到准确性更高的语义理解结果,进一步提高儿童的语音识别的准确性。

其中,步骤S11的前端处理中,预处理的方法中可包括利用FIR低通滤波 器进行滤波,以滤除信号中的高次谐波和随机干扰成分,被滤除的成分是奇异 模态,从而避免了随后EMD筛选中因奇异模态影响造成的模态混叠,以便在被 筛选出的模态信号中得到完整的有用信号。预处理的实现方法亦可使用现有技 术语音识别方法中的预处理通用方法,例如,普通PC机的声卡即可用于实现预 处理。设对每条(句)语音信号,预处理后得到原始语音信号时间序列义(O, HHT变换首先对语音情感信号进行EMD(经验模态分析,Empirical Mode Decomposition)分解,把非平稳的语音情感信号X(O分解成为六个平稳的IMF(固 有模态函数,Intrinsic Mode Functions )窄带信号分量。关于HHT变换的详细内 容可参见文献[l]: Norden E. Huang, Zheng Shen, Steven R. Long, The empirical mode decomposition & the Hilbert spectrum for nonlinear and non-stationary time series analysis, Proceed of the Royal Society of London Series A: Mathematical
[0029]	本发明实施例提供的针对儿童的语音识别方法能够在提取全部语音语料的声学特征过程中加入声道长度归一化技术,并以此建立声学模型,避免现有技术中对儿童语音识别不准的问题。本发明实施例中,依次通过全部语音语料中的女性语料和儿童语料作为训练数据来进行反复建模,并在对声学模型进行建立时,针对儿童发音速度变化大、容易出现大段静音的问题,在声学模型中添加建立静音模型以及语气词模型,使得最终得到的声学模型更接近于儿童语音发音特点,合理高效地提高对儿童语音的识别率,达到对儿童语音针对性更强,语音识别率更高,识别结果更加准确的有益效果。另外,本发明实施例中,通过包括有变形文本语料的混合文本语料库建立语言模型,对儿童语音进行识别,使得识别率更高;本发明的语义理解步骤中,能够针对性地对语言模型处理中得到的具有词重复、叠词的词尾重复或者词与词之间具有多余语气词的识别文本进行相应的语义理解处理,以得到正确的语义理解结果。综上,本发明实施例提供的针对儿童的语音识别方法能够解决现有技术中对儿童语音识别不准的问题,达到合理高效提高儿童语音的识别率的有益效果。
×