[0041] 由于儿童发音语速变化大,并且儿童的语音信息中可能出现会说说停停的问题,因此,需要在声学模型的设置中加入静音模型,来识别儿童语音中可能出现大段静音的情况。本发明实施例中,在建立声学模型时,需要对不同的发音建立单独的模型。以中文为例,需要对66个声韵母单独建立HMM模型。并且,本发明实施例能够进一步增大静音模型的描述精度。例如,在通常的声音模型中,采用32个高斯混合模型(Gassion Mixture Model,以下简称GMM)进行描述声韵母的HMM的每个状态,则在建立本发明实施例中的静音模型时,可以将GMM的采用个数提升为至少采用64个。本发明实施例中,针对儿童发音速度变化大、容易出现大段静音的发音特点,在建立的声音模型中添加静音模型,提高对儿童语音信息的识别率,合理高效地增大对」L童语音信息识别的准确性。
1982年正式成立了汉语拼音正词法委员会。该委员会提出,汉语拼音正词法应该以现代汉语语法中定义的词作为正词法的拼写单位,同时也要照顾到阅读和理解的方便,并且要照顾到某些国际上拼写的习惯。该委员会同时也开始研制汉语拼音正词法的基本规则,参考过去个人研制的和集体草拟的正词法规则,《汉语拼音方案》公布以来出版的各种拼音读物,各种以《汉语拼音方案》为基础并以词为拼写单位的词书,各种信息处理用的汉语拼音分词连写的实践经验,广泛听取了个方面人士的意见,并请教育界、出版界、信息处理界和语文界的专家学者进行了讨论,又与有关单位协作,进行了10万多词的拼写试验。在这些工作的基础上,1984年10月,中国文字改革委员会发表了《汉语拼音正词法基本规则(试用稿)》。1988年7月1日,国家教育委员会、国家语言文字工作委员会发出《关于公布〈汉语拼音正词法基本规则(试用稿)〉的联合通知》。1996年1月22日,国家技术监督局发布《汉语拼音正词法基本规则》,把它当作国家标准。
7、 根据权利要求1所述的儿童语音情感识别方法,其特征在于,所述音强特征提取方法为:对情感语音的固有模态计算Teager能量算子,然后取模,提取幅度信息,用来表征音强特征;所述语调特征提取方法为:对情感语音的固有模态的Hilbert谱计算Teager能量算子,取模后,根据设定的幅度域值确定出浊音段与清音段,之后对无声段和清音段进行插值,得到基音曲线全局变化趋势,用来表征语调特征;所述音色特征提取方法为:从所述浊音段估计声门波导数信号,由牛顿-高斯型非线性估计方法获得分段函数的LF模型表示声门波导数的粗糙部分,然后从声门波导数估计值中减去次粗糙结构,得到精细结构分量,对精细分量做HHT变换,提取没有被一般的声门波形状所表现的特征,作为音色特征;所述节奏特征提取方法为:对情感语音的固有模态计算语速,用以表征节奏特征。
[0073] 本发明实施例提供的针对儿童的语音识别方法能够在提取全部语音语料的声学特征过程中加入声道长度归一化技术,并以此建立声学模型,避免现有技术中对儿童语音识别不准的问题。本发明实施例中,依次通过全部语音语料中的女性语料和儿童语料作为训练数据来进行反复建模,并在对声学模型进行建立时,针对儿童发音速度变化大、容易出现大段静音的问题,在声学模型中添加建立静音模型以及语气词模型,使得最终得到的声学模型更接近于儿童语音发音特点,合理高效地提高对儿童语音的识别率,达到对儿童语音针对性更强,语音识别率更高,识别结果更加准确的有益效果。另外,本发明实施例中,通过包括有变形文本语料的混合文本语料库建立语言模型,对儿童语音进行识别,使得识别率更高;本发明的语义理解步骤中,能够针对性地对语言模型处理中得到的具有词重复、叠词的词尾重复或者词与词之间具有多余语气词的识别文本进行相应的语义理解处理,以得到正确的语义理解结果。
其中,步骤S11的前端处理中,预处理的方法中可包括利用FIR低通滤波 器进行滤波,以滤除信号中的高次谐波和随机干扰成分,被滤除的成分是奇异 模态,从而避免了随后EMD筛选中因奇异模态影响造成的模态混叠,以便在被 筛选出的模态信号中得到完整的有用信号。预处理的实现方法亦可使用现有技 术语音识别方法中的预处理通用方法,例如,普通PC机的声卡即可用于实现预 处理。设对每条(句)语音信号,预处理后得到原始语音信号时间序列义(O, HHT变换首先对语音情感信号进行EMD(经验模态分析,Empirical Mode Decomposition)分解,把非平稳的语音情感信号X(O分解成为六个平稳的IMF(固 有模态函数,Intrinsic Mode Functions )窄带信号分量。关于HHT变换的详细内 容可参见文献[l]: Norden E. Huang, Zheng Shen, Steven R. Long, The empirical mode decomposition & the Hilbert spectrum for nonlinear and non-stationary time series analysis, Proceed of the Royal Society of London Series A: Mathematical

1982年正式成立了汉语拼音正词法委员会。该委员会提出,汉语拼音正词法应该以现代汉语语法中定义的词作为正词法的拼写单位,同时也要照顾到阅读和理解的方便,并且要照顾到某些国际上拼写的习惯。该委员会同时也开始研制汉语拼音正词法的基本规则,参考过去个人研制的和集体草拟的正词法规则,《汉语拼音方案》公布以来出版的各种拼音读物,各种以《汉语拼音方案》为基础并以词为拼写单位的词书,各种信息处理用的汉语拼音分词连写的实践经验,广泛听取了个方面人士的意见,并请教育界、出版界、信息处理界和语文界的专家学者进行了讨论,又与有关单位协作,进行了10万多词的拼写试验。在这些工作的基础上,1984年10月,中国文字改革委员会发表了《汉语拼音正词法基本规则(试用稿)》。1988年7月1日,国家教育委员会、国家语言文字工作委员会发出《关于公布〈汉语拼音正词法基本规则(试用稿)〉的联合通知》。1996年1月22日,国家技术监督局发布《汉语拼音正词法基本规则》,把它当作国家标准。
我先推荐几本,欢迎大家跟帖交流! 第一本:《单韵母好孤单》 这是一本仅针对单韵母和声母拼读、以短语和短句阅读为主的拼音书。 (刚上完大班上学期的宝宝就能用,强烈推荐) 特点 1 :书里只有单韵母和声母(标题除外) 特点 2 :以短语、短句、短文阅读为主 适合 1 :只学习了单韵母和声母的宝贝 适合 2 :希望复习单韵母和声母拼读练习的宝贝 适合 3 :想要比其他人早一点开始自主拼音阅读的宝贝 适合 4 : 阅读拼音长句和故事有困难的宝贝 第二本:《复韵母来作客》 这是一本以短语和短句阅读为主的拼音阅读书。从某种角度来说,它就是一本桥梁书,连接字词到长句阅读的一座桥梁。 特点 :以短语、短句、短文阅读为主 适合 1 : 学习了所有单韵母、声母和复韵母的宝贝 适合 2 :希望复习韵母和声母拼读练习的宝贝 适合 3 : 即将开始自主拼音阅读的宝贝 适合 4 : 阅读拼音长句和故事有困难的宝贝 以上两本书都可以在淘宝和微店买到。
汉语拼音方案草案,经中国文字改革委员会提出后,两年来,由中国人民政治协商会议全国委员会和各地方协商委员会组织了广泛的讨论,并且由国务院组织汉语拼音方案审订委员会加以审核修订,最后又由中国人民政治协商会议全国委员会常务委员会召开扩大会议加以审议,现在由国务院全体会议通过,准备提请全国人民代表大会下次会议讨论和批准,并且决定登报公布,让全国人民事先知道。 应用汉语拼音方案为汉字注音来帮助识字和统一读音,对于改进学校语文教学,推广普通话,扫除文盲,都将起推进作用。对于少数民族制定文字和学习汉语方面,也有重大意义。因此,这个方案草案在提请全国人民代表大会讨论和批准之后,可以在师范、中小学校,成人补习学校,扫盲教育和出版等方面逐步推行,并在实践过程中继续求得完善化。具体办法,将由教育部、文化部及其他有关单位会同中国文字改革委员会分别拟定,报告国务院批准施行。
[0029] 本发明实施例提供的针对儿童的语音识别方法能够在提取全部语音语料的声学特征过程中加入声道长度归一化技术,并以此建立声学模型,避免现有技术中对儿童语音识别不准的问题。本发明实施例中,依次通过全部语音语料中的女性语料和儿童语料作为训练数据来进行反复建模,并在对声学模型进行建立时,针对儿童发音速度变化大、容易出现大段静音的问题,在声学模型中添加建立静音模型以及语气词模型,使得最终得到的声学模型更接近于儿童语音发音特点,合理高效地提高对儿童语音的识别率,达到对儿童语音针对性更强,语音识别率更高,识别结果更加准确的有益效果。另外,本发明实施例中,通过包括有变形文本语料的混合文本语料库建立语言模型,对儿童语音进行识别,使得识别率更高;本发明的语义理解步骤中,能够针对性地对语言模型处理中得到的具有词重复、叠词的词尾重复或者词与词之间具有多余语气词的识别文本进行相应的语义理解处理,以得到正确的语义理解结果。综上,本发明实施例提供的针对儿童的语音识别方法能够解决现有技术中对儿童语音识别不准的问题,达到合理高效提高儿童语音的识别率的有益效果。
×