在全国语言文字工作会议期间,由于“拼音化方向”在政策上的变化,代表们对于“拼音化方向”问题进行了热烈的讨论。当时的国家语言文字工作委员会副主任陈章太在《全国语言文字工作会议的总结发言》中特别对于“拼音化方向”作了如下的说明:“关于拼音化方向问题,代表们在讨论中有两种不同的意见,这也反映了社会上对这个问题的不同认识。比较多的同志赞成工作报告不提这个问题,认为这符合中央倡导的实事求是、注重务实的精神,容易收到实效,有利于新时期语言文字工作的开展,同时也有利于推动文字改革工作。另外一些同志则认为报告中的有关表述,虽然是现实的,可行的,但总觉得对拼音化方向不加以正面表述,是一种后退,调子低了,可能对今后工作开展不利。我们对这两种意见进行了认真的严肃的考虑、研究,仍然认为工作报告中的表述是符合实际的,是积极而又稳妥的,是前进而不是后退的。实际上我们在会前关于这个问题倾听过社会上的意见和专家的意见,也倾听过许多负责同志的意见。我们相信现在这样的表述,将会得到国内外更加广泛的赞同和支持,将能团结更多的人来做好新时期的语言文字工作,并且更好地完成过去还没有完成的文字改革任务,从而更有效地为我国的现代化建设服务。这里我们向同志们作个说明,刘导生同志的工作报告中关于这个问题的提法,国家语委是事先请示过中央和国务院的领导同志的。大会期间同志们对这个问题的不同意见,我们也报告了党中央和国务院。昨天下午,国家语委接到了党中央和国务院对这个问题的批示,同意刘导生同志工作报告中对这个问题的表述。希望同志们能很好理解。当然,对这个问题有不同的认识,这是正常的,也是可以讨论的,但希望这种讨论不要影响集中力量做好我们当前要做的主要工作。”这样,就把当时我国政府的政策变化的背景说得更清楚了。
[0041] 由于儿童发音语速变化大,并且儿童的语音信息中可能出现会说说停停的问题,因此,需要在声学模型的设置中加入静音模型,来识别儿童语音中可能出现大段静音的情况。本发明实施例中,在建立声学模型时,需要对不同的发音建立单独的模型。以中文为例,需要对66个声韵母单独建立HMM模型。并且,本发明实施例能够进一步增大静音模型的描述精度。例如,在通常的声音模型中,采用32个高斯混合模型(Gassion Mixture Model,以下简称GMM)进行描述声韵母的HMM的每个状态,则在建立本发明实施例中的静音模型时,可以将GMM的采用个数提升为至少采用64个。本发明实施例中,针对儿童发音速度变化大、容易出现大段静音的发音特点,在建立的声音模型中添加静音模型,提高对儿童语音信息的识别率,合理高效地增大对」L童语音信息识别的准确性。
我先推荐几本,欢迎大家跟帖交流! 第一本:《单韵母好孤单》 这是一本仅针对单韵母和声母拼读、以短语和短句阅读为主的拼音书。 (刚上完大班上学期的宝宝就能用,强烈推荐) 特点 1 :书里只有单韵母和声母(标题除外) 特点 2 :以短语、短句、短文阅读为主 适合 1 :只学习了单韵母和声母的宝贝 适合 2 :希望复习单韵母和声母拼读练习的宝贝 适合 3 :想要比其他人早一点开始自主拼音阅读的宝贝 适合 4 : 阅读拼音长句和故事有困难的宝贝 第二本:《复韵母来作客》 这是一本以短语和短句阅读为主的拼音阅读书。从某种角度来说,它就是一本桥梁书,连接字词到长句阅读的一座桥梁。 特点 :以短语、短句、短文阅读为主 适合 1 : 学习了所有单韵母、声母和复韵母的宝贝 适合 2 :希望复习韵母和声母拼读练习的宝贝 适合 3 : 即将开始自主拼音阅读的宝贝 适合 4 : 阅读拼音长句和故事有困难的宝贝 以上两本书都可以在淘宝和微店买到。
[0073] 本发明实施例提供的针对儿童的语音识别方法能够在提取全部语音语料的声学特征过程中加入声道长度归一化技术,并以此建立声学模型,避免现有技术中对儿童语音识别不准的问题。本发明实施例中,依次通过全部语音语料中的女性语料和儿童语料作为训练数据来进行反复建模,并在对声学模型进行建立时,针对儿童发音速度变化大、容易出现大段静音的问题,在声学模型中添加建立静音模型以及语气词模型,使得最终得到的声学模型更接近于儿童语音发音特点,合理高效地提高对儿童语音的识别率,达到对儿童语音针对性更强,语音识别率更高,识别结果更加准确的有益效果。另外,本发明实施例中,通过包括有变形文本语料的混合文本语料库建立语言模型,对儿童语音进行识别,使得识别率更高;本发明的语义理解步骤中,能够针对性地对语言模型处理中得到的具有词重复、叠词的词尾重复或者词与词之间具有多余语气词的识别文本进行相应的语义理解处理,以得到正确的语义理解结果。
[0060] 本发明实施例中,由于在训练语言模型的文本语料库做了文本变形处理,因此,在最终的儿童语音识别结果的文本中,通过改进的语义理解模型进行相应的文本变形后处理。优选地,本发明实施例中,对识别文本进行语义理解处理的步骤包括下列至少之一:首先,通过对识别文本进行常规词语法分析,去除识别文本中连续出现重复的词,以获得所述语义理解结果;例如“今天妈妈买的苹果苹果真好吃”变成“今天妈妈买的苹果真好吃”。其次,通过对识别文本进行常规词语法分析,去除识别文本中词尾重复的叠词,以获得语义理解结果。例如,“今天妈妈买的苹果果真好吃”变成“今天妈妈买的苹果真好吃”。最后,通过对识别文本进行常规词语法分析和句法分析,去除识别文本中词与词之间多余的语气词,以获得语义理解结果。例如“今天妈妈买的苹果嗯真好吃”变成“今天妈妈买的苹果真好吃”。本发明实施例中,在对识别文本进行语义理解处理时,对识别文本进行常规语法分析以及基础的句法分析,并找出句法主体结构之外的组词等无意义的词,加以去除,并获得语义理解结果。另外,语义理解模型还可以根据训练语言模型的儿童语料库,分析特征提取模式规则,并结合应用规则和统计模型的方法,对语音识别的文本进行分析和处理,得到准确性更高的语义理解结果,进一步提高儿童的语音识别的准确性。
[0073]	本发明实施例提供的针对儿童的语音识别方法能够在提取全部语音语料的声学特征过程中加入声道长度归一化技术,并以此建立声学模型,避免现有技术中对儿童语音识别不准的问题。本发明实施例中,依次通过全部语音语料中的女性语料和儿童语料作为训练数据来进行反复建模,并在对声学模型进行建立时,针对儿童发音速度变化大、容易出现大段静音的问题,在声学模型中添加建立静音模型以及语气词模型,使得最终得到的声学模型更接近于儿童语音发音特点,合理高效地提高对儿童语音的识别率,达到对儿童语音针对性更强,语音识别率更高,识别结果更加准确的有益效果。另外,本发明实施例中,通过包括有变形文本语料的混合文本语料库建立语言模型,对儿童语音进行识别,使得识别率更高;本发明的语义理解步骤中,能够针对性地对语言模型处理中得到的具有词重复、叠词的词尾重复或者词与词之间具有多余语气词的识别文本进行相应的语义理解处理,以得到正确的语义理解结果。

[0060]	本发明实施例中,由于在训练语言模型的文本语料库做了文本变形处理,因此,在最终的儿童语音识别结果的文本中,通过改进的语义理解模型进行相应的文本变形后处理。优选地,本发明实施例中,对识别文本进行语义理解处理的步骤包括下列至少之一:首先,通过对识别文本进行常规词语法分析,去除识别文本中连续出现重复的词,以获得所述语义理解结果;例如“今天妈妈买的苹果苹果真好吃”变成“今天妈妈买的苹果真好吃”。其次,通过对识别文本进行常规词语法分析,去除识别文本中词尾重复的叠词,以获得语义理解结果。例如,“今天妈妈买的苹果果真好吃”变成“今天妈妈买的苹果真好吃”。最后,通过对识别文本进行常规词语法分析和句法分析,去除识别文本中词与词之间多余的语气词,以获得语义理解结果。例如“今天妈妈买的苹果嗯真好吃”变成“今天妈妈买的苹果真好吃”。本发明实施例中,在对识别文本进行语义理解处理时,对识别文本进行常规语法分析以及基础的句法分析,并找出句法主体结构之外的组词等无意义的词,加以去除,并获得语义理解结果。另外,语义理解模型还可以根据训练语言模型的儿童语料库,分析特征提取模式规则,并结合应用规则和统计模型的方法,对语音识别的文本进行分析和处理,得到准确性更高的语义理解结果,进一步提高儿童的语音识别的准确性。
×