在全国语言文字工作会议期间,由于“拼音化方向”在政策上的变化,代表们对于“拼音化方向”问题进行了热烈的讨论。当时的国家语言文字工作委员会副主任陈章太在《全国语言文字工作会议的总结发言》中特别对于“拼音化方向”作了如下的说明:“关于拼音化方向问题,代表们在讨论中有两种不同的意见,这也反映了社会上对这个问题的不同认识。比较多的同志赞成工作报告不提这个问题,认为这符合中央倡导的实事求是、注重务实的精神,容易收到实效,有利于新时期语言文字工作的开展,同时也有利于推动文字改革工作。另外一些同志则认为报告中的有关表述,虽然是现实的,可行的,但总觉得对拼音化方向不加以正面表述,是一种后退,调子低了,可能对今后工作开展不利。我们对这两种意见进行了认真的严肃的考虑、研究,仍然认为工作报告中的表述是符合实际的,是积极而又稳妥的,是前进而不是后退的。实际上我们在会前关于这个问题倾听过社会上的意见和专家的意见,也倾听过许多负责同志的意见。我们相信现在这样的表述,将会得到国内外更加广泛的赞同和支持,将能团结更多的人来做好新时期的语言文字工作,并且更好地完成过去还没有完成的文字改革任务,从而更有效地为我国的现代化建设服务。这里我们向同志们作个说明,刘导生同志的工作报告中关于这个问题的提法,国家语委是事先请示过中央和国务院的领导同志的。大会期间同志们对这个问题的不同意见,我们也报告了党中央和国务院。昨天下午,国家语委接到了党中央和国务院对这个问题的批示,同意刘导生同志工作报告中对这个问题的表述。希望同志们能很好理解。当然,对这个问题有不同的认识,这是正常的,也是可以讨论的,但希望这种讨论不要影响集中力量做好我们当前要做的主要工作。”这样,就把当时我国政府的政策变化的背景说得更清楚了。
《中华人民共和国国家通用语言文字法》第一章第十八条规定:“国家通用语言文字以《汉语拼音方案》作为拼写和注音的工具。《汉语拼音方案》是中国人名、地名和中文文献罗马字母拼写法的统一规范,并用于汉字不便使用或不能使用的领域。初等教育应当进行汉语拼音教学。”这样,就从法律上确定了汉语拼音的地位和作用。汉语拼音在汉字教学中起了很好的作用。80年代初期开始的一项小学语文教学改革实验――“注音识字,提前读写”,简称“注提”。儿童首先用一个月左右学好汉语拼音,然后充分利用汉语拼音来帮助识字,从一年级开始就进行听说读写的全面训练,寓识字于读写之中,用汉语拼音阅读和作文,在阅读和作文中逐步增加汉字,最后达到全部用汉字阅读和写作。通过生动活泼的语言实践活动,促使学生在语言、思维、智力各个方面都得到和谐的发展。这项实验在全国进行,并编写了“注音识字,提前读写”的教材。
[0060] 本发明实施例中,由于在训练语言模型的文本语料库做了文本变形处理,因此,在最终的儿童语音识别结果的文本中,通过改进的语义理解模型进行相应的文本变形后处理。优选地,本发明实施例中,对识别文本进行语义理解处理的步骤包括下列至少之一:首先,通过对识别文本进行常规词语法分析,去除识别文本中连续出现重复的词,以获得所述语义理解结果;例如“今天妈妈买的苹果苹果真好吃”变成“今天妈妈买的苹果真好吃”。其次,通过对识别文本进行常规词语法分析,去除识别文本中词尾重复的叠词,以获得语义理解结果。例如,“今天妈妈买的苹果果真好吃”变成“今天妈妈买的苹果真好吃”。最后,通过对识别文本进行常规词语法分析和句法分析,去除识别文本中词与词之间多余的语气词,以获得语义理解结果。例如“今天妈妈买的苹果嗯真好吃”变成“今天妈妈买的苹果真好吃”。本发明实施例中,在对识别文本进行语义理解处理时,对识别文本进行常规语法分析以及基础的句法分析,并找出句法主体结构之外的组词等无意义的词,加以去除,并获得语义理解结果。另外,语义理解模型还可以根据训练语言模型的儿童语料库,分析特征提取模式规则,并结合应用规则和统计模型的方法,对语音识别的文本进行分析和处理,得到准确性更高的语义理解结果,进一步提高儿童的语音识别的准确性。
[0013] 依据本发明的另一方面,还提供了一种针对儿童的语音识别装置,包括:模型建立模块,配置为通过已知的语音语料库和文本语料库分别建立声学模型和语言模型;接收模块,配置为接收所述儿童的语音信号,并对所述语音信号进行前端处理;特征提取处理模块,配置为对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征;识别文本获得模块,配置为通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本;语义理解处理模块,配置为对所述识别文本进行语义理解处理,以获得语义理解结果;其中所述模型建立模块还配置为通过以下步骤建立声学模型:对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征;根据所述全部语音语料的声学特征进行建模,以获得所述声学模型。
×