10.一种针对儿童的语音识别装置,包括: 模型建立模块,配置为通过已知的语音语料库和文本语料库分别建立声学模型和语言模型; 接收模块,配置为接收所述儿童的语音信号,并对所述语音信号进行前端处理; 特征提取处理模块,配置为对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征; 识别文本获得模块,配置为通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本; 语义理解处理模块,配置为对所述识别文本进行语义理解处理,以获得语义理解结果;其中 所述模型建立模块还配置为通过以下步骤建立声学模型: 对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征; 根据所述全部语音语料的声学特征进行建模,以获得所述声学模型。
[0014] 本发明实施例提供的针对儿童的语音识别方法能够在提取全部语音语料的声学特征过程中加入声道长度归一化技术,并以此建立声学模型,避免现有技术中对儿童语音识别不准的问题。本发明实施例中,依次通过全部语音语料中的女性语料和儿童语料作为训练数据来进行反复建模,并在对声学模型进行建立时,针对儿童发音速度变化大、容易出现大段静音的问题,在声学模型中添加建立静音模型以及语气词模型,使得最终得到的声学模型更接近于儿童语音发音特点,合理高效地提高对儿童语音的识别率,达到对儿童语音针对性更强,语音识别率更高,识别结果更加准确的有益效果。另外,本发明实施例中,通过包括有变形文本语料的混合文本语料库建立语言模型,对儿童语音进行识别,使得识别率更高;本发明的语义理解步骤中,能够针对性地对语言模型处理中得到的具有词重复、叠词的词尾重复或者词与词之间具有多余语气词的识别文本进行相应的语义理解处理,以得到正确的语义理解结果。[0015] 综上,本发明实施例提供的针对儿童的语音识别方法能够解决现有技术中对儿童语音识别不准的问题,达到合理高效提高儿童语音的识别率的有益效果。
自从教育部发布关于《幼儿园“小学化”专项治理工作的通知》,很多人就问了,幼儿园不学知识,一年级跟不上怎么办? 很多幼儿园也疑惑,不让提前教拼音,那还能教啥? 这里青瑞君就带大家来看看新政策下,幼儿园应当怎么教: 把握共赢、全面、独立、过渡的原则: 新政策所倡导的是呼吁教学应符合幼儿身心发展的规律,并不是不教知识。 孩子从幼儿园进入小学这个阶段,正是从学前期向学龄期发展的重要过渡时期。 幼儿园可以把重点放在儿童身体素质、心理素质的培养上,通过环境与游戏的影响,使幼儿获得丰富的感性知识和直接体验。 理念上以激发兴趣为主: 从心理学角度分析,幼儿上学后如果事先掌握一些零星知识,教师讲课时就更容易引发学生的共鸣。 知识点的衔接应根据幼儿学习特点设定,在实施中把握分寸,避免“小学化”,这样才能让幼儿平稳度过幼小衔接期。 设立明确教学目标: 幼儿园应在幼儿成长的每个年龄段设立分层目标,在整个幼儿教育期间逐渐完成。 如: 适当调整大班下学期的作息时间与活动内容,缩短午睡时间, 每节课延长到 35 分钟,培养幼儿对学习的持久性, 模仿小学座位,让两个幼儿用一张课桌等。 尝试在大班年级设立专门的拼音游戏时间,让幼儿通过做游戏对拼音字母和四声有一定了解,激发幼儿学习拼音的兴趣; 在学前的最后一年,通过游戏和绘画活动中培养儿童写字所需的街办公,熟悉田字格、四线格等; 适当增加智力活动的比重,以开发幼儿的思维能力,计算课在让幼儿了解 10 以内加减法的基础上,多进行口算、心算能力的培养; 语言课增加看图说话及说话绘图等方面的训练内容,以发展幼儿口语表达能力。 学习对政策的理解与解读能力,才能从教学角度更好地开办和管理幼儿园。 每一个有志于做园长、或者正在做园长的人,你准备好了吗? 关注青瑞,关注早幼教人的自我成长~
汉语拼音方案草案,经中国文字改革委员会提出后,两年来,由中国人民政治协商会议全国委员会和各地方协商委员会组织了广泛的讨论,并且由国务院组织汉语拼音方案审订委员会加以审核修订,最后又由中国人民政治协商会议全国委员会常务委员会召开扩大会议加以审议,现在由国务院全体会议通过,准备提请全国人民代表大会下次会议讨论和批准,并且决定登报公布,让全国人民事先知道。 应用汉语拼音方案为汉字注音来帮助识字和统一读音,对于改进学校语文教学,推广普通话,扫除文盲,都将起推进作用。对于少数民族制定文字和学习汉语方面,也有重大意义。因此,这个方案草案在提请全国人民代表大会讨论和批准之后,可以在师范、中小学校,成人补习学校,扫盲教育和出版等方面逐步推行,并在实践过程中继续求得完善化。具体办法,将由教育部、文化部及其他有关单位会同中国文字改革委员会分别拟定,报告国务院批准施行。
在全国语言文字工作会议期间,由于“拼音化方向”在政策上的变化,代表们对于“拼音化方向”问题进行了热烈的讨论。当时的国家语言文字工作委员会副主任陈章太在《全国语言文字工作会议的总结发言》中特别对于“拼音化方向”作了如下的说明:“关于拼音化方向问题,代表们在讨论中有两种不同的意见,这也反映了社会上对这个问题的不同认识。比较多的同志赞成工作报告不提这个问题,认为这符合中央倡导的实事求是、注重务实的精神,容易收到实效,有利于新时期语言文字工作的开展,同时也有利于推动文字改革工作。另外一些同志则认为报告中的有关表述,虽然是现实的,可行的,但总觉得对拼音化方向不加以正面表述,是一种后退,调子低了,可能对今后工作开展不利。我们对这两种意见进行了认真的严肃的考虑、研究,仍然认为工作报告中的表述是符合实际的,是积极而又稳妥的,是前进而不是后退的。实际上我们在会前关于这个问题倾听过社会上的意见和专家的意见,也倾听过许多负责同志的意见。我们相信现在这样的表述,将会得到国内外更加广泛的赞同和支持,将能团结更多的人来做好新时期的语言文字工作,并且更好地完成过去还没有完成的文字改革任务,从而更有效地为我国的现代化建设服务。这里我们向同志们作个说明,刘导生同志的工作报告中关于这个问题的提法,国家语委是事先请示过中央和国务院的领导同志的。大会期间同志们对这个问题的不同意见,我们也报告了党中央和国务院。昨天下午,国家语委接到了党中央和国务院对这个问题的批示,同意刘导生同志工作报告中对这个问题的表述。希望同志们能很好理解。当然,对这个问题有不同的认识,这是正常的,也是可以讨论的,但希望这种讨论不要影响集中力量做好我们当前要做的主要工作。”这样,就把当时我国政府的政策变化的背景说得更清楚了。
《中华人民共和国国家通用语言文字法》第一章第十八条规定:“国家通用语言文字以《汉语拼音方案》作为拼写和注音的工具。《汉语拼音方案》是中国人名、地名和中文文献罗马字母拼写法的统一规范,并用于汉字不便使用或不能使用的领域。初等教育应当进行汉语拼音教学。”这样,就从法律上确定了汉语拼音的地位和作用。汉语拼音在汉字教学中起了很好的作用。80年代初期开始的一项小学语文教学改革实验――“注音识字,提前读写”,简称“注提”。儿童首先用一个月左右学好汉语拼音,然后充分利用汉语拼音来帮助识字,从一年级开始就进行听说读写的全面训练,寓识字于读写之中,用汉语拼音阅读和作文,在阅读和作文中逐步增加汉字,最后达到全部用汉字阅读和写作。通过生动活泼的语言实践活动,促使学生在语言、思维、智力各个方面都得到和谐的发展。这项实验在全国进行,并编写了“注音识字,提前读写”的教材。
[0060] 本发明实施例中,由于在训练语言模型的文本语料库做了文本变形处理,因此,在最终的儿童语音识别结果的文本中,通过改进的语义理解模型进行相应的文本变形后处理。优选地,本发明实施例中,对识别文本进行语义理解处理的步骤包括下列至少之一:首先,通过对识别文本进行常规词语法分析,去除识别文本中连续出现重复的词,以获得所述语义理解结果;例如“今天妈妈买的苹果苹果真好吃”变成“今天妈妈买的苹果真好吃”。其次,通过对识别文本进行常规词语法分析,去除识别文本中词尾重复的叠词,以获得语义理解结果。例如,“今天妈妈买的苹果果真好吃”变成“今天妈妈买的苹果真好吃”。最后,通过对识别文本进行常规词语法分析和句法分析,去除识别文本中词与词之间多余的语气词,以获得语义理解结果。例如“今天妈妈买的苹果嗯真好吃”变成“今天妈妈买的苹果真好吃”。本发明实施例中,在对识别文本进行语义理解处理时,对识别文本进行常规语法分析以及基础的句法分析,并找出句法主体结构之外的组词等无意义的词,加以去除,并获得语义理解结果。另外,语义理解模型还可以根据训练语言模型的儿童语料库,分析特征提取模式规则,并结合应用规则和统计模型的方法,对语音识别的文本进行分析和处理,得到准确性更高的语义理解结果,进一步提高儿童的语音识别的准确性。
×