[0060] 本发明实施例中,由于在训练语言模型的文本语料库做了文本变形处理,因此,在最终的儿童语音识别结果的文本中,通过改进的语义理解模型进行相应的文本变形后处理。优选地,本发明实施例中,对识别文本进行语义理解处理的步骤包括下列至少之一:首先,通过对识别文本进行常规词语法分析,去除识别文本中连续出现重复的词,以获得所述语义理解结果;例如“今天妈妈买的苹果苹果真好吃”变成“今天妈妈买的苹果真好吃”。其次,通过对识别文本进行常规词语法分析,去除识别文本中词尾重复的叠词,以获得语义理解结果。例如,“今天妈妈买的苹果果真好吃”变成“今天妈妈买的苹果真好吃”。最后,通过对识别文本进行常规词语法分析和句法分析,去除识别文本中词与词之间多余的语气词,以获得语义理解结果。例如“今天妈妈买的苹果嗯真好吃”变成“今天妈妈买的苹果真好吃”。本发明实施例中,在对识别文本进行语义理解处理时,对识别文本进行常规语法分析以及基础的句法分析,并找出句法主体结构之外的组词等无意义的词,加以去除,并获得语义理解结果。另外,语义理解模型还可以根据训练语言模型的儿童语料库,分析特征提取模式规则,并结合应用规则和统计模型的方法,对语音识别的文本进行分析和处理,得到准确性更高的语义理解结果,进一步提高儿童的语音识别的准确性。
[0041] 由于儿童发音语速变化大,并且儿童的语音信息中可能出现会说说停停的问题,因此,需要在声学模型的设置中加入静音模型,来识别儿童语音中可能出现大段静音的情况。本发明实施例中,在建立声学模型时,需要对不同的发音建立单独的模型。以中文为例,需要对66个声韵母单独建立HMM模型。并且,本发明实施例能够进一步增大静音模型的描述精度。例如,在通常的声音模型中,采用32个高斯混合模型(Gassion Mixture Model,以下简称GMM)进行描述声韵母的HMM的每个状态,则在建立本发明实施例中的静音模型时,可以将GMM的采用个数提升为至少采用64个。本发明实施例中,针对儿童发音速度变化大、容易出现大段静音的发音特点,在建立的声音模型中添加静音模型,提高对儿童语音信息的识别率,合理高效地增大对」L童语音信息识别的准确性。
1982年正式成立了汉语拼音正词法委员会。该委员会提出,汉语拼音正词法应该以现代汉语语法中定义的词作为正词法的拼写单位,同时也要照顾到阅读和理解的方便,并且要照顾到某些国际上拼写的习惯。该委员会同时也开始研制汉语拼音正词法的基本规则,参考过去个人研制的和集体草拟的正词法规则,《汉语拼音方案》公布以来出版的各种拼音读物,各种以《汉语拼音方案》为基础并以词为拼写单位的词书,各种信息处理用的汉语拼音分词连写的实践经验,广泛听取了个方面人士的意见,并请教育界、出版界、信息处理界和语文界的专家学者进行了讨论,又与有关单位协作,进行了10万多词的拼写试验。在这些工作的基础上,1984年10月,中国文字改革委员会发表了《汉语拼音正词法基本规则(试用稿)》。1988年7月1日,国家教育委员会、国家语言文字工作委员会发出《关于公布〈汉语拼音正词法基本规则(试用稿)〉的联合通知》。1996年1月22日,国家技术监督局发布《汉语拼音正词法基本规则》,把它当作国家标准。

热门查询: 老黄历 周公解梦 周公解梦大全查询 2019放假安排 手机号码测吉凶 百家姓 | 黄道吉日 2019年4月5日黄历 2019年4月6日黄历 2019年4月7日黄历 2019年4月8日黄历 2019年4月黄道吉日 | 家常菜 鲁菜 川菜 苏菜 粤菜 闽菜 浙菜 湘菜 徽菜 沪菜 京菜 渝菜 | 天气预报 北京天气 上海天气 香港天气 广州天气 深圳天气 台北天气 澳门天气 天津天气 沈阳天气 大连天气 南京天气 苏州天气 杭州天气 武汉天气 重庆天气 成都天气 无锡天气 宁波天气 合肥天气 厦门天气 | 周公解梦大全 老黄历 天气预报查询 火车时刻表 手机号码归属地 家常菜谱大全 货币汇率查询 邮政编码查询 万年历 2019年放假安排 生男生女预测表 QQ号码吉凶 安全期计算器 观音灵签 日常生活: 手机号码归属地 邮政编码查询 机构邮政编码查询 货币汇率查询 天气预报查询 家常菜谱大全 PM2.5查询 常用电话号码 快递查询 区号查询 数字大写转换 2019年放假安排 台湾邮编查询 汽车车标大全 大学查询 人民币存款利率表 升降旗时间 国家地区查询 全国社会性组织 (共19个) 站长工具: IP地址查询 下载地址加解密工具 二维码生成器 进程查询 密码强度检测 ASCII码对照表 UNIX时间戳 (共7个) 交通出行: 火车时刻表 北京车牌尾号限行查询 实时路况查询 地铁线路图 机场三字码查询 交通违章查询 车牌号查询 中国电子地图 世界时差查询 (共9个) 休闲娱乐: 疯狂猜图答案 中华谜语大全 脑筋急转弯 绕口令大全 QQ号码吉凶 外星年龄 外星体重 竖排古文 (共8个) 民俗文化: 周公解梦大全 老黄历 百家姓大全 历史上的今天 歇后语大全 十二生肖 万年历 二十四节气表 地母经 名人名言名句大全 民间谚语 解密生日 佛学大辞典 (共13个) 学习应用: 新华字典 汉语词典 成语大全 诗词大全 在线翻译 英语单词大全 英文名 专业英汉汉英词典 百科全书 英文缩写大全 五笔字根表 笔画数查询 汉字部首查询 汉字拼音查询 区位码查询 汉字简体繁体转换 郑码编码查询 仓颉编码查询 四角号码在线查询 中文电码查询 在线编码解码 百万圆周率 摩尔斯电码 科学计算器 在线输入法 (共25个) 身体健康: 安全期计算器 药品查询 绿色食品 民间偏方大全 中草药名方大全 中草药民间验方 酒方大全 食物营养成分查询 中草药大全 中华本草 中医名词辞典 粥谱大全 (共12个) 占卜求签: 二十八星宿算命 六十四卦金钱课 观音灵签 黄大仙灵签 诸葛神算 妈祖天后灵签 关帝灵签 吕祖灵签 车公灵签 王公祖仔灵签 文王神卦 灵棋经 称骨算命 预测吉凶 指纹运势查询 生男生女预测表 姓名缘分测试 (共17个)


在全国语言文字工作会议期间,由于“拼音化方向”在政策上的变化,代表们对于“拼音化方向”问题进行了热烈的讨论。当时的国家语言文字工作委员会副主任陈章太在《全国语言文字工作会议的总结发言》中特别对于“拼音化方向”作了如下的说明:“关于拼音化方向问题,代表们在讨论中有两种不同的意见,这也反映了社会上对这个问题的不同认识。比较多的同志赞成工作报告不提这个问题,认为这符合中央倡导的实事求是、注重务实的精神,容易收到实效,有利于新时期语言文字工作的开展,同时也有利于推动文字改革工作。另外一些同志则认为报告中的有关表述,虽然是现实的,可行的,但总觉得对拼音化方向不加以正面表述,是一种后退,调子低了,可能对今后工作开展不利。我们对这两种意见进行了认真的严肃的考虑、研究,仍然认为工作报告中的表述是符合实际的,是积极而又稳妥的,是前进而不是后退的。实际上我们在会前关于这个问题倾听过社会上的意见和专家的意见,也倾听过许多负责同志的意见。我们相信现在这样的表述,将会得到国内外更加广泛的赞同和支持,将能团结更多的人来做好新时期的语言文字工作,并且更好地完成过去还没有完成的文字改革任务,从而更有效地为我国的现代化建设服务。这里我们向同志们作个说明,刘导生同志的工作报告中关于这个问题的提法,国家语委是事先请示过中央和国务院的领导同志的。大会期间同志们对这个问题的不同意见,我们也报告了党中央和国务院。昨天下午,国家语委接到了党中央和国务院对这个问题的批示,同意刘导生同志工作报告中对这个问题的表述。希望同志们能很好理解。当然,对这个问题有不同的认识,这是正常的,也是可以讨论的,但希望这种讨论不要影响集中力量做好我们当前要做的主要工作。”这样,就把当时我国政府的政策变化的背景说得更清楚了。
汉语拼音方案草案,经中国文字改革委员会提出后,两年来,由中国人民政治协商会议全国委员会和各地方协商委员会组织了广泛的讨论,并且由国务院组织汉语拼音方案审订委员会加以审核修订,最后又由中国人民政治协商会议全国委员会常务委员会召开扩大会议加以审议,现在由国务院全体会议通过,准备提请全国人民代表大会下次会议讨论和批准,并且决定登报公布,让全国人民事先知道。 应用汉语拼音方案为汉字注音来帮助识字和统一读音,对于改进学校语文教学,推广普通话,扫除文盲,都将起推进作用。对于少数民族制定文字和学习汉语方面,也有重大意义。因此,这个方案草案在提请全国人民代表大会讨论和批准之后,可以在师范、中小学校,成人补习学校,扫盲教育和出版等方面逐步推行,并在实践过程中继续求得完善化。具体办法,将由教育部、文化部及其他有关单位会同中国文字改革委员会分别拟定,报告国务院批准施行。
汉语拼音方案草案,经中国文字改革委员会提出后,两年来,由中国人民政治协商会议全国委员会和各地方协商委员会组织了广泛的讨论,并且由国务院组织汉语拼音方案审订委员会加以审核修订,最后又由中国人民政治协商会议全国委员会常务委员会召开扩大会议加以审议,现在由国务院全体会议通过,准备提请全国人民代表大会下次会议讨论和批准,并且决定登报公布,让全国人民事先知道。 应用汉语拼音方案为汉字注音来帮助识字和统一读音,对于改进学校语文教学,推广普通话,扫除文盲,都将起推进作用。对于少数民族制定文字和学习汉语方面,也有重大意义。因此,这个方案草案在提请全国人民代表大会讨论和批准之后,可以在师范、中小学校,成人补习学校,扫盲教育和出版等方面逐步推行,并在实践过程中继续求得完善化。具体办法,将由教育部、文化部及其他有关单位会同中国文字改革委员会分别拟定,报告国务院批准施行。
[0060] 本发明实施例中,由于在训练语言模型的文本语料库做了文本变形处理,因此,在最终的儿童语音识别结果的文本中,通过改进的语义理解模型进行相应的文本变形后处理。优选地,本发明实施例中,对识别文本进行语义理解处理的步骤包括下列至少之一:首先,通过对识别文本进行常规词语法分析,去除识别文本中连续出现重复的词,以获得所述语义理解结果;例如“今天妈妈买的苹果苹果真好吃”变成“今天妈妈买的苹果真好吃”。其次,通过对识别文本进行常规词语法分析,去除识别文本中词尾重复的叠词,以获得语义理解结果。例如,“今天妈妈买的苹果果真好吃”变成“今天妈妈买的苹果真好吃”。最后,通过对识别文本进行常规词语法分析和句法分析,去除识别文本中词与词之间多余的语气词,以获得语义理解结果。例如“今天妈妈买的苹果嗯真好吃”变成“今天妈妈买的苹果真好吃”。本发明实施例中,在对识别文本进行语义理解处理时,对识别文本进行常规语法分析以及基础的句法分析,并找出句法主体结构之外的组词等无意义的词,加以去除,并获得语义理解结果。另外,语义理解模型还可以根据训练语言模型的儿童语料库,分析特征提取模式规则,并结合应用规则和统计模型的方法,对语音识别的文本进行分析和处理,得到准确性更高的语义理解结果,进一步提高儿童的语音识别的准确性。
×