10.一种针对儿童的语音识别装置,包括: 模型建立模块,配置为通过已知的语音语料库和文本语料库分别建立声学模型和语言模型; 接收模块,配置为接收所述儿童的语音信号,并对所述语音信号进行前端处理; 特征提取处理模块,配置为对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征; 识别文本获得模块,配置为通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本; 语义理解处理模块,配置为对所述识别文本进行语义理解处理,以获得语义理解结果;其中 所述模型建立模块还配置为通过以下步骤建立声学模型: 对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征; 根据所述全部语音语料的声学特征进行建模,以获得所述声学模型。
[0060] 本发明实施例中,由于在训练语言模型的文本语料库做了文本变形处理,因此,在最终的儿童语音识别结果的文本中,通过改进的语义理解模型进行相应的文本变形后处理。优选地,本发明实施例中,对识别文本进行语义理解处理的步骤包括下列至少之一:首先,通过对识别文本进行常规词语法分析,去除识别文本中连续出现重复的词,以获得所述语义理解结果;例如“今天妈妈买的苹果苹果真好吃”变成“今天妈妈买的苹果真好吃”。其次,通过对识别文本进行常规词语法分析,去除识别文本中词尾重复的叠词,以获得语义理解结果。例如,“今天妈妈买的苹果果真好吃”变成“今天妈妈买的苹果真好吃”。最后,通过对识别文本进行常规词语法分析和句法分析,去除识别文本中词与词之间多余的语气词,以获得语义理解结果。例如“今天妈妈买的苹果嗯真好吃”变成“今天妈妈买的苹果真好吃”。本发明实施例中,在对识别文本进行语义理解处理时,对识别文本进行常规语法分析以及基础的句法分析,并找出句法主体结构之外的组词等无意义的词,加以去除,并获得语义理解结果。另外,语义理解模型还可以根据训练语言模型的儿童语料库,分析特征提取模式规则,并结合应用规则和统计模型的方法,对语音识别的文本进行分析和处理,得到准确性更高的语义理解结果,进一步提高儿童的语音识别的准确性。
从前,我一直觉得孩子在上小学之前没有必要学习拼音。因为拼音本身只是学习语言的一种工具,而且也比较简单。我记得自己上学的时候,也是通过学校学习掌握这项技能的。 但是,在和很多家长和小学老师沟通之后,我改变了自己的想法。 LELE 爸 我认为孩子在上小学之前先学习拼音是很必要的。孩子在幼儿园大班的时候是用了一年的时间,来系统地学习拼音,所以孩子因为提前学过了拼音,上了一年级之后,当老师复习的时候,就比较容易接受了。 我也问过很多的家长该不该让孩子提前学习拼音的问题。在幼儿园学过拼音的孩子,家长都认为提前学习了拼音,是很有好处的。 而一些公立幼儿园的孩子,在幼儿园的时候并没有学过拼音,所以他们的家长普遍认为孩子上小学以后,拼音就学得比较困难,往往跟不上老师的教学进度。 小天使fish 妈 我家宝贝今年上的小学一年级,我是彻底秉承了幼儿园不学拼音不学算数不学识字这样的理念,因为老师说教育局都不让提前学,原来我还是比较赞同的。 但孩子毕竟是自己的,现在私立学校都进行入学测试,不光考玩的,如跳绳,打球等,也考知识性的,读故事书,用英语介绍自己,算数,识字等。 我们突击了好一段时间才勉强过关,上一年级以后发现班上大多数小朋友都上过幼小衔接班,人家不光会是识字会速算,会拼音会英语,写的还很快,第一学期对我和孩爸简直就是噩梦,每天写作业要到十点多甚至更晚,送他上学放学的路上我都在给他讲字的构造,路边的石子,树枝树叶,小狗等都变成了我们的教具,终于孩子慢慢地入了道。 但由于不是统一的水平,老师还是会经常表扬写字好的,算数好的,一次次考试下来,本来自信的儿子越来越不自信,说话完全没底气,还整天提心吊胆怕问考试问成绩…… 孩子在入学之前,有两样必要的内容,还是必须要学好。 首先就是拼音。 一是因为现在很多小学老师,加快了拼音的教学进度。这样,最大的问题,是没有储备的孩子,很可能一开始就被挫伤了学习自信。拼音只是一个很小的技能,最大的核心就是需要时间不断接触,不断训练。完全可以通过一些简单的积累,避免孩子入学后的焦虑。所以,上学前花一点时间储备,很有必要。 第二,就是我支持孩子在上学,打下一定的书写基础。 因为写字是个技术动作,一定要练,才能掌握。要是入学才开始写字,孩子锻炼的时间就少了。让毫无基础的孩子一上来就写各种内容,压力会很大。一定要让孩子提前准备好。 还有一个实际情况是:小学老师要同时应付班上三四十个小孩子。因此,大部分老师并不会对每个孩子写字的姿势和笔顺做出严格的要求。这种情况下,如果孩子没有正确扎实的书写基础,很容易就会养成坏习惯。等到孩子养成了错误的姿势或者笔顺,就很难纠正过来了。 学习拼音和写字,除了学习知识本身,更重要的是培养孩子的一种读书习惯,也就是我们所说的书性。通过在家练习,最重要的,是帮助孩子建立“我要读书了”这样的一种状态。这算的上孩子入学前,最重要的一课。 如此一来,我就开始了为孩子寻最好拼音学习教学视频。结果, 我发现了一套《 汉语拼音教学视频》 (全13课),看了以后觉得特别适合孩子用。陪娃看过以后发现确实不错,所以今天打算分享给更多的人,希望能够解决爸爸妈妈们的实际问题~ 汉语拼音对刚进入小学不久的孩子来说是陌生的,也是抽象的、枯燥乏味的。教师如果不为他们在头脑中建起一座抽象符合与具体事物之间的桥梁,一旦孩子对拼音学习失去兴趣,那么,拼音将会直接削弱学习语文的兴趣。因此《语文课程标准》尊重儿童的认知规律,将汉语拼音的功能定位在帮助认读生字、学习普通话上,而且还强调“:汉语拼音教学尽可能有趣味性,宜以活动和游戏为主,与学说普通话、识字教学相结合。 这部汉语拼音教学视频通过科学的教学方法和教学手段使学习拼音变得生动有趣,并根据儿童的学习特点,在拼音教学中重点开发教学的趣味性、从而最大限度地激发学习兴趣,启发学生思维,让儿童在不拘一格的学习方式中积极愉快的度过学习第一道难关——汉语拼音。 免费领取 《 汉语拼音教学视频》 (全 13 课)! 1、关注 那群妈妈 公众号:naqunmama 2 、回复 在 那群妈妈 公众号 回复: 汉语拼音教学 ,按提示操作,即可 免费获取 《 汉语拼音教学视频》 (全 13 课)! 有什么问题可以咨询我的私信:nqmmcn 特别声明: 分享的资源版权属于原出版公司,本资源为电子书,传播分享仅限于家庭使用与交流心得、参考和辅助购买决策,不得以任何理由在商业行为中使用,若喜欢此资源,建议购买实体产品。
其中,步骤S11的前端处理中,预处理的方法中可包括利用FIR低通滤波 器进行滤波,以滤除信号中的高次谐波和随机干扰成分,被滤除的成分是奇异 模态,从而避免了随后EMD筛选中因奇异模态影响造成的模态混叠,以便在被 筛选出的模态信号中得到完整的有用信号。预处理的实现方法亦可使用现有技 术语音识别方法中的预处理通用方法,例如,普通PC机的声卡即可用于实现预 处理。设对每条(句)语音信号,预处理后得到原始语音信号时间序列义(O, HHT变换首先对语音情感信号进行EMD(经验模态分析,Empirical Mode Decomposition)分解,把非平稳的语音情感信号X(O分解成为六个平稳的IMF(固 有模态函数,Intrinsic Mode Functions )窄带信号分量。关于HHT变换的详细内 容可参见文献[l]: Norden E. Huang, Zheng Shen, Steven R. Long, The empirical mode decomposition & the Hilbert spectrum for nonlinear and non-stationary time series analysis, Proceed of the Royal Society of London Series A: Mathematical
[0041] 由于儿童发音语速变化大,并且儿童的语音信息中可能出现会说说停停的问题,因此,需要在声学模型的设置中加入静音模型,来识别儿童语音中可能出现大段静音的情况。本发明实施例中,在建立声学模型时,需要对不同的发音建立单独的模型。以中文为例,需要对66个声韵母单独建立HMM模型。并且,本发明实施例能够进一步增大静音模型的描述精度。例如,在通常的声音模型中,采用32个高斯混合模型(Gassion Mixture Model,以下简称GMM)进行描述声韵母的HMM的每个状态,则在建立本发明实施例中的静音模型时,可以将GMM的采用个数提升为至少采用64个。本发明实施例中,针对儿童发音速度变化大、容易出现大段静音的发音特点,在建立的声音模型中添加静音模型,提高对儿童语音信息的识别率,合理高效地增大对」L童语音信息识别的准确性。

其中,步骤S11的前端处理中,预处理的方法中可包括利用FIR低通滤波 器进行滤波,以滤除信号中的高次谐波和随机干扰成分,被滤除的成分是奇异 模态,从而避免了随后EMD筛选中因奇异模态影响造成的模态混叠,以便在被 筛选出的模态信号中得到完整的有用信号。预处理的实现方法亦可使用现有技 术语音识别方法中的预处理通用方法,例如,普通PC机的声卡即可用于实现预 处理。设对每条(句)语音信号,预处理后得到原始语音信号时间序列义(O, HHT变换首先对语音情感信号进行EMD(经验模态分析,Empirical Mode Decomposition)分解,把非平稳的语音情感信号X(O分解成为六个平稳的IMF(固 有模态函数,Intrinsic Mode Functions )窄带信号分量。关于HHT变换的详细内 容可参见文献[l]: Norden E. Huang, Zheng Shen, Steven R. Long, The empirical mode decomposition & the Hilbert spectrum for nonlinear and non-stationary time series analysis, Proceed of the Royal Society of London Series A: Mathematical


[0073] 本发明实施例提供的针对儿童的语音识别方法能够在提取全部语音语料的声学特征过程中加入声道长度归一化技术,并以此建立声学模型,避免现有技术中对儿童语音识别不准的问题。本发明实施例中,依次通过全部语音语料中的女性语料和儿童语料作为训练数据来进行反复建模,并在对声学模型进行建立时,针对儿童发音速度变化大、容易出现大段静音的问题,在声学模型中添加建立静音模型以及语气词模型,使得最终得到的声学模型更接近于儿童语音发音特点,合理高效地提高对儿童语音的识别率,达到对儿童语音针对性更强,语音识别率更高,识别结果更加准确的有益效果。另外,本发明实施例中,通过包括有变形文本语料的混合文本语料库建立语言模型,对儿童语音进行识别,使得识别率更高;本发明的语义理解步骤中,能够针对性地对语言模型处理中得到的具有词重复、叠词的词尾重复或者词与词之间具有多余语气词的识别文本进行相应的语义理解处理,以得到正确的语义理解结果。
汉语拼音方案草案,经中国文字改革委员会提出后,两年来,由中国人民政治协商会议全国委员会和各地方协商委员会组织了广泛的讨论,并且由国务院组织汉语拼音方案审订委员会加以审核修订,最后又由中国人民政治协商会议全国委员会常务委员会召开扩大会议加以审议,现在由国务院全体会议通过,准备提请全国人民代表大会下次会议讨论和批准,并且决定登报公布,让全国人民事先知道。 应用汉语拼音方案为汉字注音来帮助识字和统一读音,对于改进学校语文教学,推广普通话,扫除文盲,都将起推进作用。对于少数民族制定文字和学习汉语方面,也有重大意义。因此,这个方案草案在提请全国人民代表大会讨论和批准之后,可以在师范、中小学校,成人补习学校,扫盲教育和出版等方面逐步推行,并在实践过程中继续求得完善化。具体办法,将由教育部、文化部及其他有关单位会同中国文字改革委员会分别拟定,报告国务院批准施行。
热门标签 人工智能 机器人 机器学习 深度学习 金融科技 未来医疗 智能驾驶 自动驾驶 计算机视觉 激光雷达 图像识别 智能音箱 区块链 智能投顾 医学影像 物联网 IoT CV 微信小程序平台 微信小程序在哪 CES 2017 CES 2016年最值得购买的智能硬件 2016 互联网 小程序 微信朋友圈 抢票软件 智能手机 智能家居 智能手环 智能机器人 智能电视 360智能硬件 智能摄像机 智能硬件产品 智能硬件发展 智能硬件创业 黑客 白帽子 大数据 云计算 新能源汽车 无人驾驶 无人机 大疆 小米无人机 特斯拉 VR游戏 VR电影 VR视频 VR眼镜 VR购物 AR 直播 扫地机器人 医疗机器人 工业机器人 类人机器人 聊天机器人 微信机器人 微信小程序 移动支付 支付宝 P2P 区块链 比特币 风控 高盛 人脸识别 指纹识别 黑科技 谷歌地图 谷歌 IBM 微软 乐视 百度 三星s8 腾讯 三星Note8 小米MIX 小米Note 华为 小米 阿里巴巴 苹果 MacBook Pro iPhone Facebook GAIR IROS 双创周 云栖大会 先打 智能硬件公司 智能硬件 QQ红包 支付宝红包 敬业福 google无人驾驶汽车智能照明色情网soylent组装手机小米家庭音响小米5拍照最大的av网站inkcase美国手美国大选谁赢了vitafun黄金钱包360云盘 下载速度慢 更多
×