基于语音识别的教学实训系统.pdf

上传人：南*** 文档编号：9287387 上传时间：2021-05-12 格式：PDF 页数：16 大小：481.88KB

收藏版权申诉举报下载

第1页 / 共16页

第2页 / 共16页

第3页 / 共16页

下载文档到电脑，查找使用更方便

30 金币

下载文档

文档描述：

《基于语音识别的教学实训系统.pdf》由会员分享，可在线阅读，更多相关《基于语音识别的教学实训系统.pdf（16页完成版）》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010229303.6 (22)申请日 2020.03.27 (71)申请人上海乂学教育科技有限公司地址 200237 上海市徐汇区宜州路188号2 幢9层、 10层 (72)发明人王鑫 (51)Int.Cl. G10L 15/22(2006.01) G10L 15/26(2006.01) G10L 17/22(2013.01) G09B 9/00(2006.01) (54)发明名称基于语音识别的教学实训系统 (57)摘要本发明提供了一种基于语音识别的教学实训系。

2、统，该基于语音识别的教学实训系统通过获取关于教学实训场景的声音信号数据，以此确定关于教学实训相关对象的语音信号数据，并对该语音信号数据进行识别处理，以此获取关于该教学实训相关对象的语音识别相关信息，再根据该语音识别相关信息，从预设实训执行数据库中匹配确定相应的教学实训执行相关数据，最后根据该教学实训执行相关数据，与互动对象进行适应性的教学实训互动，其充分利用语音识别技术来对教学实训过程进行智能化的升级，以便于实训对象通过语音控制的方式就能够实现相应的教学实训互动，这有利于提升教学实训操作的可执行性和智能性。权利要求书4页说明书10页附图1页。

3、CN 111276146 A 2020.06.12 CN 111276146 A 1.基于语音识别的教学实训系统，其特征在于：所述基于语音识别的教学实训系统包括语音获取模块、语音识别模块、语音-实训匹配模块和教学实训执行模块；其中，所述语音获取模块用于获取关于教学实训场景的声音信号数据，以此确定关于教学实训相关对象的语音信号数据；所述语音识别模块用于对所述语音信号数据进行识别处理，以此获取关于所述教学实训相关对象的语音识别相关信息；所述语音-实训匹配模块用于根据所述语音识别相关信息，从预设实训执行数据库中匹配确定相应的教学实训执行相关数据；所述教学实训执行模块用。

4、于根据所述教学实训执行相关数据，与互动对象进行适应性的教学实训互动。 2.如权利要求1所述的基于语音识别的教学实训系统，其特征在于：所述语音获取模块包括声音采集子模块、声音预处理子模块和语音信号提取子模块；其中，所述声音采集子模块用于根据预定声音采集模式，从所述教学实训场景中记录采集所述声音信号数据；所述声音预处理子模块用于对所述声音信号数据进行关于声音属性的预处理，以此获得声音信号预处理数据；所述语音信号生成子模块用于从所述声音信号预处理数据中生成得到所述语音信号数据。 3.如权利要求2所述的基于语音识别的教学实训系统，其特征在于：所述声音采集子模块包括教学实。

5、训场景检测单元、声音采集模式确定单元和声音信号数据记录单元；其中，所述教学实训场景检测单元用于检测当前教学实训场景中相应的人员数量状态和/或人员相对位置分布状态；所述声音采集模式确定单元用于根据所述人员数量状态和/或所述人员相对位置分布状态，确定所述预定声音采集模式对应的声音采集频率、声音采集灵敏度、声音采集上下极限值和声音采集空间角中的至少一者；所述声音信号数据记录单元用于根据所述预定声音采集模式中对应的声音采集频率、声音采集灵敏度、声音采集上下极限值和声音采集空间角中的至少一者，从所述教学实训场景中记录采集所述声音信号数据；或者，所述声音预处理子模块包。

6、括背景噪声剔除单元、声纹辨识单元和声道标定单元；其中，所述背景噪声剔除单元用于根据预定背景噪声识别与分离模型，从所述声音信号数据中识别相应的背景噪声成分，并将所述背景噪声成分从所述声音信号数据中分离；所述声纹辨识单元用于对分离所述背景噪声成分后的所述声音信号数据进行声纹辨识处理，以此确定所述声音信号数据对应的声纹分布状态；所述声道标定单元用于根据所述声纹分布状态，标定所述声音信号数据中对应存在的所有声纹通道；或者，所述语音信号生成子模块包括声道分离单元和声道语音信号提取单元；其中，所述声道分离单元用于根据所述声音信号预处理数据中标定的所述声音信号数据中权利要求。

7、书 1/4 页 2 CN 111276146 A 2 对应存在的所有声纹通道，对所述声音信号预处理数据进行对应声纹通道的分离处理；所述声道语音信号提取单元用于从分离处理后的每一个声纹通道中提取得到相应的语音信号数据。 4.如权利要求1所述的基于语音识别的教学实训系统，其特征在于：所述语音识别模块包括语音识别模型构建子模块、语音识别模型运行子模块和语音识别结果转换子模块；其中，所述语音识别模型构建子模块用于根据预设教学实训历史大数据和数据训练模式，构建相应的教学实训场景语音识别模型；所述语音识别模型运行子模块用于通过所述教学实训场景语音识别模型，对所述语音信号数据进行。

8、识别处理，以此获得相应的语音语义初步识别数据；所述语音识别结果转换子模块用于根据语义语法解析算法，对所述语音语义初步识别数据进行语法解析处理，以此获得所述语音识别相关信息。 5.如权利要求4所述的基于语音识别的教学实训系统，其特征在于：所述语音识别结果转换子模块包括语义语法解析算法构建单元和语法解析处理单元；其中，所述语义语法解析算法构建单元用于根据教学实训场景中对应的教学相关词汇大数据和/或教学相关词汇大数据，构建相应的所述语义语法解析算法；所述语法解析处理单元用于根据所述语义语法解析算法，对所述语音语义初步识别数据进行关于词汇、字段和语句中至少一者的所述语法解。

9、析处理，以此获得所述语音识别相关信息。 6.如权利要求1所述的基于语音识别的教学实训系统，其特征在于：所述语音-实训匹配模块包括语义定标子模块和实训执行动作数据确定子模块；其中，所述语义定标子模块用于对所述语音识别相关信息进行关于词汇、字段和语句中至少一者的定标处理，此次获取对应的语义定标结果；所述实训执行动作数据确定子模块用于根据所述语义定标结果，从所述预设实训执行数据中确定满足预定匹配条件的所述教学实训执行相关数据。 7.如权利要求6所述的基于语音识别的教学实训系统，其特征在于：所述语义定标子模块包括句段切分单元和定标处理单元；其中，所述句段切分单元用于对所。

10、述语音识别相关信息进行关于词汇、字段或者语句的细化切分处理，以此获得的对应的词汇切分集合、字段切分集合或者语句切分集合；所述定标处理单元用于根据所述词汇切分集合、所述字段切分集合或者所述语句切分集合，对所述语音识别相关信息进行所述定标处理，以此获取对应的所述语音定标结果；或者，所述实训执行动作数据确定子模块包括匹配度计算单元和教学实训执行相关数据定位单元；其中，所述匹配度计算单元用于根据所述语义定标结果，计算所述语音识别相关信息中每一项相关数据对应的教学实训场景匹配度值；所述教学实训执行相关数据定位单元用于根据所述教学实训场景匹配度值和所述预定匹配条件，从。

11、所述预设实训执行数据中定位得到所述教学实训执行相关数据。权利要求书 2/4 页 3 CN 111276146 A 3 8.如权利要求1所述的基于语音识别的教学实训系统，其特征在于：所述教学实训执行模块包括教学实训互动对象确定子模块和实训互动执行子模块；其中，所述教学实训互动对象确定子模块用于根据所述语音识别相关数据，确定当前所述教学实训执行相关数据对应的互动对象；所述实训互动执行子模块用于根据所述教学实训执行相关数据对应的执行指令，与所述互动对象进行适应性的教学实训互动。 9.如权利要求8所述的基于语音识别的教学实训系统，其特征在于：所述教学实训互动对象确定子模块包括。

12、互动对象身份确定单元和互动对象位置确定单元；其中，所述互动对象身份确定单元用于根据所述语音识别相关数据，确定当前所述教学实训执行相关数据对应的互动对象的身份信息；所述互动对象位置确定单元用于根据所述语音识别相关数据，确定当前所述教学实训执行相关数据对应的互动对象的位置信息。 10.如权利要求8所述的基于语音识别的教学实训系统，其特征在于：所述实训互动执行子模块包括执行指令生成单元和实训动作确定单元；其中，所述执行指令生成单元用于根据所述教学实训执行相关数据生成所述执行指令；所述实训动作确定单元用于根据所述执行指令，确定相应的教学实训动作，以此所述互动对象进行适应。

13、性的教学实训互动。 11.如权利要求1所述的一种基于语音识别的教学实训系统，其特征在于：所述语音-实训匹配模块用于根据所述语音识别相关信息，从预设实训执行数据库中匹配确定相应的教学实训执行相关数据；还包括根据数据处理获取的所述声音信号预处理关键特征数据及词汇切分集合，与所述预设实训执行数据库匹配，根据比对结果，执行从预设实训执行数据库中匹配确定相应的教学实训执行相关数据的操作；其具体实现步骤包括：步骤A1、根据所述声音采集子模块，获取教学实训场景的声音信号数据，并进行随机抽样处理；步骤A2、根据所述背景噪声剔除模型，对所述步骤A1随机抽样提取的声音信号数据。

14、进行滤波处理，以消除噪音干扰，根据公式(1)相位展开处理，获取声音信号预处理关键特征数据；其中， e为自然常数， t为声音信号总时长，为声音信号的时间坐标， f为所述声音采集频率， A为所述声音采集极限值， Amax为所述声音采集上极限值， Amin为所述声音采集下极限值， w为所述声音采集灵敏度， v(t)为所述随机抽样提取声音信号数据， f( -t)e-wftdt为在权利要求书 3/4 页 4 CN 111276146 A 4 给定总时长t和时间坐标上进行的相位展开， (Amax+Amin)为所确认的声音采集上、下极限值之和，为所述声音采集频率的补偿值， V(A，。

15、 f,w)为所述获取声音信号预处理关键特征数据；步骤A3、将所述获取声音信号预处理关键特征数据通过公式(2)进行所述词汇细化切分处理，以获取所述词汇切分集合；其中， arctan为反正切函数， m为正整数， i为随机抽样提取的声音信号数据词汇数量， x 为随机抽样提取的声音信号数据各词汇的笔画数量， Ji为所述词汇数量为i的词汇组， g x 为所述词汇笔画数量为x的词汇组，为获取所述词汇数量数据集，为获取所述词汇笔画数据集， W J为获取所述词汇切分集合；步骤A4、将所述步骤A2获取的所述声音信号预处理关键特征数据与步骤A3获取的词汇切分集合，与所述预设实训执行数据库D。

16、 o进行比对，通过公式(3)判断匹配结果，并执行从预设实训执行数据库中匹配确定相应的教学实训执行相关数据的操作； NN( ,(W(J)*V(A， f,w)/D(o)2) (3) 其中， N表示在所述期望值为，标准差为W(J)*V(A， f,w)/D(o)条件下的正态分布结果，若N值大于99.74，则表示所述随机抽样提取声音信号与所述预设实训执行数据库匹配，执行从预设实训执行数据库中匹配确定相应的教学实训执行相关数据的操作。权利要求书 4/4 页 5 CN 111276146 A 5 基于语音识别的教学实训系统技术领域 0001 本发明涉及智能教学实训的技术领域，特别涉及一。

17、种基于语音识别的教学实训系统。背景技术 0002 教学实训环节是教学过程中必要的实践环节，通过该教学实训环节能够培养学生的实践能力，以便于将课堂教学中学习到的知识应用到现实中，从而帮助学生更好地和更快地理解和吸收知识。目前，教学实践环节通常是以教学实验的形式来实现的，但是教学实验通常都需要在特定的场所并借助相应的实验设备才能够进行，这对于教学实践环节提出了较严格的要求，并且也不利于进行难度较高的教学实训操作。为了解决这一问题，现有技术提出了模拟教学实训的模式，模拟教学实训通过在相应的模拟空间中提供虚拟的教学实训操作，以便于学生对教学知识的梳。

18、理和消化，但是这种模式并没有充分利用语音识别技术来提升教学实训操作的可执行性和智能性，这严重地阻碍了教学实训操作的升级和推广。发明内容 0003 针对现有技术存在的缺陷，本发明提供一种基于语音识别的教学实训系统，该基于语音识别的教学实训系统包括语音获取模块、语音识别模块、语音-实训匹配模块和教学实训执行模块；其中，该语音获取模块用于获取关于教学实训场景的声音信号数据，以此确定关于教学实训相关对象的语音信号数据；该语音识别模块用于对该语音信号数据进行识别处理，以此获取关于该教学实训相关对象的语音识别相关信息；该语音-实训匹配模块用于根据该语音识别。

19、相关信息，从预设实训执行数据库中匹配确定相应的教学实训执行相关数据；该教学实训执行模块用于根据该教学实训执行相关数据，与互动对象进行适应性的教学实训互动；可见，该基于语音识别的教学实训系统通过获取关于教学实训场景的声音信号数据，以此确定关于教学实训相关对象的语音信号数据，并对该语音信号数据进行识别处理，以此获取关于该教学实训相关对象的语音识别相关信息，再根据该语音识别相关信息，从预设实训执行数据库中匹配确定相应的教学实训执行相关数据，最后根据该教学实训执行相关数据，与互动对象进行适应性的教学实训互动，其充分利用语音识别技术来对教学实训过程进。

20、行智能化的升级，以便于实训对象通过语音控制的方式就能够实现相应的教学实训互动，这有利于提升教学实训操作的可执行性和智能性。 0004 本发明提供一种基于语音识别的教学实训系统，其特征在于： 0005 所述基于语音识别的教学实训系统包括语音获取模块、语音识别模块、语音-实训匹配模块和教学实训执行模块；其中， 0006 所述语音获取模块用于获取关于教学实训场景的声音信号数据，以此确定关于教学实训相关对象的语音信号数据； 0007 所述语音识别模块用于对所述语音信号数据进行识别处理，以此获取关于所述说明书 1/10 页 6 CN 111276146 A 6 教学实训。

21、相关对象的语音识别相关信息； 0008 所述语音-实训匹配模块用于根据所述语音识别相关信息，从预设实训执行数据库中匹配确定相应的教学实训执行相关数据； 0009 所述教学实训执行模块用于根据所述教学实训执行相关数据，与互动对象进行适应性的教学实训互动； 0010 进一步，所述语音获取模块包括声音采集子模块、声音预处理子模块和语音信号提取子模块；其中， 0011 所述声音采集子模块用于根据预定声音采集模式，从所述教学实训场景中记录采集所述声音信号数据； 0012 所述声音预处理子模块用于对所述声音信号数据进行关于声音属性的预处理，以此获得声音信号预处理数据； 00。

22、13 所述语音信号生成子模块用于从所述声音信号预处理数据中生成得到所述语音信号数据； 0014 进一步，所述声音采集子模块包括教学实训场景检测单元、声音采集模式确定单元和声音信号数据记录单元；其中， 0015 所述教学实训场景检测单元用于检测当前教学实训场景中相应的人员数量状态和/或人员相对位置分布状态； 0016 所述声音采集模式确定单元用于根据所述人员数量状态和/或所述人员相对位置分布状态，确定所述预定声音采集模式对应的声音采集频率、声音采集灵敏度、声音采集上下极限值和声音采集空间角中的至少一者； 0017 所述声音信号数据记录单元用于根据所述预定声音采集模。

23、式中对应的声音采集频率、声音采集灵敏度、声音采集上下极限值和声音采集空间角中的至少一者，从所述教学实训场景中记录采集所述声音信号数据； 0018 或者， 0019 所述声音预处理子模块包括背景噪声剔除单元、声纹辨识单元和声道标定单元；其中， 0020 所述背景噪声剔除单元用于根据预定背景噪声识别与分离模型，从所述声音信号数据中识别相应的背景噪声成分，并将所述背景噪声成分从所述声音信号数据中分离； 0021 所述声纹辨识单元用于对分离所述背景噪声成分后的所述声音信号数据进行声纹辨识处理，以此确定所述声音信号数据对应的声纹分布状态； 0022 所述声道标定单元用。

24、于根据所述声纹分布状态，标定所述声音信号数据中对应存在的所有声纹通道； 0023 或者， 0024 所述语音信号生成子模块包括声道分离单元和声道语音信号提取单元；其中， 0025 所述声道分离单元用于根据所述声音信号预处理数据中标定的所述声音信号数据中对应存在的所有声纹通道，对所述声音信号预处理数据进行对应声纹通道的分离处理； 0026 所述声道语音信号提取单元用于从分离处理后的每一个声纹通道中提取得到相应的语音信号数据；说明书 2/10 页 7 CN 111276146 A 7 0027 进一步，所述语音识别模块包括语音识别模型构建子模块、语音识别模型运行子。

25、模块和语音识别结果转换子模块；其中， 0028 所述语音识别模型构建子模块用于根据预设教学实训历史大数据和数据训练模式，构建相应的教学实训场景语音识别模型； 0029 所述语音识别模型运行子模块用于通过所述教学实训场景语音识别模型，对所述语音信号数据进行识别处理，以此获得相应的语音语义初步识别数据； 0030 所述语音识别结果转换子模块用于根据语义语法解析算法，对所述语音语义初步识别数据进行语法解析处理，以此获得所述语音识别相关信息； 0031 进一步，所述语音识别结果转换子模块包括语义语法解析算法构建单元和语法解析处理单元；其中， 0032 所述语义语法解析算法。

26、构建单元用于根据教学实训场景中对应的教学相关词汇大数据和/或教学相关词汇大数据，构建相应的所述语义语法解析算法； 0033 所述语法解析处理单元用于根据所述语义语法解析算法，对所述语音语义初步识别数据进行关于词汇、字段和语句中至少一者的所述语法解析处理，以此获得所述语音识别相关信息； 0034 进一步，所述语音-实训匹配模块包括语义定标子模块和实训执行动作数据确定子模块；其中， 0035 所述语义定标子模块用于对所述语音识别相关信息进行关于词汇、字段和语句中至少一者的定标处理，此次获取对应的语义定标结果； 0036 所述实训执行动作数据确定子模块用于根据所述。

27、语义定标结果，从所述预设实训执行数据中确定满足预定匹配条件的所述教学实训执行相关数据； 0037 进一步，所述语义定标子模块包括句段切分单元和定标处理单元；其中， 0038 所述句段切分单元用于对所述语音识别相关信息进行关于词汇、字段或者语句的细化切分处理，以此获得的对应的词汇切分集合、字段切分集合或者语句切分集合； 0039 所述定标处理单元用于根据所述词汇切分集合、所述字段切分集合或者所述语句切分集合，对所述语音识别相关信息进行所述定标处理，以此获取对应的所述语音定标结果； 0040 或者， 0041 所述实训执行动作数据确定子模块包括匹配度计算单元和教。

28、学实训执行相关数据定位单元；其中， 0042 所述匹配度计算单元用于根据所述语义定标结果，计算所述语音识别相关信息中每一项相关数据对应的教学实训场景匹配度值； 0043 所述教学实训执行相关数据定位单元用于根据所述教学实训场景匹配度值和所述预定匹配条件，从所述预设实训执行数据中定位得到所述教学实训执行相关数据； 0044 进一步，所述教学实训执行模块包括教学实训互动对象确定子模块和实训互动执行子模块；其中， 0045 所述教学实训互动对象确定子模块用于根据所述语音识别相关数据，确定当前所述教学实训执行相关数据对应的互动对象； 0046 所述实训互动执行子模块用。

29、于根据所述教学实训执行相关数据对应的执行指说明书 3/10 页 8 CN 111276146 A 8 令，与所述互动对象进行适应性的教学实训互动； 0047 进一步，所述教学实训互动对象确定子模块包括互动对象身份确定单元和互动对象位置确定单元；其中， 0048 所述互动对象身份确定单元用于根据所述语音识别相关数据，确定当前所述教学实训执行相关数据对应的互动对象的身份信息； 0049 所述互动对象位置确定单元用于根据所述语音识别相关数据，确定当前所述教学实训执行相关数据对应的互动对象的位置信息； 0050 进一步，所述实训互动执行子模块包括执行指令生成单元和实训动作确。

30、定单元；其中， 0051 所述执行指令生成单元用于根据所述教学实训执行相关数据生成所述执行指令； 0052 所述实训动作确定单元用于根据所述执行指令，确定相应的教学实训动作，以此所述互动对象进行适应性的教学实训互动。 0053 进一步，所述语音-实训匹配模块用于根据所述语音识别相关信息，从预设实训执行数据库中匹配确定相应的教学实训执行相关数据；其中， 0054 还包括根据数据处理获取的所述声音信号预处理关键特征数据及词汇切分集合，与所述预设实训执行数据库匹配，根据比对结果，执行从预设实训执行数据库中匹配确定相应的教学实训执行相关数据的操作；其具体实现步骤。

31、包括： 0055 步骤A1、根据所述声音采集子模块，获取教学实训场景的声音信号数据，并进行随机抽样处理； 0056 步骤A2、根据所述背景噪声剔除模型，对所述步骤A1随机抽样提取的声音信号数据进行滤波处理，以消除噪音干扰，根据公式(1)相位展开处理，获取声音信号预处理关键特征数据； 0057 0058 其中， e为自然常数， t为声音信号总时长，为声音信号的时间坐标， f 为所述声音采集频率， A为所述声音采集极限值， Amax为所述声音采集上极限值， Amin为所述声音采集下极限值， w为所述声音采集灵敏度， v(t)为所述随机抽样提取声音信号数据， f(。

32、 -t)e-wftdt 为在给定总时长t和时间坐标上进行的相位展开， (Amax+Amin)为所确认的声音采集上、下极限值之和，为所述声音采集频率的补偿值， V(A， f,w)为所述获取声音信号预处理关键特征数据； 0059 步骤A3、将所述获取声音信号预处理关键特征数据通过公式(2)进行所述词汇细化切分处理，以获取所述词汇切分集合；说明书 4/10 页 9 CN 111276146 A 9 0060 0061 其中， arctan为反正切函数， m为正整数， i为随机抽样提取的声音信号数据词汇数量， x为随机抽样提取的声音信号数据各词汇的笔画数量， J i为所述词。

33、汇数量为i的词汇组， g x为所述词汇笔画数量为x的词汇组，为获取所述词汇数量数据集，为获取所述词汇笔画数据集， W J为获取所述词汇切分集合； 0062 步骤A4、将所述步骤A2获取的所述声音信号预处理关键特征数据与步骤 A3获取的词汇切分集合，与所述预设实训执行数据库D(o)进行比对，通过公式(3)判断匹配结果，并执行从预设实训执行数据库中匹配确定相应的教学实训执行相关数据的操作； 0063 NN( ,(W(J)*V(A， f,w)/D(o)2) (3) 0064 其中， N表示在所述期望值为m，标准差为W(J)*V(A， f,w)/D(o)条件下的正态分布。

34、结果，若N值大于99.74，则表示所述随机抽样提取声音信号与所述预设实训执行数据库匹配，执行从预设实训执行数据库中匹配确定相应的教学实训执行相关数据的操作。 0065 相比于现有技术，该基于语音识别的教学实训系统通过获取关于教学实训场景的声音信号数据，以此确定关于教学实训相关对象的语音信号数据，并对该语音信号数据进行识别处理，以此获取关于该教学实训相关对象的语音识别相关信息，再根据该语音识别相关信息，从预设实训执行数据库中匹配确定相应的教学实训执行相关数据，最后根据该教学实训执行相关数据，与互动对象进行适应性的教学实训互动，其充分利用语音识别技。

35、术来对教学实训过程进行智能化的升级，以便于实训对象通过语音控制的方式就能够实现相应的教学实训互动，这有利于提升教学实训操作的可执行性和智能性。 0066 本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。 0067 下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。附图说明 0068 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介。

36、绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。 0069 图1为本发明提供的一种基于语音识别的教学实训系统的结构示意图。说明书 5/10 页 10 CN 111276146 A 10 具体实施方式 0070 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于。

37、本发明保护的范围。 0071 参阅图1，为本发明实施例提供的一种基于语音识别的教学实训系统的结构示意图。该基于语音识别的教学实训系统包括语音获取模块、语音识别模块、语音-实训匹配模块和教学实训执行模块；其中， 0072 该语音获取模块用于获取关于教学实训场景的声音信号数据，以此确定关于教学实训相关对象的语音信号数据； 0073 该语音识别模块用于对该语音信号数据进行识别处理，以此获取关于该教学实训相关对象的语音识别相关信息； 0074 该语音-实训匹配模块用于根据该语音识别相关信息，从预设实训执行数据库中匹配确定相应的教学实训执行相关数据； 0075 该教学实。

38、训执行模块用于根据该教学实训执行相关数据，与互动对象进行适应性的教学实训互动。 0076 优选地，该语音获取模块包括声音采集子模块、声音预处理子模块和语音信号提取子模块；其中， 0077 该声音采集子模块用于根据预定声音采集模式，从该教学实训场景中记录采集该声音信号数据； 0078 该声音预处理子模块用于对该声音信号数据进行关于声音属性的预处理，以此获得声音信号预处理数据； 0079 该语音信号生成子模块用于从该声音信号预处理数据中生成得到该语音信号数据。 0080 优选地，该声音采集子模块包括教学实训场景检测单元、声音采集模式确定单元和声音信号数据记录单。

39、元；其中， 0081 该教学实训场景检测单元用于检测当前教学实训场景中相应的人员数量状态和/或人员相对位置分布状态； 0082 该声音采集模式确定单元用于根据该人员数量状态和/或该人员相对位置分布状态，确定该预定声音采集模式对应的声音采集频率、声音采集灵敏度、声音采集上下极限值和声音采集空间角中的至少一者； 0083 该声音信号数据记录单元用于根据该预定声音采集模式中对应的声音采集频率、声音采集灵敏度、声音采集上下极限值和声音采集空间角中的至少一者，从该教学实训场景中记录采集该声音信号数据。 0084 优选地，该声音预处理子模块包括背景噪声剔除单元、声纹辨识。

40、单元和声道标定单元；其中， 0085 该背景噪声剔除单元用于根据预定背景噪声识别与分离模型，从该声音信号数据中识别相应的背景噪声成分，并将该背景噪声成分从该声音信号数据中分离； 0086 该声纹辨识单元用于对分离该背景噪声成分后的该声音信号数据进行声纹辨识说明书 6/10 页 11 CN 111276146 A 11 处理，以此确定该声音信号数据对应的声纹分布状态； 0087 该声道标定单元用于根据该声纹分布状态，标定该声音信号数据中对应存在的所有声纹通道。 0088 优选地，该语音信号生成子模块包括声道分离单元和声道语音信号提取单元；其中， 0089 该声。

41、道分离单元用于根据该声音信号预处理数据中标定的该声音信号数据中对应存在的所有声纹通道，对该声音信号预处理数据进行对应声纹通道的分离处理； 0090 该声道语音信号提取单元用于从分离处理后的每一个声纹通道中提取得到相应的语音信号数据。 0091 优选地，该语音识别模块包括语音识别模型构建子模块、语音识别模型运行子模块和语音识别结果转换子模块；其中， 0092 该语音识别模型构建子模块用于根据预设教学实训历史大数据和数据训练模式，构建相应的教学实训场景语音识别模型； 0093 该语音识别模型运行子模块用于通过该教学实训场景语音识别模型，对该语音信号数据进行识别处理。

42、，以此获得相应的语音语义初步识别数据； 0094 该语音识别结果转换子模块用于根据语义语法解析算法，对该语音语义初步识别数据进行语法解析处理，以此获得该语音识别相关信息。 0095 优选地，该语音识别结果转换子模块包括语义语法解析算法构建单元和语法解析处理单元；其中， 0096 该语义语法解析算法构建单元用于根据教学实训场景中对应的教学相关词汇大数据和/或教学相关词汇大数据，构建相应的该语义语法解析算法； 0097 该语法解析处理单元用于根据该语义语法解析算法，对该语音语义初步识别数据进行关于词汇、字段和语句中至少一者的该语法解析处理，以此获得该语音识别相关。

43、信息。 0098 优选地，该语音-实训匹配模块包括语义定标子模块和实训执行动作数据确定子模块；其中， 0099 该语义定标子模块用于对该语音识别相关信息进行关于词汇、字段和语句中至少一者的定标处理，此次获取对应的语义定标结果； 0100 该实训执行动作数据确定子模块用于根据该语义定标结果，从该预设实训执行数据中确定满足预定匹配条件的该教学实训执行相关数据。 0101 优选地，该语义定标子模块包括句段切分单元和定标处理单元；其中， 0102 该句段切分单元用于对该语音识别相关信息进行关于词汇、字段或者语句的细化切分处理，以此获得的对应的词汇切分集合、字段切分。

44、集合或者语句切分集合； 0103 该定标处理单元用于根据该词汇切分集合、该字段切分集合或者该语句切分集合，对该语音识别相关信息进行该定标处理，以此获取对应的该语音定标结果。 0104 优选地，该实训执行动作数据确定子模块包括匹配度计算单元和教学实训执行相关数据定位单元；其中， 0105 该匹配度计算单元用于根据该语义定标结果，计算该语音识别相关信息中每一项相关数据对应的教学实训场景匹配度值；说明书 7/10 页 12 CN 111276146 A 12 0106 该教学实训执行相关数据定位单元用于根据该教学实训场景匹配度值和该预定匹配条件，从该预设实训执行数。

45、据中定位得到该教学实训执行相关数据。 0107 优选地，该教学实训执行模块包括教学实训互动对象确定子模块和实训互动执行子模块；其中， 0108 该教学实训互动对象确定子模块用于根据该语音识别相关数据，确定当前该教学实训执行相关数据对应的互动对象； 0109 该实训互动执行子模块用于根据该教学实训执行相关数据对应的执行指令，与该互动对象进行适应性的教学实训互动。 0110 优选地，该教学实训互动对象确定子模块包括互动对象身份确定单元和互动对象位置确定单元；其中， 0111 该互动对象身份确定单元用于根据该语音识别相关数据，确定当前该教学实训执行相关数据对应的互动。

46、对象的身份信息； 0112 该互动对象位置确定单元用于根据该语音识别相关数据，确定当前该教学实训执行相关数据对应的互动对象的位置信息。 0113 优选地，该实训互动执行子模块包括执行指令生成单元和实训动作确定单元；其中， 0114 该执行指令生成单元用于根据该教学实训执行相关数据生成该执行指令； 0115 该实训动作确定单元用于根据该执行指令，确定相应的教学实训动作，以此该互动对象进行适应性的教学实训互动。 0116 优选地，所述语音-实训匹配模块用于根据所述语音识别相关信息，从预设实训执行数据库中匹配确定相应的教学实训执行相关数据；其中， 0117 还包括根据。

47、数据处理获取的所述声音信号预处理关键特征数据及词汇切分集合，与所述预设实训执行数据库匹配，根据比对结果，执行从预设实训执行数据库中匹配确定相应的教学实训执行相关数据的操作；其具体实现步骤包括： 0118 步骤A1、根据所述声音采集子模块，获取教学实训场景的声音信号数据，并进行随机抽样处理； 0119 步骤A2、根据所述背景噪声剔除模型，对所述步骤A1随机抽样提取的声音信号数据进行滤波处理，以消除噪音干扰，根据公式(1)相位展开处理，获取声音信号预处理关键特征数据； 0120 0121 其中， e为自然常数， t为声音信号总时长，为声音信号的时间坐标，。

48、 f 为所述声音采集频率， A为所述声音采集极限值， Amax为所述声音采集上极限值， Amin为所述声音采集下极限值， w为所述声音采集灵敏度， v(t)为所述随机抽样提取声音信号数据， f( -t)e-wftdt 为在给定总时长t和时间坐标上进行的相位展开， (Amax+Amin)为所确认的声音采集上、下极限值之和，为所述声音采集频率的补偿值， V(A， f,w)为所述获取声音信号预处理说明书 8/10 页 13 CN 111276146 A 13 关键特征数据； 0122 步骤A3、将所述获取声音信号预处理关键特征数据通过公式(2)进行所述词汇细化切分处理，以。

49、获取所述词汇切分集合； 0123 0124 其中， arctan为反正切函数， m为正整数， i为随机抽样提取的声音信号数据词汇数量， x为随机抽样提取的声音信号数据各词汇的笔画数量， J i为所述词汇数量为i的词汇组， g x为所述词汇笔画数量为x的词汇组，为获取所述词汇数量数据集，为获取所述词汇笔画数据集， W J为获取所述词汇切分集合； 0125 步骤A4、将所述步骤A2获取的所述声音信号预处理关键特征数据与步骤 A3获取的词汇切分集合，与所述预设实训执行数据库D(o)进行比对，通过公式(3)判断匹配结果，并执行从预设实训执行数据库中匹配确定相应的教学实训执行。

50、相关数据的操作； 0126 NN( ,(W(J)*V(A， f,w)/D(o)2) (3) 0127 其中， N表示在所述期望值为m，标准差为W(J)*V(A， f,w)/D(o)条件下的正态分布结果，若N值大于99.74，则表示所述随机抽样提取声音信号与所述预设实训执行数据库匹配，执行从预设实训执行数据库中匹配确定相应的教学实训执行相关数据的操作。 0128 上述技术方案的有益效果是：所述一种基于语音识别的教学实训系统，根据目标对象实训期间反馈的声音信号数据，实时进行声音特征参数处理，并通过对声音信号数据的具体词汇进行提炼分析，与所述预设实训执行数据库比对。

展开阅读全文

内容关键字: 基于语音识别教学系统