基于语音识别的教学实训系统.pdf

上传人:南*** 文档编号:9287387 上传时间:2021-05-12 格式:PDF 页数:16 大小:481.88KB
收藏 版权申诉 举报 下载
基于语音识别的教学实训系统.pdf_第1页
第1页 / 共16页
基于语音识别的教学实训系统.pdf_第2页
第2页 / 共16页
基于语音识别的教学实训系统.pdf_第3页
第3页 / 共16页
文档描述:

《基于语音识别的教学实训系统.pdf》由会员分享,可在线阅读,更多相关《基于语音识别的教学实训系统.pdf(16页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010229303.6 (22)申请日 2020.03.27 (71)申请人 上海乂学教育科技有限公司 地址 200237 上海市徐汇区宜州路188号2 幢9层、 10层 (72)发明人 王鑫 (51)Int.Cl. G10L 15/22(2006.01) G10L 15/26(2006.01) G10L 17/22(2013.01) G09B 9/00(2006.01) (54)发明名称 基于语音识别的教学实训系统 (57)摘要 本发明提供了一种基于语音识别的教学实 训系。

2、统, 该基于语音识别的教学实训系统通过获 取关于教学实训场景的声音信号数据, 以此确定 关于教学实训相关对象的语音信号数据, 并对该 语音信号数据进行识别处理, 以此获取关于该教 学实训相关对象的语音识别相关信息, 再根据该 语音识别相关信息, 从预设实训执行数据库中匹 配确定相应的教学实训执行相关数据, 最后根据 该教学实训执行相关数据, 与互动对象进行适应 性的教学实训互动, 其充分利用语音识别技术来 对教学实训过程进行智能化的升级, 以便于实训 对象通过语音控制的方式就能够实现相应的教 学实训互动, 这有利于提升教学实训操作的可执 行性和智能性。 权利要求书4页 说明书10页 附图1页 。

3、CN 111276146 A 2020.06.12 CN 111276146 A 1.基于语音识别的教学实训系统, 其特征在于: 所述基于语音识别的教学实训系统包括语音获取模块、 语音识别模块、 语音-实训匹配 模块和教学实训执行模块; 其中, 所述语音获取模块用于获取关于教学实训场景的声音信号数据, 以此确定关于教学实 训相关对象的语音信号数据; 所述语音识别模块用于对所述语音信号数据进行识别处理, 以此获取关于所述教学实 训相关对象的语音识别相关信息; 所述语音-实训匹配模块用于根据所述语音识别相关信息, 从预设实训执行数据库中 匹配确定相应的教学实训执行相关数据; 所述教学实训执行模块用。

4、于根据所述教学实训执行相关数据, 与互动对象进行适应性 的教学实训互动。 2.如权利要求1所述的基于语音识别的教学实训系统, 其特征在于: 所述语音获取模块包括声音采集子模块、 声音预处理子模块和语音信号提取子模块; 其中, 所述声音采集子模块用于根据预定声音采集模式, 从所述教学实训场景中记录采集所 述声音信号数据; 所述声音预处理子模块用于对所述声音信号数据进行关于声音属性的预处理, 以此获 得声音信号预处理数据; 所述语音信号生成子模块用于从所述声音信号预处理数据中生成得到所述语音信号 数据。 3.如权利要求2所述的基于语音识别的教学实训系统, 其特征在于: 所述声音采集子模块包括教学实。

5、训场景检测单元、 声音采集模式确定单元和声音信号 数据记录单元; 其中, 所述教学实训场景检测单元用于检测当前教学实训场景中相应的人员数量状态和/或 人员相对位置分布状态; 所述声音采集模式确定单元用于根据所述人员数量状态和/或所述人员相对位置分布 状态, 确定所述预定声音采集模式对应的声音采集频率、 声音采集灵敏度、 声音采集上下极 限值和声音采集空间角中的至少一者; 所述声音信号数据记录单元用于根据所述预定声音 采集模式中对应的声音采集频率、 声音采集灵敏度、 声音采集上下极限值和声音采集空间 角中的至少一者, 从所述教学实训场景中记录采集所述声音信号数据; 或者, 所述声音预处理子模块包。

6、括背景噪声剔除单元、 声纹辨识单元和声道标定单元; 其中, 所述背景噪声剔除单元用于根据预定背景噪声识别与分离模型, 从所述声音信号数据 中识别相应的背景噪声成分, 并将所述背景噪声成分从所述声音信号数据中分离; 所述声纹辨识单元用于对分离所述背景噪声成分后的所述声音信号数据进行声纹辨 识处理, 以此确定所述声音信号数据对应的声纹分布状态; 所述声道标定单元用于根据所 述声纹分布状态, 标定所述声音信号数据中对应存在的所有声纹通道; 或者, 所述语音信号生成子模块包括声道分离单元和声道语音信号提取单元; 其中, 所述声道分离单元用于根据所述声音信号预处理数据中标定的所述声音信号数据中 权利要求。

7、书 1/4 页 2 CN 111276146 A 2 对应存在的所有声纹通道, 对所述声音信号预处理数据进行对应声纹通道的分离处理; 所述声道语音信号提取单元用于从分离处理后的每一个声纹通道中提取得到相应的 语音信号数据。 4.如权利要求1所述的基于语音识别的教学实训系统, 其特征在于: 所述语音识别模块包括语音识别模型构建子模块、 语音识别模型运行子模块和语音识 别结果转换子模块; 其中, 所述语音识别模型构建子模块用于根据预设教学实训历史大数据和数据训练模式, 构 建相应的教学实训场景语音识别模型; 所述语音识别模型运行子模块用于通过所述教学实训场景语音识别模型, 对所述语音 信号数据进行。

8、识别处理, 以此获得相应的语音语义初步识别数据; 所述语音识别结果转换子模块用于根据语义语法解析算法, 对所述语音语义初步识别 数据进行语法解析处理, 以此获得所述语音识别相关信息。 5.如权利要求4所述的基于语音识别的教学实训系统, 其特征在于: 所述语音识别结果转换子模块包括语义语法解析算法构建单元和语法解析处理单元; 其中, 所述语义语法解析算法构建单元用于根据教学实训场景中对应的教学相关词汇大数 据和/或教学相关词汇大数据, 构建相应的所述语义语法解析算法; 所述语法解析处理单元用于根据所述语义语法解析算法, 对所述语音语义初步识别数 据进行关于词汇、 字段和语句中至少一者的所述语法解。

9、析处理, 以此获得所述语音识别相 关信息。 6.如权利要求1所述的基于语音识别的教学实训系统, 其特征在于: 所述语音-实训匹配模块包括语义定标子模块和实训执行动作数据确定子模块; 其中, 所述语义定标子模块用于对所述语音识别相关信息进行关于词汇、 字段和语句中至少 一者的定标处理, 此次获取对应的语义定标结果; 所述实训执行动作数据确定子模块用于根据所述语义定标结果, 从所述预设实训执行 数据中确定满足预定匹配条件的所述教学实训执行相关数据。 7.如权利要求6所述的基于语音识别的教学实训系统, 其特征在于: 所述语义定标子模块包括句段切分单元和定标处理单元; 其中, 所述句段切分单元用于对所。

10、述语音识别相关信息进行关于词汇、 字段或者语句的细化 切分处理, 以此获得的对应的词汇切分集合、 字段切分集合或者语句切分集合; 所述定标处理单元用于根据所述词汇切分集合、 所述字段切分集合或者所述语句切分 集合, 对所述语音识别相关信息进行所述定标处理, 以此获取对应的所述语音定标结果; 或者, 所述实训执行动作数据确定子模块包括匹配度计算单元和教学实训执行相关数据定 位单元; 其中, 所述匹配度计算单元用于根据所述语义定标结果, 计算所述语音识别相关信息中每一 项相关数据对应的教学实训场景匹配度值; 所述教学实训执行相关数据定位单元用于根据所述教学实训场景匹配度值和所述预 定匹配条件, 从。

11、所述预设实训执行数据中定位得到所述教学实训执行相关数据。 权利要求书 2/4 页 3 CN 111276146 A 3 8.如权利要求1所述的基于语音识别的教学实训系统, 其特征在于: 所述教学实训执行模块包括教学实训互动对象确定子模块和实训互动执行子模块; 其 中, 所述教学实训互动对象确定子模块用于根据所述语音识别相关数据, 确定当前所述教 学实训执行相关数据对应的互动对象; 所述实训互动执行子模块用于根据所述教学实训执行相关数据对应的执行指令, 与所 述互动对象进行适应性的教学实训互动。 9.如权利要求8所述的基于语音识别的教学实训系统, 其特征在于: 所述教学实训互动对象确定子模块包括。

12、互动对象身份确定单元和互动对象位置确定 单元; 其中, 所述互动对象身份确定单元用于根据所述语音识别相关数据, 确定当前所述教学实训 执行相关数据对应的互动对象的身份信息; 所述互动对象位置确定单元用于根据所述语音识别相关数据, 确定当前所述教学实训 执行相关数据对应的互动对象的位置信息。 10.如权利要求8所述的基于语音识别的教学实训系统, 其特征在于: 所述实训互动执行子模块包括执行指令生成单元和实训动作确定单元; 其中, 所述执行指令生成单元用于根据所述教学实训执行相关数据生成所述执行指令; 所述实训动作确定单元用于根据所述执行指令, 确定相应的教学实训动作, 以此所述 互动对象进行适应。

13、性的教学实训互动。 11.如权利要求1所述的一种基于语音识别的教学实训系统, 其特征在于: 所述语音-实训匹配模块用于根据所述语音识别相关信息, 从预设实训执行数据库中 匹配确定相应的教学实训执行相关数据; 还包括根据数据处理获取的所述声音信号预处理关键特征数据及词汇切分集合, 与所 述预设实训执行数据库匹配, 根据比对结果, 执行从预设实训执行数据库中匹配确定相应 的教学实训执行相关数据的操作; 其具体实现步骤包括: 步骤A1、 根据所述声音采集子模块, 获取教学实训场景的声音信号数据, 并进行随机抽 样处理; 步骤A2、 根据所述背景噪声剔除模型, 对所述步骤A1随机抽样提取的声音信号数据。

14、进 行滤波处理, 以消除噪音干扰, 根据公式(1)相位展开处理, 获取声音信号预处理关键特征 数据; 其中, e为自然常数, t为声音信号总时长, 为声音信号的时间坐标, f为所述声音采集 频率, A为所述声音采集极限值, Amax为所述声音采集上极限值, Amin为所述声音采集下极限 值, w为所述声音采集灵敏度, v(t)为所述随机抽样提取声音信号数据, f( -t)e-wftdt为在 权利要求书 3/4 页 4 CN 111276146 A 4 给定总时长t和时间坐标 上进行的相位展开, (Amax+Amin)为所确认的声音采集上、 下极限值 之和,为所述声音采集频率的补偿值, V(A,。

15、 f,w)为所述获取声音信号预处理关键特 征数据; 步骤A3、 将所述获取声音信号预处理关键特征数据通过公式(2)进行所述词汇细化切 分处理, 以获取所述词汇切分集合; 其中, arctan为反正切函数, m为正整数, i为随机抽样提取的声音信号数据词汇数量, x 为随机抽样提取的声音信号数据各词汇的笔画数量, Ji为所述词汇数量为i的词汇组, g x 为所述词汇笔画数量为x的词汇组,为获取所述词汇数量数据集, 为获取所述词汇笔画数据集, W J为获取所述词汇切分 集合; 步骤A4、 将所述步骤A2获取的所述声音信号预处理关键特征数据与步骤A3获取的词汇 切分集合, 与所述预设实训执行数据库D。

16、 o进行比对, 通过公式(3)判断匹配结果, 并执行从 预设实训执行数据库中匹配确定相应的教学实训执行相关数据的操作; NN( ,(W(J)*V(A, f,w)/D(o)2) (3) 其中, N表示在所述期望值为 , 标准差为W(J)*V(A, f,w)/D(o)条件下的正态分布结果, 若N值大于99.74, 则表示所述随机抽样提取声音信号与所述预设实训执行数据库匹配, 执行从预设实训执行数据库中匹配确定相应的教学实训执行相关数据的操作。 权利要求书 4/4 页 5 CN 111276146 A 5 基于语音识别的教学实训系统 技术领域 0001 本发明涉及智能教学实训的技术领域, 特别涉及一。

17、种基于语音识别的教学 实训 系统。 背景技术 0002 教学实训环节是教学过程中必要的实践环节, 通过该教学实训环节能够培 养学 生的实践能力, 以便于将课堂教学中学习到的知识应用到现实中, 从而帮 助学生更好地和 更快地理解和吸收知识。 目前, 教学实践环节通常是以教学实 验的形式来实现的, 但是教 学实验通常都需要在特定的场所并借助相应的实验 设备才能够进行, 这对于教学实践环 节提出了较严格的要求, 并且也不利于进 行难度较高的教学实训操作。 为了解决这一问 题, 现有技术提出了模拟教学实 训的模式, 模拟教学实训通过在相应的模拟空间中提供虚 拟的教学实训操作, 以便于学生对教学知识的梳。

18、理和消化, 但是这种模式并没有充分利用 语音识别 技术来提升教学实训操作的可执行性和智能性, 这严重地阻碍了教学实训操作 的升级和推广。 发明内容 0003 针对现有技术存在的缺陷, 本发明提供一种基于语音识别的教学实训系统, 该基 于语音识别的教学实训系统包括语音获取模块、 语音识别模块、 语音-实 训匹配模块和教 学实训执行模块; 其中, 该语音获取模块用于获取关于教学实 训场景的声音信号数据, 以 此确定关于教学实训相关对象的语音信号数据; 该 语音识别模块用于对该语音信号数据 进行识别处理, 以此获取关于该教学实训 相关对象的语音识别相关信息; 该语音-实训匹 配模块用于根据该语音识别。

19、相 关信息, 从预设实训执行数据库中匹配确定相应的教学实 训执行相关数据; 该 教学实训执行模块用于根据该教学实训执行相关数据, 与互动对象进 行适应性 的教学实训互动; 可见, 该基于语音识别的教学实训系统通过获取关于教学实 训场景的声音信号数据, 以此确定关于教学实训相关对象的语音信号数据, 并 对该语音信 号数据进行识别处理, 以此获取关于该教学实训相关对象的语音识 别相关信息, 再根据该 语音识别相关信息, 从预设实训执行数据库中匹配确定 相应的教学实训执行相关数据, 最 后根据该教学实训执行相关数据, 与互动对 象进行适应性的教学实训互动, 其充分利用语 音识别技术来对教学实训过程进。

20、 行智能化的升级, 以便于实训对象通过语音控制的方式 就能够实现相应的教学 实训互动, 这有利于提升教学实训操作的可执行性和智能性。 0004 本发明提供一种基于语音识别的教学实训系统, 其特征在于: 0005 所述基于语音识别的教学实训系统包括语音获取模块、 语音识别模块、 语 音-实 训匹配模块和教学实训执行模块; 其中, 0006 所述语音获取模块用于获取关于教学实训场景的声音信号数据, 以此确定 关于 教学实训相关对象的语音信号数据; 0007 所述语音识别模块用于对所述语音信号数据进行识别处理, 以此获取关于 所述 说明书 1/10 页 6 CN 111276146 A 6 教学实训。

21、相关对象的语音识别相关信息; 0008 所述语音-实训匹配模块用于根据所述语音识别相关信息, 从预设实训执 行数据 库中匹配确定相应的教学实训执行相关数据; 0009 所述教学实训执行模块用于根据所述教学实训执行相关数据, 与互动对象 进行 适应性的教学实训互动; 0010 进一步, 所述语音获取模块包括声音采集子模块、 声音预处理子模块和语 音信号 提取子模块; 其中, 0011 所述声音采集子模块用于根据预定声音采集模式, 从所述教学实训场景中 记录 采集所述声音信号数据; 0012 所述声音预处理子模块用于对所述声音信号数据进行关于声音属性的预 处理, 以此获得声音信号预处理数据; 00。

22、13 所述语音信号生成子模块用于从所述声音信号预处理数据中生成得到所 述语音 信号数据; 0014 进一步, 所述声音采集子模块包括教学实训场景检测单元、 声音采集模式 确定单 元和声音信号数据记录单元; 其中, 0015 所述教学实训场景检测单元用于检测当前教学实训场景中相应的人员数 量状态 和/或人员相对位置分布状态; 0016 所述声音采集模式确定单元用于根据所述人员数量状态和/或所述人员相 对位 置分布状态, 确定所述预定声音采集模式对应的声音采集频率、 声音采集 灵敏度、 声音采 集上下极限值和声音采集空间角中的至少一者; 0017 所述声音信号数据记录单元用于根据所述预定声音采集模。

23、式中对应的声 音采集 频率、 声音采集灵敏度、 声音采集上下极限值和声音采集空间角中的至 少一者, 从所述教 学实训场景中记录采集所述声音信号数据; 0018 或者, 0019 所述声音预处理子模块包括背景噪声剔除单元、 声纹辨识单元和声道标定 单元; 其中, 0020 所述背景噪声剔除单元用于根据预定背景噪声识别与分离模型, 从所述声 音信 号数据中识别相应的背景噪声成分, 并将所述背景噪声成分从所述声音信 号数据中分离; 0021 所述声纹辨识单元用于对分离所述背景噪声成分后的所述声音信号数据 进行声 纹辨识处理, 以此确定所述声音信号数据对应的声纹分布状态; 0022 所述声道标定单元用。

24、于根据所述声纹分布状态, 标定所述声音信号数据中 对应 存在的所有声纹通道; 0023 或者, 0024 所述语音信号生成子模块包括声道分离单元和声道语音信号提取单元; 其 中, 0025 所述声道分离单元用于根据所述声音信号预处理数据中标定的所述声音 信号数 据中对应存在的所有声纹通道, 对所述声音信号预处理数据进行对应声 纹通道的分离处 理; 0026 所述声道语音信号提取单元用于从分离处理后的每一个声纹通道中提取 得到相 应的语音信号数据; 说明书 2/10 页 7 CN 111276146 A 7 0027 进一步, 所述语音识别模块包括语音识别模型构建子模块、 语音识别模型 运行子 。

25、模块和语音识别结果转换子模块; 其中, 0028 所述语音识别模型构建子模块用于根据预设教学实训历史大数据和数据 训练模 式, 构建相应的教学实训场景语音识别模型; 0029 所述语音识别模型运行子模块用于通过所述教学实训场景语音识别模型, 对所 述语音信号数据进行识别处理, 以此获得相应的语音语义初步识别数据; 0030 所述语音识别结果转换子模块用于根据语义语法解析算法, 对所述语音语 义初 步识别数据进行语法解析处理, 以此获得所述语音识别相关信息; 0031 进一步, 所述语音识别结果转换子模块包括语义语法解析算法构建单元和 语法 解析处理单元; 其中, 0032 所述语义语法解析算法。

26、构建单元用于根据教学实训场景中对应的教学相 关词汇 大数据和/或教学相关词汇大数据, 构建相应的所述语义语法解析算法; 0033 所述语法解析处理单元用于根据所述语义语法解析算法, 对所述语音语义 初步 识别数据进行关于词汇、 字段和语句中至少一者的所述语法解析处理, 以 此获得所述语音 识别相关信息; 0034 进一步, 所述语音-实训匹配模块包括语义定标子模块和实训执行动作数 据确定 子模块; 其中, 0035 所述语义定标子模块用于对所述语音识别相关信息进行关于词汇、 字段和 语句 中至少一者的定标处理, 此次获取对应的语义定标结果; 0036 所述实训执行动作数据确定子模块用于根据所述。

27、语义定标结果, 从所述预 设实 训执行数据中确定满足预定匹配条件的所述教学实训执行相关数据; 0037 进一步, 所述语义定标子模块包括句段切分单元和定标处理单元; 其中, 0038 所述句段切分单元用于对所述语音识别相关信息进行关于词汇、 字段或者 语句 的细化切分处理, 以此获得的对应的词汇切分集合、 字段切分集合或者语 句切分集合; 0039 所述定标处理单元用于根据所述词汇切分集合、 所述字段切分集合或者所 述语 句切分集合, 对所述语音识别相关信息进行所述定标处理, 以此获取对应 的所述语音定标 结果; 0040 或者, 0041 所述实训执行动作数据确定子模块包括匹配度计算单元和教。

28、学实训执行 相关数 据定位单元; 其中, 0042 所述匹配度计算单元用于根据所述语义定标结果, 计算所述语音识别相关 信息 中每一项相关数据对应的教学实训场景匹配度值; 0043 所述教学实训执行相关数据定位单元用于根据所述教学实训场景匹配度 值和所 述预定匹配条件, 从所述预设实训执行数据中定位得到所述教学实训执 行相关数据; 0044 进一步, 所述教学实训执行模块包括教学实训互动对象确定子模块和实训 互动 执行子模块; 其中, 0045 所述教学实训互动对象确定子模块用于根据所述语音识别相关数据, 确定 当前 所述教学实训执行相关数据对应的互动对象; 0046 所述实训互动执行子模块用。

29、于根据所述教学实训执行相关数据对应的执 行指 说明书 3/10 页 8 CN 111276146 A 8 令, 与所述互动对象进行适应性的教学实训互动; 0047 进一步, 所述教学实训互动对象确定子模块包括互动对象身份确定单元和 互动 对象位置确定单元; 其中, 0048 所述互动对象身份确定单元用于根据所述语音识别相关数据, 确定当前所 述教 学实训执行相关数据对应的互动对象的身份信息; 0049 所述互动对象位置确定单元用于根据所述语音识别相关数据, 确定当前所 述教 学实训执行相关数据对应的互动对象的位置信息; 0050 进一步, 所述实训互动执行子模块包括执行指令生成单元和实训动作确。

30、定 单元; 其中, 0051 所述执行指令生成单元用于根据所述教学实训执行相关数据生成所述执 行指 令; 0052 所述实训动作确定单元用于根据所述执行指令, 确定相应的教学实训动作, 以此 所述互动对象进行适应性的教学实训互动。 0053 进一步, 所述语音-实训匹配模块用于根据所述语音识别相关信息, 从预 设实训 执行数据库中匹配确定相应的教学实训执行相关数据; 其中, 0054 还包括根据数据处理获取的所述声音信号预处理关键特征数据及词汇切 分集 合, 与所述预设实训执行数据库匹配, 根据比对结果, 执行从预设实训执 行数据库中匹配 确定相应的教学实训执行相关数据的操作; 其具体实现步骤。

31、包 括: 0055 步骤A1、 根据所述声音采集子模块, 获取教学实训场景的声音信号数据, 并进行 随机抽样处理; 0056 步骤A2、 根据所述背景噪声剔除模型, 对所述步骤A1随机抽样提取的声 音信号数 据进行滤波处理, 以消除噪音干扰, 根据公式(1)相位展开处理, 获取声音信号预处理关键 特征数据; 0057 0058 其中, e为自然常数, t为声音信号总时长, 为声音信号的时间坐标, f 为所述声音 采集频率, A为所述声音采集极限值, Amax为所述声音采集上极限 值, Amin为所述声音采集下 极限值, w为所述声音采集灵敏度, v(t)为所述随机 抽样提取声音信号数据, f(。

32、 -t)e-wftdt 为在给定总时长t和时间坐标 上进行的相 位展开, (Amax+Amin)为所确认的声音采集上、 下 极限值之和,为所述声音 采集频率的补偿值, V(A, f,w)为所述获取声音信号预处理 关键特征数据; 0059 步骤A3、 将所述获取声音信号预处理关键特征数据通过公式(2)进行所 述词汇细 化切分处理, 以获取所述词汇切分集合; 说明书 4/10 页 9 CN 111276146 A 9 0060 0061 其中, arctan为反正切函数, m为正整数, i为随机抽样提取的声音信号 数据词汇 数量, x为随机抽样提取的声音信号数据各词汇的笔画数量, J i为 所述词。

33、汇数量为i的词 汇组, g x为所述词汇笔画数量为x的词汇组, 为获取所述词汇数 量数据集, 为获取所述词汇笔画数据集, W J为获取所 述 词汇切分集合; 0062 步骤A4、 将所述步骤A2获取的所述声音信号预处理关键特征数据与步骤 A3获取 的词汇切分集合, 与所述预设实训执行数据库D(o)进行比对, 通过公 式(3)判断匹配结果, 并执行从预设实训执行数据库中匹配确定相应的教学 实训执行相关数据的操作; 0063 NN( ,(W(J)*V(A, f,w)/D(o)2) (3) 0064 其中, N表示在所述期望值为m, 标准差为W(J)*V(A, f,w)/D(o)条件下的 正态分布 。

34、结果, 若N值大于99.74, 则表示所述随机抽样提取声音信号与所 述预设实训执行数据库 匹配, 执行从预设实训执行数据库中匹配确定相应的教 学实训执行相关数据的操作。 0065 相比于现有技术, 该基于语音识别的教学实训系统通过获取关于教学实训 场景 的声音信号数据, 以此确定关于教学实训相关对象的语音信号数据, 并对 该语音信号数据 进行识别处理, 以此获取关于该教学实训相关对象的语音识别 相关信息, 再根据该语音识 别相关信息, 从预设实训执行数据库中匹配确定相 应的教学实训执行相关数据, 最后根据 该教学实训执行相关数据, 与互动对象 进行适应性的教学实训互动, 其充分利用语音识别 技。

35、术来对教学实训过程进行 智能化的升级, 以便于实训对象通过语音控制的方式就能够 实现相应的教学实 训互动, 这有利于提升教学实训操作的可执行性和智能性。 0066 本发明的其它特征和优点将在随后的说明书中阐述, 并且, 部分地从说明 书中变 得显而易见, 或者通过实施本发明而了解。 本发明的目的和其他优点可 通过在所写的说明 书、 权利要求书、 以及附图中所特别指出的结构来实现和获 得。 0067 下面通过附图和实施例, 对本发明的技术方案做进一步的详细描述。 附图说明 0068 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施 例或 现有技术描述中所需要使用的附图作简单地介。

36、绍, 显而易见地, 下面描述 中的附图仅仅是 本发明的一些实施例, 对于本领域普通技术人员来讲, 在不付 出创造性劳动的前提下, 还 可以根据这些附图获得其他的附图。 0069 图1为本发明提供的一种基于语音识别的教学实训系统的结构示意图。 说明书 5/10 页 10 CN 111276146 A 10 具体实施方式 0070 下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行清 楚、 完 整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是 全部的实施例。 基于 本发明中的实施例, 本领域普通技术人员在没有作出创造 性劳动前提下所获得的所有其 他实施例, 都属于。

37、本发明保护的范围。 0071 参阅图1, 为本发明实施例提供的一种基于语音识别的教学实训系统的结 构示意 图。 该基于语音识别的教学实训系统包括语音获取模块、 语音识别模块、 语音-实训匹配模 块和教学实训执行模块; 其中, 0072 该语音获取模块用于获取关于教学实训场景的声音信号数据, 以此确定关 于教 学实训相关对象的语音信号数据; 0073 该语音识别模块用于对该语音信号数据进行识别处理, 以此获取关于该教 学实 训相关对象的语音识别相关信息; 0074 该语音-实训匹配模块用于根据该语音识别相关信息, 从预设实训执行数 据库中 匹配确定相应的教学实训执行相关数据; 0075 该教学实。

38、训执行模块用于根据该教学实训执行相关数据, 与互动对象进行 适应 性的教学实训互动。 0076 优选地, 该语音获取模块包括声音采集子模块、 声音预处理子模块和语音 信号提 取子模块; 其中, 0077 该声音采集子模块用于根据预定声音采集模式, 从该教学实训场景中记录 采集 该声音信号数据; 0078 该声音预处理子模块用于对该声音信号数据进行关于声音属性的预处理, 以此 获得声音信号预处理数据; 0079 该语音信号生成子模块用于从该声音信号预处理数据中生成得到该语音 信号数 据。 0080 优选地, 该声音采集子模块包括教学实训场景检测单元、 声音采集模式确 定单元 和声音信号数据记录单。

39、元; 其中, 0081 该教学实训场景检测单元用于检测当前教学实训场景中相应的人员数量 状态 和/或人员相对位置分布状态; 0082 该声音采集模式确定单元用于根据该人员数量状态和/或该人员相对位置 分布 状态, 确定该预定声音采集模式对应的声音采集频率、 声音采集灵敏度、 声音采集上下极 限值和声音采集空间角中的至少一者; 0083 该声音信号数据记录单元用于根据该预定声音采集模式中对应的声音采 集频 率、 声音采集灵敏度、 声音采集上下极限值和声音采集空间角中的至少一 者, 从该教学实 训场景中记录采集该声音信号数据。 0084 优选地, 该声音预处理子模块包括背景噪声剔除单元、 声纹辨识。

40、单元和声 道标定 单元; 其中, 0085 该背景噪声剔除单元用于根据预定背景噪声识别与分离模型, 从该声音信 号数 据中识别相应的背景噪声成分, 并将该背景噪声成分从该声音信号数据中 分离; 0086 该声纹辨识单元用于对分离该背景噪声成分后的该声音信号数据进行声 纹辨识 说明书 6/10 页 11 CN 111276146 A 11 处理, 以此确定该声音信号数据对应的声纹分布状态; 0087 该声道标定单元用于根据该声纹分布状态, 标定该声音信号数据中对应存 在的 所有声纹通道。 0088 优选地, 该语音信号生成子模块包括声道分离单元和声道语音信号提取单 元; 其 中, 0089 该声。

41、道分离单元用于根据该声音信号预处理数据中标定的该声音信号数 据中对 应存在的所有声纹通道, 对该声音信号预处理数据进行对应声纹通道的 分离处理; 0090 该声道语音信号提取单元用于从分离处理后的每一个声纹通道中提取得 到相应 的语音信号数据。 0091 优选地, 该语音识别模块包括语音识别模型构建子模块、 语音识别模型运 行子模 块和语音识别结果转换子模块; 其中, 0092 该语音识别模型构建子模块用于根据预设教学实训历史大数据和数据训 练模 式, 构建相应的教学实训场景语音识别模型; 0093 该语音识别模型运行子模块用于通过该教学实训场景语音识别模型, 对该 语音 信号数据进行识别处理。

42、, 以此获得相应的语音语义初步识别数据; 0094 该语音识别结果转换子模块用于根据语义语法解析算法, 对该语音语义初 步识 别数据进行语法解析处理, 以此获得该语音识别相关信息。 0095 优选地, 该语音识别结果转换子模块包括语义语法解析算法构建单元和语 法解 析处理单元; 其中, 0096 该语义语法解析算法构建单元用于根据教学实训场景中对应的教学相关 词汇大 数据和/或教学相关词汇大数据, 构建相应的该语义语法解析算法; 0097 该语法解析处理单元用于根据该语义语法解析算法, 对该语音语义初步识 别数 据进行关于词汇、 字段和语句中至少一者的该语法解析处理, 以此获得该 语音识别相关。

43、信 息。 0098 优选地, 该语音-实训匹配模块包括语义定标子模块和实训执行动作数据 确定子 模块; 其中, 0099 该语义定标子模块用于对该语音识别相关信息进行关于词汇、 字段和语句 中至 少一者的定标处理, 此次获取对应的语义定标结果; 0100 该实训执行动作数据确定子模块用于根据该语义定标结果, 从该预设实训 执行 数据中确定满足预定匹配条件的该教学实训执行相关数据。 0101 优选地, 该语义定标子模块包括句段切分单元和定标处理单元; 其中, 0102 该句段切分单元用于对该语音识别相关信息进行关于词汇、 字段或者语句 的细 化切分处理, 以此获得的对应的词汇切分集合、 字段切分。

44、集合或者语句切 分集合; 0103 该定标处理单元用于根据该词汇切分集合、 该字段切分集合或者该语句切 分集 合, 对该语音识别相关信息进行该定标处理, 以此获取对应的该语音定标 结果。 0104 优选地, 该实训执行动作数据确定子模块包括匹配度计算单元和教学实训 执行 相关数据定位单元; 其中, 0105 该匹配度计算单元用于根据该语义定标结果, 计算该语音识别相关信息中 每一 项相关数据对应的教学实训场景匹配度值; 说明书 7/10 页 12 CN 111276146 A 12 0106 该教学实训执行相关数据定位单元用于根据该教学实训场景匹配度值和 该预定 匹配条件, 从该预设实训执行数。

45、据中定位得到该教学实训执行相关数据。 0107 优选地, 该教学实训执行模块包括教学实训互动对象确定子模块和实训互 动执 行子模块; 其中, 0108 该教学实训互动对象确定子模块用于根据该语音识别相关数据, 确定当前 该教 学实训执行相关数据对应的互动对象; 0109 该实训互动执行子模块用于根据该教学实训执行相关数据对应的执行指 令, 与 该互动对象进行适应性的教学实训互动。 0110 优选地, 该教学实训互动对象确定子模块包括互动对象身份确定单元和互 动对 象位置确定单元; 其中, 0111 该互动对象身份确定单元用于根据该语音识别相关数据, 确定当前该教学 实训 执行相关数据对应的互动。

46、对象的身份信息; 0112 该互动对象位置确定单元用于根据该语音识别相关数据, 确定当前该教学 实训 执行相关数据对应的互动对象的位置信息。 0113 优选地, 该实训互动执行子模块包括执行指令生成单元和实训动作确定单 元; 其 中, 0114 该执行指令生成单元用于根据该教学实训执行相关数据生成该执行指令; 0115 该实训动作确定单元用于根据该执行指令, 确定相应的教学实训动作, 以 此该互 动对象进行适应性的教学实训互动。 0116 优选地, 所述语音-实训匹配模块用于根据所述语音识别相关信息, 从预 设实训 执行数据库中匹配确定相应的教学实训执行相关数据; 其中, 0117 还包括根据。

47、数据处理获取的所述声音信号预处理关键特征数据及词汇切 分集 合, 与所述预设实训执行数据库匹配, 根据比对结果, 执行从预设实训执 行数据库中匹配 确定相应的教学实训执行相关数据的操作; 其具体实现步骤包 括: 0118 步骤A1、 根据所述声音采集子模块, 获取教学实训场景的声音信号数据, 并进行 随机抽样处理; 0119 步骤A2、 根据所述背景噪声剔除模型, 对所述步骤A1随机抽样提取的声 音信号数 据进行滤波处理, 以消除噪音干扰, 根据公式(1)相位展开处理, 获取声音信号预处理关键 特征数据; 0120 0121 其中, e为自然常数, t为声音信号总时长, 为声音信号的时间坐标,。

48、 f 为所述声音 采集频率, A为所述声音采集极限值, Amax为所述声音采集上极限 值, Amin为所述声音采集下 极限值, w为所述声音采集灵敏度, v(t)为所述随机 抽样提取声音信号数据, f( -t)e-wftdt 为在给定总时长t和时间坐标 上进行的相 位展开, (Amax+Amin)为所确认的声音采集上、 下 极限值之和,为所述声音 采集频率的补偿值, V(A, f,w)为所述获取声音信号预处理 说明书 8/10 页 13 CN 111276146 A 13 关键特征数据; 0122 步骤A3、 将所述获取声音信号预处理关键特征数据通过公式(2)进行所 述词汇细 化切分处理, 以。

49、获取所述词汇切分集合; 0123 0124 其中, arctan为反正切函数, m为正整数, i为随机抽样提取的声音信号 数据词汇 数量, x为随机抽样提取的声音信号数据各词汇的笔画数量, J i为 所述词汇数量为i的词 汇组, g x为所述词汇笔画数量为x的词汇组,为获取所述词汇数量 数据集, 为获取所述词汇笔画数据集, W J为获取所述 词汇切分集合; 0125 步骤A4、 将所述步骤A2获取的所述声音信号预处理关键特征数据与步骤 A3获取 的词汇切分集合, 与所述预设实训执行数据库D(o)进行比对, 通过公 式(3)判断匹配结果, 并执行从预设实训执行数据库中匹配确定相应的教学 实训执行。

50、相关数据的操作; 0126 NN( ,(W(J)*V(A, f,w)/D(o)2) (3) 0127 其中, N表示在所述期望值为m, 标准差为W(J)*V(A, f,w)/D(o)条件下的 正态分布 结果, 若N值大于99.74, 则表示所述随机抽样提取声音信号与所 述预设实训执行数据库 匹配, 执行从预设实训执行数据库中匹配确定相应的教 学实训执行相关数据的操作。 0128 上述技术方案的有益效果是: 所述一种基于语音识别的教学实训系统, 根 据目标 对象实训期间反馈的声音信号数据, 实时进行声音特征参数处理, 并通 过对声音信号数据 的具体词汇进行提炼分析, 与所述预设实训执行数据库比对。

展开阅读全文
内容关键字: 基于 语音 识别 教学 系统
关于本文
本文标题:基于语音识别的教学实训系统.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/9287387.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1