唤醒词的确认方法及系统.pdf

上传人:zhu****_FC 文档编号:10404245 上传时间:2021-06-20 格式:PDF 页数:15 大小:564.94KB
收藏 版权申诉 举报 下载
唤醒词的确认方法及系统.pdf_第1页
第1页 / 共15页
唤醒词的确认方法及系统.pdf_第2页
第2页 / 共15页
唤醒词的确认方法及系统.pdf_第3页
第3页 / 共15页
文档描述:

《唤醒词的确认方法及系统.pdf》由会员分享,可在线阅读,更多相关《唤醒词的确认方法及系统.pdf(15页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010530753.9 (22)申请日 2020.06.11 (71)申请人 北京声智科技有限公司 地址 100080 北京市海淀区北四环西路67 号3层306室 (72)发明人 冯大航陈孝良常乐 (74)专利代理机构 北京集佳知识产权代理有限 公司 11227 代理人 藏斌 (51)Int.Cl. G10L 15/22(2006.01) G06N 3/04(2006.01) (54)发明名称 一种唤醒词的确认方法及系统 (57)摘要 本发明提供了一种唤醒词的确认方法及系 。

2、统, 该方法包括: 获取待分析唤醒词的音素特征 并判断是否唤醒智能设备; 当判断结果为唤醒智 能设备时, 对音素特征进行计算得到中间结果; 将中间结果输入预设的确认模型进行处理, 得到 唤醒确认结果。 本方案中, 利用待分析唤醒词的 音素特征确定是否能唤醒智能设备。 若能, 对音 素特征进行计算得到中间结果, 将中间结果输入 预设的确认模型, 得到唤醒确认结果, 在保证智 能设备唤醒率的同时减少误唤醒。 权利要求书2页 说明书8页 附图4页 CN 111696555 A 2020.09.22 CN 111696555 A 1.一种唤醒词的确认方法, 其特征在于, 所述方法包括: 获取待分析唤醒。

3、词的音素特征并判断是否唤醒智能设备; 当判断结果为唤醒智能设备时, 对所述音素特征进行计算得到中间结果; 将所述中间结果输入预设的确认模型进行处理, 得到唤醒确认结果。 2.根据权利要求1所述的方法, 其特征在于, 判断是否唤醒智能设备的过程, 包括: 利用所述音素特征, 分别计算第一唤醒路径的第一分值和第二唤醒路径的第二分值; 计算所述第一分值和第二分值之间的分值差; 若所述分值差小于分值阈值, 确定唤醒智能设备; 若所述分值差大于等于分值阈值, 确定未唤醒所述智能设备。 3.根据权利要求1所述的方法, 其特征在于, 所述对所述音素特征进行计算得到中间结 果, 包括: 利用所述音素特征, 分。

4、别计算第一唤醒路径的第一分值和第二唤醒路径的第二分值; 计算所述第一分值和第二分值之间的分值差; 计算每个声韵母的时间长度和平均后验概率。 4.根据权利要求1所述的方法, 其特征在于, 获取所述确认模型的过程包括: 将唤醒词样本数据和非唤醒词样本数据输入预设的神经网络模型, 训练所述神经网络 模型直至所述神经网络模型收敛, 得到所述确认模型。 5.根据权利要求3所述的方法, 其特征在于, 计算每个声韵母的平均后验概率的过程, 包括: 确定每个所述声韵母的帧数; 针对每个所述声韵母, 计算每帧所述声韵母的后验概率; 针对每个所述声韵母, 计算每帧所述声韵母的后验概率的平均值, 得到所述声韵母的 。

5、平均后验概率。 6.根据权利要求1所述的方法, 其特征在于, 所述将所述中间结果输入预设的确认模型 进行处理, 得到唤醒确认结果, 包括: 将所述中间结果输入预设的确认模型进行唤醒词确认, 判断所述待分析唤醒词是否为 唤醒所述智能设备的唤醒词; 若是, 确定所述待分析唤醒词为唤醒所述智能设备的唤醒词; 若否, 确定所述待分析唤醒词不是唤醒所述智能设备的唤醒词。 7.根据权利要求3所述的方法, 其特征在于, 所述将所述中间结果输入预设的确认模型 进行处理, 得到唤醒确认结果, 包括: 将所述分值差以及所述每个声韵母的时间长度和平均 后验概率输入预设的确认模型进行处理, 得到唤醒确认结果。 8.一。

6、种唤醒词的确认系统, 其特征在于, 所述系统包括: 处理单元, 用于获取待分析唤醒词的音素特征并判断是否唤醒智能设备; 计算单元, 用于当判断结果为唤醒智能设备时, 对所述音素特征进行计算得到中间结 果; 唤醒确认单元, 用于将所述中间结果输入预设的确认模型进行处理, 得到唤醒确认结 果。 9.根据权利要求8所述的系统, 其特征在于, 所述处理单元包括: 权利要求书 1/2 页 2 CN 111696555 A 2 第一计算模块, 用于利用所述音素特征, 分别计算第一唤醒路径的第一分值和第二唤 醒路径的第二分值; 第二计算模块, 用于计算所述第一分值和第二分值之间的分值差; 确定模块, 用于若。

7、所述分值差小于分值阈值, 确定唤醒智能设备, 若所述分值差大于等 于分值阈值, 确定未唤醒所述智能设备。 10.根据权利要求8所述的系统, 其特征在于, 所述计算单元包括: 第一计算模块, 用于利用所述音素特征, 分别计算第一唤醒路径的第一分值和第二唤 醒路径的第二分值; 第二计算模块, 用于计算所述第一分值和第二分值之间的分值差; 第三计算模块, 用于计算每个声韵母的时间长度和平均后验概率。 权利要求书 2/2 页 3 CN 111696555 A 3 一种唤醒词的确认方法及系统 技术领域 0001 本发明涉及语音识别技术领域, 具体涉及一种唤醒词的确认方法及系统。 背景技术 0002 随着。

8、人工智能的发展, 智能设备逐渐被广泛应用。 在智能设备中, 唤醒在智能应用 中具有重要的作用, 为了人与智能设备之间进行交互, 目前, 一般都需要一个唤醒词将智能 设备唤醒, 然后再进行交互。 0003 在唤醒智能设备时, 唤醒智能设备的难易度与用户的使用体验息息相关。 因此如 何在保证唤醒率的同时减少误唤醒, 是现如今亟需解决的问题。 发明内容 0004 有鉴于此, 本发明实施例提供一种唤醒词的确认方法及系统, 以在保证唤醒率的 同时减少误唤醒。 0005 为实现上述目的, 本发明实施例提供如下技术方案: 0006 本发明实施例第一方面公开一种唤醒词的确认方法, 所述方法包括: 0007 获。

9、取待分析唤醒词的音素特征并判断是否唤醒智能设备; 0008 当判断结果为唤醒智能设备时, 对所述音素特征进行计算得到中间结果; 0009 将所述中间结果输入预设的确认模型进行处理, 得到唤醒确认结果。 0010 优选的, 判断是否唤醒智能设备的过程, 包括: 0011 利用所述音素特征, 分别计算第一唤醒路径的第一分值和第二唤醒路径的第二分 值; 0012 计算所述第一分值和第二分值之间的分值差; 0013 若所述分值差小于分值阈值, 确定唤醒智能设备; 0014 若所述分值差大于等于分值阈值, 确定未唤醒所述智能设备。 0015 优选的, 所述对所述音素特征进行计算得到中间结果, 包括: 0。

10、016 利用所述音素特征, 分别计算第一唤醒路径的第一分值和第二唤醒路径的第二分 值; 0017 计算所述第一分值和第二分值之间的分值差; 0018 计算每个声韵母的时间长度和平均后验概率。 0019 优选的, 获取所述确认模型的过程包括: 0020 将唤醒词样本数据和非唤醒词样本数据输入预设的神经网络模型, 训练所述神经 网络模型直至所述神经网络模型收敛, 得到所述确认模型。 0021 优选的, 计算每个声韵母的平均后验概率的过程, 包括: 0022 确定每个所述声韵母的帧数; 0023 针对每个所述声韵母, 计算每帧所述声韵母的后验概率; 0024 针对每个所述声韵母, 计算每帧所述声韵母。

11、的后验概率的平均值, 得到所述声韵 说明书 1/8 页 4 CN 111696555 A 4 母的平均后验概率。 0025 优选的, 所述将所述中间结果输入预设的确认模型进行处理, 得到唤醒确认结果, 包括: 0026 将所述中间结果输入预设的确认模型进行唤醒词确认, 判断所述待分析唤醒词是 否为唤醒所述智能设备的唤醒词; 0027 若是, 确定所述待分析唤醒词为唤醒所述智能设备的唤醒词; 0028 若否, 确定所述待分析唤醒词不是唤醒所述智能设备的唤醒词。 0029 优选的, 所述将所述中间结果输入预设的确认模型进行处理, 得到唤醒确认结果, 包括: 将所述分值差以及所述每个声韵母的时间长度。

12、和平均后验概率输入预设的确认模型 进行处理, 得到唤醒确认结果。 0030 本发明实施例第二方面公开一种唤醒词的确认系统, 所述系统包括: 0031 处理单元, 用于获取待分析唤醒词的音素特征并判断是否唤醒智能设备; 0032 计算单元, 用于当判断结果为唤醒智能设备时, 对所述音素特征进行计算得到中 间结果; 0033 唤醒确认单元, 用于将所述中间结果输入预设的确认模型进行处理, 得到唤醒确 认结果。 0034 优选的, 所述处理单元包括: 0035 第一计算模块, 用于利用所述音素特征, 分别计算第一唤醒路径的第一分值和第 二唤醒路径的第二分值; 0036 第二计算模块, 用于计算所述第。

13、一分值和第二分值之间的分值差; 0037 确定模块, 用于若所述分值差小于分值阈值, 确定唤醒智能设备, 若所述分值差大 于等于分值阈值, 确定未唤醒所述智能设备。 0038 优选的, 所述计算单元包括: 0039 第一计算模块, 用于利用所述音素特征, 分别计算第一唤醒路径的第一分值和第 二唤醒路径的第二分值; 0040 第二计算模块, 用于计算所述第一分值和第二分值之间的分值差; 0041 第三计算模块, 用于计算每个声韵母的时间长度和平均后验概率。 0042 基于上述本发明实施例提供的一种唤醒词的确认方法及系统, 该方法包括: 获取 待分析唤醒词的音素特征并判断是否唤醒智能设备; 当判断。

14、结果为唤醒智能设备时, 对音 素特征进行计算得到中间结果; 将中间结果输入预设的确认模型进行处理, 得到唤醒确认 结果。 本方案中, 利用待分析唤醒词的音素特征确定是否能唤醒智能设备。 若能, 对音素特 征进行计算得到中间结果, 将中间结果输入预设的确认模型得到唤醒确认结果, 在保证智 能设备唤醒率的同时减少误唤醒。 附图说明 0043 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本 发明的实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据 提供的附图获得。

15、其他的附图。 说明书 2/8 页 5 CN 111696555 A 5 0044 图1为本发明实施例提供的一种唤醒词的确认方法的流程图; 0045 图2为本发明实施例提供的判断是否唤醒智能设备的流程图; 0046 图3为本发明实施例提供的待分析唤醒词的音素特征的示意图; 0047 图4为本发明实施例提供的计算中间结果的流程图; 0048 图5为本发明实施例提供的一种唤醒词的确认系统的结构框图; 0049 图6为本发明实施例提供的一种唤醒词的确认系统的另一结构框图; 0050 图7为本发明实施例提供的一种唤醒词的确认系统的又一结构框图。 具体实施方式 0051 下面将结合本发明实施例中的附图, 。

16、对本发明实施例中的技术方案进行清楚、 完 整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是全部的实施例。 基于 本发明中的实施例, 本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例, 都属于本发明保护的范围。 0052 在本申请中, 术语 “包括” 、“包含” 或者其任何其他变体意在涵盖非排他性的包含, 从而使得包括一系列要素的过程、 方法、 物品或者设备不仅包括那些要素, 而且还包括没有 明确列出的其他要素, 或者是还包括为这种过程、 方法、 物品或者设备所固有的要素。 在没 有更多限制的情况下, 由语句 “包括一个” 限定的要素, 并不排除在包括所述。

17、要素的过 程、 方法、 物品或者设备中还存在另外的相同要素。 0053 由背景技术可知, 目前在唤醒智能设备时需要相应的唤醒词, 唤醒智能设备的难 易度与用户的使用体验息息相关。 如何在保证唤醒率的同时减少误唤醒, 是现如今亟需解 决的问题。 0054 因此, 本发明实施例提供一种唤醒词的确认方法及系统, 若唤醒智能设备, 对待唤 醒词的音素特征进行计算得到中间结果。 将中间结果输入确认模型进行处理得到唤醒确认 结果, 以在保证唤醒率的同时减少误唤醒。 0055 参见图1, 示出了本发明实施例提供的一种唤醒词的确认方法的流程图, 该确认方 法包括以下步骤: 0056 步骤S101: 获取待分析。

18、唤醒词的音素特征。 0057 需要说明的是, 音素特征至少包括待分析唤醒词的声韵母, 待分析唤醒词为当前 用户用于唤醒智能设备所使用的词语。 0058 可以理解的是, 待分析唤醒词的声韵母指示构成待分析唤醒词的声母和韵母, 也 就是说, 获取待分析唤醒词的声韵母即为获取待分析唤醒词对应的声母和韵母。 0059 进一步需要说明的是, 预先为智能设备设置相应的唤醒词, 即当智能设备获取该 唤醒词时执行唤醒操作。 0060 例如: 设置 “开启音箱” 为智能音箱的唤醒词。 当用户对着智能音箱说:“开启音箱” 时, 智能音箱就会被唤醒, 然后可以进行人机交互, 其中,“开启音箱” 就是预先设置的智能 。

19、音箱的唤醒词。 0061 在具体实现步骤S101的过程中, 获取待分析唤醒词后, 对该待分析唤醒词进行特 征提取, 获取待分析唤醒词的音素特征。 0062 例如:“开启音箱” 为待分析唤醒词。 接收到 “开启音箱” , 然后提取 “开启音箱” 中每 说明书 3/8 页 6 CN 111696555 A 6 个字的声韵母(声母和韵母)。“开” 字获得声母为 “k” ,“启” 字获得声母 “q” ,“音” 字获得的声 母为 “y” ,“箱” 字获得声母为 “x” 。“开” 字获得韵母为 “ai” ,“启” 字获得的韵母为 “i” ,“音” 字 获得的韵母为 “in” ,“箱” 字获得韵母为 “ia。

20、ng” 。 以上总共获取 “开启音箱” 对应的8个音素, 再加上静音音素 “sil” , 即总共获取9类音素特征。 0063 步骤S102: 判断是否唤醒智能设备。 若判断结果为唤醒智能设备, 执行步骤S103。 0064 在具体实现步骤S102的过程中, 利用待分析唤醒词的音素特征, 计算该待分析唤 醒词的分值, 若计算得到的分值满足预设的唤醒条件, 确定待分析唤醒词唤醒智能设备, 即 若计算得到的分值满足预设的唤醒条件, 则判断结果为唤醒智能设备。 0065 步骤S103: 对音素特征进行计算得到中间结果。 0066 需要说明的是, 在唤醒智能设备后, 会产生相应的中间结果, 中间结果至少。

21、包括: 唤醒分值、 每个声韵母的后验概率和每个声韵母的持续时间长度等。 在具体实现步骤S103 的过程中, 对待分析唤醒词的音素特征进行计算, 得到对应的中间结果。 0067 需要说明的是, 对于同一个唤醒词, 由于用户发音的习惯不同, 该唤醒词的每个声 韵母的时间长度(持续时间长度)有所不同, 并且每个声韵母之间的时间长度也会互相影 响, 例如: 用户说话语速快, 则每个声韵母的时间长度也会短。 0068 步骤S104: 将中间结果输入预设的确认模型进行处理, 得到唤醒确认结果。 0069 需要说明的是, 确认模型预先基于样本数据训练神经网络模型得到, 具体过程为: 预先收集唤醒词样本数据和。

22、非唤醒词样本数据等样本数据, 按照上述方式计算每个样本唤 醒词和每个样本非唤醒词的中间结果, 将每个样本唤醒词和每个样本非唤醒词的中间结果 输入预设的神经网络模型, 训练神经网络模型直至神经网络模型收敛, 得到确认模型。 0070 例如: 利用唤醒词样本数据和非唤醒词样本数据, 训练深度神经网络模型(Deep Neural Networks, DNN)直至收敛, 得到确认模型。 0071 在具体实现步骤S104的过程中, 将待分析唤醒词对应的中间结果输入确认模型中 进行处理, 得到唤醒词确认结果, 即判断待分析唤醒词是否为唤醒智能设备的唤醒词, 若 是, 确定待分析唤醒词为唤醒智能设备的唤醒词。

23、, 若否, 确定待分析唤醒词不是唤醒智能设 备的唤醒词。 也就是说, 该确认模型的输出结果即可确认待分析唤醒词是否为唤醒智能设 备的唤醒词。 0072 需要说明的是, 将待分析唤醒词输入确认模型后, 确认模型输出的结果是0至1之 间的数。 也就是说, 若确认模型输出的结果大于等于唤醒词分数阈值, 则确定待分析唤醒词 为唤醒智能设备的唤醒词。 若确认模型输出的结果小于唤醒词分数阈值, 则确定待分析唤 醒词不是唤醒智能设备的唤醒词。 0073 在本发明实施例中, 利用待分析唤醒词的音素特征确定是否能唤醒智能设备, 若 能, 对音素特征进行计算得到中间结果, 将中间结果输入预设的确认模型, 确定待分。

24、析唤醒 词是否为唤醒智能设备的唤醒词, 在保证智能设备唤醒率的同时减少误唤醒。 0074 上述本发明实施例图1步骤S102中涉及的判断是否唤醒智能设备的过程, 参见图 2, 示出了本发明实施例提供的判断是否唤醒智能设备的流程图, 包括以下步骤: 0075 步骤S201: 利用音素特征, 分别计算第一唤醒路径的第一分值和第二唤醒路径的 第二分值。 0076 在具体实现步骤S201的过程中, 利用维特比算法和音素特征, 分别计算第一唤醒 说明书 4/8 页 7 CN 111696555 A 7 路径的第一分值和第二唤醒路径的第二分值。 0077 为更好解释说明步骤S201中的内容, 通过图3示出的。

25、待分析唤醒词的音素特征的 示意图进行举例说明, 需要说明的是, 图3仅用于举例说明。 0078 如图3所示, 以 “开启音箱” 为待分析唤醒词, 其中, 该待分析唤醒词的音素特征为8 类, 再加上静音音素 “sil” , 总共9类音素特征。 利用维特比算法, 计算第一唤醒路径的第一 分值, 以及计算第二唤醒路径的第二分值。 0079 步骤S202: 计算第一分值和第二分值之间的分值差。 0080 在具体实现步骤S202的过程中, 计算第一分值和第二分值的差值, 得到第一分值 和第二分值之间的分值差。 0081 预先设置相应的分值阈值, 若分值差小于分值阈值, 确定唤醒智能设备, 即确定待 分析。

26、唤醒词唤醒智能设备, 若分值差大于等于分值阈值, 确定未唤醒智能设备, 即确定待分 析唤醒词未唤醒智能设备。 0082 步骤S203: 若分值差小于分值阈值, 确定唤醒智能设备。 0083 步骤S204: 若分值差大于等于分值阈值, 确定未唤醒智能设备。 0084 在本发明实施例中, 利用维特比算法和音素特征, 分别计算第一唤醒路径的第一 分值和第二唤醒路径的第二分值。 利用第一分值和第二分值的分值差确定待分析唤醒词是 否能唤醒智能设备, 以保证唤醒率。 0085 上述本发明实施例图1步骤S103中涉及的计算中间结果的过程, 参见图4, 示出了 本发明实施例提供的计算中间结果的流程图, 包括以。

27、下步骤: 0086 步骤S401: 利用音素特征, 分别计算第一唤醒路径的第一分值和第二唤醒路径的 第二分值。 0087 在具体实现步骤S401的过程中, 计算第一分值和第二分值的过程, 请参见上述本 发明实施例图2步骤S201中的内容, 在此不再进行赘述。 0088 步骤S402: 计算第一分值和第二分值之间的分值差。 0089 步骤S403: 计算每个声韵母的时间长度和平均后验概率。 0090 需要说明的是, 在利用分值差确定待分析唤醒词唤醒智能设备之后, 确定待分析 唤醒词的对齐结果, 即确定待分析唤醒词的每个声韵母的帧数。 也就是说, 确定待分析唤醒 词的每个声母的帧数, 以及确定待分。

28、析唤醒词的每个韵母的帧数。 0091 在具体实现步骤S403的过程中, 确定每个声韵母的帧数, 针对每个声韵母, 计算每 帧声韵母的后验概率。 针对每个声韵母, 计算每帧声韵母的后验概率的平均值, 得到声韵母 的平均后验概率。 0092 例如: 以 “开启音箱” 为待分析唤醒词, 假设声母 “k” 的帧数为5帧, 则计算每帧 “k” 的后验概率, 计算5帧 “k” 的后验概率的平均值, 即得到 “k” 的平均后验概率。 通过以上方式, 计算待分析唤醒词的每个声韵母的平均后验概率。 0093 也就是说, 待分析唤醒词的中间结果至少包括: 分值差、 每个声韵母的时间长度和 每个声韵母的平均后验概率。

29、。 0094 例如: 以 “开启音箱” 为待分析唤醒词,“开启音箱” 包括8个声韵母, 每个声韵母对 应各自的时间长度和平均后验概率。 也就是说 “开启音箱” 的中间结果即为分值差、 每个声 韵母对应各自的时间长度和平均后验概率, 总共17个值。 说明书 5/8 页 8 CN 111696555 A 8 0095 在将中间结果输入预设的确认模型进行唤醒词确认的过程中, 将待分析唤醒词对 应的分值差、 每个声韵母的时间长度和平均后验概率输入确认模型进行处理(唤醒词确 认), 得到唤醒确认结果, 即确定待分析唤醒词是否为唤醒智能设备的唤醒词。 0096 例如: 将上述得到的待分析唤醒词对应的17个。

30、值(仅用于举例)输入确认模型进行 唤醒词确认, 确定待分析唤醒词是否为唤醒智能设备的唤醒词。 0097 同理, 在训练神经网络模型的过程中, 针对每个样本唤醒词和每个样本非唤醒词 等样本词, 按照上述方式计算每个样本词对应的分值差、 每个声韵母的时间长度和平均后 验概率。 例如: 计算每个样本唤醒词对应的17个值, 计算每个样本非唤醒词的17个值, 将每 个样本唤醒词和每个样本非唤醒词对应的17个值输入神经网络模型, 训练神经网络模型直 至神经网络模型收敛, 得到确认模型。 0098 在本发明实施例中, 计算待分析唤醒词对应的第一分值和第二分值之间的分值 差, 以及计算每个声韵母的时间长度和平。

31、均后验概率。 将待分析唤醒词对应的分值差、 每个 声韵母的时间长度和平均后验概率输入确认模型进行唤醒词确认, 确定待分析唤醒词是否 为唤醒智能设备的唤醒词, 在保证智能设备唤醒率的同时减少误唤醒。 0099 与上述本发明实施例提供的一种唤醒词的确认方法相对应, 参见图5, 本发明实施 例还提供一种唤醒词的确认系统的结构框图, 该确认系统包括: 处理单元501、 计算单元502 和唤醒确认单元503; 0100 处理单元501, 用于获取待分析唤醒词的音素特征并判断是否唤醒智能设备。 0101 计算单元502, 用于当判断结果为唤醒智能设备时, 对音素特征进行计算得到中间 结果。 0102 唤醒。

32、确认单元503, 用于将中间结果输入预设的确认模型进行处理, 得到唤醒确认 结果。 0103 在具体实现中, 用于获取确认模型的唤醒确认单元503具体用于: 将唤醒词样本数 据和非唤醒词样本数据输入预设的神经网络模型, 训练神经网络模型直至神经网络模型收 敛, 得到确认模型。 0104 在具体实现中, 唤醒确认单元503具体用于: 将中间结果输入预设的确认模型进行 唤醒词确认, 判断待分析唤醒词是否为唤醒智能设备的唤醒词, 若是, 确定待分析唤醒词为 唤醒智能设备的唤醒词, 若否, 确定待分析唤醒词不是唤醒智能设备的唤醒词。 0105 在本发明实施例中, 确定是否能唤醒智能设备, 若能, 对音。

33、素特征进行计算得到中 间结果, 将中间结果输入预设的确认模型进行处理得到唤醒确认结果, 在保证智能设备唤 醒率的同时减少误唤醒。 0106 结合图5示出的内容, 参见图6, 示出了本发明实施例提供的一种唤醒词的确认系 统的另一结构框图, 处理单元501包括: 第一计算模块5011、 第二计算模块5012和确定模块 5013; 0107 第一计算模块5011, 用于利用音素特征, 分别计算第一唤醒路径的第一分值和第 二唤醒路径的第二分值。 0108 第二计算模块5012, 用于计算第一分值和第二分值之间的分值差。 0109 确定模块5013, 用于若分值差小于分值阈值, 确定唤醒智能设备, 若分。

34、值差大于等 于分值阈值, 确定未唤醒智能设备。 说明书 6/8 页 9 CN 111696555 A 9 0110 在本发明实施例中, 利用维特比算法和音素特征, 分别计算第一唤醒路径的第一 分值和第二唤醒路径的第二分值。 利用第一分值和第二分值的分值差确定待分析唤醒词是 否能唤醒智能设备, 以保证唤醒率。 0111 结合图5示出的内容, 参见图7, 示出了本发明实施例提供的一种唤醒词的确认系 统的又一结构框图, 计算单元502包括: 第一计算模块5021、 第二计算模块5022和第三计算 模块5023; 0112 第一计算模块5021, 用于利用音素特征, 分别计算第一唤醒路径的第一分值和第。

35、 二唤醒路径的第二分值。 0113 第二计算模块5022, 用于计算第一分值和第二分值之间的分值差。 0114 第三计算模块5023, 用于计算每个声韵母的时间长度和平均后验概率。 0115 在具体实现中, 第三计算模块5023具体用于: 确定每个声韵母的帧数, 针对每个声 韵母, 计算每帧声韵母的后验概率, 针对每个声韵母, 计算每帧声韵母的后验概率的平均 值, 得到声韵母的平均后验概率。 0116 相应的, 唤醒确认单元503具体用于: 将分值差以及每个声韵母的时间长度和平均 后验概率输入预设的确认模型进行处理, 得到唤醒确认结果。 0117 在本发明实施例中, 计算待分析唤醒词对应的第一。

36、分值和第二分值之间的分值 差, 以及计算每个声韵母的时间长度和平均后验概率。 将待分析唤醒词对应的分值差、 每个 声韵母的时间长度和平均后验概率输入确认模型进行处理得到唤醒确认结果, 在保证智能 设备唤醒率的同时减少误唤醒。 0118 综上所述, 本发明实施例提供一种唤醒词的确认方法及系统, 该方法包括: 获取待 分析唤醒词的音素特征并判断是否唤醒智能设备; 当判断结果为唤醒智能设备时, 对音素 特征进行计算得到中间结果; 将中间结果输入预设的确认模型进行处理, 得到唤醒确认结 果。 本方案中, 利用待分析唤醒词的音素特征确定是否能唤醒智能设备。 若能, 对音素特征 进行计算得到中间结果, 将。

37、中间结果输入预设的确认模型, 得到唤醒确认结果, 在保证智能 设备唤醒率的同时减少误唤醒。 0119 本说明书中的各个实施例均采用递进的方式描述, 各个实施例之间相同相似的部 分互相参见即可, 每个实施例重点说明的都是与其他实施例的不同之处。 尤其, 对于系统或 系统实施例而言, 由于其基本相似于方法实施例, 所以描述得比较简单, 相关之处参见方法 实施例的部分说明即可。 以上所描述的系统及系统实施例仅仅是示意性的, 其中所述作为 分离部件说明的单元可以是或者也可以不是物理上分开的, 作为单元显示的部件可以是或 者也可以不是物理单元, 即可以位于一个地方, 或者也可以分布到多个网络单元上。 可。

38、以根 据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。 本领域普通技术 人员在不付出创造性劳动的情况下, 即可以理解并实施。 0120 专业人员还可以进一步意识到, 结合本文中所公开的实施例描述的各示例的单元 及算法步骤, 能够以电子硬件、 计算机软件或者二者的结合来实现, 为了清楚地说明硬件和 软件的可互换性, 在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。 这些 功能究竟以硬件还是软件方式来执行, 取决于技术方案的特定应用和设计约束条件。 专业 技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能, 但是这种实现不应 认为超出本发明的范围。 说明书 7/。

39、8 页 10 CN 111696555 A 10 0121 对所公开的实施例的上述说明, 使本领域专业技术人员能够实现或使用本发明。 对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的, 本文中所定义的 一般原理可以在不脱离本发明的精神或范围的情况下, 在其它实施例中实现。 因此, 本发明 将不会被限制于本文所示的这些实施例, 而是要符合与本文所公开的原理和新颖特点相一 致的最宽的范围。 说明书 8/8 页 11 CN 111696555 A 11 图1 说明书附图 1/4 页 12 CN 111696555 A 12 图2 图3 说明书附图 2/4 页 13 CN 111696555 A 13 图4 图5 图6 说明书附图 3/4 页 14 CN 111696555 A 14 图7 说明书附图 4/4 页 15 CN 111696555 A 15 。

展开阅读全文
内容关键字: 唤醒 的确 方法 系统
关于本文
本文标题:唤醒词的确认方法及系统.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10404245.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1