设备的唤醒方法及装置、电子设备、存储介质.pdf

上传人:磨** 文档编号:10333371 上传时间:2021-06-18 格式:PDF 页数:26 大小:908.17KB
收藏 版权申诉 举报 下载
设备的唤醒方法及装置、电子设备、存储介质.pdf_第1页
第1页 / 共26页
设备的唤醒方法及装置、电子设备、存储介质.pdf_第2页
第2页 / 共26页
设备的唤醒方法及装置、电子设备、存储介质.pdf_第3页
第3页 / 共26页
文档描述:

《设备的唤醒方法及装置、电子设备、存储介质.pdf》由会员分享,可在线阅读,更多相关《设备的唤醒方法及装置、电子设备、存储介质.pdf(26页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010537368.7 (22)申请日 2020.06.12 (71)申请人 北京小米松果电子有限公司 地址 100085 北京市海淀区清河朱房路临 66号C栋C单元 (72)发明人 王昭 (74)专利代理机构 北京善任知识产权代理有限 公司 11650 代理人 康艳青 (51)Int.Cl. G10L 15/22(2006.01) G10L 25/24(2013.01) G10L 25/51(2013.01) (54)发明名称 设备的唤醒方法及装置、 电子设备、 存储介 。

2、质 (57)摘要 本公开是关于一种设备的唤醒方法及装置、 电子设备、 存储介质。 所述唤醒方法应用于第一 电子设备中, 所述方法包括: 接收来自第二电子 设备的唤醒消息, 确定当前状态为未唤醒状态 时, 获取本地采集的语音数据; 对所述语音数据 进行梅尔频率倒谱系数提取, 获取所述语音数据 的第一梅尔频率倒谱系数; 从所述唤醒消息中解 析所述唤醒消息中携带的第二梅尔频率倒谱系 数; 将所述第一梅尔频率倒谱系数与所述第二梅 尔频率倒谱系数进行匹配, 确定所述第一梅尔频 率倒谱系数和所述第二梅尔频率倒谱系数之间 的差异小于或小于等于设定阈值时, 生成唤醒指 令; 响应于所述唤醒指令, 唤醒所述第一。

3、电子设 备。 本公开适用于多电子设备组网下差异化的多 设备预唤醒场景。 权利要求书4页 说明书15页 附图6页 CN 111724780 A 2020.09.29 CN 111724780 A 1.一种设备的唤醒方法, 应用于第一电子设备中, 其特征在于, 所述方法包括: 接收来自第二电子设备的唤醒消息, 确定当前状态为未唤醒状态时, 获取本地采集的 语音数据; 对所述语音数据进行梅尔频率倒谱系数提取, 获取所述语音数据的第一梅尔频率倒谱 系数; 从所述唤醒消息中解析所述唤醒消息中携带的第二梅尔频率倒谱系数; 将所述第一梅尔频率倒谱系数与所述第二梅尔频率倒谱系数进行匹配, 确定所述第一 梅尔频。

4、率倒谱系数和所述第二梅尔频率倒谱系数之间的差异小于或小于等于设定阈值时, 生成唤醒指令; 响应于所述唤醒指令, 唤醒所述第一电子设备。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述语音数据进行梅尔频率倒谱系 数提取, 获取所述语音数据的第一梅尔频率倒谱系数, 包括: 对所述语音数据中的高频部分进行补偿, 提升所述高频部分的分辨率; 以设定时长将补偿后的所述语音数据划分为语音数据段; 将所述语音数据段与设定的汉明Hamming窗函数相乘, 形成加窗的语音数据段; 对所述加窗的语音数据段进行傅里叶变换, 得到所述加窗的语音数据段的频谱; 将所述频谱通过由T个三角形带通滤波器组成的梅尔刻。

5、度滤波器进行滤波, 对滤波后 的频谱取对数, 求出每一个输出的对数能量; 其中, T的取值范围为20至30; 对所述对数进行离散余弦变换, 得到所述第一梅尔频率倒谱系数。 3.根据权利要求2所述的方法, 其特征在于, 所述以设定时长将补偿后的所述语音数据 划分为语音数据段, 包括: 以第一设定时长将补偿后的所述语音数据划分多个语音数据段, 所述多个语音数据段 中相邻的第一语音数据段和第二语音数据段中具有第二设定时长的重叠语音段; 其中, 所 述第二设定时长与所述第一设定时长之比的取值范围为1/3至2/3。 4.根据权利要求1所述的方法, 其特征在于, 所述将所述第一梅尔频率倒谱系数与所述 第二。

6、梅尔频率倒谱系数进行匹配, 确定所述第一梅尔频率倒谱系数和所述第二梅尔频率倒 谱系数之间的差异小于或小于等于设定阈值, 包括: 所述第一梅尔频率倒谱系数形成为序号1至n的第一时间序列; 所述第二梅尔频率倒谱 系数形成为序号1至m的第二时间序列, 以(1, m)或(1, n)为原点, 将所述第一时间序列和所 述第二时间序列构成二维坐标系; m和n为大于1的自然数; 对于所述二维坐标系中的位置(i,j)的最小累计距离D(i,j), 则有D(i,j)dij+minD (i-1,j),D(i,j-1),D(i-1,j-1), 其中, D(i-1,j)表示所述二维坐标系中的位置(i-1,j)的 最小累计。

7、距离, D(i,j-1)表示所述二维坐标系中的位置(i,j-1)的最小累计距离, D(i-1,j- 1)表示所述二维坐标系中的位置(i-1,j-1)的最小累计距离; 以D(i,j)的最小累计距离表征方式确定所述二维坐标系中的位置(m,n)的最小累计距 离D(m,n), 当D(m,n)小于或小于等于第一设定阈值时, 确定所述第一梅尔频率倒谱系数和 所述第二梅尔频率倒谱系数之间的差异小于或小于等于设定阈值。 5.根据权利要求1所述的方法, 其特征在于, 所述方法还包括: 接收到来自所述第二电子设备的消息, 所述消息中携带有唤醒标识时, 确定所述消息 权利要求书 1/4 页 2 CN 1117247。

8、80 A 2 为唤醒消息; 确定当前状态为唤醒状态时, 丢弃或屏蔽所述唤醒消息。 6.根据权利要求1至5任一项所述的方法, 其特征在于, 在生成唤醒指令后, 所述方法还 包括: 确定当前基于所述语音数据的唤醒机制是否已启动, 启动时关闭当前基于所述语音数 据的唤醒机制, 未启动时屏蔽当前基于所述语音数据的唤醒机制。 7.一种设备的唤醒方法, 应用于第二电子设备中, 其特征在于, 所述方法包括: 采集语音数据, 对所述语音数据进行识别, 生成识别语音信息; 将所述识别语音信息在语音指令数据库中进行匹配; 确定所述识别语音信息与唤醒指令匹配时, 调用所述唤醒指令, 唤醒所述电子设备, 对 所述语音。

9、数据进行梅尔频率倒谱系数提取, 获取所述语音数据的梅尔频率倒谱系数; 生成唤醒消息, 并通过通信接口广播所述唤醒消息, 其中, 所述唤醒消息中承载有所述 梅尔频率倒谱系数。 8.根据权利要求7所述的方法, 其特征在于, 所述对所述语音数据进行梅尔频率倒谱系 数提取, 获取所述语音数据的梅尔频率倒谱系数, 包括: 对所述语音数据中的高频部分进行补偿, 提升所述高频部分的分辨率; 以设定时长将补偿后的所述语音数据划分为语音数据段; 将所述语音数据段与设定的汉明Hamming窗函数相乘, 形成加窗的语音数据段; 对所述加窗的语音数据段进行傅里叶变换, 得到所述加窗的语音数据段的频谱; 将所述频谱通过。

10、由T个三角形带通滤波器组成的梅尔刻度滤波器进行滤波, 对滤波后 的频谱取对数, 求出每一个输出的对数能量; 其中, T的取值范围为20至30; 对所述对数进行离散余弦变换, 得到所述梅尔频率倒谱系数。 9.根据权利要求8所述的方法, 其特征在于, 所述以设定时长将补偿后的所述语音数据 划分为语音数据段, 包括: 以第一设定时长将补偿后的所述语音数据划分多个语音数据段, 所述多个语音数据段 中相邻的第一语音数据段和第二语音数据段中具有第二设定时长的重叠语音段; 其中, 所 述第二设定时长与所述第一设定时长之比的取值范围为1/3至2/3。 10.根据权利要求7至9任一项所述的方法, 其特征在于, 。

11、所述确定所述识别语音信息与 唤醒指令匹配之后, 所述方法还包括: 确定当前状态为唤醒状态时, 丢弃所述识别语音信息, 不调用所述唤醒指令。 11.一种设备的唤醒装置, 配置于第一电子设备中, 其特征在于, 所述装置包括: 接收单元, 用于接收来自第二电子设备的唤醒消息; 获取单元, 用于在当前状态为未唤醒状态时, 获取本地采集的语音数据; 提取单元, 用于对所述语音数据进行梅尔频率倒谱系数提取, 获取所述语音数据的第 一梅尔频率倒谱系数; 解析单元, 用于从所述唤醒消息中解析所述唤醒消息中携带的第二梅尔频率倒谱系 数; 匹配单元, 用于将所述第一梅尔频率倒谱系数与所述第二梅尔频率倒谱系数进行匹。

12、 配, 确定所述第一梅尔频率倒谱系数和所述第二梅尔频率倒谱系数之间的差异小于或小于 权利要求书 2/4 页 3 CN 111724780 A 3 等于设定阈值时, 触发生成单元; 生成单元, 用于生成唤醒指令; 唤醒单元, 用于响应于所述唤醒指令, 唤醒所述第一电子设备。 12.根据权利要求11所述的装置, 其特征在于, 所述提取单元包括: 补偿子单元, 用于对所述语音数据中的高频部分进行补偿, 提升所述高频部分的分辨 率; 划分子单元, 用于以设定时长将补偿后的所述语音数据划分为语音数据段; 加窗子单元, 用于将所述语音数据段与设定的Hamming窗函数相乘, 形成加窗的语音数 据段; 傅里。

13、叶变换子单元, 用于对所述加窗的语音数据段进行傅里叶变换, 得到所述加窗的 语音数据段的频谱; 梅尔滤波子单元, 用于将所述频谱通过由T个三角形带通滤波器组成的梅尔刻度滤波 器进行滤波, 对滤波后的频谱取对数, 求出每一个输出的对数能量; 其中, T的取值范围为20 至30; 余弦变换子单元, 用于对所述对数进行离散余弦变换, 得到所述第一梅尔频率倒谱系 数。 13.根据权利要求12所述的装置, 其特征在于, 所述划分子单元, 还用于以第一设定时 长将补偿后的所述语音数据划分多个语音数据段, 所述多个语音数据段中相邻的第一语音 数据段和第二语音数据段中具有第二设定时长的重叠语音段; 其中, 所。

14、述第二设定时长与 所述第一设定时长之比的取值范围为1/3至2/3。 14.根据权利要求11所述的装置, 其特征在于, 所述匹配单元, 还用于: 所述第一梅尔频率倒谱系数形成为序号1至n的第一时间序列; 所述第二梅尔频率倒谱 系数形成为序号1至m的第二时间序列, 以(1, m)或(1, n)为原点, 将所述第一时间序列和所 述第二时间序列构成二维坐标系; m和n为大于1的自然数; 对于所述二维坐标系中的位置(i,j)的最小累计距离D(i,j), 则有D(i,j)dij+minD (i-1,j),D(i,j-1),D(i-1,j-1), 其中, D(i-1,j)表示所述二维坐标系中的位置(i-1,。

15、j)的 最小累计距离, D(i,j-1)表示所述二维坐标系中的位置(i,j-1)的最小累计距离, D(i-1,j- 1)表示所述二维坐标系中的位置(i-1,j-1)的最小累计距离; 以D(i,j)的最小累计距离表征方式确定所述二维坐标系中的位置(m,n)的最小累计距 离D(m,n), 当D(m,n)小于或小于等于第一设定阈值时, 确定所述第一梅尔频率倒谱系数和 所述第二梅尔频率倒谱系数之间的差异小于或小于等于设定阈值。 15.根据权利要求11所述的装置, 其特征在于, 所述装置还包括: 确定单元, 用于在所述接收单元接收到来自所述第二电子设备的消息, 在所述消息中 携带有唤醒标识时, 确定所述。

16、消息为唤醒消息; 确定当前状态为唤醒状态时, 丢弃或屏蔽所述唤醒消息。 16.根据权利要求11至15任一项所述的装置, 其特征在于, 所述装置还包括: 执行单元, 用于确定当前基于所述语音数据的唤醒机制是否已启动, 启动时关闭当前 基于所述语音数据的唤醒机制, 未启动时屏蔽当前基于所述语音数据的唤醒机制。 17.一种设备的唤醒装置, 配置于第二电子设备中, 其特征在于, 所述装置包括: 权利要求书 3/4 页 4 CN 111724780 A 4 采集单元, 用于采集语音数据; 识别单元, 用于对所述语音数据进行识别, 生成识别语音信息; 匹配单元, 用于将所述识别语音信息在语音指令数据库中进。

17、行匹配, 确定所述识别语 音信息与唤醒指令匹配时, 触发执行单元; 执行单元, 用于调用所述唤醒指令, 唤醒所述电子设备; 提取单元, 用于对所述语音数据进行梅尔频率倒谱系数提取, 获取所述语音数据的梅 尔频率倒谱系数; 生成单元, 用于生成唤醒消息; 其中, 所述唤醒消息中承载有所述梅尔频率倒谱系数; 广播单元, 用于通过通信接口广播所述唤醒消息。 18.根据权利要求17所述的装置, 其特征在于, 所述提取单元包括: 补偿子单元, 用于对所述语音数据中的高频部分进行补偿, 提升所述高频部分的分辨 率; 划分子单元, 用于以设定时长将补偿后的所述语音数据划分为语音数据段; 加窗子单元, 用于将。

18、所述语音数据段与设定的Hamming窗函数相乘, 形成加窗的语音数 据段; 傅里叶变换子单元, 用于对所述加窗的语音数据段进行傅里叶变换, 得到所述加窗的 语音数据段的频谱; 梅尔滤波子单元, 用于将所述频谱通过由T个三角形带通滤波器组成的梅尔刻度滤波 器进行滤波, 对滤波后的频谱取对数, 求出每一个输出的对数能量; 其中, T的取值范围为20 至30; 余弦变换子单元, 用于对所述对数进行离散余弦变换, 得到所述梅尔频率倒谱系数。 19.根据权利要求18所述的装置, 其特征在于, 所述划分子单元, 还用于以第一设定时 长将补偿后的所述语音数据划分多个语音数据段, 所述多个语音数据段中相邻的第。

19、一语音 数据段和第二语音数据段中具有第二设定时长的重叠语音段; 其中, 所述第二设定时长与 所述第一设定时长之比的取值范围为1/3至2/3。 20.根据权利要求17至19任一项所述的装置, 其特征在于, 所述执行单元, 还用于在所 述匹配单元确定所述识别语音信息与唤醒指令匹配, 当前状态为唤醒状态时, 丢弃所述识 别语音信息, 不调用所述唤醒指令。 21.一种电子设备, 其特征在于, 所述电子设备包括: 处理器和用于存储处理器可执行 指令的存储器, 其中, 所述处理器被配置为在调用存储器中的可执行指令时, 能够执行如权 利要求1至6中任一项所述的电子设备的唤醒方法, 或执行如权利要求7至10中。

20、任一项所述 的设备的唤醒方法。 22.一种非临时性计算机可读存储介质, 当所述存储介质中的指令由电子设备的处理 器执行时, 使得电子设备能够执行如权利要求1至6中任一项所述的电子设备的唤醒方法, 或执行如权利要求7至10中任一项所述的设备的唤醒方法。 权利要求书 4/4 页 5 CN 111724780 A 5 设备的唤醒方法及装置、 电子设备、 存储介质 技术领域 0001 本公开涉及电子设备开启技术, 尤其涉及一种设备的唤醒方法及装置、 电子设备、 存储介质。 背景技术 0002 在电子设备能够互相联网的应用场景下, 如智能家居互相联网的应用场景下, 而 大多智能家居等电子设备支持语音开启。

21、功能。 但是, 不同的电子设备之间的唤醒引擎、 本地 运算能力和网络交互能力等都存在差异。 在针对智能家居的多设备唤醒时, 有一些电子设 备可能由于唤醒系统的响应速度较慢、 运算能力差或网络延迟等因素, 会导致唤醒的速度 非常慢。 而且, 可能会出现联网的电子设备越多, 电子设备中唤醒响应较慢的电子设备也越 多的情况。 另外, 对于协同工作的多个电子设备而言, 如果某些电子设备因反应迟缓而不能 及时被唤醒, 将影响针对整个协同电子设备的处理效率。 如何能在这种情况下发挥优势电 子设备的计算能力, 如果在其他设备还未完成唤醒引擎时, 辅助未唤醒的电子设备进行唤 醒, 这有助于提升多协同电子设备的。

22、整体唤醒响应速度, 提升用户使用体验。 遗憾的是, 目 前尚无相关技术可供参考。 发明内容 0003 本公开提供一种设备的唤醒方法及装置、 电子设备、 存储介质。 0004 根据本公开实施例的第一方面, 提供一种设备的唤醒方法, 应用于第一电子设备 中, 所述方法包括: 0005 接收来自第二电子设备的唤醒消息, 确定当前状态为未唤醒状态时, 获取本地采 集的语音数据; 0006 对所述语音数据进行梅尔频率倒谱系数提取, 获取所述语音数据的第一梅尔频率 倒谱系数; 0007 从所述唤醒消息中解析所述唤醒消息中携带的第二梅尔频率倒谱系数; 0008 将所述第一梅尔频率倒谱系数与所述第二梅尔频率倒。

23、谱系数进行匹配, 确定所述 第一梅尔频率倒谱系数和所述第二梅尔频率倒谱系数之间的差异小于或小于等于设定阈 值时, 生成唤醒指令; 0009 响应于所述唤醒指令, 唤醒所述第一电子设备。 0010 可选的, 所述对所述语音数据进行梅尔频率倒谱系数提取, 获取所述语音数据的 第一梅尔频率倒谱系数, 包括: 0011 对所述语音数据中的高频部分进行补偿, 提升所述高频部分的分辨率; 0012 以设定时长将补偿后的所述语音数据划分为语音数据段; 0013 将所述语音数据段与设定的汉明Hamming窗函数相乘, 形成加窗的语音数据段; 0014 对所述加窗的语音数据段进行傅里叶变换, 得到所述加窗的语音。

24、数据段的频谱; 0015 将所述频谱通过由T个三角形带通滤波器组成的梅尔刻度滤波器进行滤波, 对滤 说明书 1/15 页 6 CN 111724780 A 6 波后的频谱取对数, 求出每一个输出的对数能量; 其中, T的取值范围为20至30; 0016 对所述对数进行离散余弦变换, 得到所述第一梅尔频率倒谱系数。 0017 可选的, 所述以设定时长将补偿后的所述语音数据划分为语音数据段, 包括: 0018 以第一设定时长将补偿后的所述语音数据划分多个语音数据段, 所述多个语音数 据段中相邻的第一语音数据段和第二语音数据段中具有第二设定时长的重叠语音段; 其 中, 所述第二设定时长与所述第一设定。

25、时长之比的取值范围为1/3至2/3。 0019 可选的, 所述将所述第一梅尔频率倒谱系数与所述第二梅尔频率倒谱系数进行匹 配, 确定所述第一梅尔频率倒谱系数和所述第二梅尔频率倒谱系数之间的差异小于或小于 等于设定阈值, 包括: 0020 所述第一梅尔频率倒谱系数形成为序号1至n的第一时间序列; 所述第二梅尔频率 倒谱系数形成为序号1至m的第二时间序列, 以(1, m)或(1, n)为原点, 将所述第一时间序列 和所述第二时间序列构成二维坐标系; m和n为大于1的自然数; 0021 对于所述二维坐标系中的位置(i,j)的最小累计距离D(i,j), 则有D(i,j)dij+ minD(i-1,j)。

26、,D(i,j-1),D(i-1,j-1), 其中, D(i-1,j)表示所述二维坐标系中的位置(i- 1,j)的最小累计距离, D(i,j-1)表示所述二维坐标系中的位置(i,j-1)的最小累计距离, D (i-1,j-1)表示所述二维坐标系中的位置(i-1,j-1)的最小累计距离; 0022 以D(i,j)的最小累计距离表征方式确定所述二维坐标系中的位置(m,n)的最小累 计距离D(m,n), 当D(m,n)小于或小于等于第一设定阈值时, 确定所述第一梅尔频率倒谱系 数和所述第二梅尔频率倒谱系数之间的差异小于或小于等于设定阈值。 0023 可选的, 所述方法还包括: 0024 接收到来自所述。

27、第二电子设备的消息, 在所述消息中携带有唤醒标识时, 确定所 述消息为唤醒消息; 0025 确定当前状态为唤醒状态时, 丢弃或屏蔽所述唤醒消息。 0026 可选的, 在生成唤醒指令后, 所述方法还包括: 0027 确定当前基于所述语音数据的唤醒机制是否已启动, 启动时关闭当前基于所述语 音数据的唤醒机制, 未启动时屏蔽当前基于所述语音数据的唤醒机制。 0028 根据本公开实施例的第二方面, 提供一种电子设备的唤醒方法, 应用于第二电子 设备中, 所述方法包括: 0029 采集语音数据, 对所述语音数据进行识别, 生成识别语音信息; 0030 将所述识别语音信息在语音指令数据库中进行匹配; 00。

28、31 确定所述识别语音信息与唤醒指令匹配时, 调用所述唤醒指令, 唤醒所述电子设 备, 对所述语音数据进行梅尔频率倒谱系数提取, 获取所述语音数据的梅尔频率倒谱系数; 0032 生成唤醒消息, 并通过通信接口广播所述唤醒消息, 其中, 所述唤醒消息中承载有 所述梅尔频率倒谱系数。 0033 可选的, 所述对所述语音数据进行梅尔频率倒谱系数提取, 获取所述语音数据的 梅尔频率倒谱系数, 包括: 0034 对所述语音数据中的高频部分进行补偿, 提升所述高频部分的分辨率; 0035 以设定时长将补偿后的所述语音数据划分为语音数据段; 0036 将所述语音数据段与设定的汉明Hamming窗函数相乘, 。

29、形成加窗的语音数据段; 说明书 2/15 页 7 CN 111724780 A 7 0037 对所述加窗的语音数据段进行傅里叶变换, 得到所述加窗的语音数据段的频谱; 0038 将所述频谱通过由T个三角形带通滤波器组成的梅尔刻度滤波器进行滤波, 对滤 波后的频谱取对数, 求出每一个输出的对数能量; 其中, T的取值范围为20至30; 0039 对所述对数进行离散余弦变换, 得到所述梅尔频率倒谱系数。 0040 可选的, 所述以设定时长将补偿后的所述语音数据划分为语音数据段, 包括: 0041 以第一设定时长将补偿后的所述语音数据划分多个语音数据段, 所述多个语音数 据段中相邻的第一语音数据段和。

30、第二语音数据段中具有第二设定时长的重叠语音段; 其 中, 所述第二设定时长与所述第一设定时长之比的取值范围为1/3至2/3。 0042 可选的, 所述确定所述识别语音信息与唤醒指令匹配之后, 所述方法还包括: 0043 确定当前状态为唤醒状态时, 丢弃所述识别语音信息, 不调用所述唤醒指令。 0044 根据本公开实施例的第三方面, 提供一种电子设备的唤醒装置, 配置于第一电子 设备中, 所述装置包括: 0045 接收单元, 用于接收来自第二电子设备的唤醒消息; 0046 获取单元, 用于在当前状态为未唤醒状态时, 获取本地采集的语音数据; 0047 提取单元, 用于对所述语音数据进行梅尔频率倒。

31、谱系数提取, 获取所述语音数据 的第一梅尔频率倒谱系数; 0048 解析单元, 用于从所述唤醒消息中解析所述唤醒消息中携带的第二梅尔频率倒谱 系数; 0049 匹配单元, 用于将所述第一梅尔频率倒谱系数与所述第二梅尔频率倒谱系数进行 匹配, 确定所述第一梅尔频率倒谱系数和所述第二梅尔频率倒谱系数之间的差异小于或小 于等于设定阈值时, 触发生成单元; 0050 生成单元, 用于生成唤醒指令; 0051 唤醒单元, 用于响应于所述唤醒指令, 唤醒所述第一电子设备。 0052 可选的, 所述提取单元包括: 0053 补偿子单元, 用于对所述语音数据中的高频部分进行补偿, 提升所述高频部分的 分辨率;。

32、 0054 划分子单元, 用于以设定时长将补偿后的所述语音数据划分为语音数据段; 0055 加窗子单元, 用于将所述语音数据段与设定的Hamming窗函数相乘, 形成加窗的语 音数据段; 0056 傅里叶变换子单元, 用于对所述加窗的语音数据段进行傅里叶变换, 得到所述加 窗的语音数据段的频谱; 0057 梅尔滤波子单元, 用于将所述频谱通过由T个三角形带通滤波器组成的梅尔刻度 滤波器进行滤波, 对滤波后的频谱取对数, 求出每一个输出的对数能量; 其中, T的取值范围 为20至30; 0058 余弦变换子单元, 用于对所述对数进行离散余弦变换, 得到所述第一梅尔频率倒 谱系数。 0059 可选。

33、的, 所述划分子单元, 还用于以第一设定时长将补偿后的所述语音数据划分 多个语音数据段, 所述多个语音数据段中相邻的第一语音数据段和第二语音数据段中具有 第二设定时长的重叠语音段; 其中, 所述第二设定时长与所述第一设定时长之比的取值范 说明书 3/15 页 8 CN 111724780 A 8 围为1/3至2/3。 0060 可选的, 所述匹配单元, 还用于: 0061 所述第一梅尔频率倒谱系数形成为序号1至n的第一时间序列; 所述第二梅尔频率 倒谱系数形成为序号1至m的第二时间序列, 以(1, m)或(1, n)为原点, 将所述第一时间序列 和所述第二时间序列构成二维坐标系; m和n为大于。

34、1的自然数; 0062 对于所述二维坐标系中的位置(i,j)的最小累计距离D(i,j), 则有D(i,j)dij+ minD(i-1,j),D(i,j-1),D(i-1,j-1), 其中, D(i-1,j)表示所述二维坐标系中的位置(i- 1,j)的最小累计距离, D(i,j-1)表示所述二维坐标系中的位置(i,j-1)的最小累计距离, D (i-1,j-1)表示所述二维坐标系中的位置(i-1,j-1)的最小累计距离; 0063 以D(i,j)的最小累计距离表征方式确定所述二维坐标系中的位置(m,n)的最小累 计距离D(m,n), 当D(m,n)小于或小于等于第一设定阈值时, 确定所述第一梅尔。

35、频率倒谱系 数和所述第二梅尔频率倒谱系数之间的差异小于或小于等于设定阈值。 0064 可选的, 所述装置还包括: 0065 确定单元, 用于在所述接收单元接收到来自所述第二电子设备的消息, 在所述消 息中携带有唤醒标识时, 确定所述消息为唤醒消息; 0066 确定当前状态为唤醒状态时, 丢弃或屏蔽所述唤醒消息。 0067 可选的, 所述装置还包括: 0068 执行单元, 用于确定当前基于所述语音数据的唤醒机制是否已启动, 启动时关闭 当前基于所述语音数据的唤醒机制, 未启动时屏蔽当前基于所述语音数据的唤醒机制。 0069 根据本公开实施例的第四方面, 提供一种电子设备的唤醒装置, 配置于第二电。

36、子 设备中, 所述装置包括: 0070 采集单元, 用于采集语音数据; 0071 识别单元, 用于对所述语音数据进行识别, 生成识别语音信息; 0072 匹配单元, 用于将所述识别语音信息在语音指令数据库中进行匹配, 确定所述识 别语音信息与唤醒指令匹配时, 触发执行单元; 0073 执行单元, 用于调用所述唤醒指令, 唤醒所述电子设备; 0074 提取单元, 用于对所述语音数据进行梅尔频率倒谱系数提取, 获取所述语音数据 的梅尔频率倒谱系数; 0075 生成单元, 用于生成唤醒消息; 其中, 所述唤醒消息中承载有所述梅尔频率倒谱系 数; 0076 广播单元, 用于通过通信接口广播所述唤醒消息。

37、。 0077 可选的, 所述提取单元包括: 0078 补偿子单元, 用于对所述语音数据中的高频部分进行补偿, 提升所述高频部分的 分辨率; 0079 划分子单元, 用于以设定时长将补偿后的所述语音数据划分为语音数据段; 0080 加窗子单元, 用于将所述语音数据段与设定的Hamming窗函数相乘, 形成加窗的语 音数据段; 0081 傅里叶变换子单元, 用于对所述加窗的语音数据段进行傅里叶变换, 得到所述加 窗的语音数据段的频谱; 说明书 4/15 页 9 CN 111724780 A 9 0082 梅尔滤波子单元, 用于将所述频谱通过由T个三角形带通滤波器组成的梅尔刻度 滤波器进行滤波, 对。

38、滤波后的频谱取对数, 求出每一个输出的对数能量; 其中, T的取值范围 为20至30; 0083 余弦变换子单元, 用于对所述对数进行离散余弦变换, 得到所述梅尔频率倒谱系 数。 0084 可选的, 所述划分子单元, 还用于以第一设定时长将补偿后的所述语音数据划分 多个语音数据段, 所述多个语音数据段中相邻的第一语音数据段和第二语音数据段中具有 第二设定时长的重叠语音段; 其中, 所述第二设定时长与所述第一设定时长之比的取值范 围为1/3至2/3。 0085 可选的, 所述执行单元, 还用于在所述匹配单元确定所述识别语音信息与唤醒指 令匹配, 当前状态为唤醒状态时, 丢弃所述识别语音信息, 不。

39、调用所述唤醒指令。 0086 根据本公开实施例的第五方面, 提供一种电子设备, 包括: 处理器和用于存储处理 器可执行指令的存储器, 其中, 所述处理器被配置为在调用存储器中的可执行指令时, 能够 执行上述的设备的唤醒方法。 0087 根据本公开实施例的第六方面, 提供一种非临时性计算机可读存储介质, 当所述 存储介质中的指令由电子设备的处理器执行时, 使得电子设备能够执行上述的设备的唤醒 方法。 0088 本公开的实施例提供的技术方案可以包括以下有益效果: 0089 在本公开的实施例中, 当电子设备接收到唤醒语音指令后, 计算能力较强的电子 设备将率先被唤醒, 此时, 被唤醒的电子设备将通过。

40、广播方式向其他电子设备发送唤醒消 息, 所广播的唤醒消息中携带有基于语音指令的梅尔频率倒谱系数, 而接收到语音指令由 于处理能力较慢的电子设备接收到唤醒消息时, 直接基于唤醒消息进行唤醒, 而不再执行 基于语音指令的唤醒机制, 而由于基于唤醒消息的处理复杂度较低, 接收到唤醒消息后通 过基于本地接收的语音数据进行梅尔频率倒谱系数提取, 再进行匹配, 即可决定是否执行 唤醒机制, 因此, 本公开实施例可以通过语音指令响应速度快的电子设备来唤醒其他电子 设备, 使处理速度较慢的电子设备不必再响应于语音指令进行唤醒, 而直接通过其他电子 设备发送的唤醒消息进行唤醒, 提升了电子设备整体唤醒的效率, 。

41、特别对于协同工作的电 子设备而言, 有助于提升协同工作的电子设备整体的唤醒效率。 本公开实施例适用于智能 家居等多电子设备组网场景下差异化的多设备预唤醒和预决策, 不需要等待设备自身唤醒 引擎工作后再做决策, 大大的改善了计算能力差、 网络延时大设备决策较慢的问题, 显著提 升用户体验。 0090 应当理解的是, 以上的一般描述和后文的细节描述仅是示例性和解释性的, 并不 能限制本公开。 附图说明 0091 此处的附图被并入说明书中并构成本说明书的一部分, 示出了符合本公开的实施 例, 并与说明书一起用于解释本公开的原理。 0092 图1为本公开实施例示出的一种设备的唤醒方法流程示意图。 00。

42、93 图2为本公开实施例示出的一种语音数据的梅尔频率倒谱系数提取流程示意图。 说明书 5/15 页 10 CN 111724780 A 10 0094 图3为本公开实施例示出的一种梅尔刻度滤波器滤波的示意图。 0095 图4为本公开实施例示出的一种两序列相似度的衡量方法的示意图。 0096 图5为本公开实施例示出的序列A的时刻i和序列B的时刻j的距离的示意图。 0097 图6为本公开实施例示出的另一种设备的唤醒方法流程示意图。 0098 图7为本公开实施例示出的一种设备的唤醒装置的组成结构示意图。 0099 图8为本公开实施例示出的另一种设备的唤醒装置的组成结构示意图。 0100 图9为本公开。

43、实施例示出的电子设备的框图。 具体实施方式 0101 这里将详细地对示例性实施例进行说明, 其示例表示在附图中。 下面的描述涉及 附图时, 除非另有表示, 不同附图中的相同数字表示相同或相似的要素。 以下示例性实施例 中所描述的实施方式并不代表与本公开相一致的所有实施方式。 相反, 它们仅是与如所附 权利要求书中所详述的、 本公开的一些方面相一致的装置和方法的例子。 0102 图1为本公开实施例示出的一种设备的唤醒方法流程示意图, 如图1所示, 本公开 实施例的设备的唤醒方法应用于第一电子设备中, 所述方法包括以下步骤: 0103 S11、 接收来自第二电子设备的唤醒消息, 确定当前状态为未唤。

44、醒状态时, 获取本 地采集的语音数据。 0104 本公开的实施例的设备的唤醒方法, 适用于以互联网组网、 以局域网组网、 以物联 网组网或以近场通信组网的电子设备群组如智能家居、 车联网终端、 智能抄表终端等。 通过 物联网技术将家中的各种电子设备连接到一起, 如音视频设备、 照明系统、 窗帘控制、 空调 控制、 安防系统、 数字影院系统等。 用以提供家电控制、 照明控制、 窗帘控制、 电话远程控制、 室内外遥控、 防盗报警、 环境监测、 暖通控制、 红外转发以及可编程定时控制等多种功能和 手段。 一些家居设备支持语音唤醒功能, 当用户需要开启处于休眠状态的家居设备时, 向家 居设备喊出唤醒语。

45、音, 家居设备接收到唤醒语音, 对唤醒语音进行识别, 并在本地进行语音 指令的匹配, 匹配成功后开启自身的操作系统, 以进行唤醒。 然而, 对于很多家居设备而言, 特别是空调、 冰箱等, 由于自身的处理能力不足, 响应唤醒语音时的处理时长较长, 会导致 这些家居设备的唤醒启动较慢。 而对于家庭影院等家居设备, 如智能音箱设备、 智能电视机 等, 由于其处理能力强大, 响应速度非常快, 能快速识别出唤醒语音并执行唤醒操作。 本公 开实施例利用响应较快的第二电子设备作为本公开实施例的唤醒传达设备, 通过响应较快 的第二电子设备去唤醒还处于语音唤醒准备阶段的第一电子设备, 使整个电子设备群组整 体唤。

46、醒效率大大提升。 0105 本公开的实施例中, 第一电子设备是指组网电子设备中的唤醒响应机制处理较慢 的电子设备, 第二电子设备是指组网电子设备中的唤醒响应机制处理较快的电子设备, 其 中的 “第一” 、“第二” 只是泛指, 并非是限定电子设备类型或属性。 0106 本公开实施例不仅适用于智能家居场景, 也适用于其他电子设备群组中, 如以物 联网组网的电子设备群组, 如智能停车管理系统中的各种检测传感器、 智能摄像电子设备 群组等应用场景中。 0107 本公开实施例中, 当第一电子设备接收到第二电子设备发送的消息后, 首先确定 所接收的消息是否为唤醒消息。 例如, 通过解析消息中的标识位来确定。

47、该消息是否为唤醒 说明书 6/15 页 11 CN 111724780 A 11 消息, 若设定标识位携带有唤醒标识, 确定所述消息为唤醒消息; 或者, 通过解析消息中是 否携带梅尔频率倒谱系数(MFCC, Mel-Frequency Cepstral Coefficients), 来判断所接收 消息是否为唤醒消息。 本公开实施例中, 当所接收到的消息中携带有MFCC时, 确定所述消息 为唤醒消息, 否则不是唤醒消息。 0108 当电子设备接收到唤醒消息时, 还需要确定自身的当前状态, 若处于非唤醒状态, 则响应该唤醒消息, 执行唤醒操作。 若确定当前状态已经处于唤醒状态, 则丢弃或屏蔽所述 。

48、唤醒消息。 0109 S12、 对所述语音数据进行梅尔频率倒谱系数提取, 获取所述语音数据的第一梅尔 频率倒谱系数。 0110 当第一电子设备确定接收到第二电子设备发送的唤醒消息, 而第一电子设备尚处 于非唤醒状态时, 获取本地语音采集单元如麦克等采集到的语音数据。 该语音数据可能即 是语音唤醒指令, 但由于电子设备的处理能力较差, 尚未响应于该语音指令进行唤醒。 此 时, 提取该可能的语音指令的梅尔频率倒谱系数, 以确定是否启动其他的唤醒触发机制。 0111 图2为本公开实施例示出的对语音数据的梅尔频率倒谱系数提取流程示意图。 如 图2所示, 本公开实施例的语音数据的梅尔频率倒谱系数提取流程。

49、包括预加重处理、 分帧及 加窗处理、 傅里叶变换处理、 梅尔滤波组滤波处理、 对数运算处理及离散余弦变换(DCT, Discrete Cosine Transform)处理等。 以下详细说明各处理过程中的具体处理方式。 0112 在本公开实施例中, 首先对语音数据首先进行预加重处理, 其实质是将语音信号 通过一个高通滤波器, 高通滤波器的数学表达式如下: 0113 H(Z)1- z-1 (1) 0114 式(1)中, Z表示语音数据, H(Z)表示预加重处理后的语音数据; 的值介于0.9-1.0 之间, 本公开实施例中取0.97。 当然, 也可以取其他值如0.93、 0.95、 0.94、 0。

50、.99等。 预加重处 理的目的是提升语音数据中的高频部分的分辨率, 使信号的频谱变得平坦, 保持在低频到 高频的整个频带中, 能用同样的信噪比求频谱。 同时, 也是为了补偿语音信号受到发音系统 所抑制的高频部分, 突出高频的共振峰。 0115 在本公开的实施例中, 以设定时长将补偿后的所述语音数据划分为语音数据段。 为了方便对语音数据进行分析, 将语音分成一个个小语音数据段, 也可以称之为帧。 先将P 个采样点集合成一个观测单位, 称为帧。 通常情况下P的值为256或512, 涵盖的时间约为20 至30ms左右。 为了避免相邻两帧的变化过大, 在对语音数据进行分段时, 让两相邻语音数据 段(帧。

展开阅读全文
内容关键字: 设备 唤醒 方法 装置 电子设备 存储 介质
关于本文
本文标题:设备的唤醒方法及装置、电子设备、存储介质.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10333371.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1