《语音转换设备及其用于转换用户语音的方法.pdf》由会员分享,可在线阅读,更多相关《语音转换设备及其用于转换用户语音的方法.pdf(14页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103730122 A (43)申请公布日 2014.04.16 CN 103730122 A (21)申请号 201310478928.6 (22)申请日 2013.10.14 10-2012-0113629 2012.10.12 KR 10-2013-0111209 2013.09.16 KR 61/774,733 2013.03.08 US G10L 21/003(2013.01) G10L 25/60(2013.01) (71)申请人 三星电子株式会社 地址 韩国京畿道水原市 (72)发明人 柳宗烨 李允宰 金承勋 金荣泰 (74)专利代理机构 北京铭硕知识产。
2、权代理有限 公司 11286 代理人 韩明星 刘灿强 (54) 发明名称 语音转换设备及其用于转换用户语音的方法 (57) 摘要 提供了一种语音转换设备及其用于转换用户 语音的方法。所述语音转换设备的语音转换方法 包括 : 在电话通话期间接收对方的语音 ; 分析对 方语音并确定对方语音是否是异常语音 ; 当确定 对方语音是异常语音时, 通过调整对方语音的谐 波信号来将对方的异常语音转换为正常语音 ; 以 及输出经过转换的正常语音。 (30)优先权数据 (51)Int.Cl. 权利要求书 2 页 说明书 6 页 附图 5 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书。
3、2页 说明书6页 附图5页 (10)申请公布号 CN 103730122 A CN 103730122 A 1/2 页 2 1. 一种语音转换设备的语音转换方法, 包括 : 在电话通话期间接收对方的语音 ; 分析对方语音并确定对方语音是否是异常语音 ; 当确定对方语音是异常语音时, 通过调整对方语音的谐波信号来将对方的异常语音转 换为正常语音 ; 以及 输出经过转换的正常语音。 2. 如权利要求 1 所述的方法, 其中, 确定的步骤包括 : 从对方语音提取语音参数 ; 以及 分析提取的语音参数并确定对方语音是否是异常语音。 3. 如权利要求 2 所述的方法, 其中, 所述语音参数包括对方语音的。
4、音调元素、 对方语音 的谐噪比 (HNR) 、 对方语音的开商和对方语音的 GRBAS 分数中的至少一个。 4. 如权利要求 1 所述的方法, 其中, 转换的步骤包括 : 通过加重对方语音的谐波元素并 消除对方语音的子谐波元素来将异常语音转换为正常语音。 5. 如权利要求 1 所述的方法, 其中, 转换的步骤包括 : 通过在对方语音之中的高频段中产生谐波信号来将异常语音转换为正常语音。 6. 如权利要求 1 所述的方法, 其特征在于将对方语音的异常语音转换为正常语音的功 能根据用户设置而被开启或关闭。 7. 如权利要求 1 所述的方法, 还包括 : 显示用于调整异常语音到正常语音的转换的强度的。
5、用户界面 ; 以及 根据通过所述用户界面输入的用户命令来设置转换强度, 其中, 转换的步骤包括 : 根据设置的转换强度来将异常语音转换为正常语音。 8. 如权利要求 1 所述的方法, 包括 : 当确定对方语音异常时, 存储指示对方语音异常的信息。 9. 如权利要求 8 所述的方法, 其中, 转换的步骤包括 : 当与其信息指示对方的语音异常的对方执行电话通话时, 在不用确定对方语音是否异 常的情况下将对方语音转换为正常语音。 10. 如权利要求 1 所述的方法, 包括 : 当确定对方语音是正常语音时, 立即输出对方语音。 11. 一种语音转换设备, 包括 : 语音接收器, 被配置为在电话通话期间。
6、接收对方的语音 ; 异常语音确定器, 被配置为分析对方语音并确定对方语音是否是异常语音 ; 正常语音转换器, 被配置为当确定对方语音是异常语音时, 通过调整对方语音的谐波 信号来将对方的异常语音转换为正常语音 ; 以及 语音输出单元, 被配置为输出经过转换的正常语音。 12. 如权利要求 11 所述的设备, 其中, 所述异常语音确定器包括 : 参数提取器, 被配置为从对方语音提取语音参数 ; 以及 参数分析器, 被配置为分析提取的语音参数并确定对方语音是否是异常语音。 13. 如权利要求 12 所述的设备, 其中, 所述语音参数包括对方语音的音调元素、 对方语 音的谐噪比 (HNR) 、 对方。
7、语音的开商和对方语音的 GRBAS 分数中的至少一个。 权 利 要 求 书 CN 103730122 A 2 2/2 页 3 14. 如权利要求 11 所述的设备, 其中, 所述正常语音转换器通过加重对方语音的谐波 元素并消除对方语音的子谐波元素来将异常语音转换为正常语音。 15. 如权利要求 11 所述的设备, 其中, 所述正常语音转换器通过在对方语音之中的高 频段中产生谐波信号来将异常语音转换为正常语音。 权 利 要 求 书 CN 103730122 A 3 1/6 页 4 语音转换设备及其用于转换用户语音的方法 0001 本申请要求于 2012 年 10 月 12 日提交到韩国知识产权局。
8、的第 10-2012-0113629 号韩国专利申请、 2013年9月16日提交到韩国知识产权局的第10-2013-0111209号韩国专 利申请以及 2013 年 3 月 8 日提交到美国专利商标局的第 61/774,733 号美国临时申请的优 先权, 所述申请的公开通过引用合并于此。 技术领域 0002 示例性实施例的多个方面涉及一种语音转换设备及其用于转换用户语音的方法, 更具体地讲, 涉及一种在电话通话期间分析对方的语音, 将对方的异常语音转换为正常语 音并输出所述语音的语音转换设备及其用于转换用户语音的方法。 背景技术 0003 最近, 由于空气污染的增加、 有限空间中的活动以及移动。
9、电话的使用, 许多人遭受 喉痛并且感到他们语音的变化。当由于各种原因伤害到咽喉时, 人的语音异常改变。此外, 一些人天生具有异常的语音。 0004 这种不能被正确地识别出的异常语音可能不仅干扰与他人的顺畅会话, 还造成不 适甚至是误解。 0005 具体地讲, 当在通过通信终端 (例如, 有线电话、 无线电话等) 执行的电话通话期间 听到异常语音时, 用户可能不能正确地识别该语音, 有时可能不能继续通过电话继续进行 会话。 0006 因此, 需要一种允许用户与具有异常语音的对方进行顺畅的电话会话的方法。 发明内容 0007 示例性实施例的一方面涉及一种语音转换设备及其用于转换用户语音的方法, 其。
10、 中, 所述语音转换设备确定电话通话期间的对方的语音是否异常, 并且当确定语音异常时, 通过调整来自对方的语音的谐波信号来将异常语音转换为正常语音, 并提供所述正常语 音。 0008 根据示例性实施例的语音转换设备的语音转换方法包括 : 在电话通话期间接收 对方的语音 ; 分析对方语音并确定对方语音是否是异常语音 ; 当确定对方语音是异常语音 时, 通过调整对方语音的谐波信号来将对方的异常语音转换为正常语音 ; 以及输出经过转 换的正常语音。 0009 确定的步骤可包括 : 从对方语音提取语音参数 ; 以及分析提取的语音参数并确定 对方语音是否是异常语音。 0010 所述语音参数可包括对方语音。
11、的音调元素、 对方语音的谐噪比 (HNR) 、 对方语音的 开商和对方语音的 GRBAS 分数中的至少一个。 0011 转换的步骤可包括 : 通过加重对方语音的谐波元素并消除对方语音的子谐波元素 来将异常语音转换为正常语音。 说 明 书 CN 103730122 A 4 2/6 页 5 0012 转换的步骤可包括 : 通过在对方语音之中的高频段中产生谐波信号来将异常语音 转换为正常语音。 0013 将对方语音的异常语音转换为正常语音的功能可根据用户设置而被开启或关闭。 0014 所述方法还可包括 : 显示用于调整异常语音到正常语音的转换的强度的用户界 面, 以及根据通过所述用户界面输入的用户命。
12、令来设置转换强度, 转换的步骤可包括 : 根据 设置的转换强度来将异常语音转换为正常语音。 0015 所述方法可包括 : 当确定对方语音异常时, 存储指示对方语音异常的信息。 0016 转换的步骤可包括 : 当与其信息指示对方的语音异常的对方执行电话通话时, 在 不用确定对方语音是否异常的情况下将对方语音转换为正常语音。 0017 所述方法可包括 : 当确定对方语音是正常语音时, 立即输出对方语音。 0018 根据示例性实施例的语音转换设备包括 : 语音接收器, 被配置为在电话通话期间 接收对方的语音 ; 异常语音确定器, 被配置为分析对方语音并确定对方语音是否是异常语 音 ; 正常语音转换器。
13、, 被配置为当确定对方语音是异常语音时, 通过调整对方语音的谐波信 号来将对方的异常语音转换为正常语音 ; 以及语音输出单元, 被配置为输出经过转换的正 常语音。 0019 所述异常语音确定器可包括 : 参数提取器, 被配置为从对方语音提取语音参数 ; 以及参数分析器, 被配置为分析提取的语音参数并确定对方语音是否是异常语音。 0020 所述语音参数可包括对方语音的音调元素、 对方语音的谐噪比 (HNR) 、 对方语音的 开商和对方语音的 GRBAS 分数中的至少一个。 0021 所述正常语音转换器可通过加重对方语音的谐波元素并消除对方语音的子谐波 元素来将异常语音转换为正常语音。 0022 。
14、所述正常语音转换器可通过在对方语音之中的高频段中产生谐波信号来将异常 语音转换为正常语音。 0023 所述设备还可包括 : 输入单元, 被配置为接收用户命令, 并且将对方语音的异常语 音转换为正常语音的功能可根据通过所述输入单元输入的用户命令而被开启或关闭。 0024 所述设备还可包括 : 显示器, 被配置为显示用于调整异常语音到正常语音的转换 的强度的用户界面, 正常语音转换器可依据根据通过所述用户界面输入的用户命令而设置 的转换强度来将异常语音转换为正常语音。 0025 所述设备可包括 : 存储器, 被配置为当确定对方语音异常时, 存储指示对方语音异 常的信息。 0026 当与其信息指示对。
15、方的语音异常的对方执行电话通话时, 所述正常语音转换器可 在不用确定对方语音是否异常的情况下将对方语音转换为正常语音。 0027 当确定对方语音是正常语音时, 所述语音输出单元可立即输出对方语音。 附图说明 0028 通过参照附图描述本发明构思的特定示例性实施例, 本发明构思的上述和 / 或其 他方面将更加清楚, 其中 : 0029 图 1 是示出根据示例性实施例的语音转换设备的配置的框图 ; 0030 图 2 是示出根据示例性实施例的异常语音确定器的配置的框图 ; 说 明 书 CN 103730122 A 5 3/6 页 6 0031 图3A至图3C是被提供用于解释根据各种示例性实施例的具有。
16、异常语音的语音参 数的示图 ; 0032 图4A至图4B是被提供用于解释根据各种示例性实施例的用于将异常语音转换为 正常语音的方法的示图 ; 0033 图 5 是示出根据示例性实施例的用于调整转换强度的用户界面的示图 ; 0034 图 6 是被提供用于解释根据示例性实施例的用于转换语音的方法的流程图。 具体实施方式 0035 应看到, 所述方法步骤和系统组件在图中已通过常规符号被呈现, 为了理解本公 开, 仅示出相关的特定细节。 此外, 对于本领域普通技术人员而言可能显而易见的细节可能 未被公开。在本公开中, 诸如第一和第二等的相关术语可被用于将一个实体与另一实体进 行区分, 而不是必然意味着。
17、这样的实体之间的任何实际关系或顺序。 0036 图1是示出根据示例性实施例的语音转换设备100的配置的框图。 如图1中所示, 语音转换设备 100 包括语音接收器 110、 异常语音确定器 120、 正常语音转换器 130、 语音输 出单元 140、 存储器 150、 输入单元 160 和显示器 170。根据示例性实施例的语音转换设备 100可以是智能电话, 但不限于此。 语音转换设备100可被实现为具有电话通话功能的各种 设备, 诸如有线电话、 个人数字助理 (PDA) 、 平板 PC、 智能电视机等等。 0037 语音接收器 110 接收对方的语音信号。具体地讲, 语音接收器 110 可在。
18、电话通话 (例如, 语音通话、 视频通话等) 期间接收对方的语音信号。 0038 异常语音确定器 120 分析对方的语音信号并确定对方的语音是异常还是正常。将 参照图 2 详细描述异常语音确定器 120。 0039 如图 2 中所示, 根据示例性实施例的异常语音确定器 120 可包括参数提取器 121 和参数分析器 123。 0040 参数提取器 121 可提取接收的对方的语音的语音参数。在这种情况下, 语音参 数可包括对方语音的音调元素、 对方语音的谐噪比 (HNR) 、 对方语音的开商和对方语音的 GRBAS 分数中的至少一个。 0041 具体地讲, 对方语音的音调元素表示对方的声带的振动。
19、频率, 并被用于检测异常 振动。对方语音的谐噪比 (HNR) 表示对方语音的谐波对噪声比率, 并被用于根据噪声比率 来确定语音是否异常。 对方语音的开商是关于在声带的振动期间声带打开时的时间的比率 的参数, 并可从第一谐波信号和第二谐波信号的能量比来推断。对方语音的 GRBAS 分数是 用于确定异常语音的特征的算法, 并且包括关于 G(等级, 整体印象) 、 R(粗糙度, 粗糙的声 音和声带的不规则振动) 、 B(呼吸) 、 A(虚弱) 和 S(语调) 的 0 3 的分数。 0042 参数分析器123可分析由参数提取器121提取的语音参数并确定对方的语音是否 异常。 0043 具体地讲, 如果。
20、语音参数是对方语音的音调元素, 则参数分析器 123 可通过分析 对方语音的音调元素来监视是否产生了子谐波元素。更具体地讲, 当语音参数是对方语音 的音调元素时, 参数分析器 123 可分析对方语音的音调元素并监视是否出现子谐波元素。 更具体地讲, 如图3A的区域310中所示, 当在两个谐波元素之间产生了子谐波信号时, 如果 存在被推断为是噪声元素的较强子谐波元素, 则参数分析器 123 可确定子谐波信号是异常 说 明 书 CN 103730122 A 6 4/6 页 7 语音。在这种情况下, 对方语音的音调元素由于子谐波信号而被改变, 因此, 如果音调是正 常语音两倍以上, 则参数分析器 1。
21、23 可将对方语音确定为异常语音。 0044 可选择地, 如果语音参数是谐噪比, 则参数分析器 123 确定谐噪比是否高于预定 值。具体地讲, 如图 3B 的左区域中所示, 当谐噪比高于预定值时, 参数分析器 123 可确定对 方语音为正常信号, 但是如图 3B 的右区域中所示, 当谐噪比低于预定值时, 参数分析器 123 可确定对方语音为异常语音。同时, 如图 3B 中所示, 在高频段, 谐噪比在正常语音和异常语 音之间可具有较大差别, 因此, 参数分析器 123 可确定高于预定频段的频段中的谐噪比, 并 确定它是正常语音还是异常语音。 0045 如果语音参数是开商, 则参数分析器 123 。
22、可计算第一谐波信号元素和第二谐波信 号元素的能量比, 并确定对方语音是正常还是异常。 具体地讲, 如果开商在预定范围 (例如, 0.4 0.6) 内, 则参数分析器 123 可确定对方语音正常。例如, 当如图 3C 的中间的曲线中 所示, 开商被计算为 0.5 时, 参数分析器 123 可确定对方语音正常。然而, 当开商在所述预 定范围以外时, 参数分析器 123 可确定对方语音异常。也就是说, 如果开商过大或过小, 则 对方语音很可能是震耳欲聋的或是干涩的语音, 参数分析器 123 可确定对方语音异常。例 如, 如果如图 3C 的左侧曲线中所示, 开商 (0.7) 高于预定范围或者开商 (0。
23、.3) 低于预定范 围, 则参数分析器 123 可确定对方语音异常。 0046 此外, 如果语音参数是 GRBAS 分数, 并且 G(等级, 整体印象) 、 R(粗糙度, 粗糙的声 音和声带的不规则振动) 、 B(呼吸) 、 A(虚弱) 和 S(语调) 中的至少一个高于预定值, 则参 数分析器 123 可确定对方语音异常。 0047 同时, 上述语音参数仅是示例, 可基于其他语音参数确定对方语音是否异常。 0048 当确定对方语音异常时, 异常语音确定器 120 可将对方语音输出到正常语音转换 器 130, 当确定对方语音正常时, 异常语音确定器 120 可将对方语音输出到语音输出单元 140。
24、。 0049 如果接收到语音被确定为异常的对方的语音信号, 则正常语音转换器 130 将对方 语音转换为正常语音。具体地讲, 正常语音转换器 130 可通过调整对方语音的谐波元素来 将异常语音转换为正常语音。 0050 具体地讲, 被确定为异常的对方语音可包括如图4A的区域410中所示的弱谐波信 号, 或者可包括如图 4A 的区域 420 中所示的谐波信号之间被确定为噪声元素的子谐波信 号。因此, 正常语音转换器 130 可加重如图 4A 的区域 430 中所示的弱谐波信号元素, 或者 可消除如图 4A 的区域 440 中所示的谐波信号之间的子谐波信号。 0051 此外, 被确定为异常的对方语。
25、音可不包括如图 4B 的区域 450 中所示的谐波信号。 因此, 正常语音转换器 130 可使用如图 4B 的区域 460 中所示的谐波产生滤波器来产生谐波 信号。 0052 也就是说, 如上所述, 正常语音转换器 130 可通过产生或加重谐波元素或者通过 消除子谐波元素来将异常语音转换为正常语音。 0053 在这种情况下, 正常语音转换器 130 可根据通过用户界面输入的用户命令来调整 设置的转换强度, 其中, 所述用户界面用于调整用于将异常语音转换为正常语音的转换强 度。 具体地讲, 如图5中所示, 如果通过用于调整语音转换强度的UI500调整语音转换强度, 则正常语音转换器 130 可根。
26、据调整的语音转换强度来将异常语音转换为正常语音。例如, 说 明 书 CN 103730122 A 7 5/6 页 8 语音转换强度越强, 正常语音转换器130可加重谐波信号越多, 并且正常语音转换器130可 更完全地消除子谐波信号。另一方面, 语音转换强度越弱, 正常语音转换器 130 可加重谐波 信号越少, 并且正常语音转换器 130 可能不能完全消除子谐波信号, 而是, 可能将子谐波信 号降低至预定比率。 0054 此外, 正常语音转换器 130 可仅将异常语音的部分特征转换为正常语音。例如, 正 常语音转换器 130 可仅消除子谐波元素, 同时保持谐波元素, 或者可仅加重谐波元素, 同时。
27、 保持子谐波元素。 0055 也就是说, 通过根据用户输入设置转换强度和方法, 用户可将对方语音转换为正 常语音, 使得语音适合于用户。 0056 同时, 正常语音转换器 130 通过调整对方的谐波元素来将异常语音转换为正常语 音的特点仅是示例, 可使用另一方法将异常语音转换为正常语音。 0057 此外, 正常语音转换器 130 可将对方的经过转换的正常语音输出到语音输出单元 140。 0058 语音输出单元 140 可输出通过异常语音确定器 120 输出的对方语音, 或输出通过 正常语音转换器 130 输出的对方语音。在这种情况下, 语音输出单元 140 可以是扬声器, 但 不限于此。语音输。
28、出单元 140 可被实现为可连接到外部设备的输出终端。 0059 存储器 150 存储用于控制语音转换设备 100 的各种程序和数据。具体地讲, 存储 器 150 可存储用于确定对方语音是正常还是异常的模块。 0060 当确定对方语音异常时, 存储器 150 可存储指示对方语音异常的信息。在这种情 况下, 存储器 150 还可在存储有关于对方的电话号码的信息的地址薄中存储指示语音是否 正常的信息。 0061 然后, 当与存储的信息指示对方的语音异常的对方执行电话通话时, 语音转换设 备 100 可不确定对方的语音是否异常, 而是, 将对方的语音直接转换为正常语音。 0062 输入单元 160 。
29、可接收用于控制语音转换设备 100 的用户命令。具体地讲, 输入单 元 160 可接收用于调整语音转换强度的用户命令、 用于开启 / 关闭将对方的异常语音转换 为正常语音的功能的用户命令等等。 0063 显示器 170 输出图像数据。具体地讲, 如图 5 中所示, 显示器 170 可显示用于调整 语音转换强度的 UI500。 0064 如上所述, 根据语音转换设备 100, 用户甚至可与具有不能被容易识别的异常语音 的对方执行顺畅的电话会话。 0065 同时, 语音转换设备 100 可根据用户设置开启或关闭将对方的异常语音转换为正 常语音的功能 (在下文中, 称为 “语音转换功能” ) 。也就。
30、是说, 如果语音转换功能被开启, 则 语音转换设备 100 可分析对方的语音并将所述语音自动转换为正常语音。然而, 如果语音 转换功能被关闭, 则语音转换设备 100 可能不能分析对方的语音并将所述语音转换为正常 语音, 直到用户命令被输入为止。 0066 在下文中, 将参照图 6 解释根据示例性实施例的语音转换方法。 0067 首先, 语音转换设备 100 接收对方的语音 (S610) 。在这种情况下, 语音转换设备 100可与对方的通信终端执行语音通话或视频通话。 此外, 语音转换设备100的语音转换功 能可被开启。 说 明 书 CN 103730122 A 8 6/6 页 9 0068 。
31、随后, 语音转换设备 100 确定接收的对方的语音是否是异常语音 (S620) 。在这种 情况下, 语音转换设备 100 可提取接收的对方的语音的语音参数, 分析提取的语音参数并 确定对方的语音是否是异常语音。 在这种情况下, 语音参数可包括对方语音的音调元素、 对 方语音的谐噪比 (HNR) 、 对方语音的开商和对方语音的 GRBAS 分数中的至少一个。 0069 如果确定对方语音是异常语音 (S620- 是) , 则语音转换设备 100 通过调整对方语 音的谐波信号来将所述异常语音转换为正常语音 (S630) 。具体地讲, 语音转换设备 100 加 重或产生对方语音的谐波信号, 并可通过消。
32、除对方语音的谐波信号之间存在的子谐波信号 来将异常语音转换为正常语音。在这种情况下, 语音转换设备 100 可根据用户输入设置转 换强度和方法。 0070 随后, 语音转换设备 100 输出被转换为正常语音的对方的语音 (S640) 。 0071 同时, 如果确定对方语音不是异常语音 (S650- 否) , 则语音转换设备 100 立即输出 对方语音 (S640) 。 0072 如上所述, 根据各种示例性实施例, 用户甚至可与具有不能被容易地识别的异常 语音的对方执行顺畅的电话会话。 0073 用于执行根据各种示例性实施例的语音转换方法的程序代码可被存储在非暂时 性计算机可读介质中。非暂时性可。
33、读介质是指可半永久性地存储数据而不是诸如寄存器、 高速缓冲存储器和内存的短时间地存储数据的介质, 并且所述非暂时性可读介质可由设备 读取。具体地讲, 上述各种应用或程序可被存储在诸如 CD、 DVD、 硬盘、 蓝光盘、 USB、 存储卡 和 ROM 的非临时可读介质中, 并在其中被提供。 0074 上述实施例和优点仅是示例性的, 并且不被解释为限制本发明。本教导可被容易 地应用于其他类型的设备。 此外, 本发明构思的示例性实施例的描述意图是说明性的, 而不 是限制权利要求的范围, 并且许多选择对象、 修改和变化对于本领域技术人员而言将是清 楚的。 说 明 书 CN 103730122 A 9 1/5 页 10 图 1 图 2 图 3A 说 明 书 附 图 CN 103730122 A 10 2/5 页 11 图 3B 图 3C 说 明 书 附 图 CN 103730122 A 11 3/5 页 12 图 4A 图 4B 说 明 书 附 图 CN 103730122 A 12 4/5 页 13 图 5 说 明 书 附 图 CN 103730122 A 13 5/5 页 14 图 6 说 明 书 附 图 CN 103730122 A 14 。