书签 分享 收藏 举报 版权申诉 / 26

一种语音增强处理方法和装置.pdf

  • 上传人:e1
  • 文档编号:4629378
  • 上传时间:2018-10-22
  • 格式:PDF
  • 页数:26
  • 大小:870.26KB
  • 摘要
    申请专利号:

    CN201110048922.6

    申请日:

    2011.03.01

    公开号:

    CN102655005A

    公开日:

    2012.09.05

    当前法律状态:

    授权

    有效性:

    有权

    法律详情:

    授权|||实质审查的生效IPC(主分类):G10L 21/02申请日:20110301|||公开

    IPC分类号:

    G10L21/02

    主分类号:

    G10L21/02

    申请人:

    华为技术有限公司

    发明人:

    艾雅·苏谟特; 刘长娥

    地址:

    518129 广东省深圳市龙岗区坂田华为基地总部办公楼

    优先权:

    专利代理机构:

    代理人:

    PDF完整版下载: PDF下载
    内容摘要

    本发明实施例公开了一种语音增强处理方法和装置,其中语音增强处理方法包括:第一VQE模块测量接收到的语音信号的至少一个语音质量参数;第一VQE模块利用至少一个语音质量参数检测语音质量问题;如果检测到语音质量问题,第一VQE模块通知第二VQE模块改变其VQE操作模式。

    权利要求书

    1: 一种语音增强处理方法, 其特征在于, 包括 : 第一 VQE 模块测量接收到的语音信号的至少一个语音质量参数 ; 第一 VQE 模块利用至少一个语音质量参数检测语音质量问题 ; 如果检测到语音质量问题, 第一 VQE 模块通知第二 VQE 模块改变其 VQE 操作模式。
    2: 根据权利要求 1 所述的方法, 其特征在于, 还包括 : 如果检测到语音质量问题, 第一 VQE 模块改变其 VQE 操作模式。
    3: 根据权利要求 1 所述的方法, 其特征在于, 第一 VQE 模块通知第二 VQE 模块改变其 VQE 操作模式包括 : 第一 VQE 模块向第二 VQE 模块发送语音质量问题报告, 所述第二 VQE 模块根据语音质 量问题报告改变 VQE 操作模式。
    4: 根据权利要求 1 所述的方法, 其特征在于, 第一 VQE 模块通知第二 VQE 模块改变其 VQE 操作模式包括 : 向第二 VQE 模块发送 VQE 操作模式改变请求, 该 VQE 操作模式改变请求包含改变的操 作模式。
    5: 根据权利要求 3 或 4 所述的方法, 其特征在于, 还包括 : 根据第二 VQE 模块对语音质量问题的解决结果改变第一 VQE 模块的 VQE 操作模式。
    6: 根据权利要求 5 所述的方法, 其特征在于, 还包括 : 如果第一 VQE 模块的 VQE 操作模式改变后未能解决该语音质量问题, 则通知第二 VQE 模块关闭部分或全部 VQE 操作模式。
    7: 根据权利要求 6 所述的方法, 其特征在于, 还包括 : 如果第一 VQE 模块未能解决语音质量问题, 则撤销第二 VQE 模块的操作模式的变更。
    8: 根据权利要求 1 所述的方法, 其特征在于, 所述 VQE 模块包括下列 VQE 功能中至少一 个: 回声抑制, 噪声抑制和自动电平控制。
    9: 一种语音增强处理装置, 其特征在于, 包括 : 测量模块, 用于测量接收到的语音信号的至少一个语音质量参数 ; 检测模块, 用于利用至少一个语音质量参数检测语音质量问题 ; 通知模块, 如果检测到语音质量问题, 则通知另一 VQE 模块改变其 VQE 操作模式。
    10: 根据权利要求 9 所述的装置, 其特征在于, 还包括 : 配置模块, 用于在检测到语音质量问题时改变其 VQE 操作模式。
    11: 根据权利要求 9 所述的装置, 其特征在于, 所述通知模块用于向所述另一 VQE 模块 发送语音质量问题报告, 所述另一 VQE 模块根据语音质量问题报告改变 VQE 操作模式。
    12: 根据权利要求 9 所述的装置, 其特征在于, 所述通知模块用于向所述另一 VQE 模块 发送 VQE 操作模式改变请求, 该 VQE 操作模式改变请求包含改变的操作模式。
    13: 根据权利要求 11 或 12 所述的装置, 其特征在于, 还包括 : 配置模块, 用于根据所述另一个 VQE 模块对语音质量问题的解决结果改变 VQE 操作模 式。
    14: 根据权利要求 13 所述的装置, 其特征在于, 如果 VQE 操作模式改变后未能解决该语音质量问题, 所述通知模块还用于通知 所述 2 另一个 VQE 模块关闭部分或全部 VQE 操作模式。
    15: 根据权利要求 13 所述的装置, 其特征在于, 包括中至少一个 : 回声抑制, 噪声抑制 和自动电平控制。

    说明书


    一种语音增强处理方法和装置

        【技术领域】
         本发明涉及数字信号处理技术领域, 尤其是一种语音增强处理方法和装置。背景技术 在数字通信领域, 语音、 图像、 音频、 视频的传输有着非常广泛的应用需求, 如手机 通话、 音视频会议、 广播电视、 多媒体娱乐等。 语音被数字化处理, 通过语音通信网络从一个 终端传递到另一个终端, 这里的终端可以是手机、 数字电话终端或其他任何类型的语音终 端, 数字电话终端例如 VOIP 电话或 ISDN 电话、 计算机、 电缆通信电话。 语音质量增强 (VQE, Voice Quality Enhancement) 功能被广泛地应用到语音通信网络中的不同地方, 用于解 决网络中的语音问题, 如声学回声 (acoustic echo)、 线回声 (line echo)、 环境噪声、 电平 等问题。常见的 VQE 功能 (VQE functionality) 包括回声消除 (EC, Echo Cancellation, Echo Canceller)、 噪 声 消 除 (NR, Noise Reduction)( 也 可 以 叫 做 噪 声 抑 制 (Noise Cancellation, Noise Canceller))、 自动电平控制 (ALC, Automatic Level Control)、 自动 听力增强 (ALE, Automatic Listener Enhancement) 等。
         语音通信网络由多个终端及互相连接的网络节点构成, 其中每个终端和每个网络 节点都可能使用 VQE 模块 ( 模块上可能具有一个或多个 VQE 功能 )。多个网络节点和终端 上的 VQE 模块可以提供相同或者不同的 VQE 功能, 如果在通信链路上的 VQE 模块的功能没 有进行很好的调度和协调, 则会损伤所传输的语音质量。例如, 两个回声消除前后串联 (in tandem), 带回声的语音信号经过第一个 EC 的处理后传递给第二个 EC 模块, 此时第二个 EC 将不能正确观察到回声的特性, 因此无法充分训练其内部的自适应滤波器以及控制其内部 的非线性处理 (NLP, Non-linear Processing) 模块, 可能造成语音的误损伤。再例如, 两个 噪声消除 (NR, Noise Reduction) 前后串联, 带噪声的语音信号先经第一个 NR 处理, 然后第 二个 NR 处理, 此时可能产生过度抑制, 从而导致信号中的语音部分受损。
         发明内容 本发明实施例的目的在于提供一种语音增强处理方法和装置, 提高语音质量。
         根据本发明的一实施例, 一种语音增强处理方法, 包括 :
         第一 VQE 模块测量接收到的语音信号的至少一个语音质量参数 ;
         第一 VQE 模块利用至少一个语音质量参数检测语音质量问题 ;
         如果检测到语音质量问题, 第一 VQE 模块通知第二 VQE 模块改变其 VQE 操作模式。
         根据本发明的另一实施例, 一种语音增强处理装置, 包括 :
         测量模块, 用于测量接收到的语音信号的至少一个语音质量参数 ;
         检测模块, 用于利用至少一个语音质量参数检测语音质量问题 ;
         通知模块, 如果检测到语音质量问题, 则通知另一 VQE 模块改变其 VQE 操作模式。
         本发明实施例, 网络中的每个 VQE 模块能和其他 VQE 模块进行动态协商, 能有效地 解决或改善网络中语音质量问题, 提升整网的语音质量。
         附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本 发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动性的前提下, 还可 以根据这些附图获得其他的附图。
         图 1 为本发明实施例所涉及的网络环境示意图 ;
         图 2 为本发明提供的语音增强处理方法一个实施例的流程示意图 ;
         图 3 为本发明提供的语音增强处理方法另一个实施例的流程示意图 ;
         图 4 为本发明提供的语音增强处理方法另一个实施例的流程示意图 ;
         图 5 为本发明提供的语音增强处理方法另一个实施例的流程示意图 ;
         图 6 为本发明提供的语音增强处理方法另一个实施例的流程示意图 ;
         图 7 为本发明提供的语音增强处理方法另一个实施例的流程示意图 ;
         图 8 为本发明提供的语音增强处理方法另一个实施例的流程示意图 ;
         图 9 为本发明提供的语音增强处理方法另一个实施例的流程示意图 ;
         图 10 为本发明提供的语音增强处理方法另一个实施例的流程示意图 ; 图 11 为本发明提供的语音增强处理方法另一个实施例的流程示意图 ; 图 12 为本发明提供的语音增强处理方法另一个实施例的流程示意图 ; 图 13 为本发明提供的语音增强处理方法另一个实施例的流程示意图 ; 图 14 为本发明提供的信号处理装置一个实施例的结构示意图 ; 图 15 为本发明提供的信号处理装置另一个实施例的结构示意图 ; 。具体实施方式
         下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行清楚、 完 整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是全部的实施例。基于 本发明中的实施例, 本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例, 都属于本发明保护的范围。
         国际电信联盟 (ITU-T) 的一个标准 G.799.2, 定义了一种动态协商机制, 通过交换 语音通信网络中 VQE 模块的所处位置信息来协商各 VQE 功能的开关。G.799.2 提供了各种 VQE 功能的最优位置, 并且推荐不在最优位置的 VQE 功能进行关闭。例如, 对于 EC, 最优位 置为终端, 如手机, 对于不在终端的 EC, 推荐关闭。G.799.2 通过这种协商方式, 在网络中只 留下最优位置的 VQE 功能, 而关闭其他位置的 VQE 功能, 虽然可以避免 VQE 模块前后串联带 来的可能的质量下降问题, 但是它也完全排除了在非最优位置的 VQE 功能对语音质量的改 善, 使得整体语音质量无法得到优化。例如, 语音通信网路里的一个 EC 不能去除所有残留 回声, 在它之后串连的另一个 EC 虽然有能力去除这些残留回声, 但是因为它不在最优位置 上而被关闭, 从而无法继续优化整体的语音质量。
         参考图 1, 本发明实施例的一个应用环境框架图, 语音通信网络中包括多个终端 ( 如终端 A、 终端 D) 和多个网络节点 ( 如网络节点 B、 网络节点 C), 任意终端或网络节点均 可以叫做网元。每个终端和网络节点 ( 例如, 基站、 网关等 ) 分别包括 VQE 模块, 如 VQE A、VQE B、 VQE C 和 VQE D。语音通话可以从终端 A 发起, 传递到终端 D, 也可以反方向发起和 传递, 这里以 A 到 D 方向进行以下叙述。每个 VQE 模块可能是一个 VQE 功能, 也可能是多个 VQE 功能的组合。
         每个网元上的每个 VQE 功能测量语音信号, 然后根据这些测量的语音质量参数来 处理语音以提升语音质量。 语音质量参数可以是语音电平、 语音频谱、 噪声电平、 噪声频谱、 信噪比 (SNR)、 残留回声或者其他任何可以从语音信号里提取出来的参数。例如, EC 通过 测量残留回声来调整训练它的自适应滤波器, 也可以通过测量语音行为 (Voice Activity) 来决定 NLP 的动作, 以更好地去除回声 ; NR 可以通过测量带噪语音的频谱, 以更好地去除噪 声; ALC 可以通过测量语音电平以将其调整到一个预定电平上。这些测量提供了语音信号 的相关信息, 图 1 中的 A、 B、 C、 D 每个点上都可以进行这些测量。例如, 终端 A 上的 VQE A, 基于终端 A 得到的语音信号测量, 可以处理网络语音问题 ( 如回声、 噪声等 ), 网络节点 B 上 也有 VQE B, 可以基于节点 B 得到的语音信号测量, 处理该节点的网络语音问题。
         然而, 两个 VQE 模块的操作不仅取决于各自的测量, 还取决于各自的设计特性。例 如, 终端 A 上的 VQE A 里有 EC, 其设计特性是只能处理一定延时的回声, 如, 延时小于 400ms 的回声可以去除, 大于 400 的回声无法去除, 另外, 由于算法处理能力有限或设计缺陷, 终 端 A 上的 EC 的自适应滤波器或 NLP 处理不能完全去除所有回声, 从而导致回声残留。 此时, 节点 B 上的 EC 便可以检测回声残留并和 A 上的 EC 进行协商。
         本发明的一个实施例, 一个 VQE 模块可以通过测量语音信号的语音质量参数检测 语音信号的质量问题, 当发现语音信号出现语音质量问题时, 将该语音质量问题发送给另 一个 VQE 模块请求另一个 VQE 模块解决该语音质量问题。收到语音质量问题报告, 另一个 VQE 模块可以改变其操作模式以解决该质量问题。进一步的, 在发送语音质量问题的同时, 该 VQE 模块可以尝试自身解决该语音质量问题, 当其检测到另一个 VQE 模块已经解决了该 语音质量问题则停止其自身解决语音质量问题的操作, 并继续检测语音信号。
         另一个实施例中, 第一 VQE 模块可以通过测量语音质量参数来检测语音质量问题 并先解决该语音质量问题, 如果第一 VQE 模块不能解决该语音质量问题, 且断定第二 VQE 模 块影响自己解决语音质量问题, 于是要求第二 VQE 模块临时或永久关闭其部分或部分操作 模式, 目的是去除第二 VQE 模块的影响, 使第一 VQE 模块可以解决语音质量问题, 如果第一 VQE 不能解决语音质量问题, 则取消发给第一 VQE 模块的要求。
         不同的 VQE 模块具备不同的 VQE 操作模式种类。例如, 一个 EC 可以通过以下方式 来改变操作模式 : 改变所支持的回声延时的长度、 改变其 NLP 算法在回声抑制数量上和减 少近端说话人剪切上的比例等, 任何可能解决语音质量问题的算法上或参数上的改变。例 如, 一个 NR 可以通过改变噪声抑制电平等来改变操作模式。例如, 一个 ALC 可以通过放大 或缩小的电平、 改变控制语音电平的任何感知方法等来改变操作模式。
         参考图 2, 本发明语音增强处理方法一个实施例的流程示意图, 包括 :
         S201 : 第一 VQE 模块测量接收到的语音信号的至少一个语音质量参数 ;
         语音质量参数为任何可以从语音信号里提取的参数, 例如可以是语音电平、 语音 频谱、 噪声电平、 噪声频谱、 信噪比 (SNR)、 残留回声。
         S202 : 第一 VQE 模块利用至少一个语音质量参数检测语音质量问题 ;
         第一 VQE 模块通过测量的语音质量参数检测对应的语音信号的质量问题, 语音质量指主观或客观上的任何语音失真和任何听觉上的不舒适, 语音质量问题可以包括以下几 种类型 : 噪声、 回声、 含糊语音 ( 语音模糊导致主观上听不清或语义听不懂 )、 音量失真 ( 如 音量或电平过大、 过小等 )。 不同的 VQE 模块可能存在不同的语音质量问题, 例如, EC 对应的 语音质量问题可以是残留回声或语音被当作回声处理掉等 ; NR 对应的语音质量问题可以 是噪声抑制过小或噪声抑制后 SNR 未达到指定数量级等 ; ALC 对应的语音质量问题可以是 电平为未达到指定数量级。一个实施例中, 可以将测量的语音信号质量参数与语音信号正 常时的语音信号质量参数相比较, 如果出现预定范围的偏差则认为出现语音质量问题。例 如, 将提取的语音电平与预设的语音电平相比较, 如果超过预设语音电平, 则认为出现语音 质量问题 ; 再例如, 噪声抑制后的信噪比未达到预设信噪比, 则认为出现语音质量问题 ; 再 例如, 残留回声比例未达到预设比例, 则认为出现语音质量问题。
         S203 : 第一 VQE 模块通知第二 VQE 模块改变其 VQE 操作模式以解决该语音质量问 题。
         改变 VQE 操作模式为 VQE 模块所作的任何足以解决语音质量问题的算法或参数上 的改变。不同的 VQE 模块具有不同的操作模式, 例如 EC 对应的 VQE 操作模式可以为改变自 适应滤波器、 NLP 的参数配置 ; NR 对应的 VQE 操作模式可以为改变噪声更新模块、 增益调整 模块的参数配置 ; ALC 对应的 VQE 操作模式可以为更改电平控制因子。第一 VQE 模块可以 通过多种方式通知第二 VQE 模块, 一个实施例中, 第一 VQE 模块可以向第二 VQE 模块发送语 音质量问题报告, 该语音质量问题报告表示第一 VQE 模块涉及的语音信号出现哪种类型的 语音质量问题。第二 VQE 模块收到该语音质量问题报告后, 相应的改变其 VQE 操作模式以 解决该语音质量问题。例如, 第一 VQE 模块向第二 VQE 模块反馈的语音质量问题为信噪比 未达到预设信噪比, 则第二 VQE 模块可以采用加大噪声抑制因子来提高信噪比。另一个实 施例中, 第一 VQE 模块可以直接向第二 VQE 模块发送 VQE 操作模式改变请求, 该 VQE 操作模 式改变请求指出操作方式。例如, 第一 VQE 模块向第二 VQE 模块发送一个提高信噪比的请 求。
         另一个实施例中, 当第一 VQE 模块检测到语音质量问题, 第一 VQE 模块改变其 VQE 操作模式。其中该步骤可以在步骤 S203 之前之后或者同步进行, 对顺序不做限定。
         另一个实施例中, 第一 VQE 模块根据第二 VQE 模块对语音质量问题的解决结果改 变其 VQE 操作模式, 进一步的, 当第一 VQE 模块的 VQE 操作模式改变后未能解决该语音质量 问题, 则通知第二 VQE 模块关闭部分或全部 VQE 操作模式。
         该实施例中, 第一 VQE 模块在检测到语音质量问题时, 通知第二 VQE 模块改变操作 模式以解决该语音质量问题。可以根据语音增强的处理效果对语音传输通道中的不同 VQE 模块之间实现动态协商, 对一次语音传输提供有效的 VQE 功能, 能有效地解决或改善网络 中语音质量问题, 大大提升整网的语音质量。
         参考图 3, 本发明语音增强处理方法另一个实施例的流程示意图, 包括 :
         S301 : 第一 VQE 模块测量至少一个语音质量参数 ;
         S302 : 第一 VQE 模块利用至少一个语音质量参数检测语音质量问题, 如果没有检 测到语音质量问题, 则返回 S301 ;
         S303 : 如果检测到语音质量问题, 则第一 VQE 模块将该语音质量问题通知给第二 VQE 模块 ;S304 : 应用语音质量解决方案解决该语音质量问题 ;
         S305 : 测量语音质量参数, 判断该语音质量问题是否解决 ;
         S306 : 如果该语音质量问题已解决, 则停止应用语音质量方案 ;
         S307 : 如果该语音质量问题未解决, 则继续应用语音质量方案。
         以终端 A 上的 VQE A 测量语音信号质量参数, 根据这些语音质量参数测量来处理 语音信号, 并将处理后的语音信号传输给节点 B ; 节点 B 上的 VQE B 监测语音质量参数语音 质量, 检测网络语音质量问题并应用语音质量解决方案为例。参考图 4, 该方法一个实施例 包括 :
         S401 : VQE B 测量至少一个语音质量参数 ;
         S402 : VQE B 利用至少一个语音质量参数检测语音质量问题, 如果没有检测到语音 质量问题, 则返回 S401 ;
         S403 : 如果检测到语音质量问题, 则 VQE B 将该语音质量问题通知给 VQE A ;
         S404 : VQE A 改变操作模式, 处理语音并解决语音质量问题 ;
         S405 : 如果 VQE B 检测到语音质量问题已经被 VQE A 解决或有所改善, 则保持监 测。 上述实施例中, 当 VQE B 发现语音质量问题时, 反馈给 VQE A, 由 VQE A 解决该语音 质量问题。
         仍以终端 A 上的 VQE A 测量语音信号质量参数, 根据这些语音质量参数测量来处 理语音 ; 节点 B 上的 VQE B 监测语音质量参数语音质量, 检测网络语音质量问题为例。参考 图 5, 该方法另一个实施例包括 :
         S501 : VQE B 测量至少一个语音质量参数 ;
         S502 : VQE B 利用至少一个语音质量参数检测语音质量问题, 如果没有检测到语音 质量问题, 则返回 S501 ;
         S503 : 如果检测到语音质量问题, 则 VQE B 将该语音质量问题通知给 VQE A ;
         S504 : VQE A 改变操作模式, 处理语音并解决语音质量问题 ;
         S505 : VQE B 处理语音并解决语音质量问题, 即改变其 VQE 操作模式 ;
         S506 : 如果 VQE B 检测到语音质量问题已经被 VQE A 解决, 则停止解决语音质量问 题, 并保持监测 ;
         S507 : 如果 VQE B 检测到语音质量问题未被 VQE A 解决, 则继续处理语音并解决语 音质量问题, 同时保持监测。
         上述实施例中, 当 VQE B 发现语音质量问题时, 反馈给 VQE A, 由 VQE A 解决该语音 质量问题, 同时 VQE B 也尝试解决该语音质量问题, 当 VQE B 发现 VQEA 能解决该语音质量 问题时停止解决该语音质量问题。
         仍以终端 A 上的 VQE A 测量语音信号质量参数, 根据这些语音质量参数测量来处 理语音信号, 并将处理后的语音信号传输给节点 B ; 节点 B 上的 VQE B 监测语音质量参数语 音质量, 检测网络语音质量问题并应用语音质量解决方案为例。参考图 6, 该方法另一个实 施例包括 :
         S601 : VQE B 测量至少一个语音质量参数 ;
         S602 : VQE B 利用至少一个语音质量参数检测语音质量问题, 如果没有检测到语音
         质量问题, 则返回 S601 ;
         S603 : 如果检测到语音质量问题, 则 VQE B 将该语音质量问题通知给 VQE A ;
         S604 : VQE A 改变操作模式, 处理语音并解决语音质量问题 ;
         S605 : 如果 VQE B 检测到语音质量问题已经被 VQE A 解决, 则保持监测 ;
         S606 : 如果 VQE B 检测到语音质量问题未被 VQE A 解决但有所改善, 则 VQE B 处理 语音并解决语音质量问题 ;
         S607 : 如果 VQE B 检测到语音质量问题相对于之前没有改善, 则通知 VQE A 恢复原 先的操作模式, 同时 VQE B 处理语音并解决语音质量问题 ;
         S608 : 如果 VQE B 检测到语音质量问题已经解决或改善, 则保持监测 ;
         S609 : 如果 VQE B 检测到语音质量问题相对于之前没有改善, 则 VQE B 撤销改变的 操作模式, 但保持监测。
         上述实施例中, 当 VQE B 发现语音质量问题时, 将语音质量问题反馈给 VQEA, 由 VQE A 解决该语音质量问题, 当 VQE A 不能解决该语音质量问题时 VQE B 解决该语音质量问 题。
         仍以终端 A 上的 VQE A 测量语音信号质量参数, 根据这些语音质量参数测量来处 理语音信号, 并将处理后的语音信号传输给节点 B ; 节点 B 上的 VQE B 监测语音质量参数语 音质量, 检测网络语音质量问题并应用语音质量解决方案为例。参考图 7, 该方法另一个实 施例包括 : S701 : VQE B 测量至少一个语音质量参数 ;
         S702 : VQE B 利用至少一个语音质量参数检测语音质量问题, 如果没有检测到语音 质量问题, 则返回 S701 ;
         S703 : 如果检测到语音质量问题, 则 VQE B 将该语音质量问题通知给 VQE A ;
         S704 : VQE A 改变操作模式, 处理语音并解决语音质量问题 ;
         S705 : 如果 VQE B 检测到语音质量问题已经被 VQE A 解决, 则保持监测 ;
         S706 : 如果 VQE B 检测到语音质量问题未被 A 解决但有所改善, 则 VQE B 处理语音 并解决语音质量问题 ;
         S707 : 如果 VQE B 检测到语音质量问题相对于之前没有改善, 则通知 VQE A 恢复原 先的操作模式, 同时 VQE B 处理语音并解决语音质量问题 ;
         S708 : VQE B 处理语音并解决语音质量问题时, 如果检测到语音质量问题已经解决 或改善, 则保持监测 ;
         S709 : 如果 VQE B 检测到语音质量问题相对于之前没有改善, 且断定它不能改善 语音质量问题原因在于 VQE A 的干扰 ( 由于语音已经被其处理过, 从而改变了语音特性, 例 如, 引起失真 ), 则通知 VQE A 关闭其部分或全部模式 ;
         S710 : VQE A 关闭部分或全部模式后, 如果 VQE B 检测到语音质量问题已经解决或 改善, 则通知 VQE A 保持现状 ;
         S711 : VQE A 关闭部分或全部模式后, 如果 VQE B 检测到语音质量问题相对于之前 没有改善, 则通知 VQE A 重新启用其部分或全部模式。
         该实施例中, VQE B 在检测到语音质量问题时, 向其在前的 VQE A 通知该语音质量 问题, VQE A 改变 VQE 操作模式以解决该技术问题, 在 VQE A 未能解决时 VQE B 改变其 VQE
         操作模式以解决该质量问题。
         参考图 8, 本发明语音增强处理方法另一个实施例的流程示意图, 包括 :
         S801 : 第一 VQE 模块测量至少一个语音质量参数 ;
         S802 : 第一 VQE 模块利用至少一个语音质量参数检测语音质量问题, 如果没有检 测到语音质量问题, 则返回 S801 ;
         S803 : 如果检测到语音质量问题, 则第一 VQE 模块改变其 VQE 操作模式以解决该语 音质量问题 ;
         S804 : 测量语音质量参数, 判断该语音质量问题是否解决 ;
         S805 : 如果该语音质量问题已解决, 则停止应用语音质量方案 ;
         S806 : 如果该语音质量问题未解决, 则通知第二 VQE 模块改变其 VQE 操作模式以解 决该语音质量问题。
         上述实施例中, 第一 VQE 模块发现语音质量问题时先自行解决该语音质量问题, 当第一 VQE 模块不能解决该问题时通知第二 VQE 模块改变其 VQE 操作模式以解决该语音质 量问题。
         以终端 A 上的 VQE A 测量语音信号质量参数, 根据这些语音质量参数测量来处理 语音信号, 并将处理后的语音信号传输给节点 B ; 节点 B 上的 VQE B 监测语音质量参数语音 质量, 检测网络语音质量问题并应用语音质量解决方案为例。参考图 9, 该方法另一个实施 例包括 :
         S901 : VQE B 测量至少一个语音质量参数 ;
         S902 : VQE B 利用至少一个语音质量参数检测语音质量问题, 如果没有检测到语音 质量问题, 则返回 S901 ;
         S903 : 如果检测到语音质量问题, VQE B 改变 VQE 操作模式以解决该语音质量问 题;
         S904 : 如果 VQE B 检测到语音质量问题已经被解决, 则保持监测 ;
         S905 : 如果 VQE B 检测到语音质量问题相对于之前没有改善, 则 VQE B 恢复原先的 VQE 操作模式, 保持监测 ;
         S906 : 如果 VQE B 检测到语音质量问题之前有所改善但未完全解决, 则通知 VQE A 改变操作模式 ;
         S907 : VQE A 改变操作模式后, 如果 VQE B 检测到语音质量问题已解决或有改善, 则保持监测 ;
         S908 : VQE A 改变操作模式后, 如果 VQE B 检测到语音质量问题未改善或有所恶 化, 则通知 VQE A 恢复原先的 VQE 操作模式, 并保持监测。
         上述实施例中, VQE B 发现语音质量问题时先自行解决该语音质量问题, 当 VQE B 不能解决该问题时通知 VQE A 改变其 VQE 操作模式以解决该语音质量问题。
         以终端 A 上的 VQE A 测量语音信号质量参数, 根据这些语音质量参数测量来处理 语音信号, 并将处理后的语音信号传输给节点 B ; 节点 B 上的 VQE B 监测语音质量参数语音 质量, 检测网络语音质量问题并应用语音质量解决方案为例。 参考图 10, 该方法另一个实施 例包括 :
         S1001 : VQE B 测量至少一个语音质量参数 ;S1002 : VQE B 利用至少一个语音质量参数检测语音质量问题, 如果没有检测到语 音质量问题, 则返回 S1001 ;
         S1003 : 如果检测到语音质量问题, VQE B 改变 VQE 操作模式以解决该语音质量问 题;
         S1004 : 如果 VQE B 检测到语音质量问题已经被解决, 则保持监测 ;
         S1005 : 如果 VQE B 检测到语音质量问题相对于之前没有改善, 同时断定不能改善 语音质量问题原因在于 VQE A 的干扰 ( 由于语音已经被其处理过, 从而改变了语音特性, 例 如, 引起失真 ), 则通知 VQE A 关闭部分或全部操作模式 ;
         S1006 : VQE A 关闭部分或全部操作模式后, 如果 VQE B 检测到语音质量问题已经 解决或改善, 则通知 VQE A 保持现状 ;
         S1007 : VQE A 关闭部分或全部操作模式后, 如果 VQE B 检测到语音质量问题相对 于之前没有改善, 则通知 VQE A 重新启动部分或全部操作模式 ;
         S1008 : 如果 VQE B 检测到语音质量问题相对于之前有改善但未完全解决, 则通知 VQE A 改变其 VQE 操作模式 ;
         S1009 : VQE A 改变操作模式后, 如果 VQE B 检测到语音质量问题已解决或有改善, 则保持监测 ; S1010 : VQE A 改变操作模式后, 如果 VQE B 检测到语音质量问题未改善或有所恶 化, 则通知 VQE A 恢复原先的 VQE 操作模式, 并保持监测。
         上述实施例中, VQE B 发现语音质量问题时先自行解决该语音质量问题, 当 VQE B 不能解决该语音质量问题并断定该语音质量问题由 VQE A 干扰引起, 则通知 VQE A 关闭其 部分或全部 VQE 操作模式以解决该语音质量问题。
         以终端 A 上包含 VQE A, 网络节点 B 上包含 VQE B, VQE A 测量语音信号质量参数, 根据这些语音质量参数测量来处理语音信号, 并将处理后的语音信号传输给节点 B B 为例, 参考图 11, 本发明语音增强处理方法另一个实施例的流程示意图, 包括 :
         S1101 : 终端 A 上的 VQE A 测量语音质量参数, 根据这些语音质量参数来处理语 音;
         S1102 : 终端 A 上的 VQE A 监测语音质量参数, 检测网络语音质量问题 ; 如果没有检 测到语音质量问题, 则回到 S1102 ;
         S1103 : 如果 VQE A 检测到任何语音质量问题, VQE A 改变操作模式, 处理语音并解 决语音质量问题 ;
         S1104 : 如果 VQE A 检测到语音质量问题已经被 VQE A 解决或改善, 则保持监测 ;
         S1105 : 如果 VQE A 检测到语音质量问题未被 VQE A 解决, 则报告该问题给 VQE B, VQE B 处理语音并解决语音质量问题 ;
         S1106 : 如果 VQE B 检测到语音质量问题已经解决或改善, 则通知 VQE A 语音质量 问题已经解决或改善 ;
         S1107 : 如果 VQE B 检测到语音质量问题未解决或改善, 且断定它不能改善语音质 量问题原因在于 VQE A 的干扰 ( 由于语音已经被其处理过, 从而改变了语音特性, 例如, 引 起失真 ), 则通知 VQE A 关闭其部分或全部模式 ;
         S1108 : VQE A 关闭部分或全部模式后, 如果 VQE B 检测到语音质量问题已经解决
         或改善, 则通知 VQE A 保持现状 ;
         S1109 : VQE A 关闭部分或全部模式后, 如果 VQE B 检测到语音质量问题相对于之 前没有改善, 则通知 VQE A 重新启用其部分或全部模式。
         上述实施例中, VQE A 在检测到语音质量问题时, 先自行解决该语音质量问题, 当 VQE A 不能解决该语音质量问题时, 通知 VQE B 改变 VQE 操作模式以解决该语音质量问题, 当 VQE B 无法解决该语音质量问题则断定原因在于 VQE A 的干扰, 则通知 VQE A 关闭其部 分或全部模式。
         以终端 A 上包含 VQE A, 网络节点 B 上包含 VQE B, VQE A 测量语音信号质量参数, 根据这些语音质量参数测量来处理语音信号, 并将处理后的语音信号传输给节点 B 为例, 参考图 12, 本发明语音增强处理方法另一个实施例的流程示意图, 包括 :
         S1201 : 终端 A 上的 VQE A 测量语音质量参数, 根据这些语音质量参数来处理语 音;
         S1202 : 终端 A 上的 VQE A 监测语音质量参数, 检测网络语音质量问题 ; 如果没有检 测到语音质量问题, 则返回 S1202 ;
         S1203 : 如果 VQE A 检测到任何语音质量问题, VQE A 报告该问题给 VQE B ; S1204 : VQE B 处理语音并解决语音质量问题 ;
         S1205 : 如果 VQE B 检测到语音质量问题已解决或改善, 则通知 VQE A 保持监测 ;
         S1206 : 如果 VQE B 检测到语音质量问题未改善, 且断定它不能改善语音质量问 题原因在于 VQE A 的干扰 ( 由于语音已经被其处理过, 从而改变了语音特性, 例如, 引起失 真 ), 则通知 VQE A 关闭其部分或全部模式 ;
         S1207 : VQE A 关闭部分或全部模式后, 如果 VQE B 检测到语音质量问题已经解决 或改善, 则通知 VQE A 保持现状 ;
         S1208 : VQE A 关闭部分或全部模式后, 如果 VQE B 检测到语音质量问题相对于之 前没有改善, 则通知 VQE A 重新启用其部分或全部模式。
         上述实施例中, VQE A 在检测到语音质量问题时, 将语音质量问题反馈给 VQE B, 由 VQE B 解决该语音质量问题, 当 VQE B 无法解决该语音质量问题则断定原因在于 VQE A 的干 扰, 则通知 VQE A 关闭其部分或全部模式。
         上述几个实施例均以终端 A 和节点 B 为例, 实际上, 两个 VQE 模块可以在任何网元 上, 对两个 VQE 模块的相对位置并无限制, 并且图 1 中两个终端间可以有任意个网元。
         实际网络中, 可以选用上述任一实施例, 或则上述实施例可以组合使用, 而上述实 施例的具体步骤顺序并不做限制。
         下面终端 A 上的 VQE A 测量语音信号质量参数, 根据这些语音质量参数测量来处 理语音信号, 并将处理后的语音信号传输给节点 B, 两个 VQE 模块为 EC 为例, 参考图 13, 本 发明语音增强处理方法另一个实施例的流程示意图, 包括 :
         S1301 : 终端 A 上的 EC 测量语音中的残留回声, 调整训练它的自适应滤波器, 也可 以通过测量语音行为 (Voice Activity) 来决定它的 NLP 模块的动作 ;
         S1302 : 节点 B 上的 EC 监测语音质量, 检测残留回声 ;
         S1303 : 如果没有检测到残留回声, 则回到 S1302 ;
         S1304 : 如果节点 B 的 EC 检测到残留回声, 则上报报告该问题给终端 A 的 EC ;
         S1305 : 终端 A 的 EC 改变操作模式, 处理语音并去除残留回声 ;
         S1306 : 如果 B 检测到残留回声已经被 A 的 EC 去除, 或则保持监测 ;
         S1307 : 如果 B 检测到残留回声未被 A 完全去除但有所减少, 则节点 B 的 EC 开启, 处理语音并去除残留回声 ;
         S1308 : 如果 B 检测到去除残留回声相对于之前没有改善, 则通知终端 A 恢复原先 的操作模式, 同时节点 B 的 EC 开启, 处理语音并去除残留回声 ;
         S1309 : B 开启后, 如果 B 检测到去除残留回声已经去除或改善, 则保持监测 ;
         S1310 : B 开启后, 如果 B 检测到残留回声相对于之前没有改善, 则断定它不能改善 语音质量问题原因在于终端 A 的 EC 的干扰 ( 由于语音已经被其处理过, 从而改变了语音特 性, 例如, 引起失真 ), 则通知 A 关闭 EC 的部分或全部模式 ;
         S1311 : A 关闭 EC 的部分或全部模式后, 如果 B 检测到语音质量问题已经解决或改 善, 则通知 A 保持现状 ;
         S1312 : A 关闭 EC 的部分或全部模式后, 如果 B 检测到语音质量问题相对于之前没 有改善, 则通知 A 重新启用部分或全部模式。
         本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以 通过计算机程序来指令相关的硬件来完成, 所述的程序可存储于一计算机可读取存储介质 中, 该程序在执行时, 可包括如上述各方法的实施例的流程。其中, 所述的存储介质可为磁 碟、 光盘、 只读存储记忆体 (Read-Only Memory, ROM) 或随机存储记忆体 (Random Access Memory, RAM) 等。 与上述方法实施例相关联, 本发明实施例提供一种语音增强处理装置, 该装置可 以位于终端或者网络节点中的任何一个网元, 其中网络节点可以为基站、 网关等。 所述语音 信号处理装置可以由硬件电路来实现, 或者由软件配合硬件来实现。例如, 参考图 14, 由一 个处理器调用语音增强处理装置来实现对网元 VQE 配置, 以提高语音质量。
         参考图 15, 本发明语音增强处理装置的一个实施例包括 :
         测量模块, 用于测量接收到的语音信号的至少一个语音质量参数 ;
         检测模块, 用于利用至少一个语音质量参数检测语音质量问题 ;
         通知模块, 如果检测到语音质量问题, 则通知另一 VQE 模块改变其 VQE 操作模式。
         另一个实施例中, 语音增强处理装置还包括 :
         配置模块, 用于在检测到语音质量问题时改变其 VQE 操作模式。
         一个实施例中, 通知模块用于向所述另一 VQE 模块发送语音质量问题报告, 所述 另一 VQE 模块根据语音质量问题报告改变 VQE 操作模式。
         另一个实施例中, 通知模块用于向所述另一 VQE 模块发送 VQE 操作模式改变请求, 该 VQE 操作模式改变请求包含改变的操作模式。
         另一个实施例中, 配置模块, 用于根据所述另一个 VQE 模块对语音质量问题的解 决结果改变 VQE 操作模式。
         另一个实施例中, 如果 VQE 操作模式改变后未能解决该语音质量问题, 所述通知 模块还用于通知所述另一个 VQE 模块关闭部分或全部 VQE 操作模式。
         上述语音增强处理装置可以包括 : 回声抑制, 噪声抑制或自动电平控制。
         与本文所揭示实施例关联描述的中例示性逻辑块、 模块及电路均可由下列装置
         构建或实施 : 通用处理器、 数字信号处理器 (DSP)、 专用集成电路 (ASIC)、 场可编程门阵列 (FPGA) 或其它可编程逻辑装置、 离散门或晶体管逻辑、 离散硬件组件、 或其设计用于实施上 文所述功能的任何组合。 通用处理器可为微处理器, 但另一选择为, 处理器也可为任何常规 处理器、 控制器、 微控制器或状态机。处理器也可构建为计算装置的组合, 例如, DSP 与微处 理器的组合、 多个微处理器的组合、 一个或一个以上微处理器与 DSP 核心的联合, 或任一其 它此类配置。
         以上所述仅为本发明的几个实施例, 本领域的技术人员依据申请文件公开的可以 对本发明进行各种改动或变型而不脱离本发明的精神和范围。

    关 键  词:
    一种 语音 增强 处理 方法 装置
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种语音增强处理方法和装置.pdf
    链接地址:https://www.zhuanlichaxun.net/p-4629378.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1