《基于通信链路质量和信源编码延迟的信源编码自适应.pdf》由会员分享,可在线阅读,更多相关《基于通信链路质量和信源编码延迟的信源编码自适应.pdf(17页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102792372 A (43)申请公布日 2012.11.21 C N 1 0 2 7 9 2 3 7 2 A *CN102792372A* (21)申请号 201080065006.7 (22)申请日 2010.03.02 G10L 19/10(2006.01) H04M 7/00(2006.01) (71)申请人瑞典爱立信有限公司 地址瑞典斯德哥尔摩 (72)发明人斯蒂芬布鲁恩 (74)专利代理机构中科专利商标代理有限责任 公司 11021 代理人潘剑颖 (54) 发明名称 基于通信链路质量和信源编码延迟的信源编 码自适应 (57) 摘要 提供了一种网络节点中的。
2、方法和装置,该方 法和装置用于使信源编码的性能适应于通信系统 中分组交换会话服务的通信链路的质量。该方法 包括获取(404)与通信链路的质量有关的信息。 该方法还包括基于已获取信息及相关信源编码延 迟,选择(406)具有相关信源编码延迟的信源编 码模式。该已选信源编码模式是从具有至少两个 与不同信源编码延迟相关联的信源编码模式的集 合中选择的,并且当在通信链路上传输信源编码 话音数据时,将使用该已选信源编码模式。 (85)PCT申请进入国家阶段日 2012.08.30 (86)PCT申请的申请数据 PCT/SE2010/050241 2010.03.02 (87)PCT申请的公布数据 WO20。
3、11/108964 EN 2011.09.09 (51)Int.Cl. 权利要求书3页 说明书8页 附图5页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 3 页 说明书 8 页 附图 5 页 1/3页 2 1.一种网络节点中的方法,该方法用于使信源编码的性能适应于通信系统中分组交换 会话服务的通信链路的质量,该方法包括以下步骤: 获取(404)与所述通信链路的质量有关的信息, 基于已获取信息及相关信源编码延迟,选择(406)具有相关信源编码延迟的信源编码 模式, 其中,当在通信链路上传输信源编码话音数据时,使用已选信源编码模式,其中所述信 源编码模式是从与不同信源编。
4、码延迟相关联的信源编码模式集合中选择的。 2.根据权利要求1所述的方法,其中所述网络节点是移动终端或会话中的其他端节 点。 3.根据权利要求1所述的方法,其中所述网络节点是中央控制节点。 4.根据权利要求2所述的方法,还包括: 使用已选信源编码模式来编码(408)将在通信链路上传输的话音数据。 5.根据权利要求1-4所述的方法,还包括: 向一个或多个其他网络节点提供已选信源编码模式的指示。 6.根据以上权利要求中任意一项所述的方法,其中不同可选信源编码模式与一个信源 编解码器相关联,和/或分别与不同信源编解码器相关联。 7.根据以上权利要求中任意一项所述的方法,其中不同可选信源编码模式中的至少。
5、一 个与自适应多速率(AMR)信源编解码器相关联,该AMR信源编解码器具有至少一种低延迟 模式。 8.根据权利要求7所述的方法,其中不等待先行缓冲区充满有效采样,就启动所述至 少一种低延迟模式的编码过程。 9.根据权利要求7或8所述的方法,其中通过修改IPC分析窗口形状和在时间上移动 IPC分析窗口中的至少一种方法,来提供所述至少一种低延迟模式。 10.根据权利要求1-6中任意一项所述的方法,其中不同可选信源编码模式中的至少 一种与可伸缩编解码器相关联,该可伸缩编解码器具有核心编码层和至少一个增强编码 层,其中不同编码层与不同固有延迟相关联。 11.根据权利要求10所述的方法,其中当同与更高固。
6、有延迟相关联的层有关的信号的 传输暂停时,不延迟同与低固有延迟相关联的层有关的信号,使它同步于同与更高固有延 迟相关联的层有关的信号。 12.根据以上权利要求中任意一项所述的方法,还包括: 基于已选信源编码模式,确定以下信息中的至少一个: 可用于通信链路上的重传的时间间隔持续时间, 通信链路上允许的重传次数,以及 通信链路上传输的信号的接收机中使用的抖动缓冲区大小。 13.根据以上权利要求中任意一项所述的方法,其中已获取的与通信链路的质量有关 的信息与以下参数中的至少一个有关: 在通信链路上重传花费的时间, 通信链路上分组的重传数量, 在通信链路上的传输中丢失的分组的数量, 权 利 要 求 书。
7、CN 102792372 A 2/3页 3 在通信链路上接收的损坏的或无用的分组的数量, 以上列出的参数之一的预定变化。 14.根据以上权利要求中任意一项所述的方法,其中当确定通信链路的质量差时,选择 与相对低信源编码延迟相关联的信源编码模式。 15.根据以上权利要求中任意一项所述的方法,其中当确定通信链路的质量好时,选择 与相对高信源编码延迟相关联的信源编码模式。 16.一种网络节点中的装置,该装置适于使信源编码性能适应于通信系统中分组交换 会话服务的通信链路的质量,该装置包括: 适于获取与通信链路的质量有关的信息的质量单元(502), 选择单元(506),适于基于已获取信息及相关信源编码延。
8、迟,选择具有相关信源编码延 迟的信源编码模式, 其中,当在通信链路上传输信源编码话音数据时,使用已选信源编码模式,其中所述信 源编码模式是从与不同信源编码延迟相关联的信源编码模式集合中选择的。 17.根据权利要求16所述的装置,其中所述网络节点是移动终端或其他端节点。 18.根据权利要求16所述的装置,其中所述网络节点是中央控制节点。 19.根据权利要求17所述的装置,还包括: 信源编码单元(508),适于使用已选信源编码模式来编码将在通信链路上传输的话音 数据。 20.根据权利要求16-19中任意一项所述的装置,还适于向一个或多个其他网络节点 提供已选信源编码模式的指示。 21.根据权利要求。
9、16-20中任意一项所述的装置,其中不同可选信源编码模式与一个 信源编解码器相关联,和/或分别与不同信源编解码器相关联。 22.根据权利要求16-21中任意一项所述的装置,其中不同可选信源编码模式中的至 少一个与自适应多速率(AMR)信源编解码器相关联,该AMR信源编解码器具有至少一种低 延迟模式。 23.根据权利要求22所述的装置,其中AMR信源编解码器适于不等待先行缓冲区充满 有效采样,就启动所述至少一种低延迟模式的编码过程。 24.根据权利要求22或23所述的装置,其中通过修改IPC分析窗口形状和在时间上移 动IPC分析窗口中的至少一种方法,来提供所述至少一种低延迟模式。 25.根据权利。
10、要求16-21中任意一项所述的装置,其中不同可选信源编码模式中的至 少一种与可伸缩编解码器相关联,该可伸缩编解码器具有核心编码层和至少一个增强编码 层,其中不同编码层与不同固有延迟相关联。 26.根据权利要求25所述的装置,其中可伸缩编解码器适于:当同与更高固有延迟相 关联的层有关的信号的传输暂停时,避免延迟同与低固有延迟相关联的层有关的信号,使 它同步于同与更高固有延迟相关联的层有关的信号。 27.根据权利要求16-26中任意一项所述的装置,还包括: 确定单元(507),适于基于已选信源编码模式,确定以下信息中的至少一个: 可用于通信链路上的重传的时间间隔持续时间, 通信链路上允许的重传次数。
11、,以及 权 利 要 求 书CN 102792372 A 3/3页 4 通信链路上传输的信号的接收机中使用的抖动缓冲区大小。 28.根据权利要求16-27中任意一项所述的装置,其中所述质量单元适于获取与以下 参数中的至少一个有关的信息: 在通信链路上重传花费的时间, 通信链路上分组的重传数量, 在通信链路上的传输中丢失的分组数量, 在通信链路上接收的损坏的或无用的分组的数量, 以上列出的参数之一的预定变化。 29.根据权利要求16-28中任意一项所述的装置,其中所述选择单元适于:当确定通信 链路的质量差时,选择与相对低信源编码延迟相关联的信源编码模式。 30.根据权利要求16-29中任意一项所述。
12、的装置,其中所述选择单元适于:当确定通信 链路的质量好时,选择与相对高信源编码延迟相关联的信源编码模式。 权 利 要 求 书CN 102792372 A 1/8页 5 基于通信链路质量和信源编码延迟的信源编码自适应 技术领域 0001 本发明涉及通信系统中对话服务的话音数据的信源编码,并且特别地,涉及由信 源编解码器引入的延迟。 背景技术 0002 端对端延迟在会话应用(例如电话)中有有限时间预算。超过特定限制的端对端 延迟将对会话质量有负面影响。因此,希望将端对端延迟维持在所述特定限制以内。 0003 端对端延迟是与端对端通信链路的不同部分相关联的多个不同延迟的总和。例 如,除了实际媒体中的。
13、传播之外,端对端通信链路典型地还包括不同连续元素,例如信源编 码、数据打包、信道编码、交织、重传和抖动缓冲。这些元素中的每一个在其处理时需要一些 处理时间,以便完成各元素的合理操作,例如良好信源编码效率或仅有少数传输错误或帧/ 分组丢失的通信链路上的可靠传输。因为端对端延迟是有限资源,仅有能够在端对端通信 链路的不同元素间分配的有限时间。 0004 在通信链路上传输话音数据之前,对该话音数据进行信源编码。典型地,为了压缩 数据序列而执行信源编码,以使之需要例如更少的传输带宽。话音数据的信源编码引入会 话服务中端对端延迟的信源编码延迟分量。信源编码延迟长度取决于所使用的信源编解码 器的种类,并且。
14、典型地在20毫秒(例如在GSM EFR(全球移动通信系统)(增强型全速率) 中)到大约50毫秒(例如在ITU-T标准G.718(国际电信联盟电信标准化部)中)的范围 内。 0005 经常用于电路交换(CS)和分组交换(PS)传输的一种信源编码是AMR(自适应多 速率)多模式编解码器。该AMR多模式编解码器引入25毫秒的编码延迟,其中5毫秒是意 在启用更多有效信源编码的“先行区(lookahead)”。因此,AMR多模式编解码器使用25毫 秒的可用端对端延迟。图1示出了示例性AMR编解码器中的先行区。每一个时隙代表5毫 秒。在这个AMR编解码器示例中,包括要编码的语音数据的每帧106和108代表。
15、4*5毫秒 20毫秒。在该编码器的信号分析中,使用30毫秒窗口帧102和104。窗口帧104有5毫 秒伸展到下一个语音数据帧中,这5毫秒组成了所谓的先行区110。 0006 传输延迟(即花费在通信系统中的实际传输上的可用端对端延迟的部分,该实际 传输包括例如无线电接入网中的传输和核心网中的传输)主要取决于所使用的接入技术 和网络配置。典型地,关于传输延迟,CS传输和PS传输之间存在明显的不同。在CS传输 中,传输延迟定义明确并且针对每一个传输帧在整个连接中是固定的。另一方面,在PS传 输中,每个分组独立传输并且因此与独立传输延迟相关,这导致众所周知的PS传输中的分 组延迟抖动(即变化)。换言之。
16、,PS传输的分组以不同延迟到达接收机,有些会早到达,有 些会晚到达。对于CS传输,使用诸如3GPP(第三代合作计划)GSM/Geran(GSM EDGE无线电 接入网,其中EDGE代表增强型数据速率GSM演进技术)或UTRAN(UMTS陆地无线电接入网, 其中UMTS代表通用移动通信系统)的接入技术。对于PS传输,可使用例如UTRAN PS承载, 例如HSPA(高速分组接入技术)和LTE(长期演进技术)。因特网中的网络电话同样是PS 说 明 书CN 102792372 A 2/8页 6 传输的例子。 0007 虽然有大量接入和传输技术可用,通常而言,在已确定传输成本的情况下,扩展可 用传输延迟。
17、预算将使传输更可靠。换句话说,通过扩展可用传输延迟的方式,传输容量可以 显著提高。例如,在LTE接入网中,取决于有关于延迟和容量的操作点,少到5毫秒的可用 或允许传输延迟的提高,将带来多达15的容量提高,该容量提高是关于小区中能够容纳 的话音呼叫的数量而言的。这在图2中示出,图2示出了该示例,示出了在操作点P1处x 毫秒的传输延迟增长怎么带来每个小区C 1 个用户的容量提高。然而在另一操作点P2处 传输延迟的相同提高带来比C 1 小相当多的每个小区C 2 个用户的容量提高。因此,可用 传输时间的缺乏会对传输容量起到极大限制作用。 0008 因此,认为由于可用传输时间缺乏带来的传输容量的限制是一。
18、个问题。 发明内容 0009 希望在会话服务中提高传输效率。本发明的目的在于能够实现会话服务中传输容 量的提高。进一步,本发明的目的在于提供一种方法和装置,用于扩展会话服务中可用端对 端延迟预算中能够用于传输的部分。 0010 根据一个方面,提供了一种网络节点中的方法,该方法用于使信源编码的性能适 应于通信系统中分组交换会话服务的通信链路的质量。在该方法中,获取与所述通信链路 的质量有关的信息。基于已获取信息及相关信源编码延迟,选择具有相关信源编码延迟的 信源编码模式。例如,存在许多具有相同特性(例如编码率)的可选信源编码模式,但这些 模式与不同编码延迟相关联。当在通信链路上传输信源编码话音数。
19、据时,使用已选信源编 码模式,并且该信源编码模式是从与不同信源编码延迟相关联的信源编码模式集合中选择 的。 0011 根据另一方面,提供了一种网络节点中的装置,该装置适于使信源编码的性能适 应于通信系统中分组交换会话服务的通信链路的质量。该装置包括适于获取与通信链路的 质量有关信息的功能单元。该装置还包括功能单元,该功能单元适于基于已获取信息及相 关信源编码延迟,选择具有相关信源编码延迟的信源编码模式。当在通信链路上传输信源 编码话音数据时,使用已选信源编码模式,并且该信源编码模式是从与不同信源编码延迟 相关联的信源编码模式集合中选择的。 0012 当需要时,可以使用上述方法和装置,用以通过增。
20、加时间在分组交换会话服务中 扩展可用传输延迟预算,通过在对话音数据信源编码时选择与已降低编码延迟相关联的信 源编码模式获得该时间。 0013 可以在不同实施例中实施以上方法和装置。在一些实施例中,网络节点是移动终 端或其他端节点,并且在一些实施例中,网络节点是中央控制节点。在以上两种情况中,可 以向一个或多个其他网络节点提供已选信源编码模式的指示。当网络节点是端节点时,可 以在网络节点中使用已选信源编码模式来编码在通信链路上传输的话音数据。 0014 在一些实施例中,不同可选信源编码模式可以与一个信源编解码器相关联,而在 其他实施例中,一些不同可选信源编码模式可以与不同信源编解码器分别相关联。。
21、 0015 在一些实施例中,不同可选信源编码模式中的至少一种可以与提供至少一种低延 迟模式的适应性多速率(AMR)信源编解码器相关联,其中可以不等待有效采样填满先行区 说 明 书CN 102792372 A 3/8页 7 就开始该至少一种低延迟模式的编码过程。可以通过修改IPC分析窗口形状和/或在时间 上移动IPC分析窗口来提供该至少一种低延迟模式。 0016 在一些实施例中,不同可选信源编码模式中的至少一种可以与可伸缩编解码器相 关联,该可伸缩编解码器具有有核心编码层和至少一个增强编码层,其中不同编码层与不 同固有延迟相关联。当同与更高固有延迟相关联的层有关的信号的传输暂停时,可以避免 延迟。
22、同与低固有延迟相关联的层有关的信号,而为了使该信号同步于同与更高固有延迟相 关联的层有关的信号,通常会执行延迟。 0017 在一些实施例中,可以基于以下因素确定不同参数:已选信源编码模式,例如可用 于通信链路上的重传的时间间隔持续时间;通信链路上允许的重传次数和/或通信链路上 传输的信号的接收机中使用的抖动缓冲区大小。这些备选是能够怎样使得从信源编码获得 的“延迟预算”可用于传输的示例。 0018 在一些实施例中,已获取的与通信链路的质量有关的信息与以下参数中的至少一 个有关:在通信链路上重传花费的时间;通信链路上分组的重传数量;在通信链路上的传 输中丢失的分组的数量;在通信链路上接收的损坏的。
23、或无用的分组数量以及以上列出的参 数之一的预定变化。 0019 在一些实施例中,可以在确定通信链路的质量差时选择与相对低信源编码延迟相 关联的信源编码模式,并且在确定通信链路的质量好时选择与相对高信源编码延迟相关联 的信源编码模式。 0020 已经根据行为基本描述以上能够并入不同实施例的特征。然而,所述装置允许对 应实施例,其中不同功能单元适于执行上述特征和行为。 附图说明 0021 通过用示例性实施例并参考附图,现在将更详细描述本发明,其中, 0022 图1是示出了根据现有技术的AMR编解码器中的先行区的示意图。 0023 图2是示出了根据现有技术的随LTE空口延迟变化的LTE系统容量的示意。
24、图。 0024 图3a-c是示出了根据实施例的使信源编码延迟适应于信道环境的示意图。 0025 图4是示出了根据实施例的过程步骤的流程图。 0026 图5是示出了无线电传输实体中的装置的实施例的框图。 0027 图6a-c是示出了与不同编码延迟相关联的可选编解码器模式的不同示例性实施 例的示意图。 具体实施方式 0028 简而言之,提供了一种方法和装置,能够使用该方法和装置,通过增加时间在分组 交换会话服务中扩展可用传输延迟预算,通过降低用于话音数据信源编码的延迟而获得该 时间。通过以下方式降低信源编码延迟:提供与不同编码延迟相关联的可选信源编码模式 集合,并适应性选择与编码延迟相关联的信源编。
25、码模式,该编码延迟在给定特定估计信道 质量的情况下优化信源编码效率和传输效率之间的权衡。目的在于在给定话音服务质量 平均等级时能够实现传输容量增强,或者在给定传输容量等级时能够实现话音服务质量增 强,或两者。 说 明 书CN 102792372 A 4/8页 8 0029 一些定义:本文件中,当讨论使信源编码的性能适应于通信链路的质量的过程时, 将使用一些表达,将在这里简单定义其中一些表达。 0030 术语“信源编码延迟”指代针对例如话音数据等的信源编码算法的执行所需的时 间。该算法信源编码延迟是从输入采样送入编码器到解码器再现该采样的时间,其中排除 需要用于在编码器和解码器之间的传已编码语音。
26、信号的计算或传输的时间。该延迟可能是 编码器在缓冲编码算法执行所需的部分输入信号时引起的。该延迟还可能是解码器在例如 能够重建语音采样之前缓冲已编码语音数据时引起的。 0031 这里术语“传输延迟”大体上指代信源编码和信源解码之间的时间,即花费在例如 打包、信道编码、交织、重传和抖动缓冲上的时间。 0032 大体上,当指代允许的延迟(例如信源编码延迟或传输延迟)量时,使用术语“延 迟预算”。 0033 术语“编解码器”按照通常具有的含义使用,即指代编码器和/或解码器。 0034 信道状态被称作“好”或“差”。没有“好”或“差”信道的严格定义,因为它取决于 例如希望或能够接收什么样的质量等级。典。
27、型地,信道状态涉及传输信道质量,可以通过 例如分组或帧擦除率、分组延迟抖动量、误码率、载频与干扰或噪声比等描述该传输信道质 量。因此,“好信道”可以被解释为具有特定希望或可接受质量的信道,而“差信道”可以被 解释为具有不希望(即太低)或不可接受质量的信道。 0035 在本发明示例性实施例中,如图3a-c示出,信源编码延迟304a适应于308信道状 态,并与传输延迟预算306a对立。当确定信道状态好时,不扩展传输延迟预算306b就能够 达到可靠传输。因此,在好信道状态期间,如图3b所示出,为了提高数据压缩率,最好在信 源编解码器上花费延迟。另一方面,当确定信道状态差时,如图3c所示出,通过在传输。
28、上花 费更多可用端对端延迟预算302,能够获得相对更多增益,例如通过在H-ARQ(混合自动重 传请求)协议中增加允许重传次数、通过增加抖动缓冲长度或通过使用更长或更有效信道 编码或更长交织,用在信源编解码器中花费更少延迟作交换,所有这些都是以仅轻微牺牲 信源编码效率为代价。 0036 假定接收机部署补偿已接收语音数据分组的时延抖动的抖动缓冲区。重要的是 抖动缓冲区同样非常适合补偿信源编码延迟的变化。如果经过合适度量,抖动缓冲区能够 执行语音编码延迟改变而不造成重建语音信号的不连续。可以考虑互联网工程任务小组 (IEIF)实时传输协议(RTP),RFC3550(注释请求),它典型地用于PS会话话。
29、音传输。该协议 为每个分组打上时间戳,该时间戳指示通过该分组传输的第一个话音采样的采样时刻。因 此,不管延迟是花费在信源编码上还是传输上,该时间戳信息提供关于由其他传输分组代 表的话音部分的已重建话音部分的准确时间位置。只要抖动缓冲区足够深以致没有缓冲区 上溢或下溢发生,那么像传输引起的任意其他延迟抖动一样,简单地处理编码延迟的变化。 0037 与本发明相关的一项观察结果是虽然模式中的一个(MR122)不针对信源编码使 用所有25毫秒,PS环境中AMR多模式编解码器针对所有编解码器模式为端对端延迟做出 同样25毫秒贡献。虽然如图1中示出,模式MR10.2及以下(即更低编码率)针对更有效 信源编。
30、码使用5毫秒先行区,模式MR122将没有使用的先行区留给信源压缩。在模式MR122 中,仅为VAD(声音活动检测)使用5毫秒的先行区。因此,在当前在模式122中使用的AMR 编解码器中,直到先行区填满有效语音采样,才处理输入信号帧。在针对CS语音传输的AMR 说 明 书CN 102792372 A 5/8页 9 应用中激发该等待,其中限制传输时间时刻每20毫秒定期发生,并且其中在AMR模式间的 模式切换仅能够在任意20毫秒界限发生。然而,PS传输不工作在同样限制下。在PS传输 中,如上所述,每一个话音分组与一个时间戳相关联。因此,不需要和CS系统中做法一样等 待且仅在预定时间发送分组。而是一旦。
31、要以分组发送的已编码话音数据可用时,就能够发 送该数据。因此,能够比包含用其他AMR模式编码的话音数据的话音分组早5毫秒发送用 AMR模式MR122编码的已编码话音数据。 0038 延迟是有效传输的重要属性,并且能够用于更有效信源编码(即更好压缩效率) 或用于如前所述的传输错误的增强恢复力。如在当前语音传输系统中的情况,能够次优选 地考虑将作为端对端延迟分量的信源编码延迟在所有传输状态下保持为固定。由于许多应 用响应于传输系统配置和状态而适应信道编码延迟的事实,应该看到这种情况。 0039 能够在两个传统编解码器(例如AMR编解码器)中应用本发明的思想,并能够在 新编解码器开发中应用本发明的思。
32、想。 0040 在本发明的一个与AMR相关的实施例中,当足够量的输入信号采样可用时,立即 开始输入信号语音帧的处理。针对编码模式MR122,这意味着不等待先行区填满有效采样就 开始编码过程,即编码过程开始和结束比传统使用情况早5毫秒。因此,能够比传统使用情 况早5毫秒开始传输。因此,能够以许多方式使用从信源编码获得的5毫秒,在涉及PS语 音传输的实时应用中提高传输效率。应注意的是,该方法可能需要AMR编解码器中VAD算 法的修改,然而这并不与本发明大体思路相冲突。 0041 在涉及不同于AMR编解码器的新编解码器或传统编解码器的一个实施例中,提供 具有至少两种模式的话音编解码器。这些模式中的一。
33、个是具有20毫秒延迟的低延迟模式, 它典型地在低比特率(例如8kbps)下工作。给定低速率和延迟,此模式提供相当好的但不 是杰出的话音质量。该至少两种模式中的第二种是高速率高质量模式,具有例如40毫秒编 码延迟,在例如16或24kbps比特率下工作。每当估计信道状态好时,不需要扩展传输延迟 预算,并且可用延迟最好花费在与较高编码延迟相关联的高质量编解码器模式。然而,当信 道状态降低时,最好切换到低速率编解码器模式,由于较低编码延迟,该低速率编解码器模 式允许在传输中花费更多延迟,这继而使传输更可靠和更有效。 0042 在一个实施例中,完全不修改传输链剩余部分(即在信源编解码以后)。在此实施 例。
34、中,从唯一事实(更多时间可用于向接收机传输语音分组)中,将获得传输增益。由于可 用传输时间增加,晚丢失(即当语音分组到达接收机太晚以至于不能用于解码)的可能性 将减少,并因此在不花费任何更多传输资源的情况下将提高语音质量。 0043 在应用重传协议(例如使用增加的冗余进行重传的HARQ协议)的系统的实施例 中,能够使用额外毫秒量的传输时间(例如与AMR相关的5毫秒)来增加重传延迟预算,并 因此允许增加重传次数。这种增加在给定同样传输资源使用(例如带宽)情况下将带来更 可靠传输。备选地,能够降低传输资源使用,同时仍然保持相同传输可靠性(例如QoS(服 务质量)等级)。因此,能够为增强语音质量或为。
35、增加传输系统容量或两者,使用额外毫秒 量。值得指出的是,不增加计算复杂度而实现质量和/或容量增益。 0044 进一步,除了在编码过程中使用先行区的传统模式,能在语音编解码器中提供备 选的不使用先行区的低延迟编码器操作模式。在AMR编解码器中,能够通过更改IPC(线性 预测编码)分析窗口,使得在编码过程中将使用更少或完全不使用先行区,来实现现有AMR 说 明 书CN 102792372 A 6/8页 10 模式(例如MR10.2)的低延迟变体。是使用常规的还是使用低延迟的编码器变体的选择能 要么是固定的(即针对有些模式,使用低延迟变体)要么是自适应的。一个自适应可能性是 在呼叫建立时确定使用哪种。
36、模式变体,这是例如基于无线电接入网的容量或负载统计。在 高业务负载有可能发生的情况下,为了有助于最大化系统容量,可以选择低延迟变体。另一 自适应可能性是允许在呼叫期间,基于从该无线电网络接收端或一些控制实体中获得的实 际信道状态估计,在模式的低延迟变体和原始版本之间在线切换。如上概述,则可以将低延 迟操作模式备选用于差信道状态下的更有效传输。将缩短IPC分析窗口,这是以稍微降低 相应低延迟(例如AMR编解码模式)模式的固有质量为代价。然而,这种质量的降低将通 过质量增益得到补偿,该质量增益是由于为了处理差信道状态而增加的容量得到的。 0045 为了保证在几乎所有时间达到最优可能语音质量,应该使。
37、信源编码延迟(即信源 编解码器模式的选择)适应于当前信道状态。例如,当确定信道状态相对好并且当不需要 用于传输增强的额外延迟时,信源编解码器可以使用编码器先行区,运行在常规模式下。然 而,当确定信道状态相对差并且当确定从获得用于传输的额外时间所获取的增益由于例如 IPC分析窗口降低而超过指定质量损失时,选择低延迟信源编码模式。这样的适应性将需 要从接收端到发送端自适应数据的传输。该自适应数据可以包括信道测量数据(例如分组 丢失率)和/或可以包括指定编解码器模式的请求。在低分组丢失率的情况下,能够选择 和/或要求具有先行区的常规编码模式。在高分组丢失率的情况下,能够选择和/或要求 低延迟编码模式。
38、。 0046 进一步,能够直接响应于已选编码延迟或与特定编码延迟相关联的已选编码模 式,适应HARQ重传允许次数。例如,当信源编解码器在“低延迟”模式中运行时,优选地设 定HARQ协议允许重传最大次数为比该编码器运行在“高延迟”模式下时更大的数。这样的 HAQR协议直接控制并不总是可能的或希望的,因为它需要MAC(媒体接入控制)层接收编码 器使用哪个层或模式的指示。然而,在从移动电话到网络上行链路传输情况中,其中在相同 物理移动电话设备中实现IP栈时,这样直接控制HARQ上行协议是明显可行的。能够基于 使用的编解码器模式或通过RTP分组时间戳的检查,促进编码延迟检测,在RTP分组中容易 检测编。
39、码延迟改变。在用于下行链路传输的HARQ协议情况下,这种基于层间通信的适应性 方法同样是可能的,虽然认为这是涉及不恰当努力并因此是不希望的。 0047 然而,可以通过使用从接收端到编码端的反馈来避免这样的层间通信。例如,使信 源编解码器模式适应于信道状态将保证在好信道状态期间在信源编解码器中使用具有先 行区的原始“高延迟”模式。进一步,当信道状态良好时,由HARQ重传引起的延迟较短。那 么,当信道状态恶化时,由HARQ重传引起的延迟增加,接收机能够检测到该延迟。因此,可 以使用花费在重传上的时间的某种检测到的增加,和/或接收到重传的数量,和/或丢失分 组数量的某种检测到的增加,作为决定使用不具。
40、有先行区的低延迟编码器模式的标准。开 始,例如在会话建立时,可以将HARQ协议允许重传次数设置为较高数,该较高数与低延迟 信源编码相匹配。指定为RFC 3550部分的IETF RTP控制协议(RTCP)提供必需的协议组 成部分,该协议组成部分促进反馈信息从接收端到编码端的传输。 0048 相似的编解码器延迟自适应策略可用固有多于一个编码延迟选项的编解码器实 现。这种编解码器的例子是可伸缩编解码器,例如具有ACELP(代数码激励线性预测)核心 层和MDCT(改进的离散余弦变换)增强层的G.718。典型地,ACELP层需要比MDCT增强层 说 明 书CN 102792372 A 10 7/8页 1。
41、1 更少的编码延迟。为了同步这些层,在解码器中延迟ACELP层信号,这样该ACELP层信号与 重建的MDCT增强层信号将有相同延迟。可以将这样为了同步层而引入额外延迟看作和AMR 模式MR122未使用的先行区延迟相似的延迟预算的浪费部分。如果使该延迟可用于增加传 输延迟预算,它将被更好地使用。根据一个实施例,以上描述的编解码器和相似编解码器种 类可以适用于以下情况: 0049 当确定信道状态好时,对语音进行信源编码以使用核心和增强层来传输。接着,使 用使用原始高延迟语音解码器模式在接收端执行信源解码,该高延迟语音解码器模式延迟 ACEIP核心层信号以使该CEIP核心层信号与增强层重建信号同步。。
42、当确定信道状态差时, 暂停增强信息(例如与MDCT相关的信息)的传输并且仅发送核心层信息。因此,当确定信 道状态差时,不是延迟解码器中已解码ACEIP层信号(这是现有的情况),而是可以起而代 之,例如在HARQ协议中使用传统用于层同步的时间,用来实现其他重传,或者在接收机抖 动缓冲区中使用传统用于层同步的时间,使该抖动缓冲区长度相应增加。能够在例如建立 时确定何时使用不同解码延迟的配置,或者能够在会话期间自适应地改变何时使用不同编 码延迟的配置。 0050 应该指出,同样能够将已描述的自适应推广到互不关联的完全不同的信源编解码 器之间的切换,该已描述的自适应是在好信道状态下具有更长延迟和对应更。
43、短传输延迟的 信源编码与在差信道状态下具有更短延迟和对应更长传输延迟的信源编码之间的自适应。 例如,当确定信道状态好时能够使用与长编码延迟相关联的音频编解码器,并且当确定信 道状态差时能够使用与相对较短编码延迟相关联的语音编解码器。接着,能够使该编码延 迟差异可用于当确定信道状态差时的信道编码,或者如以上实施例所述,可用于HAQR协议 中以实现进一步重传,或者可用于接收机抖动缓冲区,使缓冲区长度相应增加。 0051 现在将参考图4描述使信源编码性能适应于通信链路的质量的过程的实施例。起 初,在步骤402中接收数据。取决于是在端节点还是在中央控制节点中应用该过程,已接收 数据是传输前将信源编码的。
44、话音数据或与将信源编码的话音数据有关的信息。 0052 在步骤404获取与通信链路的质量有关的信息。能够例如通过对从通信链路上接 收到的传输的测量、从另一网络实体接收到通信链路质量报告或者通过使用任意其他合适 方法,获取信息。接着,在步骤406中,基于在步骤404中获取的信息,从至少两个信源编码 模式的集合中选择一种信源编码模式。能够通过比较表示在步骤404中获取的质量信息的 值和预定阈值,进行以上步骤。当该值低于阈值时,选择低延迟编解码器模式,否则,选择另 一模式。该集合中不同信源编码模式与不同信源编码延迟相关联,并且从该集合中选择信 源编码模式涉及为了匹配通信链路的质量,则选择期望的信源编。
45、码延迟。当在用来编码已 接收话音数据的端节点中应用该过程时,在步骤408中使用已选信源编码模式来编码已接 收话音数据,并且接着在步骤410中,向另一网络节点传输该已信源编码的话音数据。当在 中央控制节点或例如用来在通信链路上传输之后接收已编码数据的端节点)中应用该过 程时,在步骤410中向一个或多个其他网络节点提供已选信源编码模式的指示。 0053 该过程可以该包括步骤407,该步骤基于已选信源编码模式,确定例如可用于重传 的时间间隔持续时间、和/或当使用已选信源编码模式时通信链路上允许的重传次数、和/ 或在通信链路上传输的信号的接收机中将使用的抖动缓冲区大小。接着向涉及的网络节点 提供已确定。
46、参数,该参数用来在会话服务的通信链路上的话音传输期间使用,该话音已用 说 明 书CN 102792372 A 11 8/8页 12 已选信源编码模式信源编码了。 0054 以下将参考图5描述示例性装置500,该装置适于能够在网络实体中执行以上描 述的过程。该装置500包括接收单元502,该单元适于接收从其他网络实体传输的信号和 /或以声波形式到达网络实体的信号,这取决于是在端节点还是在中央控制节点提供装置 500。装置500还包括质量单元504,该单元适于获取与通信链路的估计质量有关的信息。 该信息能够例如源自对从通信链路接收的传输的测量,或者源自从另一网络实体接收的通 信链路质量报告,或者通。
47、过使用任意其他合适方法获得。装置500还包括选择单元506,该 单元适于基于在质量单元504中获取的信息,从与不同编码延迟相关联的至少包含两个信 源编码模式的集合中选择一个信源编码模式。当在端节点中提供该装置时,该装置还包括 信源编码单元508,该单元适于使用通过选择单元506选择的信源编码模式来对已接收话 音数据进行信源编码。信源编码单元508能够包括例如一个或多个信源编解码器或者具有 以上不同编解码器模式(具有不同延迟)的一个编解码器。装置500还包括传输单元510。 在端节点中,该传输单元510适于在通信链路上传输已编码话音数据和/或向一个或多个 其他网络节点提供已选信源编码模式的指示。。
48、在中央控制节点中,该传输单元510适于向 一个或多个其他网络节点提供已选信源编码模式的指示。 0055 装置500可以还包括确定单元507,该单元适于基于已选信源编码模式,确定例如 以下中的至少一项:可用于通信链路上的重传的时间间隔持续时间;通信链路上允许的重 传次数;通信链路上传输的信号的接收机中的抖动缓冲区大小。接着向涉及的网络节点或 功能单元提供已确定参数,这是通过从单元507起的虚线箭头示意性示出的。 0056 图5还示出了计算机程序产品(CPP)514,该产品包括指令516,当通过处理器512 或类似组件执行该指令时,该指令将使单元504-510根据已描述过程的实施例执行它们的 任务。
49、。通过从512起的虚线箭头示意性示出了处理器512和单元504-510之间的连接。 0057 应该注意的是,图5仅逻辑地示出了装置500的各种功能单元。然而,技术人员可 以使用任意合适软件和/或硬件装置(例如ASIC(专用集成电路)、FPGA(现场可编程门阵 列)和DSP(数字信号处理器)在实际中自由实现这些功能。因此,本发明通常并不限于 装置500示出的结构。 0058 在图6a-c中示出可选编解码器模式分量的不同示例性实施例。图6a示出了根据 一个实施例的编解码器,该编解码器的每个编码率有多于一个编解码模式,至少一个编码 率与高编码延迟相关联,至少一个编码率与低编码延迟相关联。图6b示出根据一个实施例 的编解码器,其中每个编解码器模式与不同编码率和不同编码延迟相关联。图6c示出一个 实施例,其中不同编码延迟与不同编解码器相关联,每个编解码器具有不同编码率模式。备 选地,能够以不同方式改变和/或合并所述实施例。可能的可选编码延迟数量显然不限于 这里为了简洁而使用的两个备选“高”和“低”。 0059 以上实施例的示例性优点是能够用信源编。