《谐波音频信号的带宽扩展.pdf》由会员分享,可在线阅读,更多相关《谐波音频信号的带宽扩展.pdf(20页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 104221082 A (43)申请公布日 2014.12.17 CN 104221082 A (21)申请号 201280071983.7 (22)申请日 2012.12.21 61/617,175 2012.03.29 US G10L 21/038(2006.01) (71)申请人 瑞典爱立信有限公司 地址 瑞典斯德哥尔摩 (72)发明人 塞巴斯蒂安内斯隆德 沃洛佳格兰恰诺夫 托马斯詹森托夫特戈德 (74)专利代理机构 中科专利商标代理有限责任 公司 11021 代理人 赵伟 (54) 发明名称 谐波音频信号的带宽扩展 (57) 摘要 一种在编解码器中支持谐波音频。
2、信号的带宽 扩展 (BWE) 的方法和装置。编解码器的解码器部 分中的方法包括 : 接收与频带 b 及频带 b 的多个 相邻频带相关联的多个增益值。 所述方法还包括 : 确定重建的对应频带 b 是否包括谱峰。当频带 b 包括谱峰时, 基于接收到的多个增益值将与频 带 b 相关的增益值设置为第一值 ; 否则基于接收 到的多个增益值将所述增益值设置为第二值。本 发明使得增益值与带宽扩展频域中的波峰位置一 致。 (30)优先权数据 (85)PCT国际申请进入国家阶段日 2014.09.28 (86)PCT国际申请的申请数据 PCT/SE2012/051470 2012.12.21 (87)PCT国际。
3、申请的公布数据 WO2013/147668 EN 2013.10.03 (51)Int.Cl. 权利要求书 2 页 说明书 10 页 附图 7 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书10页 附图7页 (10)申请公布号 CN 104221082 A CN 104221082 A 1/2 页 2 1. 一种由变换音频解码器执行的用于支持谐波音频信号的带宽扩展 “BWE” 的方法, 所 述方法包括 : - 接收 (401a) 与频带 b 及频带 b 的多个相邻频带相关联的多个增益值 ; - 确定 (404a) 带宽扩展频率区域的重建的对应频带 b 是。
4、否包括谱峰, 以及 : 当重建的频带 b 包括至少一个谱峰时 : - 基于接收到的多个增益值, 将与重建的频带 b 相关联的增益值设置 (406a : 1) 为第 一值 ; 以及 当重建的频带 b 不包括任何谱峰时 : - 基于接收到的多个增益值, 将与重建的频带 b 相关联的增益值设置 (406a : 2) 为第 二值, 其中, 所述第二值小于或等于所述第一值 ; 从而使得增益值与所述带宽扩展频率区域中的波峰位置一致。 2. 根据权利要求 1 所述的方法, 其中, 所述第一值是接收到的多个增益值的加权和。 3. 根据权利要求 2 所述的方法, 其中, 所述加权和是接收到的多个增益值的平均值。。
5、 4. 根据前述权利要求的任意一项所述的方法, 其中, 所述第二值是接收到的多个增益 值中最小的增益值之一。 5. 根据前述权利要求中任一项所述的方法, 其中, 所述第二值是接收到的多个增益值 之中的最小增益值。 6. 根据前述权利要求中任一项所述的方法, 还包括 : - 接收 (402b) 反映原始信号的高频部分的至少一段的波峰能量与噪声底能量之间的 关系的系数 ; - 基于接收到的系数 , 将对应的重建的高频段的变换系数与噪声混合 (403b), 从而能够实现所述原始信号的所述高频部分的噪声特性的重建。 7. 一种用于支持谐波音频信号的带宽扩展 “BWE” 的音频解码器 (501), 所述。
6、音频解码 器包括 : - 接收单元, 适于接收与频带 b 及频带 b 的多个相邻频带相关联的多个增益值 ; - 确定单元 (504), 适于确定带宽扩展频率区域的重建的对应频带 b 是否包括谱峰 ; - 增益应用单元 (508), 适于 : - 当重建的频带 b 包括至少一个谱峰时, 基于接收到的多个增益值将与重建的频带 b 相关联的增益值设置为第一值 ; 以及 - 当重建的频带 b 不包括任何谱峰时, 基于接收到的多个增益值将与重建的频带 b 相 关联的增益值设置为第二值, 其中, 所述第二值小于或等于所述第一值 ; 从而使得增益值与所述带宽扩展频率区域中的波峰位置一致。 8. 根据权利要求。
7、 7 所述的音频解码器, 其中, 所述第一值是接收到的多个增益值的加 权和。 9. 根据权利要求 8 所述的音频解码器, 其中, 所述加权和是接收到的多个增益值的平 均值。 10. 根据权利要求 7-9 中任一项所述的音频解码器, 其中, 所述第二值是接收到的多个 增益值之中最小的增益值之一。 11. 根据权利要求 7-10 中任一项所述的音频解码器, 其中, 所述第二值是接收到的多 权 利 要 求 书 CN 104221082 A 2 2/2 页 3 个增益值之中的最小增益值。 12. 根据权利要求 7-11 中任一项所述的音频解码器, 还适于接收反映原始信号的高频 部分的至少一段的波峰能量。
8、和噪声底能量之间的关系的系数 ; 以及还包括 : - 噪声混合单元 (510), 适于基于接收到的系数 将对应的重建的高频段的变换系数 与噪声混合, 从而能够实现所述原始信号的所述高频部分的噪声特性的重建。 13. 一种包括根据权利要求 6-12 中任一项所述的音频解码器的用户设备。 14. 一种由变换音频编码器执行的用于支持谐波音频信号的带宽扩展 “BWE” 的方法, 所述方法包括 : - 确定 (602) 与在谐波音频信号的频谱的上部中的频带 b 相关联的波峰能量 ; - 确定 (603) 与所述频带 b 相关联的噪声底能量 ; -基于所确定的波峰能量和噪声底能量, 确定(604)与所述频。
9、带b相关联的噪声混合系 数 ; 以及 - 向对应的变换音频解码器提供 (606) 所述噪声混合系数 。 15.根据权利要求14所述的方法, 其中, 所述频谱的上部是包括比BWE交叉频率更高频 率的部分。 16. 一种用于支持谐波音频信号的带宽扩展 “BWE” 的音频编码器, 所述音频编码器包 括 : -确定单元(704), 适于确定与在谐波音频信号的频谱的上部中的频带b相关联的波峰 能量和噪声底能量 ; - 噪声系数单元 (706), 适于基于所确定的波峰能量和噪声底能量, 确定与所述频带 b 相关联的噪声混合系数 ; 以及 - 提供单元 (708), 适于向对应的变换音频解码器提供所述噪声混。
10、合系数 。 17. 一种包括计算机可读代码的计算机程序 (810), 当在处理单元中运行时, 使得音频 解码器执行根据权利要求 1-6 中任一项所述的方法。 18. 一种计算机程序产品 (808), 包括计算机可读介质和存储在所述计算机可读介质 中的根据权利要求 16 所述的计算机程序 (810)。 权 利 要 求 书 CN 104221082 A 3 1/10 页 4 谐波音频信号的带宽扩展 技术领域 0001 本发明涉及音频信号的编码和解码, 更具体地, 涉及支持谐波音频信号的带宽扩 展 (BWE)。 背景技术 0002 基于变换的编码是当今的音频压缩 / 传输系统中最常用的方案。这种方案。
11、的主 要步骤是首先通过合适的变换 ( 例如 DFT( 离散傅立叶变换 )、 DCT( 离散余弦变换 ) 或 MDCT( 修正离散余弦变换 ) 将信号波形的短块转换到频域。然后变换系数被量化、 发送或 存储且随后用于重建音频信号。这种方案对于一般的音频信号有效, 但是需要足够高的比 特速率以创建变换系数的足够好的表示。下面将给出这种变换域编码方案的高层概述。 0003 将要编码的波形逐块地变换到频域。 用于此目的一个常用变换是所谓的修正离散 余弦变换(MDCT)。 将由此得到的频域变换矢量分成频谱包络(缓慢变化的能量)和频谱残 留。频谱残留是使用所述频谱包络对所获得的频域矢量进行归一化而获得的。。
12、对频谱包络 进行量化, 将量化指标发送到解码器。 接下来, 使用量化的频谱包络作为比特分配算法的输 入, 并基于频谱包络的特性分配用于编码残留矢量的比特。 作为此步骤的结果, 某个数量的 比特被分配给残留的不同部分 ( 残留矢量或 “子矢量” )。一些残留矢量不接收任何比特且 必定是充满噪声的或带宽扩展的。 通常, 残留矢量的编码是两个步骤的过程 ; 首先对矢量项 的幅值进行编码, 接着对非零项的符号 ( 不要与 “相位” 混淆, 相位是与例如傅立叶变换相 关的 ) 进行编码。将针对于残留幅值和符号的量化指标发送给解码器, 在解码器中将残留 和频谱包络进行组合, 并最终变换回时域。 0004 。
13、电信网络的容量在持续增长。 然而, 尽管有增长的容量, 仍然存在限制每一通信信 道所需带宽的强驱动力。在移动网络中, 用于每个呼叫的较小的传输带宽在移动设备和服 务于该设备的基站两者中都产生较低的功率消耗。 这转化成了移动运营商能量和成本的节 约, 同时, 最终用户将体验到延长的电池寿命和增长的通话时间。此外, 每一用户消耗的带 宽越少, 移动网络能够 ( 并行地 ) 服务的用户就越多。 0005 提高将被以低的或中等的比特速率传送的音频信号质量的一个方法是集中可用 的比特以精确地表示音频信号中的较低频率。因此, 使用 BWE 技术来基于仅需要少量比特 的较低频率塑造较高频率。这些技术的背景是。
14、人类听觉系统的灵敏度取决于频率。具体而 言, 人类听觉系统 ( 例如我们的听力 ) 对于较高频率不太精确。 0006 在典型的频域 BWE 方案中, 高频变换系数按照频带进行分组。针对每个频带, 对增 益 ( 能量 ) 进行计算、 量化并发送 ( 至信号的解码器 )。在解码器端, 用高频增益对所接收 到的低频系数的翻转或平移 (translate) 及能量归一化版本进行缩放 (scale)。这样, BWE 并不完全是 “瞎的” , 因为至少频谱能量与目标信号的高频频带的频谱能量相似。 0007 然而, 某些音频信号的 BWE 可能会导致音频信号包含瑕疵, 这对听众带来烦恼。 发明内容 说 明 。
15、书 CN 104221082 A 4 2/10 页 5 0008 本文提出了支持和改善谐波音频信号的 BWE 的技术。 0009 根据本发明的第一方面, 提出了一种变换音频解码器中的方法。该方法用于支持 谐波音频信号的带宽扩展 (BWE)。所提出的方法可以包括与频带 b 及频带 b 的多个相邻频 带相关的多个增益值的接收。 所提出的方法还包括确定带宽扩展频率区域的重建的对应频 带 b 是否包括谱峰。此外, 如果该频带包括至少一个谱峰, 该方法包括基于所接收到的多 个增益值将与频带 b 相关的增益值 Gb设置为第一值。如果该频带不包括任何谱峰, 该方 法包括基于所接收到的多个增益值将与频带 b 。
16、相关的增益值 Gb设置为第二值。因此使得 增益值与频谱的带宽扩展部分中的波峰位置一致。 0010 此外, 该方法可能包括 : 接收反映原始信号的高频部分的至少一段的波峰能量与 噪声底能量之间关系的参数或系数 。该方法还可以包括 : 基于接收到的系数 , 将对应 的重建的高频段的变换系数与噪声混合。从而使得可以重建 / 仿真原始信号的高频部分的 噪声特性。 0011 根据本发明的第二方面, 提出了一种支持谐波音频信号的带宽扩展 (BWE) 的变换 音频解码器或编解码器。该变换音频编解码器包括适于执行上面描述的动作的功能单元。 此外, 提出了一种变换音频编码器或编解码器, 包括适于导出或提供一个或。
17、更多个参数的 功能单元, 当将所述一个或更多个参数提供给变换音频解码器时, 能够进行本文描述的噪 声混合。 0012 根据本发明的第三方面, 提出了一种用户终端, 其包括根据本发明第二方面的变 换音频编解码器。用户终端可能是例如移动终端、 平板设备、 计算机、 智能电话等诸如此类 的设备。 附图说明 0013 现在将通过示例性的实施例并参照附图的方式更详细地描述本发明, 在附图中 : 0014 图 1 示出了谐波音频频谱, 即谐波音频信号的频谱。这种类型的频谱通常针对于 例如单一乐器声音、 嗓音等。 0015 图 2 示出了谐波音频频谱的带宽扩展。 0016 图 3a 示出了用解码器接收到的对。
18、应 BWE 频带增益来进行缩放的 BWE 频谱 ( 也 在图 2 中示出 )。频谱的 BWE 部分严重失真。 0017 图3b示出了本文提出的利用修正的BWE频带增益来进行缩放的BWE频谱。 在 这种情况下, 频谱的 BWE 部分得到了所希望的形状。 0018 图4a和图4b是示出了根据示例性实施例的变换音频解码器中的过程中的动作的 流程图。 0019 图 5 是示出了根据示例性实施例的变换音频解码器的框图。 0020 图 6 是示出了根据示例性实施例的变换音频编码器中的过程中的动作的流程图。 0021 图 7 是示出了根据示例性实施例的变换音频编码器的框图。 0022 图 8 是示出了根据示。
19、例性实施例的变换音频解码器中的装置的框图。 具体实施方式 说 明 书 CN 104221082 A 5 3/10 页 6 0023 如上所述, 音频信号的带宽扩展与一些问题相关联。 在解码器中, 当翻转或平移低 频带(即经编码、 传输和解码的频带部分)以形成高频带时, 不能确定谱峰将会与原始信号 或 “真实的” 高频带中的谱峰结束于 (end up) 相同的频带中。来自低频带中的谱峰也许会 结束于在原始信号没有波峰的频带中。 还可能是另一种方式, 即, 低频信号的没有波峰的部 分(在翻转或平移之后)结束于原始信号具有波峰的频带中。 图1提供了谐波频谱的示例, 图 2 提供了 BWE 原理的图示。
20、, 接下来将对此作进一步的描述。 0024 如上描述的效果可能导致具有主要谐波内容的信号产生严重质量下降。 原因是波 峰和增益位置间的这种不匹配将导致不必要的波峰衰减, 或者两个谱峰之间低能量频谱系 数的放大。 0025 本文描述的方案涉及一种基于与波峰位置有关的信息来控制带宽扩展区域的带 宽增益的新方法。 此外, 本文提出的BWE算法能够通过所发送的噪声混合等级来控制 “谱峰 噪声底比” 。这导致了在扩展的高频中保留大量结构的 BWE。 0026 本文描述的方案适用于谐波音频信号。图 1 示出了谐波音频信号的频谱 ( 还可以 表示为谐波频谱)。 从图中可以看出, 频谱包括波峰。 这种类型的频。
21、谱典型地适用于例如单 一乐器 ( 如长笛 ) 的声音或者嗓音等。 0027 本文将讨论谐波音频信号频谱的两个部分。一个包括较低频率的下部, 其中 “下” 表示低于将要进行带宽扩展的部分 ; 一个包括较高频率的上部, 例如比下部高。 本文使用的 像 “下部” 或 “低 / 较低频率” 之类的表达指的是谐波音频频谱的低于 BWE 交叉频率的部分 ( 参见图 2)。类似地, 像 “上部” 或者 “高 / 较高频率” 之类的表达指的是谐波音频频谱的 高于 BWE 交叉频率的部分 ( 参见图 2)。 0028 图 2 示出了谐波音频信号的频谱。本文接下来讨论的两个部分, 在 BWE 交叉频率 左边的可看。
22、作下部, 在 BWE 交叉频率右边的可看作上部。在图 2 中, 用浅灰色示出了原始频 谱, 即 ( 在编码器端看到的 ) 原始音频信号的频谱。用深 / 较深灰色示出了频谱的带宽扩 展部分。频谱的带宽扩展部分不由编码器进行编码, 而是通过使用先前描述的接收到的频 谱的下部在解码器端进行重建。在图 2 中, 出于比较的原因, 对于较高频率能看到原始 ( 浅 灰色 ) 频谱和 BWE( 深灰色 ) 频谱两者。较高频率的原始频谱对于解码器是未知的, 针对于 每一个 BWE 频带 ( 或者高频带 ) 的增益值例外。在图 2 中, BWE 频带用虚线分隔。 0029 为了更好地理解在频谱的带宽扩展部分中的。
23、增益值和波峰位置之间的不匹配的 问题, 可以研究图 3a。在频带 302a, 原始频谱包括波峰, 但重建的 BWE 频谱不包括波峰。这 在图 2 的频带 202 中可以看到。因此, 当将针对包括波峰的原始频带计算的增益应用于不 包括波峰的 BWE 频带时, 如在频带 302a 中看到的那样, 将放大 BWE 频带的低能量频谱系数。 0030 图 3a 中的频带 304a 表示了相反的情况, 即, 原始频谱的对应频带不包括波峰, 但 重建的 BWE 频谱的对应频带包括波峰。因此, 针对 ( 从编码器接收到的 ) 频带所获得的增 益是针对于低能量频带计算的。当将该增益应用于包括波峰的对应频带时, 。
24、结果变成了衰 减的波峰, 如在图 3a 的频带 304a 中所见。从感知或心理声学的观点来看, 因为多种原因, 频带 302a 中示出的情况比频带 304a 中的情况对听众来说要更糟糕。简单地描述, 也就是, 与声音分量的异常缺失相比, 体验到声音分量的异常出现通常令听众更加不愉快。 0031 接下来将描述新的 BWE 算法的一个示例, 以阐述本文所描述的概念。 0032 设Y(k)表示BWE区域(高频变换系数)中变换系数的集合。 将这些变换系数分组 说 明 书 CN 104221082 A 6 4/10 页 7 到 B 个频带中。频带大小 Mb可以是恒定的, 或者朝着高频增加。例如, 如果频。
25、带是 8 次元的且均匀的 ( 即所有的 Mb 8), 我们得到 : Y1 Y(1) . Y(8), Y2 Y(9) . Y(16) 等等。 0033 BWE 算法中的第一步骤是计算所有频带的增益 : 0034 0035 将这些增益进行量化并发送到解码器。 0036 BWE 算法中的第二步骤 ( 该步骤是可选的 ) 是计算噪声混合参数或系数 , 例 如是 BWE 频谱的平均波峰能量和平均噪声底能量的函数, 如 : 0037 0038 在这里, 已根据下面的(3)导出参数。 然而, 可以通过不同的方式(如取决于什 么适用于所使用的编解码器或量化器的类型等等 ) 来选择所使用的确切表达式。 0039。
26、 0040 可以例如通过追踪相应的最大和最小频谱能量来计算波峰和噪声底能量。 0041 可以使用少量的比特来对噪声混合参数 进行量化。在这里, 作为示例, 用两个 比特来量化 。当对噪声混合参数 进行量化时, 得到参数例如,将参数 发送到解码器。 将BWE区域分成两个或更多个段 s , 并在这些段的每一个中独立地计算噪 声混合参数 s。在这种情况下, 编码器将向解码器发送噪声混合参数的集合, 例如每个段 一个。 0042 解码器操作 0043 解码器从比特流中提取所计算的量化增益(每个频带一个)的集合以及一个或 更多个量化噪声混合参数或因子解码器还接收针对于频谱的低频部分 ( 即, ( 谐波音。
27、频 信号的 ) 频谱的已编码部分, 该低频部分与要被带宽扩展的高频部分相对 ) 的量化变换系 数。 0044 设为能量归一化的、 量化的低频系数的集合。然后将这些系数与噪声 ( 例如存 储在例如噪声码本中的预先生成的噪声 Nb) 进行混合。使用预先生成、 预先存储的噪声有 机会确保噪声的质量, 也就是噪声不包括任何无意的差异和偏差。 然而, 可以备选地在需要 时 “抽空” 生成噪声。例如将系数与噪声码本中的噪声 Nb混合如下 : 0045 0046 可以通过不同的方式设置噪声混合参数或因子的范围。例如, 这里将噪声混合因 说 明 书 CN 104221082 A 7 5/10 页 8 子的范围。
28、设置为 0, 0.4)。这个范围意味着例如在某些情况下噪声贡献被完全忽略 ( 0), 在某些情况下噪声码本在混合矢量中贡献 40 ( 0.4), 这是使用该范围时 的最大贡献。引入这种类型的噪声混合 ( 所得矢量包含例如 60至 100之间的原始低频 带结构 ) 的原因是频谱的高频部分通常比频谱的低频部分有更多噪声。因此, 与由翻转或 平移的低频频谱区域构成的 BWE 高频频谱区域相比, 上面描述的噪声混合操作创建了能够 更好地拟合原始信号频谱的高频部分的统计特征的矢量。例如, 如果提供并接收到多个噪 声混合因子 (), 可以在 BWE 区域的不同部分上独立地执行噪声混合操作。 0047 在现。
29、有技术方案中, 将接收到的量化的增益的集合直接用于 BWE 区域的对应 频带。然而, 根据本文所描述的方案, 例如在适当的时候首先基于有关 BWE 频谱波峰位置的 信息来修正这些接收到的量化的增益所需要的关于波峰位置的信息可以从比特流中 的低频区域信息中提取, 或者由波峰抓取算法基于低频带的量化变换系数 ( 或者所导出的 BWE 频带的系数 ) 进行估计。然后将低频区域中与波峰相关的信息转移到高频 (BWE) 区域 中。也就是说, 当从低频带信号推导高频带 (BWE) 信号时, 该算法能够登记谱峰位于 (BWE 区域的 ) 哪些频带。 0048 例如, 可以使用标志fp(b)来指示移动(翻转或。
30、平移)到BWE区域的频带b的低频 系数是否包含波峰。例如, fp(b) 1 指示频带 b 至少包含一个波峰, fp(b) 0 指示频带 b 不包含任何波峰。如前所述, BWE 区域中的每一个频带 b 都与增益相关联,取决于原 始信号的对应频带中包括的波峰的数目和大小。为了使增益与 BWE 区域中每个频带的实际 波峰内容相匹配, 需使增益相适应。例如根据下面的表达式对每个频带作增益修正 : 0049 0050 作此增益修正的动机如下 : 在 (BWE) 频带包含波峰 (fp(b) 1) 的情况下, 为了避 免对应的增益来自 ( 原始信号的 ) 没有任何波峰的频带时的波峰衰减, 将此频带的增益修 。
31、正为当前频带及两个相邻频带的增益的加权和。在上面的示例性公式 (5a) 中, 权重是相等 的 ( 即 1/3), 这导致修正的增益为当前频带的增益及两个相邻频带的增益的均值。例如可 根据下式实现备选增益修改 : 0051 0052 在频带不包含波峰 (fp(b) 0) 的情况下, 我们不希望通过应用从包含一个或更 多个波峰的原始信号中计算出的强增益来放大该频带中的类似噪声的结构。 为了避免这种 说 明 书 CN 104221082 A 8 6/10 页 9 情况, 选择例如当前频带增益及两个相邻频带增益的最小值作为该频带的增益。 备选地, 可 以将包括波峰的频带的增益选择或计算为 3 个以上频。
32、带 ( 如 5 或 7 个频带 ) 的加权和 ( 例 如, 均值 ), 或者选择为如 3、 5 或 7 个频带的中间值。与使用 “真实的” 增益相比, 通过使用 加权和(例如均值或中间值), 波峰也许会轻微衰减。 然而, 与相反的情况相比, 与 “真实的” 增益相比的衰减或许是有益的, 如前所述, 因为从感知的观点来看, 与导致过大音频分量的 放大相比, 适度的衰减更好。 0053 波峰不匹配的原因且因此也是增益修正的原因是频谱带位于预定的网格上, 但是 ( 翻转和平移低频系数之后的 ) 波峰位置和波峰是随时间变化的。这可能导致波峰以不可 控的方式进入或移出频带。因此因此, 频谱的 BWE 部。
33、分的波峰位置不一定与原始信号中的 波峰位置相匹配, 因此与频带相关联的增益和频带的波峰内容之间可能会存在不匹配。图 3a 示出了用未修正的增益进行缩放的示例, 图 3b 示出了用修正的增益进行缩放的示例。 0054 在图3b中可以看出使用本文提出的修正的增益的结果。 在频带302b中, 低能量频 谱系数不再像在图 3a 的频带 302a 中那样被放大, 而是用更合适的带宽增益进行缩放。此 外, 频带 304b 中的波峰不再像在图 3a 的频带 304a 中那样被衰减。与对应于图 3a 的频谱 的音频信号相比, 图 3b 中示出的频谱很可能对应于对于听众来说更令人愉快的音频信号。 0055 因此。
34、, BWE 算法可创建频谱的高频部分。因为 ( 例如为了节省带宽的原因 ) 在解 码器处高频系数Yb不可用, 所以作为替代, 通过使用修正的量化增益缩放经翻转(或平移) 的低频系数 ( 可能在噪声混合之后 ) 来重建或形成高频变换系数 0056 0057 该变换系数的集合用于重建音频信号波形的高频部分。 0058 本文描述的方案是 BWE 原理的改进, 通常用于变换域音频编码。所提出的算法保 留了 BWE 区域中的多峰结构 ( 波峰噪声底比 ), 因此提供了重建信号的改进的音频质量。 0059 术语 “变换音频编解码器” 或 “变换编解码器” 包含编码器 - 解码器对, 是该领域 中的常用术语。
35、。在本发明的公开中, 为了分别描述变换编解码器的功能 / 部件, 使用了术语 “变换音频编码器” 或 “编码器” 和 “变换音频解码器” 或 “解码器” 。因此, 可以把术语 “变换 音频编码器” /“编码器” 和 “变换音频解码器” /“解码器” 与术语 “变换音频编解码器” 或 “变换编解码器” 相交换。 0060 解码器中的示例性过程, 图 4a 和图 4b 0061 下面将参照图 4a 描述在解码器中支持谐波音频信号的带宽扩展 (BWE) 的示例性 过程。该过程适用于变换音频编码器 ( 例如 MDCT 编码器 ) 或其它编码器。音频信号主要 包括音乐, 还可以或者备选地包括例如语音。 。
36、0062 在动作 401a 中, 接收到与频带 b( 原始频带 ) 有关的增益值以及和与频带 b 相邻 的多个其他频带有关的增益值。然后在动作 404a 中确定 BWE 区域的重建的对应频带 b 是 否包括谱峰。当重建的频带 b 至少包括一个谱峰时, 在动作 406a : 1 中, 基于所接收到的多 个增益值, 将与重建的频带 b 相关的增益值设置为第一值。当重建的频带 b 不包括任何 谱峰时, 在动作 406a : 2 中, 基于所接收到的多个增益值, 将与重建的频带 b 相关的增益值 设置为第二值。第二值小于等于第一值。 说 明 书 CN 104221082 A 9 7/10 页 10 0。
37、063 在图4b中, 以略有不同及更加扩展的方式(例如具有与先前描述的噪声混合有关 的附加可选动作 ), 示出了图 4a 中所示的过程。下面将描述图 4b。 0064 在动作 401b 中接收到与频谱的上部的频带有关的增益值。假定还在某一时间点 接收到涉及频谱的下部的信息 ( 在图 4a 或图 4b 中未示出 ), 即变换系数和增益值等等。此 外, 假定在某个时间点执行带宽扩展, 通过如前所述的翻转或平移低频带频谱来创建高频 带频谱。 0065 可以在可选动作 402b 中接收一个或更多个噪声混合系数。所接收的一个或更多 个噪声混合系数已在编码器中基于原始高频带频谱中的能量分布计算出。在 ( 。
38、同样可选 的)动作403b中, 参见上面的公式(4), 使用噪声混合系数将高频带区域中的系数与噪声混 合。因此, 对于 “噪声特性” 或 “噪声分量” , 带宽扩展区域的频谱将更好地对应原始高频带 频谱。 0066 此外, 在动作 404b 中, 确定所创建的 BWE 区域的频带是否包括谱峰。例如, 如果频 带包括谱峰, 可以将与该频带相关联的指示符设置为 1。如果另一个频带不包括谱峰, 可以 将与那个频带相关联的指示符设置为 0。基于频带是否包括谱峰的信息, 在动作 405b 中修 正与所述频带有关的增益。如前所述, 当修正频带的增益时, 为了达到想要的结果, 也要考 虑相邻频带的增益。通过。
39、这种方式修正增益, 能够得到改进的 BWE 频谱。如在动作 406b 所 示的, 然后将修正的增益应用于 BWE 频谱的各个频带。 0067 示例性解码器 0068 下面, 将参照图 5 描述适于执行支持谐波音频信号的带宽扩展 (BWE) 的上述过程 的示例性变换音频解码器。变换音频解码器可以是例如 MDCT 解码器, 或其它解码器。 0069 将变换音频解码器 501 示为经由通信单元 502 与其它实体进行通信。将虚线包围 的变换音频解码器的部分示为装置500, 该部分适于实现上述过程的性能。 变换音频解码器 还可以包括其它功能单元 516, 例如提供常规解码器和 BWE 功能的功能单元,。
40、 并还可以包括 一个或更多个存储单元 514。 0070 可以通过例如以下各项中的一个或更多个来实现变换音频解码器501和/或装置 500 : 处理器或微处理器及带有合适存储设备的适当软件、 可编程逻辑设备 (PLD) 或其它电 子元件。 0071 假定变换音频解码器包括用于获得从编码实体提供的适当参数的功能单元。 与现 有技术相比, 噪声混合系数是要获得的新的参数。 因此, 解码器应当适于使得当需要一个或 更多个噪声混合系数时能够获取该一个或更多个噪声混合系数。 将音频解码器描述和实现 为包括接收单元, 该接收单元适于接收与频带 b 及频带 b 的多个相邻频带相关联的多个增 益值 ; 或许还。
41、接收噪声混合系数。然而, 图 5 中并未显式地示出这种接收单元。 0072 变换音频解码器包括确定单元 504, 也可以称作波峰检测单元, 该单元适于确定和 指示 BWE 频谱区域的哪些频带包括波峰及哪些频带不包括波峰。也就是说确定单元适于确 定带宽扩展频率区域的重建的对应频带 b 是否包括谱峰。此外, 变换音频解码器包括增益 修正单元 506, 该单元适于根据频带是否包括波峰来修正与频带相关联的增益。如果频带 包括波峰, 将修正增益计算为加权和, 例如与所讨论的频带相邻的多个频带的(原始)增益 ( 包括所讨论的频带的增益 ) 的均值或中间值。 0073 变换音频解码器还包括适于将修正增益应用。
42、或设置到 BWE 频谱的适当频带的增 说 明 书 CN 104221082 A 10 8/10 页 11 益应用单元 508。也就是说, 增益应用单元适于 : 当重建的频带 b 包括至少一个谱峰时, 基 于接收到的多个增益值将与重建的频带 b 相关联的增益值设置为第一值 ; 以及当重建的 频带 b 不包括任何谱峰时, 基于接收到的多个增益值将与重建的频带 b 相关联的增益值 设置为第二值, 其中第二值小于等于第一值。因此使得增益值与带宽扩展频率区域中的波 峰位置一致。 0074 备选地, 如果可能不作修改, 可以由 ( 常规的 ) 其他功能 516 提供应用功能, 只是 所应用的增益不是原始增。
43、益, 而是修正的增益。此外, 变换音频解码器包括噪声混合单元 510, 该噪声混合单元 510 适于基于音频信号的编码器提供的一个或更多个噪声系数或参 数来将频谱的 BWE 部分的系数与 ( 例如来自码本的 ) 噪声进行混合。 0075 示例性过程编码器 0076 下面将参照图6描述在编码器中支持谐波音频信号的带宽扩展(BWE)的示例性过 程。该过程适用于变换音频编码器 ( 例如 MDCT 编码器 ) 或其它编码器。如上文所述, 音频 信号被主要认为包括音乐, 也可以或者备选地包括例如语音。 0077 下面描述的过程涉及背离使用变换编码器的谐波音频信号的传统编码方法的编 码过程部分。因此, 下。
44、面描述的动作对于用于频谱下部的变换系数和增益等的获取和频谱 上部的频带 ( 该部分将在解码器端由 BWE 构建 ) 的增益的获取是可选的附加动作。 0078 在动作 602 中, 确定涉及频谱上部的波峰能量。此外, 在动作 603 中, 确定涉及频 谱上部的噪声底能量。 例如, 如上所述, 计算BWE频谱的一个或更多个段的平均波峰能量 和平均噪声底能量此外, 在动作 604 中, 根据一些适当的公式, 如上述的公式 (3) 计 算噪声混合系数, 使得与 BWE 频谱某些段有关的噪声系数反映所述段的噪声量或 “噪声特 性” 。在动作 606 中, 向解码实体或存储器提供一个或更多个噪声混合系数以。
45、及由编码器提 供的常规信息。所述提供包括例如仅仅将计算的噪声混合系数输出到输出端, 和 / 或例如 将该系数发送到解码器。如前所述, 在提供噪声混合系数之前, 可先对其进行量化。 0079 示例性编码器 0080 下面将参照图7描述适合执行支持谐波音频信号的带宽扩展(BWE)的上述过程的 示例性变换音频解码器。变换音频解码器可以是例如 MDCT 解码器或其它解码器。 0081 将变换音频解码器 701 示为经由通信单元 702 与其它实体进行通信。将虚线包围 的变换音频解码器的部分示为装置700, 该部分适于实现上述过程中的性能。 变换音频解码 器还可以包括其它功能单元 712, 例如提供常规。
46、编码功能的功能单元, 并且还包括一个或更 多个存储单元 710。 0082 变换音频编码器 701 和 / 或装置 700 可以通过例如以下各项中的一项或更多项来 实现 : 处理器或微处理器及带有合适存储设备的适当软件、 可编程逻辑设备 (PLD) 或其它 电子元件。 0083 变换音频编码器可以包括确定单元 704, 该确定单元 704 适于确定频谱上部的波 峰能量和噪声底能量。此外, 变换音频编码器可以包括噪声系数单元 706, 该噪声系数单元 706 适于对于频谱的整个上部或其中的段计算一个或更多个噪声混合系数。变换音频编码 器还包括提供单元708, 适于提供由编码器使用的所计算的噪声混。
47、合系数。 所述提供可以包 括例如仅将计算的噪声混合系数输出到输出端, 和 / 或将该系数发送到解码器。 说 明 书 CN 104221082 A 11 9/10 页 12 0084 示例性装置 0085 图 8 示意性地示出了适于在变换音频解码器中使用的装置 800 的实施例, 其还可 以是公开图5示出的变换音频解码器中使用的装置的实施例的备选方法。 在此, 在装置800 中包括例如带有 DSP( 数字信号处理器 ) 的处理单元 806。处理单元 806 可以是单一的单元 或者是执行本文描述的过程的不同步骤的多个单元。装置 800 还包括用于接收信号 ( 例如 经编码的频谱的下部、 整个频谱的。
48、增益和噪声混合系数 ( 参见, 如果是编码器 : 谐波频谱的 上部 ) 的输入单元 802 和用于输出信号 ( 例如修正的增益和 / 或整个频谱 ( 参见, 如果是 编码器 : 噪声混合系数 ) 的输出单元 804。可以在装置的硬件中将输入单元 802 和输出单 元 804 安排为同一个。 0086 此外, 装置 800 包括以诸如 EEPROM、 闪存和硬盘等非易失性或易失性存储器形式 的至少一个计算机程序产品 808。计算机程序产品 808 包括计算机程序 810, 计算机程序 810 包括代码, 当该代码在装置 800 的处理单元 806 中运行时, 使装置和 / 或变换音频编码 器执行。
49、先前结合图 4 描述的过程的动作。 0087 因此, 在描述的示例性中, 装置800的计算机程序810中的代码可以包括用于获得 涉及音频频谱下部的信息和涉及整个音频频谱的增益的获得模块 810a。此外, 还可以获得 涉及音频频谱上部的噪声系数。 计算机程序包括检测模块810b, 检测模块810b用于检测和 指示带宽扩展频率区域的重建频带 b 的频带是否包括谱峰。计算机程序 810 还可以包括增 益修正模块 810c, 用于修正与频谱的重建的上部的频带相关联的增益。计算机程序 810 还 可以包括用于将修正的增益应用于频谱上部的对应频带的增益应用模块 810d。此外, 计算 机程序 810 可以包括用于基于所接收到的噪声混合系数将频谱的上部与噪声进行混合的 噪声混合。