1、(10)申请公布号 CN 103795364 A (43)申请公布日 2014.05.14 CN 103795364 A (21)申请号 201410039751.4 (22)申请日 2011.02.03 61/303,643 2010.02.11 US 201180009098.1 2011.02.03 H03G 7/00(2006.01) G10L 19/16(2013.01) (71)申请人 杜比实验室特许公司 地址 美国加利福尼亚州 申请人 杜比国际公司 (72)发明人 杰弗里C里德米勒 哈拉尔德H蒙特 米夏埃尔舒格 梅尔廷沃尔特斯 (74)专利代理机构 北京集佳知识产权代理有限 公司
2、 11227 代理人 陈炜 李德山 (54) 发明名称 用于对编码输入信号进行解码的方法和设备 (57) 摘要 提供了用于对编码输入信号进行解码的方法 和设备。所述方法包括 : 接收包括编码音频信息 和相关联的元数据的编码输入信号, 相关联的元 数据包括一个或多个解码控制参数、 用于指定适 合于被第一解码模式使用的动态范围压缩的一个 或多个第一参数、 以及用于指定适合于被第二解 码模式使用的动态范围压缩的一个或多个第二参 数 ; 对编码音频信息应用解码处理, 以获得子带 信号, 其中, 响应于一个或多个解码控制参数来调 节所述解码处理 ; 修改子带信号, 以获得具有改 变的动态范围特性的修改子
3、带信号, 其中, 响应于 一个或多个第二参数来调节所述修改 ; 对修改子 带信号应用合成滤波器组, 以获得时域音频信号 ; 以及对时域音频信号施加增益并应用限制器。 (30)优先权数据 (62)分案原申请数据 (51)Int.Cl. 权利要求书 2 页 说明书 10 页 附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书10页 附图3页 (10)申请公布号 CN 103795364 A CN 103795364 A 1/2 页 2 1. 一种用于对编码输入信号进行解码以生成音频输出信号的方法, 其中, 所述方法包 括 : 接收包括编码音频信息和相关
4、联的元数据的所述编码输入信号, 其中, 所述相关联的 元数据包括一个或多个解码控制参数、 用于指定适合于被第一解码模式使用的动态范围压 缩的一个或多个第一参数、 以及用于指定适合于被第二解码模式使用的动态范围压缩的一 个或多个第二参数, 所述第一解码模式使用第一参考再现水平, 所述第二解码模式使用第 二参考再现水平 ; 对所述编码音频信息应用解码处理, 以获得子带信号, 其中, 响应于所述一个或多个解 码控制参数来调节所述解码处理 ; 修改所述子带信号, 以获得具有改变的动态范围特性的修改子带信号, 其中, 响应于所 述一个或多个第二参数来调节所述修改 ; 对所述修改子带信号应用合成滤波器组,
5、 以获得时域音频信号 ; 以及 对所述时域音频信号施加增益并应用限制器, 其中, 所述增益的施加提高所述音频输 出信号的有效参考再现水平, 并且其中, 所述限制器的应用防止所述音频输出信号的幅度 超过限幅水平。 2. 根据权利要求 1 所述的方法, 其中, 所述第一参考再现水平对应于低于所述限幅水 平31dB的幅度, 所述第二参考再现水平对应于低于所述限幅水平20dB的幅度, 并且所述有 效参考再现水平对应于低于所述限幅水平 14dB 至 8dB 的幅度。 3. 根据权利要求 2 所述的方法, 其中, 所述有效参考再现水平对应于低于所述限幅水 平 11dB 的幅度。 4. 一种用于对编码输入信
6、号进行解码以生成音频输出信号的设备, 其中, 所述设备包 括 : 用于接收包括编码音频信息和相关联的元数据的所述编码输入信号的装置, 其中, 所 述相关联的元数据包括一个或多个解码控制参数、 用于指定适合于被第一解码模式使用的 动态范围压缩的一个或多个第一参数、 以及用于指定适合于被第二解码模式使用的动态范 围压缩的一个或多个第二参数, 所述第一解码模式使用第一参考再现水平, 所述第二解码 模式使用第二参考再现水平 ; 用于对所述编码音频信息应用解码处理以获得子带信号的装置, 其中, 响应于所述一 个或多个解码控制参数来调节所述解码处理 ; 用于修改所述子带信号以获得具有改变的动态范围特性的修
7、改子带信号的装置, 其 中, 响应于所述一个或多个第二参数来调节所述修改 ; 用于对所述修改子带信号应用合成滤波器组以获得时域音频信号的装置 ; 以及 用于对所述时域音频信号施加增益并应用限制器的装置, 其中, 所述增益的施加提高 所述音频输出信号的有效参考再现水平, 并且其中, 所述限制器的应用防止所述音频输出 信号的幅度超过限幅水平。 5. 根据权利要求 4 所述的设备, 其中, 所述第一参考再现水平对应于低于所述限幅水 平31dB的幅度, 所述第二参考再现水平对应于低于所述限幅水平20dB的幅度, 并且所述有 效参考再现水平对应于低于所述限幅水平 14dB 至 8dB 的幅度。 6. 根
8、据权利要求 5 所述的设备, 其中, 所述有效参考再现水平对应于低于所述限幅水 权 利 要 求 书 CN 103795364 A 2 2/2 页 3 平 11dB 的幅度。 权 利 要 求 书 CN 103795364 A 3 1/10 页 4 用于对编码输入信号进行解码的方法和设备 0001 本申请是申请号为 “201180009098.1” 、 发明名称为 “用于对便携式装置内的音频 信号的响度进行非破坏性标准化的系统和方法” 的发明专利申请 (进入国家阶段的 PCT 申 请, 其国际申请号为 PCT/US2011/023531) 的分案申请。 0002 对相关申请的引用 0003 本申请
9、要求 2010 年 2 月 11 日提交的美国专利临时申请 61/303,643 的优先权, 其 全部内容通过引用合并于此。 技术领域 0004 本申请总体涉及对音频信号的编码和解码, 并且更具体地, 涉及可用于针对较宽 范围的回放装置和收听环境对音频信号进行编码和解码的技术。 背景技术 0005 手持式和其它类型的便携式装置的日益普及已经对用于在这些装置上回放的媒 体内容的创作者和分发者产生了新的机会和挑战, 同样也已经对装置的设计者和制造者产 生了新的机会和挑战。许多便携式装置能够回放广泛的媒体内容类型和格式, 包括通常与 用于 HDTV(高清电视) 、 Blu-ray(蓝光) 或 DVD
10、(数字多功能盘) 的高质量、 宽带宽和宽动态 范围的音频内容相关联的那些媒体内容类型和格式。 便携式装置可用于在其自身的内部声 换能器上或者在诸如耳机的外部换能器上回放该类型的音频内容 ; 然而, 这些便携式装置 通常无法在变化的媒体格式和内容类型中以一致的响度和可理解度来再现该内容。 发明内容 0006 本发明涉及提供用于对音频信号进行编码和解码、 以在包括手持式和其它类型的 便携式装置的多种装置上进行回放的改进方法。 0007 根据本发明的一个方面, 提供了一种用于对编码输入信号进行解码以生成音频输 出信号的方法, 其中, 所述方法包括 : 接收包括编码音频信息和相关联的元数据的所述编码
11、输入信号, 其中, 所述相关联的元数据包括一个或多个解码控制参数、 用于指定适合于被第 一解码模式使用的动态范围压缩的一个或多个第一参数、 以及用于指定适合于被第二解码 模式使用的动态范围压缩的一个或多个第二参数, 所述第一解码模式使用第一参考再现水 平, 所述第二解码模式使用第二参考再现水平 ; 对所述编码音频信息应用解码处理, 以获得 子带信号, 其中, 响应于所述一个或多个解码控制参数来调节所述解码处理 ; 修改所述子带 信号, 以获得具有改变的动态范围特性的修改子带信号, 其中, 响应于所述一个或多个第二 参数来调节所述修改 ; 对所述修改子带信号应用合成滤波器组, 以获得时域音频信号
12、 ; 以 及对所述时域音频信号施加增益并应用限制器, 其中, 所述增益的施加提高所述音频输出 信号的有效参考再现水平, 并且其中, 所述限制器的应用防止所述音频输出信号的幅度超 过限幅水平。 0008 根据本发明的另一个方面, 提供了一种用于对编码输入信号进行解码以生成音频 说 明 书 CN 103795364 A 4 2/10 页 5 输出信号的设备, 其中, 所述设备包括 : 用于接收包括编码音频信息和相关联的元数据的所 述编码输入信号的装置, 其中, 所述相关联的元数据包括一个或多个解码控制参数、 用于指 定适合于被第一解码模式使用的动态范围压缩的一个或多个第一参数、 以及用于指定适合
13、于被第二解码模式使用的动态范围压缩的一个或多个第二参数, 所述第一解码模式使用第 一参考再现水平, 所述第二解码模式使用第二参考再现水平 ; 用于对所述编码音频信息应 用解码处理以获得子带信号的装置, 其中, 响应于所述一个或多个解码控制参数来调节所 述解码处理 ; 用于修改所述子带信号以获得具有改变的动态范围特性的修改子带信号的装 置, 其中, 响应于所述一个或多个第二参数来调节所述修改 ; 用于对所述修改子带信号应用 合成滤波器组以获得时域音频信号的装置 ; 以及用于对所述时域音频信号施加增益并应用 限制器的装置, 其中, 所述增益的施加提高所述音频输出信号的有效参考再现水平, 并且其 中
14、, 所述限制器的应用防止所述音频输出信号的幅度超过限幅水平。 0009 本发明的各种特征及其优选实施例可通过参考以下论述和附图而得到更好的理 解, 在附图中, 相同的附图标记在多幅图中指的是相同的元件。 附图和以下论述的内容仅作 为示例来阐述, 并且不应理解为表示对本发明的范围的限制。 附图说明 0010 图 1 是回放装置的示意框图。 0011 图 2 是编码装置的示意框图。 0012 图 3 至图 5 是转码装置的示意框图。 0013 图 6 是可用于实现本发明的各个方面的装置的示意框图。 具体实施方式 0014 A. 介绍 0015 本发明涉及用于对音频信息进行编码和解码, 以在具有挑战
15、性的收听环境 (诸如 手持式和其它类型的便携式装置的用户所遇到的收听环境) 中进行回放。诸如以下所描 述的公开标准描述了音频编码和解码的一些示例 : 由高级电视业务顾问委员会有限公司 (Advanced Television Systems Committee,Inc.) 在 2005 年 6 月 14 日公布的 “Digital Audio Compression Standard(AC-3,E-AC-3)” , 修订 B, 文档 A/52B(此处称为 “ATSC 标 准” ) , 以及由国际标准组织 (ISO) 公布的 ISO/IEC13818-7, 高级音频编码 (AAC) (此处称为
16、“MPEG-2AAC 标准” ) 和 ISO/IEC14496-3, 子部分 4(此处称为 “MPEG-4 音频标准” ) 。只是作 为示例而给出了遵照这些标准的编码和解码处理。 本发明的原理也可用于遵照其它标准的 编码系统。 0016 发明人发现, 遵照一些编码标准的装置的可用特征通常不足以用于手持式和其它 类型的便携式装置的典型的应用和收听环境。 当这些类型的装置被用于对遵照这些标准的 编码输入信号的音频内容进行解码时, 所解码的音频内容通常以如下响度水平被再现 : 该 响度水平显著低于通过对专门为在这些装置上回放而准备的编码输入信号进行解码而获 得的音频内容的响度水平。 0017 遵照例
17、如 ATSC 标准的编码输入信号 (此处称为 “遵照 ATSC 的编码信号” ) 包含编 码音频信息以及用于描述该信息可以如何解码的元数据。 一些元数据参数标识动态范围压 说 明 书 CN 103795364 A 5 3/10 页 6 缩简档, 该动态范围压缩简档指定当对编码音频信息进行解码时可如何对音频信息的动态 范围进行压缩。可以保持解码信号的完全动态范围, 或者可以在解码时以不同的程度来对 其进行压缩, 以满足不同应用和收听环境的要求。其它元数据标识编码音频信息的响度的 某种度量, 诸如编码信号中的对话的水平或平均节目水平。该元数据可被解码器用于调整 解码信号的幅度, 以在回放期间实现指
18、定的响度或参考再现水平。 在一些应用中, 可以指定 或假设一个或多个参考再现水平, 而在其它应用中, 用户可对参考再现水平的设置进行控 制。例如, 用于对遵照 ATSC 的编码信号进行编码和解码的编码处理假设要以两个参考再现 水平之一回放对话。一个水平是比限幅水平低 31dB, 其中限幅水平是最大的可能数字值或 满量程 (FS) 值, 这个比限幅水平低 31dB 的水平在这里标记为 -31dBFS。使用该水平的解码 模式有时称为 “线模式 (Line Mode) ” , 并且旨在用于适合较宽动态范围的应用和环境中。 另 一水平被设置为-20dBFS。 使用该第二水平的解码模式有时称为 “RF模
19、式” , 其旨在用在如在 通过对射频 (RF) 信号调制而进行广播时所遇到的应用和环境中, 其中需要较窄的动态范围 以避免过调制。 0018 对于另一示例, 遵照MPEG-2AAC标准和MPEG-4音频标准的编码信号包括用于标识 编码音频信息的平均响度水平的元数据。对遵照 MPEG-2AAC 和 MPEG-4 音频的编码信号进 行解码的处理可允许收听者指定期望的回放水平。 解码器使用该期望的回放水平和平均响 度元数据来调整解码信号的幅度, 以实现期望的回放水平。 0019 当手持式和其它类型的便携式装置被用于根据这些元数据参数来对遵照 ATSC、 遵 照MPEG-2AAC以及遵照MPEG-4音
20、频的编码信号的音频内容进行解码和回放时, 动态范围和 响度水平通常是不适合的, 这是由于这些类型的装置所遇到的不利的收听环境或者由于因 在这些装置中使用的较低操作电压而导致的电限制。 0020 遵照其它标准的编码信号使用类似类型的元数据, 并且可包括用于指定期望的回 放响度水平的规定。对这些信号进行解码的便携式装置通常遇到相同的问题。 0021 本发明可用于改进手持式和便携式装置的用户的收听体验, 而不需要专门为这些 装置准备的内容。 0022 B. 装置概述 0023 图 1 是包括本发明的各个方面的一种类型的接收器 / 解码器装置 10 的示意框图。 装置 10 从信号路径 11 接收编码
21、输入信号, 在反格式化器 12 中应用适当的处理以从输入信 号提取编码音频信息和相关联的元数据, 将编码音频信息传递到解码器 14 并且沿信号路 径 13 传递元数据。编码音频信息包括表示听觉刺激的谱内容的编码子带信号, 并且元数据 指定多种参数的值, 这多种参数包括一个或多个解码控制参数以及用于根据动态范围压缩 简档来指定动态范围压缩的一个或多个参数。术语 “动态范围压缩简档” 指的是诸如增益 因子、 压缩进行 (compress attack) 次数和压缩释放 (compress release) 次数的特征, 这些 特征定义了动态范围压缩器的操作特性。 0024 解码器 14 对编码音频
22、信息应用解码处理以获得解码子带信号, 该解码子带信号 被传递到动态范围控制 16。可响应于从信号路径 13 接收的解码控制参数来调节解码处理 的操作和功能。 可用于调节解码处理的操作和功能的解码控制参数的示例是用于标识音频 信道的数量和配置的参数, 其中该音频信道由编码音频信息表示。 0025 动态范围控制 16 可选地调整解码音频信息的动态范围。该调整可响应于从信号 说 明 书 CN 103795364 A 6 4/10 页 7 路径13和/或从控制信号接收的元数据而被启动或关闭以及调节, 其中可响应于来自收听 者的输入来提供该控制信号。例如, 可响应于收听者操作开关或者选择用于装置 10
23、的操作 选项来提供控制信号。 0026 在遵照例如 ATSC 标准、 MPEG-2AAC 标准或 MPEG-4 音频标准的实施中, 编码输入信 号包括以段或帧的序列布置的编码音频信息。各个帧包含如下编码子带信号 : 这些编码子 带信号表示具有其完全动态范围的音频信号的谱分量。动态范围控制 16 可不采取动作, 这 允许以最大的动态范围量来回放音频信号, 或者动态范围控制 16 可修改解码子带信号, 以 按照不同的程度来压缩动态范围。 0027 合成滤波器组18对解码子带信号应用可由动态范围控制16调整的一组合成滤波 器, 并且在其输出处提供可以是数字或模拟信号的时域音频信号。 0028 增益-
24、限制器20在本发明的一些实施中用于调整时域音频信号的幅度。 增益-限 制器 20 的输出沿着路径 21 传递, 以用于随后由声换能器进行呈现。 0029 图 2 是包括本发明的各个方面的编码器 / 发送器装置 30 的示意框图。装置 30 从 信号路径31接收表示听觉刺激的音频输入信号。 装置30对音频信号应用一组分析滤波器, 以获得作为输入音频信号的频域表示的子带信号或者表示输入音频信号的一组带限信号。 元数据计算器34对音频输入信号和/或从音频输入信号获得的一个或多个信号 (诸如来自 分析滤波器组 32 的子带信号或音频输入信号的变型形式) 进行分析, 以计算指定多种参数 的值的元数据,
25、这多种参数包括编码控制参数、 一个或多个解码控制参数以及用于根据动 态范围压缩简档来指定动态范围压缩的一个或多个参数。元数据计算器 34 可对时域信号、 频域信号或者时域和频域信号的组合进行分析。也可响应于从路径 33 接收的一个或多个 元数据参数来调节由元数据计算器 34 执行的计算。编码器 36 对分析滤波器组 32 的输出 应用编码处理, 以获得包括编码子带信号的编码音频信息, 该编码音频信息被传递到格式 化器 38。可响应于从路径 33 接收的编码控制参数来调节编码处理。编码处理还可生成沿 着路径 33 的其它解码控制参数, 以供在装置 10 中执行的处理用于对编码音频信息进行解 码。
26、格式化器 38 将编码音频信息和元数据中的至少一些元数据汇编成为具有适合于传输 或存储的格式的编码输出信号, 该元数据包括一个或多个解码控制参数以及用于指定动态 范围压缩的一个或多个参数。 0030 在遵照例如 ATSC 标准、 MPEG-2AAC 标准或 MPEG-4 音频标准的实施中, 编码输出信 号包括以段或帧的序列布置的编码音频信息。各个帧包含如下编码子带信号 : 这些编码子 带信号表示具有其完全动态范围的音频信号的谱分量, 并且具有用于以参考再现水平进行 回放的幅度。 0031 反格式化器 12、 解码器 14、 合成滤波器组 18、 分析滤波器组 32、 编码器 36 以及格 式化
27、器 38 在设计和操作方面可以是传统的。一些示例包括遵照上述公开标准的相应部件。 在这些标准中指定或提出的部件的实施适合用于本发明, 但并非必需这些部件。这些部件 的特定实施都不是必须的。 0032 图 3 至图 5 是包括上述装置 10 和装置 30 中的一些部件的转码器装置 40 的不同 实施的示意框图。这些部件与它们的对应部件基本上相同地工作。图 3 所示的装置 40 能 够将从路径 11 接收的编码输入信号转码成遵照相同编码标准的变型形式。在该实施中, 装 置 40 从信号路径 11 接收编码输入信号, 在反格式化器 12 中应用适当的处理以从编码输入 说 明 书 CN 1037953
28、64 A 7 5/10 页 8 信号提取第一编码音频信息和相关联的元数据, 将第一编码音频信息传递到解码器 14 和 格式化器38, 并且沿着信号路径43传递元数据。 第一编码音频信息包括表示听觉刺激的谱 内容的编码子带信号, 并且元数据指定多种参数的值, 这多种参数包括一个或多个解码控 制参数以及用于根据第一动态范围压缩简档来指定动态范围压缩的一个或多个参数。 解码 器 14 对第一编码音频信息应用解码处理以获得解码子带信号。可响应于从信号路径 43 接 收的一个或多个解码控制参数来调节解码处理的操作和功能。 子带信号可以是听觉刺激的 频域表示或者表示听觉刺激的一组带限信号。 0033 元数
29、据计算器 44 对解码子带信号和 / 或从解码子带信号得到的一个或多个信号 进行分析, 以计算用于根据第二动态范围压缩简档来指定动态范围压缩的一个或多个参数 值。例如, 可通过对解码子带信号应用合成滤波器组 18 来得到一个或多个信号。可响应于 从路径 43 接收的元数据来调节由元数据计算器 44 执行的计算。如果合成滤波器组 18 的 输出不需要用于元数据计算, 则可从该实施中省略合成滤波器组 18。 0034 图 4 中示出了装置 40 的另一实施。该实施与图 3 所示的实施类似, 但是包括编码 器 36。包括编码器 36 允许装置 40 将遵照第一编码标准的、 从路径 11 接收的编码输
30、入信 号转码成遵照第二编码标准的编码输出信号, 该第二编码标准可与第一编码标准相同或不 同, 只要两个编码标准的子带信号兼容即可。这可在该实施中通过使编码器 36 对子带信号 应用编码处理以获得遵照第二编码标准的第二编码音频信息来实现。 第二编码音频信息被 传递到格式化器 38。可响应于从路径 43 接收的元数据来调节编码处理。编码处理还可生 成沿着路径 43 的其它元数据, 以供在装置 10 中执行的处理用于对编码音频信息解码。格 式化器38将从路径43接收的元数据和其接收的编码音频信息汇编成具有适合于传输或存 储的格式的编码输出信号。 0035 图5中示出了装置40的又一实现。 该实现包括
31、合成滤波器组18, 该合成滤波器组 18 被应用于解码子带信号, 以获得编码音频信息的时域或宽带表示。包括合成滤波器组 18 和分析滤波器组 32 允许装置 40 在基本上任意编码标准选择之间进行转码。合成滤波器组 18 的输出被传递到分析滤波器组 32, 分析滤波器组 32 生成子带信号, 以供编码器 36 进行 编码。编码器 36 对分析滤波器组 32 的输出应用编码处理, 以获得第二编码音频信息, 该第 二编码音频信息被传递到格式化器38。 编码处理还可生成沿着路径43的其它元数据, 以供 在装置 10 中执行的处理用于对编码音频信息解码。元数据计算器 44 可根据其对从解码器 14 接
32、收的子带信号、 合成滤波器组 18 的输出以及分析滤波器组 32 的输出中的任意或全部 的分析来计算元数据参数值。 0036 以下更详细地描述装置 10 和装置 30 的一些方面。这些描述适用于装置 40 的相 应特征。这些方面是按照遵照上述 ATSC 标准的方法和装置的特征和特性来描述的。这些 具体特征和特性仅作为示例来讨论。 这些实施中的根本原理直接适用于遵照其它标准的方 法和装置。 0037 C. 接收器 / 解码器 0038 上述回放问题可通过使用下述三种不同技术中的一种或多种来解决。 第一技术使 用增益限制并且可通过仅在装置 10 中的特征来实施。第二技术和第三技术使用动态范围 压缩
33、, 并且其实施需要在装置 10 和装置 30 两者中的特征。 0039 1. 增益 - 限制器 说 明 书 CN 103795364 A 8 6/10 页 9 0040 第一技术以 RF 模式而不是以线模式来操作装置 10, 以使得其利用动态范围控制 16 对遵照 ATSC 的编码输入信号进行解码, 动态范围控制 16 提供较高的动态范围压缩水平 和较高的参考再现水平。增益 - 限制器 20 提供额外的增益, 从而将有效参考再现水平提高 到从-14dBFS到-8dBFS的值。 经验结果表明等于-11dBFS的参考水平对于很多应用给出良好 结果。 0041 增益 - 限制器 20 还应用限制操作
34、, 以防止放大的数字信号超过 0dBFS。限制器的 操作特性可以影响再现音频的感知质量, 但是没有特定限制器对本发明而言是必须的。限 制器可基本上以任意可能期望的方式来实施。优选地, 限制器被设计成提供 “软” 限制功能 而非 “硬” 限幅功能。 0042 2. 差分压缩值 0043 第二技术允许装置10在动态范围控制16中应用一个或多个修改的动态范围压缩 参数。反格式化器 12 从编码输入信号获得差分动态范围压缩 (DRC) 参数值, 并且沿着路径 13 将差分参数值与传统的 DRC 参数值一起传递到动态范围控制 16。动态范围控制 16 通过 对传统的 DRC 参数值和对应的差分 DRC
35、参数值进行算术组合来计算所需的一个或多个 DRC 参数值。在该情形中不需要使用增益 - 限制器 20。 0044 由生成编码输入信号的编码器 / 发送器装置 30 在编码输入信号中提供差分 DRC 参数值。这在以下进行描述。 0045 如果编码输入信号不包含这些差分DRC值, 则装置10可以使用根据上述第一技术 的增益 - 限制器 20。 0046 3. 独特压缩简档 0047 第三技术允许装置10在动态范围控制16中应用根据新动态范围压缩简档的动态 范围压缩。反格式化器 12 从编码输入信号获得新简档的一个或多个 DRC 参数值, 并且沿路 径 13 将它们传递到动态范围控制 16。在该情形
36、中不需要使用增益 - 限制器 20。 0048 由生成编码输入信号的编码器 / 发送器装置 30 在编码输入信号中提供新动态范 围压缩简档的 DRC 参数值。这在以下进行描述。 0049 如果编码输入信号不包含新 DRC 简档的一个或多个 DRC 参数值, 则装置 10 可以使 用根据上述第一技术的增益 - 限制器 20。 0050 D. 编码器 / 发送器 0051 1. 差分压缩值 0052 在装置 10 中通过使用从编码输入信号提取的差分 DRC 参数值来实施上述第二技 术的处理。这些差分参数值由生成编码信号的装置 30 来提供。 0053 装置 30 提供一组差分 DRC 参数值, 这
37、组差分 DRC 参数值表示将存在于编码信 号中的一组 DRC 参数值与新 DRC 简档的一组对应的基本参数值之间的差, 并且是防止解 码音频信号样本超过 0dBFS以实现较高的参考再现水平所需的。用于计算 DRC 参数值 的特定方法都不是本发明必须的。在由高级电视业务顾问委员会有限公司 (Advanced Television Systems Committee,Inc.) 在 2009 年 11 月 4 日公布的 “ATSC Recommended Practice:Techniques for Estalishiing an Maintaining Audio Loudness for D
38、igital Television” , 文档 A/85(尤其是在第 9 节和附录 F) 中以及在 Robinson 等人的 “Dynamic Range Control via Metadata” , 预印号5028, 107th AES convention, 纽约, 1999年9月中 说 明 书 CN 103795364 A 9 7/10 页 10 公开了遵照 ATSC 标准的用于计算参数值的公知方法。 0054 如果编码输出信号遵照 ATSC 标准、 MPEG-2AAC 标准或 MPEG-4 音频标准, 则参考再 现水平增加到从-14dBFS到-8dBFS的值。 经验结果表明等于-11
39、dBFS的参考水平对于很多应 用给出良好结果。 0055 对于遵照 ATSC 的编码输出信号, 元数据计算器 34 计算对于该标准中指定的对应 的基本参数 “compr” 的差分参数值。 格式化器38可将差分参数值汇编成各个编码信号帧的 标记为 “addbsi” (额外比特流信息) 和 / 或 “auxdata” (辅助数据) 的部分。如果差分参数 值被汇编成 “addbsi” 部分或 “auxdata” 部分, 则编码信号将与所有遵照 ATSC 的解码器兼 容。不能识别差分参数值的那些解码器仍然可以通过忽略 “addbsi” 和 “auxdata” 部分而 正确地对编码信号帧进行处理和解码。
40、参考以上引用的 A/52b 文献文档以得到更多细节。 0056 对于遵照 MPEG-2AAC 标准或 MPEG-4 音频标准的编码输出信号, 格式化器 38 可将 差分参数值汇编成各个编码信号帧的在两个标准中被标记为 “Fill_Element” 或 “Data_ Stream_Element” 的部分。 如果差分参数值被汇编成这些部分之一, 则编码信号将与所有遵 照 MPEG-2AAC 标准和 MPEG-4 音频标准的解码器兼容。参考以上引用的 ISO/IEC13818-7 和 ISO/IEC14496-3 文档以得到更多细节。 0057 可计算差分参数值, 并以大于、 等于或小于对应的基本
41、参数值在编码信号中的速 率的速率来将差分参数值插入到编码信号中。差分值的速率可变化。用于表示先前的差分 值是否应该再次使用的标志或比特也可包括在编码信号中。 0058 2. 独特压缩简档 0059 在装置10中通过使用从编码输入信号提取的、 新动态范围压缩简档的DRC参数值 来实施上述第三技术的处理。这些参数值由生成编码信号的装置 30 来提供。 0060 装置30通过计算如下参数值来得到新DRC简档的DRC参数值 : 这些参数值是防止 解码音频信号样本超过 0dBFS以得到较高的参考再现水平所需的。 0061 如果编码输出信号遵照 ATSC 标准、 MPEG-2AAC 标准或 MPEG-4
42、音频标准, 则元数据 计算器 34 基于参考再现水平增加到从 -14dBFS到 -8dBFS的值这一假设来计算 DRC 压缩值。 经验结果表明等于 -11dBFS的参考水平对于很多应用给出良好结果。格式化器 38 可将 DRC 简档的参数值汇编成各个编码信号帧的如上所述的用于差分参数的部分。 帧的这些部分的 使用允许编码信号与遵照各个标准的所有解码器兼容。 0062 E. 实现 0063 包括本发明的各个方面的装置可以以多种方式来实现, 这些方式包括用于由计算 机或某种其它装置执行的软件, 该其他装置包括耦合到与通用计算机中发现的部件类似的 部件的更专用的部件 (诸如数字信号处理器 (DSP)
43、 电路) 。图 6 是可用于实施本发明的方面 的装置 70 的示意框图。处理器 72 提供计算资源。RAM73 是被处理器 72 用于进行处理的系 统随机存取存储器 (RAM) 。ROM74 表示某种形式的持久存储装置 (诸如只读存储器 (ROM) ) , 其用于存储操作装置 70 所需的程序并且可以用于执行本发明的各个方面。I/O 控制 75 表 示用于利用通信信道 76、 77 接收输入信号和发送输出信号的接口电路。在所示出的实施例 中, 所有主要的系统部件均连接到总线 71, 总线 71 可表示多于一个物理或逻辑总线 ; 然而, 总线架构不是实现本发明必须的。 0064 在由通用计算机系
44、统实现的实施例中, 可包括额外的部件, 用于与诸如键盘或鼠 说 明 书 CN 103795364 A 10 8/10 页 11 标和显示器的装置接口, 以及用于控制具有存储介质 (诸如磁带或磁盘、 或者光学介质) 的 存储装置78。 存储介质可用于记录用于操作系统、 用途以及应用的指令的程序, 并且可包括 实施本发明的各个方面的程序。 0065 实践本发明的各个方面所需的功能可以由以多种方式实施的部件来执行, 这些部 件包括分立逻辑部件、 集成电路、 一个或多个 ASIC 和 / 或程序控制处理器。这些部件实现 的方式对本发明并不重要。 0066 本发明的软件实施可通过多种机器可读介质 (诸如
45、贯穿包括从超声频率到紫外线 频率的频谱的调制通信信道或基带) 或者使用基本上任何记录技术表达信息的存储介质 (包括磁带、 卡或盘、 光卡或光盘、 以及包括纸的介质上的可检测标记) 来表达。 0067 根据本申请, 提供了以下方案 : 0068 方案 1. 一种用于对编码输入信号进行解码以生成音频输出信号的方法, 其中, 所 述方法包括 : 0069 接收包括编码音频信息和相关联的元数据的所述编码输入信号, 所述相关联的元 数据包括一个或多个解码控制参数以及一个或多个第一参数, 所述一个或多个第一参数根 据第一动态范围压缩简档来指定动态范围压缩, 并且所述相关联的元数据可选地包括一个 或多个第二
46、参数, 所述一个或多个第二参数根据第二动态范围压缩简档来指定动态范围压 缩, 其中, 所述一个或多个第一参数具有下述值 : 根据生成所述编码音频信息的编码处理而 设置所述值, 以表示具有用于以第一参考再现水平进行回放的、 不超过限幅水平的幅度的 听觉刺激 ; 并且其中, 所述一个或多个第二参数具有下述值 : 根据生成所述编码音频信息 的编码处理而设置所述值, 以表示具有用于以第二参考再现水平进行回放的、 不超过所述 限幅水平的幅度的所述听觉刺激, 所述第二参考再现水平高于所述第一参考再现水平 ; 0070 对所述编码音频信息应用解码处理, 以获得表示所述听觉刺激的谱内容的子带信 号, 其中,
47、响应于所述一个或多个解码控制参数来调节所述解码处理 ; 0071 修改所述子带信号, 以获得具有改变的动态范围特性的修改子带信号, 其中, 如果 所述元数据包括所述一个或多个第二参数, 则响应于所述一个或多个第二参数来调节所述 修改, 或者如果所述元数据不包括所述一个或多个第二参数, 则响应于所述一个或多个第 一参数来调节所述修改 ; 0072 对所述修改子带信号应用合成滤波器组, 以获得时域音频信号 ; 以及 0073 如果所述元数据不包括所述一个或多个第二参数, 则响应于所述元数据而对所述 时域音频信号施加增益并应用限制器, 其中, 所述增益的施加修改所述时域音频信号, 以获 得具有用于以
48、所述第二参考再现水平进行回放的幅度的所述音频输出信号, 并且其中, 所 述限制器的应用防止所述音频输出信号的幅度超过所述限幅水平。 0074 方案 2. 根据方案 1 所述的方法, 其中, 所述一个或多个第二参数表示所述第一动 态范围压缩简档和所述第二动态范围压缩简档的对应参数之间的差。 0075 方案 3. 根据方案 1 或 2 所述的方法, 其中, 所述编码输入信号遵照 ATSC 标准、 MPEG-2AAC标准或MPEG-4音频标准, 所述第一参考再现水平对应于低于所述限幅水平20dB 的幅度, 并且所述第二参考再现水平对应于低于所述限幅水平 11dB 的幅度。 0076 方案 4. 一种
49、用于对表示听觉刺激的音频输入信号进行编码的方法, 其中, 所述方 法包括 : 说 明 书 CN 103795364 A 11 9/10 页 12 0077 接收所述音频输入信号 ; 0078 对所述音频输入信号应用分析滤波器组, 以生成表示所述音频输入信号的谱内容 的子带信号 ; 0079 分析从所述音频输入信号得到的一个或多个信号, 以计算元数据, 所述元数据包 括一个或多个第一参数以及一个或多个第二参数, 所述一个或多个第一参数根据第一动态 范围压缩简档来指定动态范围压缩, 而所述一个或多个第二参数根据第二动态范围压缩简 档来指定动态范围压缩, 其中, 所述一个或多个第一参数具有下述值 : 所述值被设置为表示 具有用于以第一参考再现水平进行回放的、 不超过限幅水平的幅度的所述听觉刺激, 并且 其中, 所述一个或多个第二参数具有下述值 : 所述值被设置为表示具有用于以第二参考再 现水平进行回放的、 不超过所述限幅水平的幅度的所述听觉刺激 ; 0080 对