音频信号处理方法和装置.pdf

上传人：奻奴

文档编号：1051979

上传时间：2018-03-28

格式：PDF

页数：39

大小：1.09MB

《音频信号处理方法和装置.pdf》由会员分享，可在线阅读，更多相关《音频信号处理方法和装置.pdf（39页完整版）》请在专利查询网上搜索。

提供了一种处理一系列输入音频信号的方法,所述输入音频信号代表放置在收听者周围预定位置的一系列虚拟的音频声源,该方法可以产生一组精简的用于在收听者周围的扬声器装置上进行播放的音频输出信号,该方法包括以下步骤:(a)对每个输入音频信号和每个输出音频信号进行以下步骤:(i)用相应的脉冲响应最初的头部对输入音频信号进行卷积以形成一系列初始响应,其中的脉冲响应充分映射了相应的虚拟声源到相应的扬声器装置的脉冲。

摘要
申请专利号：	CN99804303.6	申请日：	1999.01.06
公开号：	CN1294782A	公开日：	2001.05.09
当前法律状态：	授权	有效性：	有权
法律详情：	专利实施许可合同备案的生效IPC(主分类):H03H 17/06合同备案号:2011990000094让与人:杜比实验室特许公司受让人:联想(北京)有限公司发明名称:音频信号处理方法申请日:19990106公开日:20010509授权公告日:20071205许可种类:普通许可备案日期:20110223\|\|\|专利权人的姓名或者名称、地址的变更IPC(主分类):H03H 17/06变更事项:专利权人变更前:杜比实验室认证公司变更后:杜比实验室特许公司变更事项:地址变更前:美国加利福尼亚州变更后:美国加利福尼亚州\|\|\|专利申请权、专利权的转移(专利权的转移)变更项目:专利权人变更前权利人:雷克技术有限公司地址: 澳大利亚新南威尔士变更后权利人:杜比实验室认证公司地址: 美国加利福尼亚州登记生效日:2008.5.16\|\|\|授权\|\|\|实质审查的生效申请日:1999.1.6\|\|\|公开
IPC分类号：	H03H17/06; H04S5/00; G06F17/10	主分类号：	H03H17/06; H04S5/00; G06F17/10
申请人：	雷克技术有限公司;
发明人：	戴维·斯坦利·麦克格拉思; 亚当·理查德·麦克基格; 格伦·诺曼·迪肯斯; 理查德·詹姆斯·卡特赖特; 安德鲁·彼得·赖利
地址：	澳大利亚新南威尔士
优先权：	1998.03.25 AU PP2595; 1998.03.31 AU PP2710; 1998.03.31 AU PP2709; 1998.11.12 AU PP7164
专利代理机构：	中原信达知识产权代理有限责任公司	代理人：	谷惠敏;李辉
PDF完整版下载：	PDF下载

内容摘要

提供了一种处理一系列输入音频信号的方法,所述输入音频信号代表放置在收听者周围预定位置的一系列虚拟的音频声源,该方法可以产生一组精简的用于在收听者周围的扬声器装置上进行播放的音频输出信号,该方法包括以下步骤:(a)对每个输入音频信号和每个输出音频信号进行以下步骤:(i)用相应的脉冲响应最初的头部对输入音频信号进行卷积以形成一系列初始响应,其中的脉冲响应充分映射了相应的虚拟声源到相应的扬声器装置的脉冲响应的初始声音和早期反射;(b)对每个输入音频信号和每个输出音频信号进行以下步骤:(i)形成音频输入信号的混音

权利要求书

1：一种处理一系列输入音频信号的方法，所述输入音频信号代表放置在收听者周围预定位置的一系列虚拟的音频声源，该方法可以产生一组精简的用于在收听者周围的扬声器装置上进行播放的音频输出信号，该方法包括以下步骤： (a)对每个输入音频信号和每个输出音频信号进行如下步骤： (ⅰ)用相应的脉冲响应最初的头部对输入音频信号进行卷积以形成一系列初始响应，其中的脉冲响应充分映射了相应的虚拟声源到相应的扬声器装置的脉冲响应的初始声音和早期反射； (b)对每个输入音频信号和每个输出音频信号进行如下步骤： (ⅰ)形成音频输入信号的混音； (ⅱ)确定单独的卷积尾； (ⅲ)用单独的卷积尾对音频信号的混音进行卷积以形成复合尾部响应； (c)对每个音频输出信号进行如下步骤： (ⅰ)把相应系列的初始响应与相应的复合尾部响应进行复合以形成音频输出信号。
2：根据权利要求1的方法，其中上述的单独的卷积尾通过合并相应的脉冲响应的尾部形成。
3：根据权利要求1的方法，进一步包括步骤：预处理上述的脉冲响应函数： (a)创建一组相应的脉冲响应函数； (b)把上述的脉冲响应函数分为多个段； (c)对预定数量的上述段，在段的末端减少脉冲响应值。
4：根据前面任何一个权利要求的方法，其中上述的输入音频信号被转化到频域，卷积在频域内进行。
5：根据权利要求4的方法，其中上述的脉冲响应函数可以在频域中通过使高频系数为零并删除使用为零的高频系数处的乘法步骤而得到简化。
6：根据前面任何一个权利要求的方法，其中上述的卷积通过使用低等待时间卷积处理方法进行。
7：根据权利要求6的方法，其中上述的低等待时间卷积处理包括以下步骤：把输入音频信号的第一预定重叠块大小的部分转化为相应的频域输入系数块；把脉冲响应信号的第二预定块大小的部分转化为相应的频域脉冲系数块；把每个频域输入系数块与预定的相应频域脉冲系数块以预定方式进行合并以产生复合输出块；把预定的复合输出块相加以对每个音频输出信号作出频域输出响应；把所述频域输出响应转换成对应的时域音频输出信号；丢掉上述的时域音频输出信号一部分；输出上述的时域音频输出信号的剩余部分。
8：一种处理一系列输入音频信号的方法，所谓音频信号代表放置在收听者周围预定位置的一系列虚拟的音频声源，该方法可以产生一组精简的用于在收听者周围的扬声器装置上进行播放的音频输出信号，该方法包括以下步骤： (a)形成一系列能充分把相应的虚拟声源映射到相应的扬声器装置的脉冲响应函数； (b)把脉冲响应函数分成多个段； (c)对预定的多个段，在段的尾部减少脉冲响应值以产生修正的脉冲响应； (d)对每个输入音频信号和每个输出音频信号进行如下步骤： (ⅰ)用相应的修正的脉冲响应部分对输入音频信号进行卷积，其中修正的脉冲响应部分把相应的虚拟声源充分映射到相应的扬声器装置。
9：一种用于把代表从不同的第一批声源发出的多个音频信号进行同时卷积的方法，以便模拟从第二批输出声源发射的音频环境，该方法包括以下步骤： (a)利用能完全映射置于音频环境中的第一批声源的脉冲响应函数的初始部分对多个音频信号的每个进行独立滤波； (b)利用脉冲响应函数的后续部分形成的回响尾部滤波器对多个音频信号进行复合回响尾部滤波。
10：根据权利要求9的方法，其中上述的多个音频信号提供一个包围收听者的复合环绕声信号。
11：根据权利要求10的方法，其中上述的滤波通过频域内的卷积发生，上述的音频信号首先被转化到频域。
12：根据权利要求1至8中任何一个的方法，其中上述的一系列输入信号包括：左前声道信号，右前声道信号，正前声道信号，左后声道信号和右后声道信号。
13：根据权利要求1至8或12中任何一个的方法，其中音频输出信号包括左右耳机输出信号。
14：根据前面任何一个权利要求中的方法，其中上述的方法通过使用位于CD-ROM播放器内的跳读保护处理器单元进行。
15：根据权利要求1至13中任何一个的方法，其中上述的方法通过使用包括数模转换器的改型的专门的集成电路来进行。
16：根据权利要求1至13中任何一个的方法，其中上述的方法通过使用专门的或可编程的数字信号处理器单元来进行。
17：根据权利要求1至13中任何一个的方法，其中上述的方法利用连接在模数转换器与数模转换器之间的DSP处理器对模拟输入进行处理。
18：根据权利要求1至13中任何一个的方法，其中上述的方法也可以通过连接到声音输出信号发生器和一对耳机间的媒介物的独立的可分离的外部装置对立体声输出信号进行处理，上述的声音输出信号以数字形式输出以由外部装置进行处理。
19：根据前面任何一个权利要求的方法，进一步包括使用可调节的控制器以预定方式改变脉冲响应函数。
20：实现权利要求1至19中任何一个的方法的装置。
21：根据权利要求1的方法，其中上述的单独的卷积尾可以从一组相应的脉冲响应的尾部中挑选一个脉冲响应而形成。
22：一种处理代表放置在收听者周围预定位置的虚拟的音频声源的输入音频信号的方法，该方法可以产生一组精简的用于在收听者周围的扬声器装置上进行播放的音频输出信号，该方法包括以下步骤： (a)通过低通滤波和抽取处理，把输入音频信号转化为较低的采样率以产生被抽取的输入信号； (b)对上述被抽取的输入信号进行滤波处理以产生被抽取的滤波信号； (c)通过插补和低通滤波处理，把上述被抽取的滤波信号转化为原来的较高的采样率以产生高采样率滤波信号； (d)对上述的输入音频信号进行稀疏滤波处理以产生稀疏滤波的音频信号； (e)把上述的高采样率滤波信号与稀疏滤波的音频信号相加以产生音频输出信号； (f)把上述的音频输出信号输出到上述的扬声器装置。
23：根据权利要求22的方法，其中稀疏滤波处理包括单独的延迟元素和增益函数。
24：根据权利要求23的方法，其中上述的稀疏滤波处理包括延迟线，从延迟线中取出多拍的音频信号，每拍的音频信号通过增益函数进行换算，把增益函数的输出相加以产生上述的稀疏滤波音频信号。

说明书

音频信号处理方法和装置
    【发明领域】

    本发明涉及音频信号处理领域，具体涉及用脉冲响应函数或类似函数对输入音频信号进行卷积的有效卷积方法。

    技术背景

    在本申请人所提出的国际PCT申请号为No．PCT／AU93／00330题目为“高精确度高效率数字滤波器”的专利申请中，公开了一种卷积处理方法，除了允许对复杂的脉冲响应进行有效长卷积外，该方法还具有特别低的等待时间。

    众所周知利用脉冲响应函数的卷积可以为音频信号增加“色彩”以至于例如当用头戴耳机进行播放时，信号能提供一种立体的收听效果。遗憾的是，这种卷积处理方法，当使用高级算法技术例如快速傅里叶变换(FFT)时通常需要过多地计算时间。这种计算方面的要求当多声道必须被独立卷积时通常还会增加，并且当要求全部的环绕声功能时通常必须对多声道进行独立卷积。现代的DSP处理器通常不能用于进行多个源的多个信号的完全卷积，特别时是对卷积的等待时间加以实时限制时。

    因此需要减少全卷积系统的处理要求，同时保持卷积处理的全部质量。

    发明综述

    根据本发明的第一个方面，提供了处理一系列输入音频信号的方法，所述输入音频信号代表放置在收听者周围预定位置的一系列虚拟的音频声源，该方法可以产生一组精简的用于在收听者周围的扬声器装置上进行播放的音频输出信号，该方法包括以下步骤：(a)对每个输入音频信号和每个输出音频信号进行以下步骤：(ⅰ)用相应的脉冲响应最初的头部对输入音频信号进行卷积以形成一系列初始响应，其中的脉冲响应充分映射了相应的虚拟声源到相应的扬声器装置的脉冲响应的初始声音和早期反射；(b)对每个输入音频信号和每个输出音频信号进行以下步骤：(ⅰ)形成音频输入信号的混音；并(ⅱ)确定单独的卷积尾；(ⅲ)用单独的卷积尾对音频信号的混音进行卷积以形成复合尾部响应；(c)对每个音频输入信号进行以下步骤：(ⅰ)把相应系列的初始响应与相应的复合尾部响应进行复合以形成音频输出信号。

    单独的卷积尾可以通过复合相应脉冲响应的尾部而形成。或者单独的卷积尾也可以从虚拟的扬声器尾部脉冲响应中挑选一个。理想地，该方法进一步包括对脉冲响应函数进行预处理的步骤：(a)构造一组对应的脉冲响应函数；(b)把脉冲响应函数分成多个段；(c)对预定的多个段，在段的尾部减少脉冲响应值。

    输入音频信号最好转化到频域，这样卷积可以在频域内进行。脉冲响应函数可以在频域中通过使高频系数为零并删除高频系数为零处的乘法步骤而得到简化。

    卷积最好通过使用低等待时间的卷积处理方法来进行。低等待时间的卷积处理方法最好包括以下步骤：把输入音频信号的第一预定块大小的部分转化为相应的频域输入系数块；把脉冲响应信号的第二预定块大小的部分转化为相应的频域脉冲系数块；把每个频域输入系数块与预定的相应频域脉冲系数块以预定方式进行合并以产生复合输出块；把预定的一些复合输出块相加以对每个音频输出信号作出频域输出响应；把频域输出响应转化为相应的时域音频输出信号；输出时域音频输出信号。

    根据本发明的另一方面，提供了处理一系列输入音频信号的方法，所述音频信号代表放置在收听者周围预定位置的一系列虚拟的音频声源，该方法可以产生一组精简的用于在收听者周围的扬声器装置上进行播放的音频输出信号，该方法包括以下步骤：(a)形成一系列能充分把相应的虚拟声源映射到相应的扬声器装置的脉冲响应函数；(b)把脉冲响应函数分成多个段；(c)对预定的多个段，在段的尾部减少脉冲响应值以产生修正的脉冲响应；(d)对每个输入音频信号和每个输出音频信号进行以下步骤：(ⅰ)用相应的修正的脉冲响应部分对输入音频信号进行卷积，其中修正的脉冲响应部分用于把相应的虚拟声源充分映射到相应的扬声器装置。

    根据本发明的再一个方面，提供了用于把代表从不同的第一批声源发出的多个音频信号进行同时卷积的方法，以便模拟从第二批输出声源发出的音频环境，该方法包括以下步骤：(a)利用能完全映射置于音频环境中的第一批声源的脉冲响应函数的初始部分对多个音频信号的每个进行独立滤波；(b)利用多个脉冲响应函数的后续部分形成的回响尾部滤波器对多个音频信号进行复合回响尾部滤波。

    滤波可以通过频域内的卷积产生，音频信号最好首先转化到频域。这一系列输入音频信号可以包括：左前声道信号，右前声道信号，正前声道信号，左后声道信号和右后声道信号。音频输出信号可以包括左右耳机的输出信号。

    本发明可通过多个不同方式来实现。例如，利用位于CD-ROM播放器内部的跳读保护处理器单元；利用包含数模转换器修正形式的专用集成电路；利用专用的或可编程的数字信号处理器；或利用连接在模数转换器与数模转换器之间的DSP处理器；或者本发明也可以通过连接到声音输出信号发生器和一对耳机间的媒介物的独立的可分离的外部装置来实现，声音输出信号以用于由外部装置处理的数字形式输出。

    进一步的修正还可以包括使用可调节的控制器以预定方式改变脉冲响应函数。附图的简要说明

    尽管其它的形式也可以落在本发明的范围内，但是此处将仅仅通过示例的方式并参照附图描述本发明的优选形式。附图中：

    图1示出了用于把一系列信号映射到两个耳机输出声道的总的卷积处理技术；

    图2示出了传统的FFT重叠与保存方法；

    图3示出了优选实施例所使用的低等待时间处理方法；

    图4示出了普通频域卷积处理方法；

    图5示出了图4的处理方法中的初次简化；

    图6示出了对输入到耳机的左耳中的一系列输入信号的理想化处理方法；

    图7示出了图6的处理要求中的初次简化；

    图8更详细地示出了使用低等待时间卷积技术对图7的方案进行的频域实现；

    图9示出了用于导出频域系数的标准合成方法；

    图10示出了频域系数产生的一种修正形式；

    图11示出了优选实施例向高频音频数据的扩展；

    图12示出了以音频处理电路代替现有的CD播放器中的跳过保护功能的实现；

    图13示出了在与数模转换器同一集成电路封装内使用音频处理电路的实现；

    图14示出了数模转换器之前的信号链中使用的音频处理电路的实现；

    图15示出了与模数转换器和数模转换器一起的配置内使用的音频处理电路的实现；

    图16描述了图15中电路的扩展，它包括了可任意选择的数字输入；

    图17描述了本发明的几个可能的实际实施例。优选实施例的描述

    在优选实施例中，希望用每个耳朵的脉冲响应函数对一系列输入信号进行全长卷积近似，这样多个输出就能加和并输出到用于在耳机上播放的左右耳。

    转到图1，图中描述了对一组6个输入杜比环绕声音信号的全卷积处理，这6个声音信号包括：左前，正前，右前，左环绕，右环绕和低频效果声道，每个声道用标号2表示。对每个声道施加左右脉冲响应函数。因此，对左前声道3，在6中，用相应的左前脉冲响应函数4对左边的信号进行卷积。左前脉冲响应函数4是左耳能接收到的对置于理想位置的左前声道扬声器发出的理想化的尖峰输出信号的脉冲响应。在10中，输出7被加和到耳机使用的左声道信号。

    同样地，在8中，用相应的左声道扬声器的右耳的脉冲响应函数5对左前置信号进行卷积产生输出9，然后在11中，输出9被加和到右声道。其它的每个信号也是用类似的方法处理的。

    因此，图1中的方案将大约需要12个卷积步骤用于6个输入信号。如此数量巨大的卷积对DSP芯片而言任务将相当繁重，特别是在希望使用长卷积的地方。

    现在转到图2，这里描述了标准的“重叠与存储”卷积处理技术，这项技术在权威文章如“数字信号处理”(by John Proakis and DimitisManolakis，McMillan Publishing Company，1992)中有全面陈述。

    在图2中的20所描述的传统的重叠与存储方法中，输入信号21被数字化处理并分成N个采样的块22，N一般是2的幂。同样地，长度为N的脉冲响应23通常通过采取所希望的环境测量来确定并且用零把其填补为长度2N。对脉冲响应23的长度为2N的块应用初次变换24以形成N个具有实系数和虚系数的复数。然后应用FFT产生N个频率系数。步骤24可在处理开始前被执行一次，相应的频域系数25被存储以备以后使用。

    下一步，取出输入音频的长度为2N的块对其再次执行快速傅里叶变换以确定与长度为2N的实输入值相应的频域数据28。接下去，在30中，两套数据逐个相乘以产生频域数据31。然后应用傅里叶逆变换产生2N个实值，丢掉最初的N个值34，另外的N个值35便成为输出音频的输出值36。图2所描述的处理技术作为标准的频域卷积处理技术已被广泛了解。但是遗憾的是，由于需要把输入数据聚集成块，又由于FFT处理需要有限的时间，这主要取决于N的值(处理时间为O(NlogN))，以上因素造成在最初的2N个输入值被输入进行第一次FFT处理27一直到随后从逆FFT处理32的输出之间存在一定的等待时间或延迟。特别是在必须满足实时要求处，这种等待时间或延迟就更加不和乎需要。

    在上述的PCT申请号为No．PCT／AU93／00330的专利申请中，公开了一种适合于实时使用的极低等待时间的卷积处理方法。在读者参照上述的PCT说明的同时，现在将参照图3对低等待时间处理技术进行简短的陈述，图3描述了低等待时间处理技术40的主要步骤，其中音频输入首先经FFT频域重叠处理41转化到频域。在42中，频域数据被存储然后在每个卷积“循环”之后被传向后续的存储块，如43，44。频域数据，如42，首先被相应的频域系数51逐个相乘，其中频域系数51对应脉冲响应函数的初始部分。

    同时，在54中，前面被延迟的频域数据43与对应于脉冲响应函数后面部分的频域系数53相乘。对于脉冲响应函数的其它部分该步骤还要重复。在56中，输出被逐个加和以产生总的频域数据，该频域数据又被进行傅里叶逆变换，丢掉半数数据57以产生音频输出58。图3的方案允许以低等待时间执行极长卷积。

    图3的一段处理方法可以用于执行与图1等同的全部处理功能。这一点在图4中进行了描述，其中6个输入声道中的每个，如60，首先通过FFT重叠处理61转化到频域。接下去，在62中，每个声道在频域内与对应于脉冲响应函数的频域系数合并。频域处理方法62还包括把频率分量加到一起形成左右输出64，65。最后，应用相反的频域丢弃处理技术66，67以产生左右声道输出。

    所要求的计算量可以通过简化所需的卷积数量而得到充分减少。

    现在转到图5，图中描述了优选实施例中执行简化功能的一种方式，其中正前声道70被增益系数71放大并被分别加到72，73左右声道。同样地，低频效果声道71的各部分也被加到其它的每个声道上。

    然后信号经受傅里叶变换重叠处理器75至78，结果是经受计算量集中的傅里叶变换处理的声道数量由6个减少到4个。下一步，应用频域处理84产生输出79，80，然后进行傅里叶逆变换和丢弃处理82，83以剩下左右声道。

    现在转到图6，图6示意地描述了用于左耳的图5的理想化的总的最终结果，其中在4个输入信号90被在95中加和形成相应的输出信号96之前，它们每个要经过相应的全长有限脉冲响应滤波器91-94。遗憾的是，为了达到较高的真实水准，必须使用相当长的脉冲响应函数。例如，对标准的48kHz的音频信号而言使用大约7000拍(tap)的脉冲响应函数并不奇怪。而且，使用图6的方案，过量的计算要求会造成扩大范围长度的滤波器。

    对脉冲响应系数的细节进行的分析以及一些试验显示所有用来精确定位声源的必要信号都包含在直接反射和前几级反射的时间内，脉冲响应的其余部分只要求强调声环境的“大小”和“混响度”。可以利用这种观测从回响中分离出每个响应的定向的或“头部”部分(比如说最初的1024拍)与“尾部”部分。“尾部”部分可以全部加和在一起，结果滤波器可以通过累加多个单独的输入信号而被激励。图7中100示意地显示了这种简化的执行过程。头部滤波器101-104可以为短的1024拍的滤波器，在105中，累加多个信号并把其传输给可包含大约6000拍的扩展尾部滤波器，然后在109中累加结果并把其输出。对右耳也重复这种处理方式。这种复合尾部的使用以两种方式减少了计算要求。首先，明显减少了必须进行实时计算的卷积和的条件数目。这种减少是通过输入声道数目的因素实现的。其次，尾部滤波器的计算等待时间只需足够短以能够把尾部滤波器的第一拍与头部滤波器的最后一拍连在一起。当使用块过滤实施技术如重叠／相加，叠加／存储，或上述的PCT申请中的低等待时间卷积算法时，这意味着使用较大的块执行尾部比执行头部要具有更低的帧频。

    现在转到图8，此处详细示出了执行图7中的复合尾部系统时频域处理的总体流程图。图8中的方案110意欲作为频域处理进行操作，就象图5中的84。总体系统包括用于分别输出到左右声道的加和111和112。四个输入是左前，右前，左后和右后，它们与存储在延迟存储块113中的第一输入一起被对称处理，并且还要与从脉冲响应115的初始部分导出的频域系数相乘，然后把输出传输到加法器111。对称处理右声道以产生右声道输出，这里就不进行进一步讨论了。

    在一个“循环”之后，延迟块113被发送到延迟块120。对DSP编程领域的技术人员来说很显然这一点只需重新变换数据块指针。在下一个循环中，系数121与块120中的数据相乘，然后把输出发送到左声道加法器111。两套系数115和121对应于脉冲响应函数的头部部分。每个声道将具有用于左右输出声道的单独的头部函数。

    延迟块120、125、126和127中的输出被发送到加法器130并把和存储在延迟块131中。延迟块131和后续的延迟块，如132、133，执行复合尾部滤波器功能，把存储在延迟块131中的初始部分与系数137相乘，然后发送到左声道加法器111。在下一个循环中，延迟块131被发送到块132并执行类似的处理过程，然后对每个剩余的延迟块，如133，执行类似的处理。右声道被再一次执行对称处理。

    从上面的讨论中很明显可以看出，在优选实施例的构造中使用了大量脉冲响应函数或部分。现在参照图9开始讨论多个频域系数块的合成处理的最佳方法。为了确定所需的频域系数，将脉冲响应140分成许多长度为N的段141。在应用FFT变换为N个复数之前，为每个段增补额外的N个0值数据，以便于转换N个频域系数144。重复上述过程可以得到其后的频域系数145，146和147。

    图9中使用分段处理通常会带来人工高频域成分，这是分段处理以及它与快速傅里叶变换的直接作用的结果，因为此过程必将引起类似于末端数值不连续性的频率成分(FFT是数据大小的模)。最终的FFT通常含有重要的高频成分，这种高频成分实际上是由于这种不连续性产生的。在优选实施例中，采用了一个更好的处理方法以便将高频成分减到某个值，此时由于一系列零频域成分，可以省去大量计算。下面将参照图10讨论制作限带频域系数块的过程。

    最初的脉冲响应150再次被分割成长度为N的段151，每段被补成长度为2N的数据段152，数据152被乘以“窗口”函数153，该窗口函数还包括渐变的末端部分156，157。这两个末端部分用于将数据序列151的端部变换到零数量级同时保持它们之间的信息。作为结果的输出159包括160，161两点上的零值。然后输出159经受实FFT处理以产生频域系数165，该频域系数除了大量下一步可丢掉的可忽略成分166外，还含有许多在傅里叶变换的低频域中才出现的较大系数167。因此，使用最终的一部分频域成分169，作为代表脉冲响应数据的对应部分的频域分量。

    丢掉分量166意味着在卷积处理过程中，只需要执行一种严格形式的卷积处理，并且没有必要乘以所有的复系数N，因为它们中的大量数据为0。因为限制了卷积过程的计算，这将再次提高效率。此外，丢掉这些系数可以同时减少数据存储和系数存储，这就有可能大量减少运算所需的存储器。

    在一优选实施例中，N等于512时，头部滤波器长为1024拍，而尾部滤波器长6144拍。因此每个头部滤波器由两个系数块组成，每个尾部滤波器由12个系数块组成。在此优选实施例中，所有的头部滤波器和每个尾部滤波器的前四个系数块可以通过使用全套的系数傅里叶变换来实现。每个尾部滤波器的下四个块可以通过使用系数块来实现，该系数块中只存在频率成分中较低的一半，每个尾部滤波器的最后四个块可以通过使用系数块来实现，该系数块中只存在频率成分中较低的四分之一。

    该优选实施例可以扩展到使用高频音频输入的情况，但需要保持低频计算要求。例如在这个行业中普遍采用频率为96KHz的数字采样率，因此希望提供相同采样率的脉冲响应的卷积。现在转到图11，该图描述了一种使用较低脉冲响应采样率的扩展形式。在该方案中，频率为96KHz的输入信号170被发送到延迟缓冲器171中。输入信号还要被低通滤波处理172，然后通过因子2衰减到48KHz，然后根据以前所描述系统在采样率加倍之前进行FIR滤波，其后还有低通滤波器176，然后它被在177中加到延迟缓冲器171所发送出的原始延迟输入信号中，该延迟缓冲器177已经被增益因子A预乘过。加法器177的输出形成了卷积数字输出。

    通常，如果将96KHz的脉冲响应表示为h96(t)，那么可以表示为h48(t)的48KHz的FIR系数可以从低通滤波器[h96(t)]导出，此处的符号是用于表示原始的脉冲响应h96(t)是由低通滤波器滤波的。但是在图11所示的改进的方法中，如果将所要求的响应表示为h96(t)，延迟的脉冲响应表示为A．δ(t-τ)，那么可表示为h48(t)的48KHz的FIR系数可以从低通滤波器[h96(t)-A．δ(t-τ)]中导出。延迟因子τ和增益因子A的选择要满足从增益元件178发出的信号具有正确的抵达时间和振幅以产生96KHz的声学脉冲响应的直接抵达部分所要求的高频成分。同样，除了使用延迟和增益方案，还有可能使用稀疏FIR以产生多个宽带和频率形状的回音。

    因此，可以看出本优选实施例提供了一种可以保持全卷积系统基本数量特征的减少了计算量的卷积系统。

    本优选实施例采用多声道数字输入信号或环绕声输入信号，如杜比前逻辑、杜比数字(AC-3)和DTS，并使用一个或多个耳机用于输出。输入信号通过使用上述技术进行立体声处理，以便通过多种声源材料上的耳机提高听觉效果使其听起来为立体声或提供增强的环绕声效果。

    给出能产生立体声效果的处理技术，并通过多个不同的实施例可以提供能承担这种处理技术的系统。例如，很多不同的实际实施例都可能实现并且最终结果可以通过使用模拟信号或数字信号处理技术或两者的复合而实现。

    在纯粹的数字仪器中，输入数据被认为可以以数字时间采样的方式获得。如果实施例作为数字音频装置如光盘(CD)、小型磁盘(MINIDISC)、数字视频盘(DVD)或数字式录音磁带(DAT)的一部分实现，输入数据就已经可以以这种形式得到。如果该单元作为实际装置本身而被实现，它可以包括数字接收机(SPDIF或类似的，光或电)。如果本发明以只存在模拟输入信号的方式实施，这种模拟信号必须使用模数转换器(ADC)进行数字化转换。

    然后数字输入信号被某种形式的数字信号处理器(DSP)处理。可以使用的DSP的例子有：

    1．半定制或全定制集成电路作为为专门任务设计的DSP。

    2．可编程DSP芯片，例如摩托罗拉DSP56002。

    3．一个或多个可编程逻辑装置。

    在实施例同一专用耳机一起使用的情况下，脉冲响应函数的滤波可用于补偿任何多余的耳机频率响应特征。

    经过处理后，立体声数字输出信号经数模转换器(DAC)转变为模拟信号，需要时进行放大，并可能通过其它电路接到立体声耳机输出。在那个设备为内置时，最后这一步可在音响设备内完成，或者这个设备作为一个分离设备完成这个工作。

    ADC和／或DAC也可以作为处理器结合到同一集成电路。还可以如此实施实施例，以便部分或全部处理都在模拟范围完成。这种设备最好有“双声道”效果开和关的开关功能，并且能安装均衡器调整的功能以满足不同类型耳机或在处理进行中控制波动，包括音量输出。

    在图12中给出的第一个实施例中，处理步骤已结合到便携式CD或DVD播放器中代替跳读保护IC，目前现有的CD播放器备有“跳读保护”，它可以缓冲随机存储器(RAM)中从CD读取的数据。如果检测到“跳读”，那就是声音受到被推离轨道的装置的机械干扰，当播放RAM中的数据时，这个设备可从CD中重新读取数据，这个跳读保护经常被用作专门的DSP，不论RAM在芯片上或不在芯片上。

    实现本实施例时，对现有设计作最小改动就可作为一个跳读保护处理器，这个用途最有可能作为一个全定制集成电路。完成的功能包括现有的跳读保护处理器及对立体声处理的应用。部分有跳读保护的RAM可为HRTF型处理的立体声算法进行运算。一个跳读保护处理器的许多控制部件在本发明所述的处理工作中将非常有用，这种方案的例子如图12所示。

    在这个例举的实施例中，定制DSP200作为一台CD或DVD播放器202内部跳读保护DSP的替代元件。这个定制DSP200由光盘读取数据，向数模转换器201输出立体声信号，转换器放大模拟输出204，205向左右扬声器输出。定制DSP可根据需求包括电路板上RAM206，也可以包括外部RAM207。有一个立体声开关28可开关双声道效果。

    在图13中所描述的第二个实施例中，处理设备装在数字音响装置210(如CD、小型磁带、DVD、或DAT播放器)上作为DAC的替代设备。在这个操作中，信号处理由装有DAC的专用集成电路211完成。因为集成电路同现有DAC管脚相容，因此只需对现有设备做一点改动，就可很容易装到数字音频装置上。

    定制IC211包括一个在电路板上的DSP芯212和普通数模转换装置213，定制IC读取普通数字数据输出，并通过DSP212处理数字信号为模拟信号213，以便提供立体声输出。还有，提供有一个双声道开关214在需要时提供控制双声道效果。

    在图14中所描述的第三个实施例中，处理设备装在数字音响装置220(如CD、小型磁带、DVD、或DAT播放器)上作为数字信号链的额外一级221。在这个操作中，信号处理由一专用的或可编程的DSP221完成，该DSP221装在数字音响装置内，在DAC222前插到立体声数字信号链上。

    在图15中所描述的第四个实施例中，处理设备装在一台音响装置(如个人卡式磁带播放机或立体声收音机230)上作为模拟信号链的额外一级。这个实施例使用ADC232以利用模拟输入信号。这个设备最有可能安装在一个单个集成电路231上，该集成电路还包括ADC232，DSP233和DAC234。它同样可以进行一些模拟处理。在卡式磁带播放机及类似设备的现有设计上，很容易加到模拟信号链中。

    在图16中所描述的第五个实施例中，处理设备作为一个外部设备，用于数字形式的立体声输入。该实施例可作为一物理单元，或者同一套前面所述的耳机一起组合。它可由电池供电，也可选择由外部直流插头供电。当在一些CD或DVD及类似设备上，这个设备或者以光或者以电的形式接受立体声输入，输入格式可为SPDIF或相似格式，该单元可支持环绕格式，如杜比数字AC-3，或DTS。它也可接收下面所述的模拟输入。信号处理由定制的IC242内的DSP芯241完成，其后面为一个DAC243，如果这个DAC不能直接驱动耳机，则在DAC后另外加放大器246，247。本发明的实施例可在一个定制的包括DSP，DAC及可能的耳机放大器的集成电路上应用。

    或者本实施例可用作一个物理单元或组合到一套耳机中去。它可电池供电，也可选择由外部直流插头供电。设备接受模拟立体声输入，该模拟数据通过ADC转换成数字数据。此数据由DSP进行处理，并通过DAC转换回模拟信号。部分或全部处理可在模拟范围中完成。这个设备可装在一个定制集成电路上，该集成电路包括ADC、DSP、DAC及可能的耳机放大器并且还要求有模拟处理电路。

    设备可加入距离或“拉近拉远”控制，使收听者能区别感知的距离和声源所处的环境。在优选实施例中，这个控制是作为一个滑块调节器实现的。当控制处于最小，声音似乎来自很靠近耳朵的地方，事实上可能是单声道。在这个控制的最大设定值，声音被觉察到来自一定距离。控制可在这些极值间变化以控制觉察到声音的远近，从最小位置开始控制滑块到最大，用户比用简单的双声道开／关更快的速度适应双声道效果。这个控制的实施包括使用对不同距离有不同滤波器响应的装置。

    图17显示了具有滑块装置的例子。也可选择提供额外的音响环境开关控制功能。

    作为进一步的选择，实施例可用作一般集成电路的方法适用于包括前面列举功能在内的更大范围的应用。这种相同的集成电路可安装到带耳机输出的任何音响设备上，作为一项发明的运用，它也同样是专门制造的任何物理单元的基本处理块。这样一个包括ADC、DSP、DAC、内存I2S立体声数字音频输入、S／PDIF数字音频输入、耳机放大器及控制销的部分或全部的集成电路允许装置以不同模式运行(例如模拟或数字输入)。

    本领域的技术人员应当注意到，只要不脱离已广泛描述的本发明的精神和范围，正如特定的实施例所显示的那样，可以对本发明做出大量变化和／或修改。因此，本实施例从各方面来考虑都是示意性的而非限制性的。

    权利要求书

    按照条约第19条的修改

    信号；

    (c)通过插补和低通滤波处理，把上述被抽取的滤波信号转化为原来的较高的采样率以产生高采样率滤波信号；

    (d)对上述的输入音频信号进行稀疏滤波处理以产生稀疏滤波的音频信号；

    (e)把上述的高采样率滤波信号与稀疏滤波的音频信号相加以产生音频输出信号；

    (f)把上述的音频输出信号输出到上述的扬声器装置。

    23．根据权利要求22的方法，其中稀疏滤波处理包括单独的延迟元素和增益函数。

    24．根据权利要求23的方法，其中上述的稀疏滤波处理包括延迟线，从延迟线中取出多拍的音频信号，每拍的音频信号通过增益函数进行换算，把增益函数的输出相加以产生上述的稀疏滤波音频信号。

    25．一种用于处理输入音频信号的方法，所述输入音频信号代表了多个放在相对于收听者的对应位置的音频声源，该方法可产生一个或多个输出信号用以展示或传达对应于收听者位置的空间感，其中对各个输出信号，该方法包括：

    把各个第一滤波器的频域表示施加到各个输入音频信号的频域表示以产生多个第一滤波信号；

    把各个第二滤波器的频域表示施加到输入音频信号的频域表示的混音上以产生第二滤波信号，其中第二滤波器的频域表示和输入音频信号的频域表示的混音的一个或多个高频系数应从应用中去除；

    通过合并第一滤波信号和第二滤波信号产生各个输出信号。

    26．根据权利要求25的方法，其中各个第一滤波器的频域表示和各个输入音频信号的频域表示的一个或多个高频系数应从应用中去除。

    27．根据权利要求25或26的方法，其中第一滤波器对应于各个可以传达相对于收听者对应位置空间感的各个脉冲响应的头部，第二滤波器对应于各个脉冲响应的尾部部分的组合。