编码方法和设备 以及解码方法和设备 【技术领域】
本发明涉及一种编码方法和编码设备、解码方法和解码设备、传输方法和传输设备,以及记录介质,具体来说,涉及这样的一种编码方法和编码设备,解码方法和编码设备,传输方法和传输设备,以及记录介质,它们适用于对诸如声频信号或音频(语音)信号之类的数字数据进行有效的编码以便进行传输或者记录在记录介质上,并在解码端接收或复制这样的信号以对其进行解码。
背景技术
迄今为止,作为有效地对诸如语音(声音)等等之类的音频信号进行编码的方法,已知由频带分割编码(子带编码)代表的非分块频频带分割割系统,和由转换编码等等代表的分块频带分割系统。
在非分块频带分割系统中,时间轴上的音频信号被分成若干个信号分量,每个分量都有若干个频带,不执行分块就执行编码。此外,在分块频带分割系统中,时间轴上的信号转换(频谱转换)为频率轴上的信号,以分成若干个信号分量,每个分量都有若干个频带,即,收集通过对每个预先确定的频带执行频谱转换获得的系数,对每个相应的频带进行编码。
此外,作为进一步改善编码效率的方法,还提出了高效的编码技术,其中,将如上所述的非分块频带分割系统和分块频带分割系统合并在一起。根据此方法,例如,通过频带分割编码执行频带分割,以对每个相应地频带的信号进行频谱转换,将其转换为频率轴上的信号,以便对已经被进行过频谱转换的信号的每个相应的频带执行编码。
这里,在执行频带分割时,由于处理比较简单,消除了混淆失真,有许多使用QMF(正交镜像滤波器)的情况。要注意,利用QMF进行频带分割的细节在"1976R.E.Crochiere,Digital coding of speechin subbands,Bell Syst.Tech.J.Vol.55,No.8 1976"等中进行了描述。
此外,作为用于执行频带分割的方法,除上述方法之外,还有,例如,POF(多相正交滤波器),这是同等带宽的滤波器划分方法。这种PQF的细节在"ICASSP 83 BOSTON,Polyphase Quadraturefilters-A new subband coding technique,Joseph H.Rothweilier"中进行了描述。
另一方面,作为上文描述的频谱转换,有,例如,将输入音频信号按预先确定的单位时间的帧分块进行的频谱转换,以执行离散傅里叶转换(DFT)、离散余弦转换(DCT)或修改的离散余弦转换(MDCT),等等,从而将时间轴信号转换为频率轴信号。
要注意,MDCT的细节在"ICASSP 1987,Subband/TransformCoding Using Filter Bank Designs Based on Time Domain AliasingCancellation,J.P.Princen,A.B.Bradley,Univ.of Surrey RoyalMelbourne Inst.of Tech."中进行了描述。
如上所述,由于通过滤波器或频谱转换获得的每个频带的信号经过量化,以具有控制生成量化噪声的频带的能力,因此可以通过使用掩蔽效应从听觉角度进行更有效的编码。此外,如果每个相应的频带的信号分量在执行量化之前被对应频带的信号分量的绝对值的最大值归一化,则可以进行更有效的编码。
通过考虑人类的听觉特征判断执行频带分割时的相应的频带的宽度。即,一般而言,存在这样的情况:音频信号被分成若干个信号分量,每个分量都有若干个不同带宽的频带(例如,32个等),以便随着频带转变到较高频带,宽度变宽,这叫做临界频带。
此外,在对每个相应的频带的数据进行编码时,按每个相应的频带执行预先确定的位分配,或者按每个相应的频带执行自适应位分配。即,例如,在对按位分配经过MDCT处理之后获得的系数数据进行编码时,位数被自适应地按MDCT处理信号获得的每个相应的频带每个块地分配给MDCT系数数据,以便执行编码。
作为位分配方法,已知,例如,按每个相应的频带根据信号的大小执行位分配的方法(以下在需要时简称为“第一位分配方法”)和按每个相应的频带通过使用听觉掩蔽获得需要的信噪比以执行固定的位分配的方法(以下在需要时简称为“第二位分配方法”)等等。
要注意,第一位分配方法的细节在"Adaptive Transform codingof Speech Signals,R.Zelinski and P.Noll,IEEE Transactions ofAcoustics,Speech and Signal Processing,Vol.ASSP-25,No.4,August1977"中进行了描述。
此外,第二位分配方法的细节在"ICASSP 1980,The critical bandcoder digital encoding of the perceptual requirements of the auditorysystem,M.A.Kransner MIT"中进行了描述。
根据第一位分配方法,量化噪声频谱变平,以使噪声能量变得最小。然而,由于从听觉角度来看不会利用掩蔽效应,从实际听觉角度来看噪声感觉不会被最优化。此外,在第二位分配方法中,在能量集中于某些频率上的情况下,甚至在输入正弦波等等的情况下,由于位分配是固定的,特征值不会变得那么好。
鉴于上述情况,提出了一种高效的编码设备,在该编码设备中,可以用于位分配的所有位都以这样的状态使用,分成用于按每个相应的小决的预先确定的固定的位分配模式的位和用于依赖于相应的块的信号的大小执行位分配的位,以允许其划分比率依赖于与输入信号相关的信号,即,随着相应信号的频谱变得平稳,相对于用于固定的位分配模式的划分比率变大。
根据此方法,在能量集中于类似于正弦波输入的特定的频谱的情况下,许多位都被分配给包括该频谱的块。如此,整个信噪特征都可以得到显著的改善。一般而言,由于人类的听觉对具有锐利的频谱分量的信号极端敏感,信噪特征以如上所述的方式改善的事实,不仅改善了测量的数值,而且从听觉角度来看,在改善声音质量方面也是有效的。
作为位分配的一种方法,除上述方法之外,还提出了许多方法。如果与听觉有关的模型进一步变细,编码设备的能力得到改善,也可以进行从听觉角度来看更有效的编码。
在DFT或DCT用作将波形信号转换成频谱的方法的情况下,当按包括M个样本的时间块执行转换时,可以获得M个独立的实数数据。然而,由于一个块通常在分别与两个相邻的块重叠预先确定的数量(M1)的样本的状态下构成,才能减少时间块(帧)之间的连接失真,M个实数数据相对于(M-M1)样本平均地进行量化,并在利用DFT或DCT的编码方法中进行编码。
此外,在MDCT用作将时间轴上的信号转换成频谱的方法的情况下,从与两个相邻的块重叠M个样本的2M个样本中获得独立的M个数据。相应地,在这种情况下,平均地相对于M个样本对M个实数数据进行量化和编码。在这种情况下,在解码设备中,对通过使用如上所述的MDCT获得的代码在相应的块实施反向转换,并将所获得的波形元素相加,同时允许它们彼此干涉,以便重建波形信号。
一般而言,通过延长转换的时间块(帧),频谱的频率分辨率得以提高,以使能量集中到特定的频谱分量中。相应地,在使用MDCT的情况下,在该方法中,通过长块长度在与两个相邻的块不完全地重叠的状态下执行转换,获得的频谱信号的数量不会随原始时间样本的数量而增加,与使用DFT或DCT的情况相比,可以进行更有效的编码。此外,相邻的块具有充分长的重叠,从而还可以减少波形信号块间的失真。
在构成实际代码串时,首先,执行归一化和量化的每个频带,表示执行量化时量化步骤的信息的量化精度信息,表示用于归一化相应的信号分量的系数的信息的归一化信息,按执行归一化和量化的每个频带,被预先确定的位数进行编码,然后对归一化和量化的频谱信号进行编码。
这里,例如,在"IDO/IEC11172-3:1993(E),1993"中,描述了有效的编码系统集,以使表示量化精度信息的位数在对频带的依赖性方面不同。根据此系统,执行归一化,以便随着频带转变到较高频带,表示量化精度信息的位数变小。
图1显示了适用于进行音频信号的频带分割以进行编码的传统的编码设备的配置的实例。要编码的音频信号被输入到频带分割单元101,在该装置中,它被分为四个频带的信号。
这里,在频带分割单元101中,诸如上文描述的QMF或PQF之类的滤波器也可以用于进行频带分割。此外,也可以进行诸如MDCT之类的频谱转换,以对作为按频带的结果获得的频谱信号进行分组以进行频带分割。
要注意,在频带分割单元101上对音频信号进行频带分割时相应的频带的宽度(以下在需要时简称为“编码单位”)可以是均匀,也可以以与临界频带宽度一致的方式不均匀。此外,虽然图1中的音频信号被分成四个编码单位,但是编码单位的数量不仅限于此。
被分解成四个编码单位(在下文中有需要时,四个编码单位分别将称为第一个~第四个编码单位)的信号被按每个预先确定的时间块(帧)传输到量化精度判断单元103。此外,第一个~第四个编码单位的信号也分别被传输到归一化单元1021~1024。
归一化单元1021~1024从构成输入的第一个~第四个编码单位的相应的信号的相应的信号分量提取其绝对值为最大的信号分量,以允许对应于此值的系数成为第一个~第四个编码单位的归一化系数。此外,在归一化单元1021~1024,构成第一个~第四个编码单位的信号的相应的信号分量被分别除以对应于第一个~第四个编码单位的归一化系数的值。相应地,在这种情况下,通过归一化获得的归一化的数据取-1,0~1,0范围内的值。
归一化的数据被分别从归一化单元1021~1024输出到量化单元1041~1044。此外,第一个~第四个编码单位的归一化系数分别被从归一化单元1021~1024传输到多路复用器105。
第一个~第四个单位的归一化数据被从相应的归一化单元1021~1024传输到量化单元1041~1044,用于指定对第一个~第四个编码单位的归一化数据进行量化时的量化步骤的量化精度信息也被从量化精度判断单元103传输到量化单元1041~1044。
即,量化精度判断单元103根据来自频带分割单元101的第一个~第四个编码单位的信号判断量化来自频带分割单元101的第一个~第四个编码单位的相应的归一化数据的量化步骤、量化第一个~第四个编码单位的相应的归一化数据的量化步骤。此外,对应于该量化步骤的第一个~第四个编码单位的量化精度信息被分别输出到量化单元1041~1044,并将它们输出到多路复用器105。
在量化单元1041~1044,第一个~第四个编码单位的归一化数据被对应于第一个~第四个编码单位的量化精度信息的量化步骤分别量化,以使它们被编码。作为结果获得的第一个~第四个编码单位的量化系数被输出到多路复用器105。在多路复用器105,有需要时对第一个~第四个编码单位的量化系数、量化精度信息和归一化系数进行编码,然后多路复用。此外,作为结果获得的编码数据被经过传输路径传输,或记录在记录介质106上。
要注意,在量化精度判断单元103中,量化步骤的判断不仅根据在频带分割之后获得的信号进行,而且还可以根据归一化数据执行或者通过考虑诸如掩蔽效应之类的听觉现象来执行。
图2显示了适用于对从具有这样的配置的编码设备输出的编码数据进行解码的解码设备的配置的实例。在图2中,编码数据被输入到信号分离器121,在该信号分离器中进行解码。如此获得的解码数据被分成第一个~第四个编码单位的量化系数、量化精度信息和归一化系数。第一个~第四个编码单位的量化系数、量化精度信息和归一化信息被传输给对应于相应的编码单位的信号分量构成单元1221~1224。
在信号分量构成单元1221,第一个编码单位的量化系数被对应于第一个编码单位的量化精度信息的量化步骤反向量化。如此,这样的量化系数成为第一个编码单位的归一化数据。此外,在信号分量构成单元1221,第一个编码单位的归一化数据被乘以对应于第一个编码单位的归一化系数的值。如此,第一个编码单位的信号经过解码,并输出到频带合成装置123。
还是在信号分量构成单元1222~1224,执行类似的过程。如此,第二个~第四个编码单位的信号经过解码,并输出到频带合成装置123。在频带合成装置123,第一个~第四个编码单位的信号被频带合成。如此,原始音频信号被恢复(重建)。
同时,由于量化精度信息包括在从图1的编码设备传递(传输)到图2的解码设备的编码数据中,因此解码设备中使用的听觉模型可以任意地设置。即,在编码设备中,可以自由地设置相对于相应的编码单位的量化步骤,并可以改善声音质量和/或改善压缩比,而不更改算术(计算)能力改善和/或细化听觉模型的解码设备。
然而,在这种情况下,用于对量化精度信息进行编码的位数本身变得比较大。结果,难以提高整个编码效率以使它等于某一特定值或更高。
鉴于上述情况,有一种取代直接对量化精度信息进行编码,而是在解码设备中从归一化系数判断量化精度信息的方法。然而,在此方法中,由于归一化系数和量化精度信息之间的关系是在判断标准时进行判断的,因此存在难以基于将来的较高级别的听觉模型对量化精度进行控制的问题。此外,在有要实现的压缩比的宽度的情况下,有必要每个压缩比地判断归一化系数和量化精度信息之间的关系。
相应地,为了进一步改善压缩比,不仅要提高直接经过编码的主信息的编码效率,而且还必要提高对不直接经过编码的诸如量化精度信息或归一化系数之类的次信息的编码效率。
由于这样的量化精度信息和/或归一化系数等等在很多情况下在相邻的归一化单位之间、在相邻的信道之间、或者在相邻的时间之间具有关联,有许多通过使用可变长度代码簿(表)判断高度相关的信息之间差值以对该差值进行编码的情况。在此方法中,与不使用差值按照原样对信息进行编码的情况相比,编码效率可以得以提高,但相反也存在一个问题,代码簿(表)的大小变大。
考虑量化精度信息的分布范围是0~7的情况,通过3位执行编码。在对量化精度信息按照原样进行编码的情况下,代码簿(表)大小是8。与此相反,在对差值进行编码的情况下,该差值大约增宽到双倍的范围-7~7,代码簿(表)的大小大约为从8到15的双倍值,如图3所示。此外,在对差值的差值进行编码的情况下,分布范围大约增宽到四倍的范围-14~14,代码簿(表)的大小大约为从8到29的四倍值,如图4所示。
此外,虽然根据概率分布准备可变长度代码,但是长码被分配给出现概率低的值。结果,与不使用可变长度代码簿(表)的情况相比,存在这样的问题,要编码的位数增加许多。
【发明内容】
鉴于此类传统的实际情况,提出了本发明,其目标是提供一种可以进行有效的编码而不扩大代码簿(表)的编码方法和编码设备,解码方法和解码设备,传输方法和传输设备。
为了实现上文描述的目标,根据本发明的一种编码方法是指这样的编码方法,用于对预先确定的信息值进行编码,包括:确定信息值之间的差值的差值计算步骤;转换差值的转换步骤,以使转换的差值可以取值的范围小于差值可以主要取值的范围;对转换的差值进行编码的编码步骤。
这里,在编码方法中,当信息值可以取值的范围的大小是N时,在转换换步骤转换的差值可以取值的范围的大小可以成为N。此时,在转换步骤,其差值是N的两个差值可以被转换成相同值。
此外,在编码方法中,在信息值可以取值的范围的大小N是2的n次幂的情况下,在转换步骤执行转换,以便只取差值计算步骤的输出的低阶n位,在编码步骤中对被转换成n位的差值进行编码。
在这样的编码方法中,在对预先确定的信息值进行编码时,转换信息值之间的差值,以使转换的差值可以取值的范围小于差值可以主要取值的范围,然后进行编码。
此外,为了实现上文描述的目标,根据本发明的一种编码设备是指这样的编码设备,用于对预先确定的信息值进行编码,包括:用于确定信息值之间的差值的差值计算装置;转换装置,用于转换差值,以使转换的差值可以取值的范围小于差值可以主要取值的范围;用于对转换的差值进行编码的编码装置。
这里,在编码设备中,当信息值可以取值的范围的大小是N时,由转换装置转换的差值可以取值的范围的大小可以成为N。此时,转换装置可以将其差值是N的两个差值转换成相同值。
在对预先确定的信息值进行编码时,这样的编码设备转换信息值之间的差值,以使转换的差值可以取值的范围小于差值可以主要取值的范围。
此外,为了实现上文描述的目标,根据本发明的一种解码方法是这样的解码方法,用于输入由一种编码方法编码的转换的差值以对信息值进行解码,该编码方法确定预先确定的信息值的差值以转换差值,使转换的差值可以取值的范围小于差值可以主要取值的范围以对转换的差值进行编码,该解码方法包括:对转换的差值进行解码的差值解码步骤;以及通过使用在差值解码步骤中解码的转换的差值确定原始信息值的信息值恢复步骤。
这里,在解码方法中,当在差值解码步骤中解码的差值可以主要取值的范围的大小是N时,在信息值恢复步骤中恢复的信息值可以取值的范围的大小可以成为N。此时,相对于在差值解码步骤中解码的一个差值,将两个信息值中的任何一个恢复为信息值以使其差值是N。
此外,在解码方法中,在信息值可以取值的范围的大小N是2的n次幂的情况下,输入转换和编码以使差值成为n位的差值,在差值解码步骤对n位的差值进行解码,以及在信息值恢复步骤只取通过使用解码的差值计算的信息值的低阶n位,以便确定原始信息值。
在这样的解码方法中,在对预先确定的信息值进行编码时,转换信息值之间的差值,以使转换的差值可以取值的范围小于差值可以主要取值的范围,然后输入编码的差值。在此转换的差值被解码之后,通过使用此解码的差值恢复原始信息值。
此外,为了实现上文描述的目标,根据本发明的一种解码设备是这样的解码设备,用于输入由一种编码方法编码的转换的差值以对信息值进行解码,该编码方法确定预先确定的信息值的差值以转换差值,使转换的差值可以取值的范围小于差值可以主要取值的范围以对转换的差值进行编码,该解码设备包括:对转换的差值进行解码的差值解码装置;以及通过使用差值解码装置中解码的转换的差值确定原始信息值的信息值恢复装置。
这里,在解码设备中,当由差值解码装置解码的差值可以主要取值的范围的大小是N时,由信息值恢复装置恢复的信息值可以取值的范围的大小可以成为N。此时,相对于由信息值解码装置中解码的一个信息值,信息值恢复装置,可以将两个信息值中的任何一个恢复为信息值以使其差值是N。
在这样的解码设备中,在对预先确定的信息值进行编码时,转换信息值之间的差值,以使转换的差值可以取值的范围小于差值可以主要取值的范围,然后输入编码的差值。在此转换的差值被解码之后,通过使用此解码的差值恢复原始信息值。
此外,为了实现上文描述的目标,根据本发明的一种传输方法是指这样的传输方法,用于对预先确定的信息值进行编码以进行传输,该传输方法包括:用于确定信息值之间的差值的差值计算步骤;转换步骤,用于转换差值,以使转换的差值可以取值的范围小于差值可以主要取值的范围;用于对转换的差值进行编码的编码步骤;以及对编码的转换的差值进行传输的传输步骤。
这里,在传输方法中,当信息值可以取值的范围的大小是N时,经过转换步骤转换之后的差值可以取值的范围的大小可以成为N。此时,其差值是N的两个差值可以被转换成相同值。
在这样的传输方法中,在对确定预先确定的信息值进行编码以进行传输时,信息值之间的差值经过转换以使转换的差值可以取值的范围小于差值可以主要取值的范围以对转换的差值进行编码以进行传输。
此外,为了实现上文描述的目标,根据本发明的一种传输设备是指这样的传输设备,用于对预先确定的信息值进行编码以进行传输,该传输设备包括:用于确定信息值之间的差值的差值计算装置;转换装置,用于转换差值,以使转换的差值可以取值的范围小于差值可以主要取值的范围;用于对转换的差值进行编码的编码装置;以及对编码的转换的差值进行传输的传输装置。
这里,在传输设备中,当信息值可以取值的范围的大小是N时,由转换装置转换的差值可以取值的范围的大小可以成为N。此时,转换装置可以将其差值是N的两个差值转换成相同值。
在对确定预先确定的信息值进行编码以进行传输时,这样的传输装置转换信息值之间的差值,以使转换的差值可以取值的范围小于差值可以主要取值的范围以对它进行编码以进行传输。
此外,为了实现上文描述的目标,根据本发明的一种记录介质,用于记录由编码方法编码的转换的差值,该编码方法包括用于确定预先确定的信息值之间的差值的差值计算步骤,转换差值的转换步骤,以使转换的差值可以取值的范围小于差值可以主要取值的范围,对转换的差值进行编码的编码步骤。
这里,在编码方法中,当信息值可以取值的范围的大小是N时,在转换步骤转换的差值可以取值的范围的大小可以成为N。此时,在转换步骤,其差值是N的两个差值被允许映射成相同值。
关于这样的记录介质,记录了差值,在该差值中,在对预先确定的信息值进行编码时,转换信息值之间的差值,以使转换的差值可以取值的范围小于差值可以主要取值的范围,然后进行编码。
通过阅读下面给出的实施例的说明,本发明的另外一些目标和本发明获得的实际优点将变得更加清楚。
【附图说明】
图1是一个说明传统的编码设备的配置的视图。
图2是一个说明传统的解码设备的配置的视图。
图3是一个显示在对差值进行编码的情况下传统的可变长度代码簿(表)的视图。
图4是一个显示在对差值的差值进行编码的情况下传统的可变长度代码簿(表)的视图。
图5是一个说明此实施例中的编码设备的配置的视图。
图6是一个说明此实施例中的解码设备的配置的视图。
图7是一个说明在编码设备的量化精度信息编码单元中对差值进行转换处理的流程图。
图8是说明用于在量化精度信息编码单元中对转换的差值进行编码的代码簿(表)的视图。
图9是一个显示在量化精度信息编码单元中转换差值的实例的视图。
图10是一个显示在量化精度信息编码单元中减少要编码的位数的实例的视图。
图11是一个说明解码设备的量化精度信息解码单元中的解码过程的流程图。
图12是一个显示量化精度信息解码单元中的解码过程的流程图。
图13是一个说明在量化精度信息编码单元中对差值进行转换处理的另一个实例的流程图。
图14是一个说明对转换的差值进行编码的代码簿(表)是转换处理的另一个实例的视图。
图15是一个说明量化精度信息解码单元中的解码过程的另一个实例的流程图。
图16是一个说明在量化精度信息编码单元中不对差值的大小执行判定的情况下转换差值的过程的流程图。
图17是一个说明在量化精度信息解码单元中不对差值的大小执行判定的解码过程的流程图。
图18是一个说明在编码设备的量化精度信息编码单元中转换差值的差值的过程的流程图。
图19是一个说明在解码设备的量化精度信息解码单元中对差值的差值进行解码的过程的流程图。
【具体实施方式】
现在将参考附图并结合应用了本发明的实施例详细地进行说明。在此实施例中,本发明应用于编码设备和解码设备,它们用于对音频信号执行有效的编码以进行传输或者记录在记录介质上,并在解码端接收或复制这样的信号以对其进行解码。要注意,虽然是在对音频信号进行有效编码的假定之下给出说明的,但是本发明不仅限于这样的实施方式,也可以使用视频信号。此外,虽然是在对不直接经过编码的诸如量化精度信息和/或归一化系数之类的次信息进行编码和解码时应用本发明的假定之下给出说明的,但是这仅仅是一个实例,本发明不仅限于这样的实例。
首先,图5显示了此实施例中的编码设备10的配置。在图5中,要编码的音频信号被输入到频带分割单元11,在该单元中,它被频带分割为四个频带的信号。
这里,在频带分割单元11中,诸如QMF(正交镜像滤波器)或PQF(多相正交滤波器)之类的滤波器也可以用于进行频带分割。此外,也可以进行诸如MDCT(修改的离散余弦转换)之类的频谱转换,以对作为结果获得的频谱信号进行分组以每个频带地进行频带分割。
要注意,在频带分割单元11上对音频信号进行频带分割时相应的频带的宽度(以下在需要时简称“编码单位”)可以是均匀的,也可以以与临界频带宽度一致的方式不均匀。此外,虽然音频信号被分成四个编码单位,但是编码单位的数量不仅限于此。
被分解成四个编码单位(在下文中有需要时,四个编码单位分别被称为第一个~第四个编码单位)的信号被传输到量化精度判断单元13每个预先确定的时间块(帧)。此外,第一个~第四个编码单位的信号也分别被传输到归一化单元121~124。
归一化单元121~124从构成输入的相应的第一个~第四个编码单位的相应的信号分量提取其绝对值为最大的信号分量,以允许对应于这些值的系数成为第一个~第四个编码单位的归一化系数。此外,在归一化单元121~124,构成第一个~第四个编码单位的信号的相应的信号分量被分别除以对应于第一个~第四个编码单位的归一化系数的值。如此,它们被归一化。相应地,在这种情况下,通过归一化获得的归一化的数据取-1,0~1,0范围内的值。
归一化的数据被分别从归一化单元121~124输出到量化单元14~144。此外,第一个~第四个编码单位的归一化系数被从相应的归一化单元121~124输出到归一化系数编码单元16。在相邻的单位的差值经过稍后将进行描述的方法进行可变长度编码之后,这样的编码的差值被输出到多路复用器17。
第一个~第四个编码单位的归一化数据被从相应的归一化单元121~124传输到量化单元141~144,用于指定对第一个~第四个编码单位的归一化数据进行量化时的量化步骤的量化精度信息也被从量化精度判断单元13传输到量化单元141~144。
即,量化精度判断单元13根据来自频带分割单元11的第一个-第四个编码单位的信号判断量化第一个-第四个编码单位的相应的归一化数据的量化步骤。此外,量化精度判断单元13将对应于这些量化步骤的第一个~第四个编码单位的量化精度信息输出到量化单元14-144,并将它们输出到量化精度信息编码单元15。量化精度信息编码单元15允许对相邻的单位的量化精度信息的差值以稍后描述的方式进行可变长度编码,此后将它们输出到多路复用器17。
在量化单元141~144,第一个~第四个单位的归一化数据被对应于第一个~第四个编码单位的量化精度信息的量化步骤分别量化,以使它们被编码,作为结果获得的第一个~第四个编码单位的量化系数被输出到多路复用器17。在多路复用器17,第一个~第四个编码单位的量化系数经过编码,并与在量化精度信息编码单元15编码的量化精度信息和在归一化系数编码单元16编码的归一化系数多路复用在一起。此外,作为多路复用器17的输出获得的编码数据被经过传输路径传输,或记录在记录介质18上。
如上所述,在此实施例中的编码设备10中,充当主信息并直接经过编码的音频信号和充当次信息并不直接经过编码的量化精度信息和归一化系数是分别进行编码的。
然后,图6显示了此实施例中的解码设备30的配置。在图6中,编码数据被输入到信号分离器31,在该信号分离器中,以分成第一个~第四个编码单位的量化系数、量化精度信息和归一化系数的方式进行解码。第一个~第四个编码单位的量化系数被传输给对应于相应的编码单位的信号分量构成单元341~344。此外,量化精度信息和归一化系数被分别在量化精度信息解码单元32和归一化系数解码单元33上进行解码,然后传输给对应于相应的编码单位的信号分量构成单元341~344。
在信号分量构成单元341,第一个编码单位的量化系数被对应于第一个编码单位的量化精度信息的量化步骤反向量化。如此,这样的反向量化的量化系数成为第一个编码单位的归一化数据。 此外,在信号分量构成单元341,第一个编码单位的归一化数据乘以对应于第一个编码单位的归一化系数的值。如此,第一个编码单位的信号经过解码,并输出到频带合成装置35。
还是在信号分量构成单元342~344,执行类似的过程。如此,第二个~第四个单位的信号经过解码,并输出到频带合成装置35。在频带合成装置35,第一个~第四个编码单位的信号被频带合成。如此,原始音频信号被恢复。
同时,在此实施例中的编码设备10中的量化精度信息编码单元15和归一化系数编码单元16,量化精度信息和归一化系数的差值经过可变长度编码。在这一情况下,对差值实施转换处理,以使产生与可变长度代码簿(表)的大小不取差值的下相同的大小。
鉴于上述情况,下面将给出有关诸如量化精度信息和/或归一化系数等等之类信息的差值的编码方法以及针对该编码方法编码的信息的解码方法的说明。
要注意,由于对于量化精度信息编码方法是解码方法,对于归一化系数编码方法和解码方法彼此类似,下面将只给出上文描述的量化精度信息编码单元15中的量化精度信息的编码方法,以及量化精度信息解码单元32中的量化精度信息的解码方法。此外,虽然是在量化精度信息的分布范围是0~7的假定之下给出说明的,显然,分布范围不仅限于此范围。
首先,将使用图7的流程图给出有关此实施例中的量化精度信息的编码方法的说明。最初,在步骤S1中,确定差值C。即,不是主要对信息值B进行编码,而是计算差值C(=A-B)以对此差值C进行编码。要注意,信息值A是与在计算差值时充当基准的信息值B高度相关的信息值,是在信息值B之前编码的值。这里,如上所述,由于量化精度信息的分布范围是0~7,差值C的分布范围成为-7~7。
然后,在随后的步骤S2中,判定差值C是否为3。在差值C大于3(是)的情况下,处理过程进入步骤S3。在差值C小于3(否)的情况下,处理过程进入步骤S4。
在步骤S3中,将差值C减去8。此后,处理过程进入步骤S6以对差值C进行编码从而完成处理过程。
在步骤S4中,判定差值C是否小于-4。在差值C小于-4(是)的情况下,处理过程进入步骤S5。在差值大于-4(否)的情况下,处理过程进入步骤S6以对差值C进行编码从而完成处理过程。
在步骤S5中,将差值C增加8。此后,处理过程进入步骤S6以对差值C进行编码从而完成处理过程。
要注意,在步骤S5和S5中使用的值8与量化精度信息的分布范围(0~7)的大小8是相同的值。即,在量化精度信息的分布范围是0~15的情况下,分布范围的大小是16,在加法/减法中使用值16。
如上所述,通过对量化精度信息的分布范围的大小8执行加法/减法,差值C的分布范围成为-4~3。因此,按该范围准备可变长度代码簿(表)就足够了。即,如图8所示,代码簿(表)的大小是8,此大小和在不取差值的情况下进行编码的情况中的代码簿(表)的大小一样。
下面将结合图9中实例给出说明。此外,在图9的I的情况下,充当差值的基准值的信息值A是0,将主要进行编码的信息值B是7。因此,差值C成为-7。由于此差值-7是小于-4的值,因此如上所述,增加8。通过此加法处理,差值C被从-7转换成1。此外,此差值1实际将经过可变长度编码。
此外,在图9的II的情况下,充当差值的基准值的信息值A是7,将主要进行编码的信息值B是2。因此,差值C成为5。由于此差值5是大于3的值,因此如上所述,减去8。通过此减法处理,差值C被从5转换成-3。此外,此差值3实际将经过可变长度编码。
此外,在图9的III的情况下,充当差值的基准值的信息值A是5,将主要进行编码的信息值B是4。因此,差值C等于1。由于此信息值1大于-4并小于3,因此不执行加法/减法,对此差值原样进行可变长度编码。
下面将使用图10对此方法减少要编码的位数的示例进行说明。在此示例中,在较低频带的相邻的量化单元中的量化精度信息的值减去某量化单元中的量化精度信息的值的差值进行编码。要注意,在常规方法中,编码是通过使用以前描述的图3中的可变长度代码簿(表)来进行的,而在此实施例中的方法中,编码是通过使用图8显示的可变长度代码簿(表)来进行的。从图10可以看出,在常规方法中,要编码的总位数是22位,而在此实施例中的方法中该位数是20位,从而减少了2位。这是因为,在常规方法中,在量化单元数是6的量化单元中,对差值5进行编码需要7位,而在此实施例中的方法中只需要5位,因为差值5被转换成-3。这里,在此示例中,在量化单元数是0的量化单元中,量化精度信息的值是通过固定长度3位进行编码的,而不使用差值。
要注意,可以使用一种方法,在该方法中,只对可以取差值的一部分值执行差值的转换,而对其余部分不执行转换。即,还可以使用一种方法,在该方法中,例如,只对差值-7、-6、6、7执行转换,以使图3显示的可变长度代码簿(表)中的位数是8,并通过按照原样使用图3的可变长度代码簿(表)对从-5到5范围内的差值执行编码。
随后,将通过使用图11的流程图,给出有关对上文描述的量化精度信息解码单元32中上文描述的编码方法编码的量化精度信息进行解码的解码方法的说明。
首先,在步骤S10中,从位流对差值C进行解码以确定随后的步骤S11中的信息值B。此时,由于信息值A的值已知,通过将信息值A减去差值C,可以确定信息值B。
然后,在随后的步骤S12,判定信息值B是否大于7。在信息值B大于7的情况下,处理过程进入步骤S13以将信息值B减去8,从而完成处理过程。在步骤S12中的信息值B小于7的情况下,处理过程进入步骤S14。
在步骤S14中,判定信息值B是否小于0。在信息值B小于0的情况下,处理过程进入步骤S15以将信息值B增加8,从而完成处理过程。在步骤S14中的信息值B大于0的情况下,处理过程完成。即,在信息值B的值超出主要分配范围的情况下,执行加法/减法,可以进行修改,以便产生分布范围内的值。如此,可以对信息值B进行解码。
下面将结合图12中实例给出说明。要注意,图12的实例对应于图9中列举的编码端的上文描述的实例。在图12的I的情况下,首先对信息值C进行解码。然后,将充当基准值的信息值A减去信息值C以确定信息值B。在实际中,将0减去1以使信息值B等于-1。由于此信息值-1是小于0的值,因此如上所述,增加8。如此,可以将信息值B转换成7。此值导致实际信息值B。
此外,在图12的II的情况下,同样,将7减去-3以使信息值B等于10。由于此信息值10大于7,因此如上所述,减去8。如此,可以将信息值B转换成3。此值导致实际信息值B。
此外,在图12的III的情况下,同样,将5减去1以使信息值B等于4。由于此信息值4大于0并小于7,此值导致实际信息值B保持原样。
如上所述,在图12中已经指出,上文描述的图9中编码的值可以完全地恢复。
同时,虽然在上文描述的示例中是在执行可变长度编码的假定之下给出说明的,如果差值大于3,则减去8,虽然如果差值小于-4,则增加8,但是本发明不仅限于此,也可以执行一种方法将其差值是2的两个差值转换成相同值。即,例如,也可以执行这样一个操作,以便在差值是负数的情况下,增加8。下面将结合这种情况下的编码过程和解码过程给出说明。
在编码过程中,如图13的流程图所示,首先,在步骤S20中,将充当基准值的信息值A减去信息值8以确定差值C。这里,如上所述,由于量化精度信息的分布范围是0~7,差值C的分布范围成为-7~7。
在步骤S21中,判定差值C是否小于0。在差值C小于0(是)的情况下,处理过程进入步骤S22。在差值C大于0(否)的情况下,处理过程进入步骤S23以对差值C进行编码从而完成处理过程。
在步骤S22中,在向差值C增加8之后,处理过程进入步骤S23以对差值C进行编码从而完成处理过程。
如上所述,增加或减去量化精度信息的分布范围的大小8,以使差值C的分布范围成为0~7。因此,按该范围准备可变长度代码簿(表)就足够了。即,如图14所示,代码簿(表)的大小是8,此大小和在不取差值的情况下进行编码的情况中的代码簿(表)的大小一样。
随后,将通过使用图15的流程图,给出有关对上文描述的量化精度信息解码单元32中此编码方法编码的量化精度信息进行解码的解码方法的说明。
首先,在步骤S30中,从位流对差值C进行解码以确定随后的步骤S31中的信息值B。此时,由于信息值A的值已知,通过将信息值A减去差值C,可以确定信息值B。
然后,在步骤S32中,判定信息值B是否小于0。在信息值B小于0(是)的情况下,处理过程进入步骤S33以将信息值B增加8,从而完成处理过程。在步骤S32中的信息值B大于0(否)的情况下,处理过程完成。
如上所述,如两个示例所示,执行这样一个操作以将将其差值是8的两个差值转换成相相同值,从而可以使可变长度代码簿(表)的大小保持和在不取差值的情况下进行编码的情况中的代码簿(表)大小一样。
同时,虽然对上文描述的两个示例进行修改以便此后确定差值以进行判定,并根据判定结果执行加法/减法,无需进行判定,将可变长度代码簿(表)的大小保持和在不取差值的情况下进行编码的情况中的代码簿(表)的大小一样。下面将结合这种方法中的编码过程和解码过程给出说明。
在编码过程中,如图16的流程图所示,首先,在步骤S40中,将充当基准值的信息值A减去信息值B以确定差值C。这里,如上所述,由于量化精度信息的分布范围是0~7,差值C的分布范围成为-7~7。
在步骤S41中,由4位二进制记数法表示的差值C的高阶一位被掩蔽以替换为只包括低阶3位的值。在实际中,取与十六进制“0x07”(即,4位二进制记数法的“0111”)的逻辑积。
然后,在步骤S42中,对被替换为只包括低阶3位的值的差值C进行编码以完成处理过程。
此外,在解码过程中,如图17的流程图所示,首先,在步骤S50中,从位流对差值C进行解码以确定随后的步骤S51中的信息值B。此时,由于差值A的值已知,通过将信息值A减去差值C,可以确定信息值B。
然后,在步骤S52中,取信息值B和十六进制“0x07”(即,4位二进制记数法的“0111”)的逻辑积,以完成处理过程。
如上所述,通过取差值C和4位二进制记数法的“0111”的逻辑积,执行相当于在差值C为负数的情况下增加8的处理过程。在此方法中,没有必要判定差值C的大小。结果,可变长度代码簿(表)的大小可以保持和在不取差值的情况下进行编码的情况中的代码簿(表)大小一样。
要注意,虽然在上述说明中是在对信息值A和信息值B之间的差值C进行编码而不是对信息值B进行编码的假定之下进行说明的,但是也可以对差值之间的差值进行编码。下面将结合这种情况下的编码过程和解码过程给出说明。要注意,虽然取差值的次数可以是任意的,但是为了简洁下面将结合取差值两次的情况给出说明。此外,虽然在下面的示例中是在执行可变长度编码的假定之下给出说明的,如果差值大于3,则减去8,如果差值小于-4,则增加8,显然,使用一种方法以便在差值是负数的情况下,以如上所述的方式增加8也是可以的。
在编码过程中,如图18的流程图所示,对差值E进行编码。即,不是主要对信息值D进行编码,而是计算差值E(=(A-B)-(C-D))以对此差值E进行编码。要注意,信息值A、B和C是在计算差值时充当基准的信息值,是在信息值D之前编码的值。
在实际中,首先,在步骤S60中,确定差值F(=A-B)。这里,如上所述,由于量化精度信息的分布范围是0~7,差值F的分布范围成为-7~7。
然后,在步骤S61中,判定差值是否大于3。在差值F大于3(是)的情况下,在步骤S62中将差值F减去8。此后,处理过程进入步骤S65。在步骤S61中差值F小于3(否)的情况下,处理过程进入步骤S63。
在步骤S83中,判定差值是否小于-4。在差值F小于-4(是)的情况下,在步骤S64中将差值F增加8。此后,处理过程进入步骤S65。在步骤S63中差值F大于-4(否)的情况下,处理过程进入步骤S65。
在步骤S65中,确定差值G(=C-D)。这里,如上所述,由于量化精度信息的分布范围是0~7,差值G的分布范围成为-7~7。
然后,在步骤S66中,判定差值G是否大于3。在差值G是3或更大(是)的情况下,在步骤S67中将差值G减去8。此后,处理过程进入步骤S70。在差值G小于3(否)的情况下,处理过程进入步骤S68。
在步骤S68中,判定差值G是否小于-4。在差值G小于-4(是)的情况下,在步骤S69中将差值G增加8。此后,处理过程进入步骤S70。在步骤S68中差值G大于-4(否)的情况下,处理过程进入步骤S70。
在步骤S70中,确定差值E。这里,由于差值F和差值G的分布范围是-4~3,差值E的分布范围成为-7~7。
然后,在步骤S71中,判定差值是否大于3。在差值E大于3(是)的情况下,处理过程进入步骤S72。在差值E小于3(否)的情况下,处理过程进入步骤S73。
在步骤S72中,将差值E减去8。此后,处理过程进入步骤S75以对差值E进行编码从而完成处理过程。
在步骤S73中,判定差值是否小于-4。在差值E小于-4(是)的情况下,处理过程进入步骤S74。在差值E大于-4(否)的情况下,处理过程进入步骤S75以对差值E进行编码从而完成处理过程。
在步骤S74中,将差值E增加8。此后,处理过程进入步骤S75以对差值E进行编码从而完成处理过程。
如上所述,增加或减去量化精度信息的分布范围的大小8,以使差值E的分布范围成为-4~3。因此,按该范围准备可变长度代码簿(表)就足够了。即,准备和在不取差值的情况下进行编码的情况中的代码簿(表)一样大小的代码簿(表)就足够了。
在解码过程中,如图19的流程图所示,首先,在步骤S80中,确定差值F(=A-B)。这里,如上所述,由于量化精度信息的分布范围是0~7,差值F的分布范围成为-7~7。
然后,在步骤S81中,判定差值F是否大于3。在差值F大于3(是)的情况下,在步骤S82中将差值F减去8。此后,处理过程进入步骤S85。在步骤S81中差值F小于3(否)的情况下,处理过程进入步骤S83。
在步骤S83中,判定差值F是否小于-4。在差值F小于-4(是)的情况下,在步骤S84中将差值F增加8。此后,处理过程进入步骤S85。在步骤S83中差值F大于-4的情况下,处理过程进入步骤S85。
在步骤S85中,对差值E进行解码。在随后的步骤S86中,确定信息值D。通过将差值E减去差值F以将此值增加信息值C,可以确定此信息值D。
然后,在步骤S87中,判定信息值D是否大于7。在信息值大于7的情况下,处理过程进入步骤S88以将信息值D减去8,从而完成处理过程。在步骤S87中的信息值D小于7的情况下,处理过程进入步骤S89。
在步骤S89中,判定信息值D是否小于0。在信息值D小于0的情况下,处理过程进入步骤S90以将信息值D增加8,从而完成处理过程。在步骤S89中的信息值D大于0的情况下,处理过程完成。通过上述处理,便可以对信息值D进行解码。
如上所述,在此实施例中,在对量化精度信息和归一化系数信息的差值进行编码时,差值被转换成限制的范围内的值。一般而言,在量化精度信息和/或归一化系数信息中,有许多它们的值在相邻的归一化单元之间、在相邻信道之间或在相邻的时间之间彼此类似的情况。因此,在计算差值时,在该出现概率中出现比较大的偏差。具体来说,在差值“0”附近概率变得很高。相应地,给予具有高出现概率的差值短的可变长度代码,从而可以减少要编码的位数。然而,与此相反,存在取差值以使代码簿(表)的大小增大的问题。鉴于上述情况,如上所述,差值被转换成限制范围内的值,从而防止代码簿(表)的大小增大,编码效率可以得以改善。此外,在对要直接经过编码的音频信号进行编码时分派了由于编码效率以此方式得到改善而发生的过度位,这样编码声音的质量可以得以改进。
要注意,本发明不仅限于上文描述的实施例,在不偏离本发明的精神的范围内可以进行各种更改或修改。
例如,虽然在上述说明中是在编码是按可变长度执行的假定之下进行说明的,但是本发明不仅限于这样的实施方式,编码可以按固定长度进行。
此外,虽然在上述说明中是与本发明应用于量化精度信息和归一化系数信息的编码和解码的情况结合地进行说明的,但是本发明不仅限于这样的实施方式,而可以应用于要通过使用差值进行编码的任何信息。
例如,本发明可以应用于如本申请的发明人已经提出的日本专利申请No.182093/2001的说明书和图形中所描述的增益控制信息。在日本专利申请No.182093/2001的说明书和图形中所描述的编码设备中,每个块都提取每个频频带分割成多个频带的信号。判定此块内的信号中是否存在波形信号电平突然变大的攻击部分或在攻击部分之后是否存在电平突然变小的释放部分。在存在攻击部分或释放部分的情况下,生成了其电平变小的部分的信号,该部分在攻击部分之前发生,增益控制量信息,表示对应于释放部分的电平大小的增益控制量、增益控制位置信息,表示将要经过此增益控制量的增益控制的增益控制位置,以及增益控制数,表示增益控制的位置的数量。如此,基于增益控制数、增益控制量信息,以及增益控制位置信息对块内的波形信号进行增益控制处理。增益控制数、增益控制量信息以及增益控制位置信息经过编码和多路复用。
这里,有许多增益控制数等于接近于相邻的编码设备的值的情况。此外,有许多增益控制数量信息和增益控制位置信息等于块内的接近于相邻的增益控制数量信息和增益控制位置信息的情况。因此,分别获取差值以对差值进行可变长度编码以具有改善编码效率的能力。此外,在此编码过程中,如上所述,差值被转换成限制范围内的值,从而防止代码簿(表)的大小增大。
此外,本发明还可以应用于合成如本申请的发明人已经提出的日本专利申请No.380639/2000或日本专利申请No.182384/2001的说明书和图形中所描述的波形的参数。在日本专利申请No.380639/2000或日本专利申请No.182384/2001的说明书和图形中所描述的编码设备中,从声音(声音)序列信号中提取音调分量以对此音调分量的频率、振幅或相进行编码。鉴于上述情况,在对此音调分量的频率、振幅或相的差值进行编码时,可以应用本发明。
此外,除上述之外,也在对用作音频信号的参数的LPC(线性预测编码)系数、LSP(线谱对)系数、倒频谱系数或声音的俯仰信息等等的差值进行编码时,可以应用本发明。
此外,由于波形信息(时间序列信号)本身还与相邻的时间高度相关,因此在对差值进行编码时,可以应用本发明。
此外,还相对于其中波形信号将被进行频谱转换的频谱系数,在对差值进行编码时,可以应用本发明。
工业实用性
通过使用如上所述的本发明,在对预先确定的信息值进行编码时,转换信息值之间的差值,以使转换的差值可以取值的范围小于差值可以主要取值的范围,然后进行编码从而在编码时防止代码簿(表)的大小增大以使编码效率改善。