用于处理数字视频信号的方法和系统.pdf

摘要
申请专利号：	CN03822713.4	申请日：	2003.09.17
公开号：	CN1685730A	公开日：	2005.10.19
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回\|\|\|实质审查的生效\|\|\|公开
IPC分类号：	H04N7/24; G06T17/20	主分类号：	H04N7/24; G06T17/20
申请人：	皇家飞利浦电子股份有限公司;
发明人：	S·奥伯格; Y·皮卡尔德
地址：	荷兰艾恩德霍芬
优先权：	2002.09.25 EP 02292353.6
专利代理机构：	中国专利代理(香港)有限公司	代理人：	邹光新;王勇
PDF完整版下载：	PDF下载

内容摘要

本发明涉及一种视频通信系统(SYS)，其能够接收数字视频信号，所述数字视频信号包括多组具有组件(COMP)的对象(OBJ)。本发明的特征在于包括：有效性信息(FLAG)，用于确定所述对象(OBJ)的组件(COMP)是否将被编码和通过传输信道(CH)传输；编码装置，用于在该有效性信息(FLAG)为允许时编码所述对象(OBJ)的组件(COMP)；解码装置，用于在该有效性信息(FLAG)为允许时解码所述对象(OBJ)的所述组件(COMP)；和恢复装置，用于在该有效性信息(FLAG)为禁止时恢复所述对象(OBJ)的所述组件(COMP)。

权利要求书

1：一种视频通信系统(SYS)，其能够接收数字视频信号，所述数字视频信号包括多组具有组件(COMP)的对象(OBJ)，该视频通信系统包括：用于编码所述视频信号的编码器(ENC)、用于传输所编码的视频信号的传输信道(CH)、和用于解码所述编码的视频信号的解码器(DEC)，其特征在于其包括：有效性信息(FLAG)，用于确定所述对象(OBJ)的组件(COMP)是否需要在编码器(ENC)侧被编码，并且通过传输信道(CH)传输；编码器(ENC)侧的编码装置，用于在有效性信息(FLAG)为允许时编码所述对象(OBJ)的组件(COMP)；解码器(DEC)侧的解码装置，用于在有效性信息(FLAG)为允许时解码所述对象(OBJ)的所述组件(COMP)；和解码器(DEC)侧的恢复装置，用于在有效性信息(FLAG)为禁止时恢复所述对象(OBJ)的所述组件(COMP)。
2：如权利要求1中的视频通信系统(SYS)，其特征在于该编码装置用于对组件(COMP)编码，就好像所述对象(OBJ)的所有组件(COMP) 都已经被编码和传输了一样。
3：如权利要求1中的视频通信系统(SYS)，其特征在于编码组件 (COMP_D)依赖于另一组件(COMP)，所述另一组件是所编码的组件或丢失组件(COMP_D)。
4：一种用于编码数字视频信号的编码器(ENC)，所述数字视频信号包括多组具有组件(COMP)的对象(OBJ)，其特征在于其包括：有效性信息(FLAG)，用于确定所述对象(OBJ)的组件是否将被编码和通过传输信道(CH)传输；和编码装置，用于在该有效性信息(FLAG)为允许时编码所述对象 (OBJ)的所述组件(COMP)。
5：如权利要求4中的编码器(ENC)，其特征在于该编码装置用于对组件(COMP)编码，就好像所述对象(OBJ)的所有组件(COMP)都已经被编码和传输了一样。
6：一种用于解码数字视频信号的解码器(DEC)，所述数字视频信号包括多组具有组件(COMP)的对象(OBJ)，其特征在于其包括：解码装置，用于在有效性信息(FLAG)为允许时解码所述对象(OBJ) 的组件(COMP)；和恢复装置，用于在有效性信息(FLAG)为禁止时恢复所述对象(OBJ) 的组件(COMP_M)。
7：如权利要求6中的解码器(DEC)，其特征在于该解码装置用于首先对不依赖于其它组件(COMP)的组件(COMP)进行解码，然后对依赖于其它组件的组件(COMP_D)进行解码，并且如果依赖于丢失组件 (COMP_M)，就在恢复所述丢失组件(COMP_M)之后对所述依赖组件 (COMP_D)进行解码。
8：一种处理数字视频信号的方法，所述数字视频信号包括多组具有组件(COMP)的对象(OBJ)，其特征在于其包括步骤：通过有效性信息(FLAG)确定所述对象(OBJ)的组件(COMP)是否将被编码和通过传输信道(CH)传输；在该有效性信息(FLAG)为允许时，对所述对象(OBJ)的所述组件 (COMP)进行编码并将其传输；在该有效性信息(FLAG)为允许时，对所述对象(OBJ)的所述组件 (COMP)进行解码；和在该有效性信息(FLAG)为禁止时，恢复所述对象(OBJ)的所述组件(COMP_M)。
9：如权利要求8中的处理数字视频信号的方法，其特征在于执行所述组件(COMP)的编码，就好像所述对象(OBJ)的所有组件(COMP)都已经被编码和传输了一样。
10：一种用于计算机的计算机程序产品，包括指令集，其中当将该指令集装载到所述计算机中时，使该计算机执行如权利要求8和9中的方法。

说明书

用于处理数字视频信号的方法和系统
    【技术领域】

    本发明涉及一种根据权利要求1的前序部分的视频通信系统，其能够接收数字视频信号。本发明进一步涉及一种根据权利要求8的前序部分的处理数字视频信号的方法。

    这种系统例如可以用于MPEG标准中的3D视频应用。

    背景技术

    视频通信系统典型地包括带有编码器的发射器和带有解码器的接收器。这种系统接收输入数字视频信号，通过编码器对所述信号进行编码，将编码的信号发送到接收器，然后通过解码器对所发送的信号进行解码，得到输出数字视频信号，其是输入数字视频信号的重建信号。接收器然后显示所述输出数字视频信号。数字视频信号包括多组对象，其特征在于某些组件，诸如形状、纹理、运动信息、差异图(在3D视频信号的情况下)等。

    当对象被编码时，所述对象的组件就被编码。每一视频组件的编码和解码过程可以或多或少地彼此相互依赖。编码性能取决于该相互依赖关系。

    让我们给出一个使用MPEG-4标准对3D视频对象进行编码的范例。在该文档中，我们参照ISO的MPEG-4下的文档号w3056，并且标题为“Information Technology-Coding of audio-visual objects-Part2：Visual，ISO/IEC JTC 1/SC 29/WG 11，Maui，December，1999”，当人们对包括两个视图的立体视频序列进行编码时，编码一个视图——指地是左视图——以及对应的差异图(或深度图)。通过使用差异图对左视图进行投影来重建右视图。在左视图中所没有的右视图的部分(遮挡部分)不能够被重建，并且留下空洞。为了正确地重建右视图，人们将从原始右视图恢复的遮挡部分编码为MPEG-4视频对象，其形状对应于这些孔。如果以3.5Mbit/s的位速率编码左视图，那么被定义用于处理遮挡部分的增强层不应该大于该位速率的10％。这里取340kbit/s。通过形状和纹理定义遮挡对象。使用编码对象的标准方法，它们的位速率开销为：

    形状：93kbit/s，即该位速率的27％分配给遮挡

    纹理：128kbit/s，即该位速率的37％。

    可以从差异图确定该遮挡形状。尽管如此，组件编码是相互依赖的，在没有对形状编码的情况下，有效编码遮挡部分的纹理是不可能的。因此，该视频序列的位速率开销不是最优的。

    【发明内容】

    相应地，本发明的目的是提供一种如权利要求1的前序部分中定义的视频通信系统，和一种如权利要求8的前序部分中定义的方法，其降低了编码对象所需要的位速率。

    为此，根据本发明的第一目的，提供一种如权利要求1所述的视频通信系统。

    另外，根据本发明的第二目的，提供一种如权利要求8所述的方法。

    如下面我们将详细看到，通过在编码其它组件时，有可能不编码并因此不传输第一组件，而就好像是在这样的情况下，编码效率得到提高，因为编码整个对象需要更少的比特。

    【附图说明】

    通过阅读下面的详细描述，并参照下面的附图，可以清楚地看到本发明的其它目的、特征和优点，其中：

    图1所述为根据本发明的包括编码器和解码器的视频通信系统；

    图2所示为根据本发明的视频通信的编码器所使用的编码方法的示意图；和

    图3所示为根据本发明的视频通信的解码器所使用的解码方法的示意图。

    【具体实施方式】

    在下面的描述中，对本领域的熟练技术人员所熟知的功能和结构就不再进行详细描述，因为不必要的详细描述就会使得本发明不够清楚。

    本发明涉及一种用于处理数字视频信号的视频通信系统。

    在图1中所述的这种系统可以用于MPEG2或MPEG4中的视频应用，其中所述视频通信系统包括发射器TRANS、传输媒体CH和接收器RECEIV。所述发射器TRANS和所述接收器RECEIV分别包括编码器ENC和解码器DEC。

    为了通过传输媒体CH有效地传输一些视频信号，其中已知视频信号的传输比特为比特流BIT_STR，所述编码器ENC对视频信号进行编码，然后将所编码的视频信号发送到解码器DEC，其对所述信号进行解码。最后，接收器RECEIV显示所述视频信号。

    视频信号包括多组具有不同的组件COMP的对象OBJ，诸如形状、纹理、运动矢量、差异图、色彩等。

    当编码器ENC编码对象OBJ时，其有效地对所述对象OBJ的所有组件COMP进行编码。很多组件的编码依赖于其它组件。例如在本领域的技术人员所熟知的INTER模式方案中，只有当我们具有运动信息时才可以使用纹理信息。当在MPEG-4中使用基于块的原理进行视频对象编码时，通过形状确定纹理块的位置，并且通过使用共处在一起的纹理决之间的空间冗余，知道该形状可以改善编码效率。

    编码器ENC包括有效性信息FLAG，用于确定对象的组件COMP是否要被编码；编码装置，用于在所述有效性信息FLAG为允许时编码所述组件COMP；和传输装置，用于在该有效性信息FLAG为允许时，传输所述对象OBJ的所述组件COMP。

    解码器DEC包括解码装置，用于在该有效性信息FLAG为允许时解码组件COMP；和恢复装置，用于在有效性信息FLAG为禁止时恢复所述组件COMP。

    如下图2中所述，下面通过编码器ENC完成对象OBJ的编码。

    对于对象OBJ的每一组件COMP，编码器ENC判定所述组件COMP是否将包括在比特流BIT_STR中。该判定取决于视频应用的类型：例如，在对遮挡部分进行编码的立体声系统中，人们知道不需要对这些遮挡的形状进行编码和传输。

    将有效性信息FLAG分配给对象OBJ的每一组件COMP。如果组件COMP将包括在比特流中，即将被编码和传输，则该有效性信号FLAG为允许。该有效性信息FLAG优选地放置在视频对象级(MPEG-4中的VO)。

    在第一非限制性的实施例中，该有效性信息FLAG具有两个值：当允许时为1；并且当禁止时为0。

    在第二非限制性的实施例中，该有效性信息FLAG具有扩展语法(extended syntax)：当允许时为1；并且当禁止时为0加上描述代码字。从该描述代码字可以知道如何恢复丢失的组件COMP(等待额外的输入，诸如预计算的形状，等待额外的输入和第n个组件信息等...)。然后，解码器DEC将使用该描述代码字来恢复组件COMP。假定在该解码器侧，恢复丢失组件COMP的方法是熟知的，并且恢复算法是有效的。

    接下来，编码器ENC对将包括在比特流BIT_STR中的所有组件COMP进行编码(图2中的ENC_COMP步骤)，并且对于需要丢失组件COMP_M的组件COMP_D，其对它们进行编码，就好像对象OBJ的所有组件COMP和特别是丢失组件COMP_M都已经被使用、编码和传输。实际上，一些编码组件可能需要使用如前所述的其它组件。

    注意到为每一对象组件COMP定义了有效性信息FLAG和潜在的描述代码字(根据在应用中所使用的有效性信息的种类)。然后所编码的视频对象OBJ与所包括的编码组件COMP一起对应于所有这些有效性信息FLAG。因此，传输到解码器的比特流BIT_STR包括丢失组件的有效性信息FLAG，并且对于每个其它组件，包括它们的相对应的有效性信息FLAG和所编码的组件COMP本身。

    注意到进行下面的假设。我们假定我们具有一个编码算法，其中视频对象OBJ分成几个组件，并且它们对应于比特流BIT_STR的不同的、可分开的部分。这意味着有可能替换一个组件而不会阻止对另一组件的解码过程。例如在MPEG-4中，如果我们使用纹理和深度信息来编码视频序列，如果我们替换或修改所编码的纹理信息，还仍然有可能对深度进行解码。而且，如果我们改变运动矢量组件，还仍然有可能解码纹理——尽管我们得到了看起来不同于原始的序列，但是所编码的纹理信息仍然是正确的。

    然后通过传输媒体CH将所述编码的比特流BIT_STR发送到接收器RECEIV的解码器DEC。

    如图3中所述，通过解码器DEC按照下面对所编码的比特流BIT_STR进行解码。

    当接收到所编码的比特流BIT_STR时，解码器DEC首先检查所述比特流BIT_STR中的有效性信息FLAG。如果有效性信息FLAG设置为1，其等待比特流BIT_STR中对应的组件COMP，其在它们的被分配的有效性信息FLAG之后。然后，其对它们进行解码。首先对不需要任何其它编码组件或丢失组件COMP_M的组件COMP进行解码(图3中的DEC_COMP步骤)，然后对依赖于其它编码组件和依赖于丢失组件COMP_M的组件COMP_D进行解码。对于这些后者的依赖组件COMP_D，解码器DEC恢复丢失组件COMP_M(图3中的RETR_COMP_M1步骤)，然后解码这些依赖组件COMP_D(图3中的DEC_COMP_D步骤)。组件之间的这些想依关系与应用有关：在立体声视频解码器中，我们可以认为当解码遮挡形状时，人们使用解码的差异图——这可以通过引入表示“从差异中恢复”意义的描述代码字来完成。取更一般的情况，在MPEG编码方案中，从运动矢量和先前帧中恢复纹理信息。

    一旦对所有的编码组件COMP进行了解码，解码器DEC恢复出最后丢失的组件COMP_M(图3中的RETR_COMP_M2步骤)。注意到，该最后步骤也可以在任何其它时间进行，例如在开始时进行。

    比特流BIT_STR就好像是没有删除任何组件。可以使用本领域的技术人员所熟知的解码过程，就好像每个组件都被正常编码和传输。

    于是，本发明的一个优点是通过只使用有效性信息FLAG来简单地降低了编码对象所需要的比特速率，并且简单地告知解码器其需要恢复某些组件本身。

    应该理解的是，本发明并不限于前述实施例，并且在不脱离本发明如所附权利要求书中限定的精神和范围，可以做出变换和修改。至于这一点，做出如下结束性的注释。

    应该理解的是，本发明并不限于前述视频应用。其可以用于任何使用对分解成多个组件的信号进行处理的系统的应用，组件的编码产生单独的比特流部分。特别地，本发明应用于其它MPEG标准家族(MPEG-1，MPEG2)的视频压缩算法和ITU H26X家族(H261，H263及扩展，H261当今是最新的，参考号Q15-K-59)。

    应该理解的是，根据本发明的方法并不限于前述实施方式。

    通过硬件或软件或二者的结合可以有多种方式实施根据本发明的方法的功能，假设使用单项硬件或软件可以执行多个功能。但是其并不排除将多项硬件或软件或二者的结合组合起来执行一个功能，由此形成单个功能而不会修改根据本发明的处理视频信号的方法。

    可以通过多种方式实施所述硬件或软件项，诸如通过有线电子电路的方式，或通过适合于被编程的集成电路的方式。集成电路可以安装在计算机中，或安装在视频系统通信中。在第二种情况下，视频系统通信包括编码装置，用于在有效性信息为允许时编码对象的组件；解码装置，用于在有效性信息为允许时解码所述对象的所述组件；和恢复装置，用于在有效性信息为禁止时恢复所述对象的所述组件，如前所述，所述装置为如上所述的硬件或软件项。

    集成电路包括指令集。由此，例如包括在计算机编程存储器或视频通信系统中的所述指令集可以使得该计算机或视频通信系统执行该编码方法的不同步骤。

    可以通过读取数据载体、例如读取盘来将指令集装载到编程存储器中。业务运营商也可以通过通信网络、诸如互联网使得该指令集可获得。

    下面权利要求中的任何附图标记都不应用理解为对权利要求的限制。很明显动词“包括”及其变化词的使用并不排除除了任何权利要求中所定义的步骤或元件之外的任何其它步骤或元件的出现。元件或步骤前面的冠词“一个”并不排除会出现多个这种元件或步骤。