书签 分享 收藏 举报 版权申诉 / 18

深度图编码方法及装置.pdf

  • 上传人:1**
  • 文档编号:4326993
  • 上传时间:2018-09-13
  • 格式:PDF
  • 页数:18
  • 大小:6.26MB
  • 摘要
    申请专利号:

    CN201210232212.3

    申请日:

    2012.07.05

    公开号:

    CN102790892A

    公开日:

    2012.11.21

    当前法律状态:

    授权

    有效性:

    有权

    法律详情:

    授权|||实质审查的生效IPC(主分类):H04N 13/00申请日:20120705|||公开

    IPC分类号:

    H04N13/00; H04N7/26

    主分类号:

    H04N13/00

    申请人:

    清华大学; 清华大学深圳研究生院

    发明人:

    戴琼海; 汪启扉; 张永兵; 季向阳; 王好谦

    地址:

    100084 北京市海淀区100084-82信箱

    优先权:

    专利代理机构:

    北京清亦华知识产权代理事务所(普通合伙) 11201

    代理人:

    张大威

    PDF完整版下载: PDF下载
    内容摘要

    本发明提出一种深度图编码方法及装置,该方法包括:建立多个划分线并组成划分集合,多个划分线用于对深度宏块进行楔形划分;以帧内编码模式对深度宏块进行编码得到第一率失真代价值;判断是否以帧间编码模式对深度宏块进行编码,如果是则以帧间编码模式进行编码得到第二率失真代价值;继续判断深度宏块是否包含不连续的运动向量场,如果是则以几何划分编码模式对深度宏块进行编码,包括:选择最优划分线对深度宏块进行划分得到第一和第二深度子区域,对两个子区域进行预测编码获取第三率失真代价值;比较不同编码模式下的率失真代价值以选择率失真代价最小的编码模式对进行编码。本发明的实施例提高深度图压缩效率、降低编码复杂度。

    权利要求书

    1.一种深度图编码方法,其特征在于,包括以下步骤:建立多个划分线并组成划分集合,其中,多个划分线用于对深度宏块进行楔形划分;以帧内编码模式对深度宏块进行编码以获取对应的第一率失真代价值;判断是否以帧间编码模式对所述深度宏块进行编码,如果是则以帧间编码模式对所述深度宏块进行编码以获取对应的第二率失真代价值;继续判断所述深度宏块是否包含不连续的运动向量场,如果所述深度宏块包含不连续的运动向量场且进行帧间编码,则以几何划分编码模式对所述深度宏块进行编码,其中,所述几何划分编码模式进一步包括:根据所述深度宏块的所有像素点的亮度信息从所述划分集合中选择最优划分线对所述深度宏块进行划分以得到第一和第二深度子区域,且分别对所述第一和第二深度子区域进行运动估计和预测编码以获取对应的第三率失真代价值;以及比较不同编码模式下深度宏块的率失真代价值,以根据比较结果选择率失真代价最小的编码模式对所述深度宏块进行编码。2.根据权利要求1所述的深度图编码方法,其特征在于,所述划分集合为:G={ξ(ρi,θi)|i=1,2,…,L},其中,ξ(ρi,θi)为所述划分线集合中的第i条划分线,ρi为深度宏块至该划分线的距离,θi为该划分线与第一方向的夹角,L为划分线的个数。3.根据权利要求2所述的深度图编码方法,其特征在于,所述深度宏块至多个划分线的距离均位于[0,8)之间,多个划分线与第一方向的夹角均位于[0,2π)之间。4.根据权利要求1所述的深度图编码方法,其特征在于,所述判断深度宏块是否包含不连续的运动向量场的步骤进一步包括:获取所述深度宏块中所有像素点的亮度值;计算所述深度宏块中所有像素点的亮度值的方差;以及比较所述方差和预设阈值的大小,如果所述方差大于所述预设阈值,则判断所述深度宏块包含不连续的运动向量场。5.根据权利要求1所述的深度图编码方法,其特征在于,根据所述深度宏块的所有像素点的亮度信息,从所述划分集合中选择最优划分线对所述深度宏块进行划分以得到第一和第二深度子区域的步骤进一步包括:分别以所述划分集合中的每一条划分线对所述深度宏块进行划分,并分别计算划分所得的两部分中各自的所有像素点的平均亮度值以得到对应的第一部分和第二部分的平均亮度值;分别对每一条划分线对应的第一部分和第二部分平均亮度值做差得到差值;以及获取使差值的绝对值最大的划分线作为所述最优划分线,以对所述深度宏块进行划分以得到第一和第二深度子区域。6.根据权利要求1所述的深度图编码方法,其特征在于,所述以帧内编码模式对深度宏块进行编码以获取对应的第一率失真代价值的步骤包括:根据H.264/MPEG-4 AVC编码标准中的帧内编码模式对所述深度宏块进行帧内编码,并将对应的最优率失真代价作为所述第一率失真代价值;所述以帧间编码模式对深度宏块进行编码以获取对应的第二率失真代价值的步骤包括:根据H.264/MPEG-4 AVC编码标准中的帧间编码模式对所述深度宏块进行帧间模式编码,并将对应的最优率失真代价作为所述第二率失真代价值。7.根据权利要求1所述的深度图编码方法,其特征在于,所述比较不同编码模式下深度宏块的率失真代价值,以根据比较结果选择率失真代价最小的编码模式对所述深度宏块进行编码的步骤包括:如果判断不对所述深度宏块进行帧间编码,则仅对所述深度宏块进行帧内编码;如果判断所述深度宏块进行帧间编码且没有包含不连续的运动向量场,则根据第一和第二率失真代价值的比较结果选择较小的率失真代价值对应的帧间编码模式或者帧内编码模式对所述深度宏块进行编码;以及如果判断所述深度宏块进行帧间编码且包含不连续的运动向量场,则根据第一至第三率失真代价值的比较结果选择最小的率失真代价值对应的帧间编码模式、帧内编码模式或者几何划分编码模式对所述深度宏块进行编码。8.一种深度图编码装置,其特征在于,包括:划分线建立模块,用于建立多个划分线并组成划分集合,其中,多个划分线用于对深度宏块进行楔形划分;帧内编码模块,用于以帧内编码模式对深度宏块进行编码以获取对应的第一率失真代价值;帧间编码判断模块,用于判断是否以帧间编码模式对所述深度宏块进行编码;帧间编码模块,用于在所述帧间编码判断模块判断以帧间编码模式对所述深度宏块进行编码时以帧间编码模式对深度宏块进行编码以获取对应的第二率失真代价值;几何划分判断模块,用于判断所述深度宏块是否包含不连续的运动向量场;几何划分编码模块,用于在所述几何划分判断模块判断所述深度宏块进行帧间编码且包含不连续的运动向量场时,以几何划分编码模式对所述深度宏块进行编码,其中,所述几何划分编码模式包括:根据所述深度宏块的所有像素点的亮度信息从所述划分集合中选择最优划分线对所述深度宏块进行划分以得到第一和第二深度子区域,且分别对所述第一和第二深度子区域进行运动估计和预测编码以获取对应的第三率失真代价值;以及编码模式选择模块,用于比较所述深度宏块在不同编码模式下的率失真代价值,以根据比较结果选择率失真代价最小的编码模式以便对所述深度宏块进行编码。9.根据权利要求8所述的深度图编码装置,其特征在于,所述划分集合为:G={ξ(ρi,θi)|i=1,2,…,L},其中,ξ(ρi,θi)为所述划分线集合中的第i条划分线,ρi为深度宏块至该划分线的距离,θi为该划分线与第一方向的夹角,L为划分线的个数。10.根据权利要求9所述的深度图编码装置,其特征在于,所述深度宏块至多个划分线的距离均位于[0,8)之间,多个划分线与第一方向的夹角均位于[0,2π)之间。11.根据权利要求8所述的深度图编码装置,其特征在于,所述几何划分判断模块用于获取所述深度宏块中所有像素点的亮度值,并计算所述深度宏块中所有像素点的亮度值的方差,并比较所述方差和预设阈值的大小,如果所述方差大于所述预设阈值,则判断所述深度宏块包含不连续的运动向量场。12.根据权利要求8所述的深度图编码装置,其特征在于,所述几何划分编码模块用于分别以所述划分集合中的每一条划分线对所述深度宏块进行划分,并分别计算划分所得的两部分中各自的所有像素点的平均亮度值以得到对应的第一部分和第二部分的平均亮度值,分别对每一条划分线对应的第一部分和第二部分的平均亮度值做差得到差值,并获取使差值的绝对值最大的划分线作为所述最优划分线,以对所述深度宏块进行划分以得到第一和第二深度子区域。13.根据权利要求8所述的深度图编码装置,其特征在于,所述帧内编码模块用于根据H264/MPEG-4 AVC编码标准中的帧内编码模式对所述深度宏块进行帧内编码,并将对应的最优率失真代价作为所述第一率失真代价值;所述帧间编码模块用于根据H264/MPEG-4 AVC编码标准中的帧间编码模式对所述深度宏块进行帧间模式编码,并将对应的最优率失真代价作为所述第二率失真代价值。14.根据权利要求8所述的深度图编码装置,其特征在于,所述编码模式选择模块用于在不对所述深度宏块进行帧间编码时,仅选择帧内编码模式,在所述深度宏块进行帧间编码且没有包含不连续的运动向量场时,根据第一和第二率失真代价值的比较结果选择较小的率失真代价值对应的帧间编码模式或者帧内编码模式对所述深度宏块进行编码,在所述深度宏块进行帧间编码且包含不连续的运动向量场时,根据第一至第三率失真代价值的比较结果选择最小的率失真代价值对应的帧间编码模式、帧内编码模式或者几何划分编码模式对所述深度宏块进行编码。

    说明书

    深度图编码方法及装置

    技术领域

    本发明涉及视频编码技术领域,特别涉及一种深度图编码方法和装置。

    背景技术

    在立体视频以及自由视点视频系统中,由多视点视频和多视点深度图构成的数据格式
    获得了广泛的应用。其中,深度是指视频帧中每个像素点对应到三维空间中的点到相机平
    面的距离。在立体视频中,为了通过虚拟视点绘制获得用户期望观看的视点所对应的视频
    信息,我们需要获得每一个视频帧所对应的深度图。因此,立体视频序列通常包含多路彩
    色视频信息以及每一路彩色视频所对应的深度图序列。由于深度图中每个像素点的深度信
    息为0-255之间的一个整数值,因此深度图可以被看作是一系列灰度图像所组成的视频序
    列。为了有效的存储和传输海量的立体视频数据,立体视频系统通常采用多视点视频编码
    方法对多视点视频和深度图序列分别进行压缩。通过视点内和视间预测编码,多视点视频
    编码方法能够有效地压缩多路深度图之间的冗余。

    传统的多视点视频编码方法是基于H.264/MPEG-4编码标准上的一种多视点视频编码
    拓展方案。在传统的多视点视频编码中,编码器以宏块为单元对每一帧图像进行编码。每
    一个16×16大小的宏块又可以被进一步被划分成16×8、8×16和8×8子块以及8×4、4×8和
    4×4的亚块。不同的子块和亚块被称为预测单元。在编码过程中,编码器对每一个预测单
    元进行运动估计,获得运动补偿预测的率失真代价。然后进行基于率失真优化的模式选择,
    获得每个块最优的编码模式和预测残差,并对残差进行变换编码。实验证明,传统的多视
    点视频编码能够在深度图上获得较好的压缩性能。

    区别于传统的彩色视频,深度图仅包含每个像素点的距离信息,不包含任何视频纹理
    信息。因此,深度图中处于物体内部的编码宏块仅包含均一的深度纹理,处在物体边缘的
    编码宏块则包含两个或多个不连续的深度区域。传统的宏块划分无法有效地表示物体边缘。
    尤其是在低编码码率的条件下,通过划分得到的子块和亚块模式较少被选用。然而,采用
    传统的多视点视频编码方法对深度图编码时,编码器仍然需要对所有的宏块模式进行运动
    估计和模式决策。该过程需要消耗大量的计算资源,增大了编码端的复杂度。

    为了获得较高的深度图压缩效率,需要针对深度图的特点设计更加高效的编码方法。
    为此,本发明针对深度图仅包含物体轮廓信息这一特征,提出一种基于几何划分的深度图
    编码方法。通过对包含不连续运动场的深度宏块进行自适应几何划分,获得了较好的预测
    结果。从而提高深度图编码的效率,同时降低深度图编码的复杂度。

    目前可以查到的与本发明比较相关的专利有四项,分别公开了一种应用于3DTV与
    FTV系统的深度图编码压缩方法,一种立体电视系统中深度图像编码方法,一种立体电视
    系统中深度图像的编码方法和一种多视点深度视频的编码方法,申请号分别为
    200810063741.9,200810161597.2,200810120082.8和200910154138.6。尽管所提及的四个专
    利均涉及立体视频中深度图的编码方法,但是第一、第二以及第三项专利均分别仅提出了
    一种对不同区域的深度宏块采用不同的量化参数的编码方案。区别在于这三个方案设计了
    不同的深度宏块分类方法;第四项专利则对不同的区域的深度宏块的编码模式进行了限定,
    对于物体边缘区域的深度宏块设定较多的编码模式,而对非物体边缘区域的深度宏块设定
    较少的编码模式。然而该发明中所有的编码模式对应的预测单元仍然是基于传统的
    H.264/MPEG-4 AVC编码标准中所规定的划分方法获得。因此,所提及的四个专利均未涉
    及基于几何划分的深度图编码方法。

    发明内容

    本发明旨在至少解决上述技术问题之一。

    为此,本发明的一个目的在于提出一种能够提高深度图压缩效率且降低深度图的编码
    复杂度的深度图编码方法。

    本发明的另一目的在于提出一种深度图编码装置。

    为了实现上述目的,本发明第一方面的实施例提出了一种深度图编码方法,包括以下
    步骤:建立多个划分线并组成划分集合,其中,多个划分线用于对深度宏块进行楔形划分;
    以帧内编码模式对深度宏块进行编码以获取对应的第一率失真代价值;判断是否以帧间编
    码模式对所述深度宏块进行编码,如果是则以帧间编码模式对所述深度宏块进行编码以获
    取对应的第二率失真代价值;继续判断所述深度宏块是否包含不连续的运动向量场,如果
    所述深度宏块进行帧间编码且包含不连续的运动向量场,则以几何划分编码模式对所述深
    度宏块进行编码,其中,所述几何划分编码模式进一步包括:根据所述深度宏块的所有像
    素点的亮度信息从所述划分集合中选择最优划分线对所述深度宏块进行划分以得到第一和
    第二深度子区域,且分别对所述第一和第二深度子区域进行运动估计和预测编码以获取对
    应的第三率失真代价值;以及比较不同编码模式下深度宏块的率失真代价值,以根据比较
    结果选择率失真代价最小的编码模式对所述深度宏块进行编码。

    另外,根据本发明上述实施例的深度图编码方法还可以具有如下附加的技术特征:

    在一些示例中,所述划分集合为:

    G={ξ(ρi,θi)|i=1,2,…,L},

    其中,ξ(ρi,θi)为所述划分线集合中的第i条划分线,ρi为深度宏块至该划分线的距离,
    θi为该划分线与第一方向的夹角,L为划分线的个数。

    在一些示例中,所述深度宏块至多个划分线的距离均位于[0,8)之间,多个划分线与
    第一方向的夹角均位于[0,2π)之间。

    在一些示例中,所述判断深度宏块是否包含不连续的运动向量场的步骤进一步包括:
    获取所述深度宏块中所有像素点的亮度值;计算所述深度宏块中所有像素点的亮度值的方
    差;以及比较所述方差和预设阈值的大小,如果所述方差大于所述预设阈值,则判断所述
    深度宏块包含不连续的运动向量场。

    在一些示例中,根据所述深度宏块的所有像素点的亮度信息从所述划分集合中选择最
    优划分线,对所述深度宏块进行划分以得到第一和第二深度子区域的步骤进一步包括:分
    别以所述划分集合中的每一条划分线对所述深度宏块进行划分,并分别计算划分所得的两
    部分中各自的所有像素点的平均亮度值以得到对应的第一部分和第二部分的平均亮度值;
    分别对每一条划分线对应的第一部分和第二部分的平均亮度值做差得到差值;以及获取使
    差值的绝对值最大的划分线作为所述最优划分线,以对所述深度宏块进行划分以得到第一
    和第二深度子区域。

    在一些示例中,所述以帧内编码模式对深度宏块进行编码以获取对应的第一率失真代
    价值的步骤包括:根据H.264/MPEG-4 AVC编码标准中的帧内编码模式对所述深度宏块进
    行帧内编码,并将对应的最优率失真代价作为所述第一率失真代价值;所述以帧间编码模
    式对深度宏块进行编码以获取对应的第二率失真代价值的步骤包括:根据H.264/MPEG-4
    AVC编码标准中的帧间编码模式对所述深度宏块进行帧间模式编码,并将对应的最优率失
    真代价作为所述第二率失真代价值。

    在一些示例中,所述比较不同编码模式下深度宏块的率失真代价值,以根据比较结果
    选择率失真代价最小的编码模式对所述深度宏块进行编码的步骤包括:如果判断不对所述
    深度宏块进行帧间编码,则仅对所述深度宏块进行帧内编码;如果判断所述深度宏块进行
    帧间编码且没有包含不连续的运动向量场,则根据第一和第二率失真代价值的比较结果选
    择较小的率失真代价值对应的帧间编码模式或者帧内编码模式对所述深度宏块进行编码;
    以及如果判断所述深度宏块进行帧间编码且包含不连续的运动向量场,则根据第一至第三
    率失真代价值的比较结果选择最小的率失真代价值对应的帧间编码模式、帧内编码模式或
    者几何划分编码模式对所述深度宏块进行编码。

    本发明第二方面的实施例提出了一种深度图编码装置,包括:划分线建立模块,用于
    建立多个划分线并组成划分集合,其中,多个划分线用于对深度宏块进行楔形划分;帧内
    编码模块,用于以帧内编码模式对深度宏块进行编码以获取对应的第一率失真代价值;帧
    间编码判断模块,用于判断是否以帧间编码模式对所述深度宏块进行编码;帧间编码模块,
    用于在所述帧间编码判断模块判断以帧间编码模式对所述深度宏块进行编码时以帧间编码
    模式对深度宏块进行编码以获取对应的第二率失真代价值;几何划分判断模块,用于判断
    所述深度宏块是否包含不连续的运动向量场;几何划分编码模块,用于在所述几何划分判
    断模块判断所述深度宏块包含不连续的运动向量场时,以几何划分编码模式对所述深度宏
    块进行编码,其中,所述几何划分编码模式包括:根据所述深度宏块的所有像素点的亮度
    信息从所述划分集合中选择最优划分线对所述深度宏块进行划分以得到第一和第二深度子
    区域,且分别对所述第一和第二深度子区域进行运动估计和预测编码以获取对应的第三率
    失真代价值;以及编码模式选择模块,用于比较所述深度宏块在不同编码模式下的率失真
    代价值,以根据比较结果选择率失真代价最小的编码模式以便对所述深度宏块进行编码。

    另外,根据本发明上述实施例的深度图编码装置还可以具有如下附加的技术特征:

    在一些示例中,所述划分集合为:

    G={ξ(ρi,θi)|i=1,2,…,L},

    其中,ξ(ρi,θi)为所述划分线集合中的第i条划分线,ρi为深度宏块至该划分线的距离,
    θi为该划分线与第一方向的夹角,L为划分线的个数。

    在一些示例中,所述深度宏块至多个划分线的距离均位于[0,8)之间,多个划分线与
    第一方向的夹角均位于[0,2π)之间。

    在一些示例中,所述几何划分判断模块用于获取所述深度宏块中所有像素点的亮度值,
    并计算所述深度宏块中所有像素点的亮度值的方差,并比较所述方差和预设阈值的大小,
    如果所述方差大于所述预设阈值,则判断所述深度宏块包含不连续的运动向量场。

    在一些示例中,所述几何划分编码模块用于分别以所述划分集合中的每一条划分线对
    所述深度宏块进行划分,并分别计算划分所得的两部分中各自的所有像素点的平均亮度值
    以得到对应的第一部分和第二部分的平均亮度值,分别对每一条划分线对应的第一部分和
    第二部分的平均亮度值做差得到差值,并获取使差值的绝对值最大的划分线作为所述最优
    划分线,以对所述深度宏块进行划分以得到第一和第二深度子区域。

    在一些示例中,所述帧内编码模块用于根据H.264/MPEG-4 AVC编码标准中的帧内编
    码模式对所述深度宏块进行帧内编码,并将对应的最优率失真代价作为所述第一率失真代
    价值;所述帧间编码模块用于根据H.264/MPEG-4 AVC编码标准中的帧间编码模式对所述
    深度宏块进行帧间模式编码,并将对应的最优率失真代价作为所述第二率失真代价值。在
    一些示例中,所述编码模式选择模块用于在不对所述深度宏块进行帧间编码时,仅选择帧
    内编码模式,在所述深度宏块进行帧间编码且没有包含不连续的运动向量场时,根据第一
    和第二率失真代价值的比较结果选择较小的率失真代价值对应的帧间编码模式或者帧内编
    码模式,在所述深度宏块进行帧间编码且包含不连续的运动向量场时,根据第一至第三率
    失真代价值的比较结果选择最小的率失真代价值对应的帧间编码模式、帧内编码模式或者
    几何划分编码模式。

    根据本发明实施例的深度图编码方法及装置,通过设计基于几何划分的深度图编码方
    法,根据合理的方式从帧间编码模式、帧内编码模式或者几何划分编码模式选择最佳的编
    码模式对深度宏块进行编码,由此,不但提高了深度图压缩效率、减少压缩时间,也降低
    深度图编码的复杂度,实现对深度图的高效编码。

    本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明
    显,或通过本发明的实践了解到。

    附图说明

    本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显
    和容易理解,其中:

    图1为本发明实施例的深度图编码方法的流程图;

    图2为本发明一个实施例深度图编码方法的划分线对深度宏块进行划分的原理图;

    图3为本发明一个实施例的深度图编码方法的详细流程图;

    图4为本发明一个实施例的深度图编码方法的采用的具有几何划分编码模式进行编码
    的编码器的工作原理图;

    图5为本发明一个实施例的深度图编码方法采用图4所示的编码器进行编码的对深度
    宏块预测编码模式的预测结构图;以及

    图6为本发明实施例的深度图编码装置的结构图。

    具体实施方式

    下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同
    或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描
    述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。

    在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、
    “后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为
    基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗
    示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对
    本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相
    对重要性。

    在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、
    “连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可
    以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以
    是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在
    本发明中的具体含义。

    为了对本发明实施例的编码方式进行验证,在本发明的下述示例中,立体视频编码的
    测试序列采用标清格式的名字为“Book Arrival”的标准测试序列,该标清格式视频序列的分
    辨率为1024×768,该测试序列包含16个视点的视频和对应的深度图。在本发明的以下示
    例中,均以该测试序列中的深度图进行测试,采用该序列的第8个视点的深度图序列作为
    测试序列。该序列包含100帧深度图。如图4所示,编解码器采用H.264/MPEG-4 MVC标
    准参考软件JMVC 6.0;编码器GOP(Group of Pictures,图像组)的帧数为8;编码的时域
    预测编码采用Hierarchical B Picture(层次化双向预测编码帧,简称层次化B帧)的预测结
    构,编码预测结构图如图5所示。每个编码的深度宏块的大小为16×16。运动估计的精度
    为四分之一像素精度。其他编码参数均采用与H.264/MPEG-4 AVC标准中主档次(Main 
    Profile)中规定的参数设置。

    以下结合附图首先描述根据本发明实施例的深度图编码方法。

    参考图1,根据本发明实施例的深度图编码方法,包括如下步骤:

    步骤S101,建立多个划分线并组成划分集合,其中,多个划分线用于对深度宏块进行
    楔形划分。在本发明的一个实施例中,划分集合为:G={ξ(ρi,θi)|i=1,2,…,L},其中,
    ξ(ρi,θi)为划分线集合中的第i条划分线,ρi为深度宏块至该划分线的距离,θi为该划分线
    与第一方向的夹角,L为划分线的个数。

    如图2所示,定义楔形几何划分的多个划分线组成的划分集合。定义划分线为一条直
    线(如图2所示的划分线),该直线通过到深度宏块中心点的距离ρ和该直线与y轴,即第
    一方向的夹角θ来表示。在该实施例中,多个划分线的距离均位于[0,8)之间,多个划分
    线与第一方向的夹角均位于[0,2π)之间,即每个划分线的两个参数ρ和θ的取值范围为
    [0,8)和[0,2π),参数ρ的采样间隔为1,其取值集合为ρ={0,1,2,…,7},参数θ的采样
    间隔为π/16,其取值集合为因此,划分集合
    G={ξ(ρi,θi)|i=1,2,…,L}中共包含256条可选的划分线,即L=256。

    步骤S102,以帧内编码模式对深度宏块进行编码以获取对应的第一率失真代价值。

    具体地,根据H.264/MPEG-4 AVC编码标准中的帧内编码模式对深度宏块进行帧内编
    码,并将对应的最优率失真代价作为第一率失真代价值。更为具体地,编码采用与传统
    H.264/MPEG-4 AVC编码标准中定义的帧内编码模式相同的方法对该深度宏块,记为Bk进
    行帧内预测编码。在本实施例中,当前深度宏块在帧内预测编码模式下最优率失真代价为
    J k intra = 5741 , ]]>即第一率失真代价值为 J k intra = 5741 . ]]>

    步骤S103,判断是否以帧间编码模式对深度宏块进行编码,如果是则以帧间编码模式
    对深度宏块进行编码以获取对应的第二率失真代价值。

    具体地,根据H.264/MPEG-4 AVC编码标准中的帧间编码模式对所述深度宏块进行帧
    间模式编码,并将对应的最优率失真代价作为所述第二率失真代价值。在该实例中,上述
    帧间编码模式为传统的帧间编码模式。

    步骤S104,继续判断深度宏块是否包含不连续的运动向量场,如果深度宏块进行帧间
    编码且包含不连续的运动向量场,则以几何划分编码模式对深度宏块进行编码,其中,几
    何划分编码模式进一步包括:根据深度宏块的所有像素点的亮度信息从划分集合中选择最
    优划分线对深度宏块进行划分以得到第一和第二深度子区域,且分别对第一和第二深度子
    区域进行运动估计和预测编码以获取对应的第三率失真代价值。

    具体地,在一些示例中,判断是否以几何划分模式对深度宏块进行编码,即判断深度
    宏块是否包含不连续的运动向量场的步骤包括:

    1、获取深度宏块中所有像素点的亮度值。例如当前编码的深度宏块Bk的全部像素点
    集合为其中N代表该深度宏块中像素点的个数,在本实施例中,N=
    256。假设该深度宏块Bk为当前帧的第529个深度宏块。设Bk的全部像素点的亮度值为
    { Y n k | n = 1,2,3 , · · · , N } , ]]>其中,的数值如下述矩阵所示:

    38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 38 108 38 38 38 38 38 38 38 38 38 38 38 38 38 38 108 108 38 38 38 38 38 38 38 38 38 38 38 38 38 108 108 108 38 38 38 38 38 38 38 38 38 38 38 38 105 108 108 108 38 38 38 38 38 38 38 38 38 38 38 38 105 105 108 108 38 38 38 38 38 38 38 38 38 38 38 105 105 105 105 105 38 38 38 38 38 38 38 38 38 38 105 105 105 105 105 105 38 38 38 38 38 38 38 38 105 105 105 105 105 105 105 105 38 38 38 38 38 38 38 108 105 105 105 105 105 105 105 105 38 38 38 38 38 38 38 108 105 105 105 108 105 105 105 105 38 38 38 38 38 38 108 108 105 105 105 105 105 105 105 105 ]]>

    2、计算深度宏块中所有像素点的亮度值的方差。通过计算可以知道,该深度宏块Bk的
    所有像素点的亮度值的方差为838。

    3、比较方差和预设阈值的大小,如果方差大于预设阈值,则判断深度宏块包含不连续
    的运动向量场。例如,该预设阈值为TS=100,则Bk所有像素点的亮度值的方差大于TS,
    因此判断深度宏块包含不连续的运动向量场。

    根据深度宏块的所有像素点的亮度信息从划分集合中选择最优划分线对所述深度宏块
    进行划分以得到第一和第二深度子区域的步骤进一步包括:

    1、分别以划分集合中的每一条划分线对深度宏块进行划分,并分别计算划分所得的两
    部分中各自的所有像素点的平均亮度值以得到对应的第一部分和第二部分平均亮度值。例
    如,编码器通过遍历集合G中的每一条划分线来搜索Bk所对应的最优划分线。在遍历过程
    中,对每一条划分线ξ(ρi,θi),将Bk划分成两部分。计算两个部分中各自所有像素点的平
    均亮度值,例如当参数ρ和参数θ的取值均为0时,此时划分线为位于宏块Bk中心的垂直
    线段。该划分线将宏块Bk分成左右大小相等的两部分,P1(ρ0,θ0)和P2(ρ0,θ0)。此时,区
    域P1(ρ0,θ0)中所有像素点的平均亮度值为40.2;区域P2(ρ0,θ0)中所有像素点的平均亮度
    值为68.1。

    2、分别对每一条划分线对应的第一部分和第二部分的平均亮度值做差得到差值。根据
    步骤1中的示例,P1(ρ0,θ0)和P2(ρ0,θ0)之间的平均亮度值做差结果为:
    d=40.2-68.1=-27.9

    3、获取使差值的绝对值最大的划分线作为所述最优划分线,以对所述深度宏块进行划
    分以得到第一和第二深度子区域。根据步骤2中的示例,差值的绝对值为:
    Δd=|40.2-68.1|=27.9。

    同理,对划分线集合G中的所有划分线均以步骤1-3的方式求取其划分后对应的深度
    划分差,将获得最大深度划分差的划分线作为所述当前宏块最优的划分线,最优划分线记
    为ξ(ρopt,θopt)。在本实施例中,对于深度宏块Bk的最大深度划分差为Δdmax=65.6。其对应
    的最优划分线ξ(ρopt,θopt)的参数取值分别为ρopt=4,

    根据上述的示例,分别对第一和第二深度子区域进行运动估计以获取对应的第三率失
    真代价值,具体为:对Bk采用最优的划分线ξ(ρopt,θopt)划分成第一和第二深度子区域,记
    为P1(ρopt,θopt)和P2(ρopt,θopt)。然后对第一和第二深度子区域分别进行运动估计,并计算
    其对应的率失真代价,在该示例中,Bk在几何划分编码模式下的第三率失真代价为

    J k GEO = 1438 . ]]>

    步骤S105,比较不同编码模式下深度宏块的率失真代价值,以根据比较结果选择率失
    真代价最小的编码模式对深度宏块进行编码。具体而言,包括如下步骤:

    1、如果判断不对深度宏块进行帧间编码,则仅对深度宏块进行帧内编码。

    2、如果判断深度宏块进行帧间编码且没有包含不连续的运动向量场,则根据第一和第
    二率失真代价值的比较结果选择较小的率失真代价值对应的帧间编码模式或者帧内编码模
    式对深度宏块进行编码。

    3、如果判断深度宏块进行帧间编码且包含不连续的运动向量场,则根据第一至第三率
    失真代价值的比较结果选择最小的率失真代价值对应的帧间编码模式、帧内编码模式或者
    几何划分编码模式对深度宏块进行编码。

    作为一个具体的示例,以上述的Bk为例:对Bk进行基于率失真优化的模式选择。在本
    实施例中,由于编码器对Bk进行了几何划分模式的预测,因此需要在几何划分编码模式,
    帧间编码模式、帧内编码模式这三种模式中选择率失真代价最小的模式作为Bk的最优编码
    模式。对于Bk,最小的率失真代价为: min ( J k GEO , J k inter , J k intra ) = J k GEO = 1438 . ]]>

    因此,Bk的最优编码模式为几何划分编码模式。则该Bk采用几何划分编码模式进行
    编码。

    参见图3,作为一个具体的例子,本发明实施例的深度图编码方法可按照如下步骤进
    行:

    步骤S110,设置几何划分模式中的划分线集合。

    步骤S120,开始编码当前宏块Bk。

    步骤S130,判断Bk是否为帧内编码宏块,如果是则转至步骤S140,否则转至步骤S220。

    步骤S140,对Bk进行帧内预测编码并计算该模式下的率失真代价,并转入步骤S150。

    步骤S150,判断Bk是否进行帧间模式编码,如果是则转至步骤S160,否则转至步骤
    S200。

    步骤S160,对Bk采用传统帧间预测模式进行编码并计算该模式下的率失真代价,并转
    入步骤S170。

    步骤S170,判断Bk是否包含不连续运动场。如果是则转至步骤S180,否则转至步骤
    S200。

    步骤S180,根据Bk中每个像素的亮度信息搜索对应的最优划分线。

    步骤S190,对最优划分线所划分成的两个部分进行运动估计和编码,并计算其对应的
    率失真代价。

    步骤S200,选取率失真代价最小的模式作为Bk的最优编码模式。

    步骤S210,采用最优模式编码Bk。

    步骤S220,判断Bk是否为当前帧的最后一个宏块。如果是则编码结束,否则转至步骤
    S120中以便对下一个深度宏块进行编码。

    参考图6,本发明进一步实施例提出了一种深度图编码装置600,包括划分线建立模块
    610、帧内编码模块620、帧间编码判断模块630、帧间编码模块640,几何划分判断模块
    650、几何划分编码模块660和编码模式选择模块670。其中:

    划分线建立模块610用于建立多个划分线并组成划分集合,其中,多个划分线用于对
    深度宏块进行楔形划分。帧内编码模块620用于以帧内编码模式对深度宏块进行编码以获
    取对应的第一率失真代价值。帧间编码判断模块630用于判断是否以帧间编码模式对所述
    深度宏块进行编码。帧间编码模块640用于在帧间编码判断模块630判断以帧间编码模式
    对深度宏块进行编码时以帧间编码模式对深度宏块进行编码以获取对应的第二率失真代价
    值。几何划分判断模块650用于判断深度宏块是否包含不连续的运动向量场。几何划分编
    码模块660用于在几何划分判断模块650判断深度宏块包含不连续的运动向量场时,以几
    何划分编码模式对深度宏块进行编码,其中,几何划分编码模式包括:根据深度宏块的所
    有像素点的亮度信息从所述划分集合中选择最优划分线对深度宏块进行划分以得到第一和
    第二深度子区域,且分别对第一和第二深度子区域进行运动估计和预测编码以获取对应的
    第三率失真代价值。编码模式选择模块670用于比较深度宏块在不同编码模式下的率失真
    代价值,以根据比较结果选择率失真代价最小的编码模式以便对所述深度宏块进行编码。

    在一些示例中,划分集合为:

    G={ξ(ρi,θi)|i=1,2,…,L},

    其中,ξ(ρi,θi)为所述划分线集合中的第i条划分线,ρi为深度宏块至该划分线的距离,
    θi为该划分线与第一方向的夹角,L为划分线的个数。

    在一些示例中,深度宏块至多个划分线的距离均位于[0,8)之间,多个划分线与第一
    方向的夹角均位于[0,2π)之间。

    在一些示例中,几何划分判断模块650用于获取深度宏块中所有像素点的亮度值,并
    计算深度宏块中所有像素点的亮度值的方差,并比较方差和预设阈值的大小,如果方差大
    于所述预设阈值,则判断深度宏块包含不连续的运动向量场。

    进一步地,几何划分编码模块660用于分别以所述划分集合中的每一条划分线对所述
    深度宏块进行划分,并分别计算划分所得的两部分中各自的所有像素点的平均亮度值以得
    到对应的第一部分和第二部分的平均亮度值,分别对每一条划分线对应的第一部分和第二
    部分的平均亮度值做差得到差值,并获取使差值的绝对值最大的划分线作为所述最优划分
    线,以对所述深度宏块进行划分以得到第一和第二深度子区域。

    在一些示例中,帧内编码模块620用于根据H.264/MPEG-4 AVC编码标准中的帧内编
    码模式对所述深度宏块进行帧内编码,并将对应的最优率失真代价作为所述第一率失真代
    价值。

    在一些示例中,帧间编码模块640用于根据H.264/MPEG-4 AVC编码标准中的帧间编
    码模式对所述深度宏块进行帧间编码,并将对应的最优率失真代价作为所述第二率失真代
    价值。

    在一些示例中,编码模式选择模块670用于在不对所述深度宏块进行帧间编码时,仅
    选择帧内编码模式,在所述深度宏块进行帧间编码且没有包含不连续的运动向量场时,根
    据第一和第二率失真代价值的比较结果选择较小的率失真代价值对应的帧间编码模式或者
    帧内编码模式,在所述深度宏块进行帧间编码且包含不连续的运动向量场时,根据第一至
    第三率失真代价值的比较结果选择最小的率失真代价值对应的帧间编码模式、帧内编码模
    式或者几何划分编码模式以便对所述深度宏块进行编码。

    根据本发明实施例的深度图编码方法及装置,通过设计基于几何划分的深度图编码方
    法,根据合理的方式从帧间编码模式、帧内编码模式或者几何划分编码模式选择最佳的编
    码模式对深度宏块进行编码,由此,不但提高了深度图压缩效率、减少压缩时间,也降低
    深度图编码的复杂度,实现对深度图的高效编码。

    在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、
    或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包
    含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定
    指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的
    一个或多个实施例或示例中以合适的方式结合。

    尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离
    本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发
    明的范围由权利要求及其等同限定。

    关 键  词:
    深度 编码 方法 装置
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:深度图编码方法及装置.pdf
    链接地址:https://www.zhuanlichaxun.net/p-4326993.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1