《三维视频格式自动检测方法及装置.pdf》由会员分享,可在线阅读,更多相关《三维视频格式自动检测方法及装置.pdf(21页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 104185023 A (43)申请公布日 2014.12.03 CN 104185023 A (21)申请号 201410469369.7 (22)申请日 2014.09.16 H04N 17/00(2006.01) H04N 13/00(2006.01) (71)申请人 上海通途半导体科技有限公司 地址 201203 上海市浦东新区郭守敬路 498 号 19 号楼 307 (72)发明人 王洪剑 林江 查毓水 (74)专利代理机构 上海君铁泰知识产权代理事 务所 ( 普通合伙 ) 31274 代理人 潘建玲 (54) 发明名称 三维视频格式自动检测方法及装置 (5。
2、7) 摘要 本发明公开了一种三维视频格式自动检测方 法及装置, 该方法包括如下步骤 : 对输入的一帧 视频图像进行图像分块进行维数缩减以减少特 征向量维数 ; 将经维数缩减后的图像块进行多特 征提取, 该多特征包含块梯度模特征, 块直方图 特征, 帧直方图特征, 投影特征, 中间线边界特征 ; 对提取的特征利用 3D 格式特征的空间域上的多 特征融合方法进行特征融合 ; 根据融合后的特征 进行空间域和时间域上的模糊特征格式判别, 判 断当前帧视频图像的图像格式 ; 输出当前帧的视 频格式, 控制播放装置按照自动检测出的视频图 像格式进行播放, 通过本发明, 不仅可大量的减少 视频格式检测的计算。
3、复杂度, 而且能够很大的提 高视频格式检测的准确率。 (51)Int.Cl. 权利要求书 3 页 说明书 13 页 附图 4 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书3页 说明书13页 附图4页 (10)申请公布号 CN 104185023 A CN 104185023 A 1/3 页 2 1. 一种三维视频格式自动检测方法, 包括如下步骤 : 步骤一, 对输入的一帧视频图像进行图像分块进行维数缩减以减少特征向量维数 ; 步骤二, 将经维数缩减后的图像块进行多特征提取, 获得第一类格式子特征值、 第二类 格式子特征值、 第三类格式子特征值, 该多特征包含块梯度。
4、模特征、 块直方图特征、 帧直方 图特征、 投影特征以及中间线边界特征 ; 步骤三, 对获得的第一类格式子特征值、 第二类格式子特征值、 第三类格式子特征值分 别利用3D格式特征的空间域上的多特征融合方法进行多特征融合获得第一类3D格式特征 值、 第二类 3D 格式特征值以及第三类 3D 格式特征值 ; 步骤四, 根据融合后的特征进行空间域上的格式判别以及时间域上的模糊特征格式判 别, 判断当前帧视频图像的图像格式 ; 步骤五, 输出当前帧的视频格式, 控制播放装置按照自动检测出的视频图像格式进行 播放。 2. 如权利要求 1 所述的一种三维视频格式自动检测方法, 其特征在于, 于步骤二中, 。
5、对 于输入的未知格式的视频图像 f(x,y), 按照如下方式进行统计 3 类格式子特征值 : 取图像 f(x,y) 的左半部分图像为可能的左眼图像, 图像 f(x,y) 的右半部分图像为可 能的右眼图像, 则根据 3D 格式子特征值计算方法计算得到该第一类格式子特征值, 符号记 为 取图像 f(x,y) 的上半部分图像为可能的左眼图像, 图像 f(x,y) 的下半部分图像为可 能的右眼图像, 则根据 3D 格式子特征值计算方法计算得到该第二类格式子特征值, 符号记 为 取图像 f(x,y) 的顶场图像为可能的左眼图像, 图像 f(x,y) 的底场图像为可能的 右眼图像, 则根据 3D 格式子特。
6、征值计算方法计算得到该第三类格式子特征值, 符号记为 3. 如权利要求 2 所述的一种三维视频格式自动检测方法, 其特征在于, 该 3D 格式子特 征值计算方法如下 : 分别计算左眼图像和右眼图像的像素帧直方图向量、 块直方图向量、 梯度模向量、 水 平投影向量, 对其计算相应的特征值, 4 种特征向量对应的归一化后特征值符号分别记为 dhist、 dblk_hist、 dmag、 dprj; 通过检测带状区域的梯度模和亮度信息检测视频图像中有没有边界线, 其归一化后的 边界线特征值符号记为 dbry; 其中, dhist、 dblk_hist、 dmag、 dprj、 dbry称为 3D 格。
7、式子特征值。 4. 如权利要求 3 所述的一种三维视频格式自动检测方法, 其特征在于, 于步骤三中, 对 该第一类格式子特征值采用如下计算公式进行多特征融合得到第一类 3D 格式特征值 : 其 中, whist、 wblk_hist、 wprj、 wbry、 wmag分 别 为 第 一 类 格 式 子 特 征 值 权 利 要 求 书 CN 104185023 A 2 2/3 页 3 预先设定的权重比例系数, 权重比例系数定义域为 0,1 且满足等式条 件 1 whist+wblk_hist+wprj+wbry+wmag, dlr 0,1 表示第一类 3D 格式特征值。 5. 如权利要求 4 所。
8、述的一种三维视频格式自动检测方法, 其特征在于, 于步骤三中, 对 该第二类格式子特征值采用如下计算公式进行多特征融合得到第二类 3D 格式特征值 : 其中, whist、 wblk_hist、 wprj、 wbry、 wmag为预先设定的权重比例系数, 与该第一类格式子特征 权重比例系数相同, dtb 0,1 表示第二类 3D 格式特征值。 6. 如权利要求 5 所述的一种三维视频格式自动检测方法, 其特征在于, 于步骤三中, 对 第三类格式子特征值采用如下计算公式进行多特征融合得到第三类 3D 格式特征值 : 其中, w hist、 wblk_hist、 wprj、 wmag为预先设定的权。
9、重比例系数, 权重比例系数定 义域为 0,1 且满足等式条件 1 whist+wblk_hist+wprj+wmag; dit 0,1 表示第三 类 3D 格式特征值。 7. 如权利要求 6 所述的一种三维视频格式自动检测方法, 其特征在于, 于步骤四中, 根 据如下表达式进行空间域上的视频格式判别 : 其中, fmt 表示图像 f(x,y) 判别的视频格式, d 表示图像 f(x,y) 的格式特征值, d min(dtb,dlr,dit), dlr表示图像 f(x,y) 的第一类 3D 格式特征值, dtb表示图像 f(x,y) 的第二 类3D格式特征值, dit表示图像f(x,y)的第三类。
10、3D格式特征值 ; 当fmt0时, 图像f(x,y) 表示判别为一个 2D 图像, 当 fmt 1 时, 图像 f(x,y) 表示判别为一个左右格式的 3D 图像, 当fmt2时, 图像f(x,y)表示判别为一个上下格式的3D图像, 当fmt3时, 图像f(x,y) 表示判别为一个交错格式的 3D 图像。 8. 如权利要求 7 所述的一种三维视频格式自动检测方法, 其特征在于, 于步骤四中, 根 据如下表达式进行时间域上的视频格式判别 : 其中, fmt 表示当前帧图像 f(x,y) 在空间域上的格式判别得到的视频格式, fmtn-1表示 前一帧图像的视频格式, 以空间域上的格式 fmt 作为。
11、起始第一帧的前一帧格式 fmtn-1的初 始化格式, fmtn表示当前帧图像经过时域信息融合后得到的视频格式, dlow为 3D 格式特征 值 d 的下门限阈值, dhigh为 3D 格式特征值 d 的下门限阈值。 9. 一种三维视频格式自动检测装置, 至少包括 : 图像分块模块, 对输入的一帧视频图像进行图像分块进行维数缩减以减少特征向量维 数 ; 多特征提取模块, 将经维数缩减后的图像块送入块梯度模特征提取子模块、 块直方图 权 利 要 求 书 CN 104185023 A 3 3/3 页 4 特征提取子模块、 帧直方图特征提取子模块、 投影特征提取子模块以及中间线边界特征提 取子模块分别。
12、进行多特征提取, 获得第一类格式子特征值、 第二类格式子特征值、 第三类格 式子特征值 ; 多特征融合模块, 对该多特征提取模块中的各子模块提取的特征值通过 3D 格式特征 的空间域上的多特征融合方法进行特征融合获得第一类 3D 格式特征值、 第二类 3D 格式特 征值以及第三类 3D 格式特征值 ; 格式判断模块, 将融合后的特征送入空间域格式判断模块及时间域格式判断模块进 行空间域上的格式判别以及时间域上的模糊特征格式判别, 判断当前帧视频图像的图像格 式。 10. 如权利要求 9 所述的一种三维视频格式自动检测装置, 其特征在于, 该多特征融合 模块对各子模块提取的第一类格式子特征值采用。
13、如下计算公式进行多特征融合得到该第 一类 3D 格式特征值 : 其 中, whist、 wblk_hist、 wprj、 wbry、 wmag分 别 为 该 第 一 类 格 式 子 特 征 值 预先设定的权重比例系数, 权重比例系数定义域为 0,1 且满足等式条 件 1 whist+wblk_hist+wprj+wbry+wmag, dlr 0,1 表示第一类 3D 格式特征值。 对各子模块提取的该第二类格式子特征值采用如下计算公式进行多特征融合得到该 第二类 3D 格式特征值 其中, whist、 wblk_hist、 wprj、 wbry、 wmag为预先设定的权重比例系数, 与该第一类格。
14、式子特征 权重比例系数相同, dtb 0,1 表示第二类 3D 格式特征值。 对各子模块提取的该第三类格式子特征采用如下计算公式进行多特征融合得到该第 三类 3D 格式特征值 : 其中, w hist、 wblk_hist、 wprj、 wmag为预先设定的权重比例系数, 权重比例系数定 义域为 0,1 且满足等式条件 1 whist+wblk_hist+wprj+wmag; dit 0,1 表示第三 类 3D 格式特征值。 权 利 要 求 书 CN 104185023 A 4 1/13 页 5 三维视频格式自动检测方法及装置 技术领域 0001 本发明涉及视频显示领域, 特别是涉及一种基于多。
15、特征融合的空间域特征格式判 别和时间域格式判别的三维视频格式自动检测方法及装置。 背景技术 0002 随着视频影像技术的发展, 越来越多的二维 (2D) 和三维 (3D) 视频的视频影片上 传到视频网站共享, 以及随着越来越多的三维 (3D) 电影在电影院的放映和三维 (3D) 数字 电视节目的开播, 三维 (3D) 视频数量呈海量增长之势。目前可以通过现有宽带传送的三维 (3D) 的视频格式有左右格式 ( 即, 图像的左半部分是左眼图像, 右半部分是右眼图像 )、 上 下格式 ( 即, 图像的上半部分是左眼图像, 下半部分是右眼图像 ), 三维视频的数量呈海量 增长之势, 如何把三维视频带回。
16、家已成为迫在眉睫的事情, 但是仍然存在着许多的挑战。 由 于现有的视频中仍然存在着大量的二维 (2D) 视频, 因此最需要解决的技术重要问题之一, 就是针对电视上播放的各种片源进行自动检测出所播放的视频图像格式, 控制电视正常播 放片源, 以实现电视智能化自动识别播放的片源是哪种格式的片源, 这就需要提供一种自 动检测视频格式是二维 (2D) 还是三维 (3D) 的技术手段, 如果是三维 (3D) 视频格式, 还需 要检测是三维(3D)视频格式中的具体哪种三维格式(左右格式、 上下格式中的哪种格式)。 0003 一个完整的三维 (3D) 电视系统如图 1 所示, 其主要模块包括视频信号接受端口。
17、、 电源系统、 音频处理器、 扬声器、 视频处理器、 图形控制器、 三维显示面板, 而用于检测三维 视频格式的模块则是图形控制器中的三维格式检测模块。 0004 公开号为 CN101980545A 的中国专利提供 “一种自动检测三维 TV 视频节目格式的 方法” , 其通过先进行图像熵阈值判别, 然后进行图像块像素的协方差相似性特征阈值征判 别方法来判别视频格式。其存在如下缺点 : 1、 具有较高的计算复杂度 ; 2、 视频格式检测的 准确率不高。 发明内容 0005 为克服上述现有技术存在的不足, 本发明之目的在于提供一种三维视频格式自动 检测方法及装置, 其不仅大量的减少视频格式检测的计算。
18、复杂度, 而且能够很大的提高视 频格式检测的准确率。 0006 为达上述及其它目的, 本发明提出一种三维视频格式自动检测方法, 包括如下步 骤 : 0007 步骤一, 对输入的一帧视频图像进行图像分块进行维数缩减以减少特征向量维 数 ; 0008 步骤二, 将经维数缩减后的图像块进行多特征提取, 获得第一类格式子特征值、 第 二类格式子特征值、 第三类格式子特征值, 该多特征包含块梯度模特征, 块直方图特征, 帧 直方图特征, 投影特征, 中间线边界特征 ; 0009 步骤三, 对获得的第一类格式子特征值、 第二类格式子特征值、 第三类格式子特征 说 明 书 CN 104185023 A 5 。
19、2/13 页 6 值利用3D格式特征的空间域上的多特征融合方法进行多特征融合获得第一类3D格式特征 值、 第二类 3D 格式特征值以及第三类 3D 格式特征值 ; 0010 步骤四, 根据融合后的特征进行空间域上的格式判别以及时间域上的模糊特征格 式判别, 判断当前帧视频图像的图像格式 ; 0011 步骤五, 输出当前帧的视频格式, 控制播放装置按照自动检测出的视频图像格式 进行播放。 0012 进一步地, 于步骤二中, 对于输入的未知格式的视频图像 f(x,y), 按照如下方式进 行统计 3 类格式子特征值 : 0013 取图像 f(x,y) 的左半部分图像为可能的左眼图像, 图像 f(x,。
20、y) 的右半部分图像 为可能的右眼图像, 则根据 3D 格式子特征值计算方法计算得到第一类格式子特征值, 符号 记为 0014 取图像 f(x,y) 的上半部分图像为可能的左眼图像, 图像 f(x,y) 的下半部分图像 为可能的右眼图像, 则根据 3D 格式子特征值计算方法计算得到第二类格式子特征值, 符号 记为 0015 取图像 f(x,y) 的顶场图像为可能的左眼图像, 图像 f(x,y) 的底场图像为可能 的右眼图像, 则根据 3D 格式子特征值计算方法计算得到第三类格式子特征值, 符号记为 0016 进一步地, 该 3D 格式子特征值计算方法如下 : 0017 分别计算左眼图像和右眼图。
21、像的像素帧直方图向量、 块直方图向量、 梯度模向量、 水平投影向量, 对其计算相应的特征值, 4 种特征向量对应的归一化后特征值符号分别记为 dhist、 dblk_hist、 dmag、 dprj; 0018 通过检测带状区域的梯度模和亮度信息检测视频图像中有没有边界线, 其归一化 后的边界线特征值符号记为 dbry; 0019 其中, dhist、 dblk_hist、 dmag、 dprj、 dbry称为 3D 格式子特征值。 0020 进一步地, 于步骤三中, 对该第一类格式子特征值采用如下计算公式进行多特征 融合得到第一类 3D 格式特征值 : 0021 0022 其 中, whis。
22、t、 wblk_hist、 wprj、 wbry、 wmag分 别 为 第 一 类 格 式 子 特 征 预先设定的权重比例系数, 权重比例系数定义域为0,1且满足等式条件 1 whist+wblk_hist+wprj+wbry+wmag, dlr 0,1 表示第一类 3D 格式特征值。 0023 进一步地, 于步骤三中, 对该第二类格式子特征值采用如下计算公式进行多特征 融合得到第二类 3D 格式特征值 : 0024 0025 其中, whist、 wblk_hist、 wprj、 wbry、 wmag为预先设定的权重比例系数, 与该第一类格式子 说 明 书 CN 104185023 A 6 。
23、3/13 页 7 特征权重比例系数相同, dtb 0,1 表示第二类 3D 格式特征值。 0026 进一步地, 于步骤三中, 对第三类格式子特征值采用如下计算公式进行多特征融 合得到第三类 3D 格式特征值 : 0027 0028 其中, w hist、 wblk_hist、 wprj、 wmag为预先设定的权重比例系数, 权重比例系 数定义域为 0,1 且满足等式条件 1 whist+wblk_hist+wprj+wmag; dit 0,1 表示 第三类 3D 格式特征值。 0029 进一步地, 于步骤四中, 根据如下表达式进行空间域上的视频格式判别 : 0030 0031 其中, fmt 。
24、表示图像 f(x,y) 判别的视频格式, d 表示图像 f(x,y) 的格式特征值, d min(dtb,dlr,dit), dlr表示图像 f(x,y) 的第一类 3D 格式特征值, dtb表示图像 f(x,y) 的 第二类 3D 格式特征值, dit表示图像 f(x,y) 的第三类 3D 格式特征值 ; 当 fmt 0 时, 图像 f(x,y) 表示判别为一个 2D 图像, 当 fmt 1 时, 图像 f(x,y) 表示判别为一个左右格式的 3D 图像, 当 fmt 2 时, 图像 f(x,y) 表示判别为一个上下格式的 3D 图像, 当 fmt 3 时, 图 像 f(x,y) 表示判别为。
25、一个交错格式的 3D 图像。 0032 进一步地, 于步骤四中, 根据如下表达式进行时间域上的视频格式判别 : 0033 0034 其中, fmt 表示当前帧图像 f(x,y) 在空间域上的格式判别得到的视频格式, fmtn-1 表示前一帧图像的视频格式, 以空间域上的格式 fmt 作为起始第一帧的前一帧格式 fmtn-1 的初始化格式, fmtn表示当前帧图像经过时域信息融合后得到的视频格式, dlow为 3D 格式 特征值 d 的下门限阈值, dhigh为 3D 格式特征值 d 的下门限阈值。 0035 为达到上述目的, 本发明还提供一种三维视频格式自动检测装置, 至少包括 : 0036 。
26、图像分块模块, 对输入的一帧视频图像进行图像分块进行维数缩减以减少特征向 量维数 ; 0037 多特征提取模块, 将经维数缩减后的图像块送入块梯度模特征提取子模块、 块直 方图特征提取子模块、 帧直方图特征提取子模块、 投影特征提取子模块以及中间线边界特 征提取子模块分别进行多特征提取, 获得第一类格式子特征值、 第二类格式子特征值、 第三 类格式子特征值 ; 0038 多特征融合模块, 对该多特征提取模块中的各子模块提取的特征通过 3D 格式特 征的空间域上的多特征融合方法进行特征融合获得第一类 3D 格式特征值、 第二类 3D 格式 特征值以及第三类 3D 格式特征值 ; 0039 格式判。
27、断模块, 将融合后的特征送入空间域格式判断模块及时间域格式判断模块 进行空间域上的格式判别以及时间域上的模糊特征格式判别, 判断当前帧视频图像的图像 说 明 书 CN 104185023 A 7 4/13 页 8 格式。 0040 进一步地, 该多特征融合模块对各子模块提取的第一类格式子特征值采用如下计 算公式进行多特征融合得到第一类 3D 格式特征值 : 0041 0042 其中, whist、 wblk_hist、 wprj、 wbry、 wmag分别为第一类格式子特征值 预先设定的权重比例系数, 权重比例系数定义域为 0,1 且满足等式条 件 1 whist+wblk_hist+wprj。
28、+wbry+wmag, dlr 0,1 表示第一类 3D 格式特征值。 0043 对各子模块提取的第二类格式子特征值采用如下计算公式进行多特征融合得到 第二类 3D 格式特征值 0044 0045 其中, whist、 wblk_hist、 wprj、 wbry、 wmag为预先设定的权重比例系数, 与该第一类格式子 特征权重比例系数相同, dtb 0,1 表示第二类 3D 格式特征值。 0046 对各子模块提取的第三类格式子特征值采用如下计算公式进行多特征融合得到 第三类 3D 格式特征值 : 0047 0048 其中, w hist、 wblk_hist、 wprj、 wmag为预先设定的。
29、权重比例系数, 权重比例系 数定义域为 0,1 且满足等式条件 1 whist+wblk_hist+wprj+wmag; dit 0,1 表示 第三类 3D 格式特征值。 0049 与现有技术相比, 本发明一种三维视频格式自动检测方法及装置通过先对输入的 一帧视频图像进行图像分块进行维数缩减以减少特征向量维素, 降低计算复杂度, 其次将 其送入 5 个特征提取子模块分别进行多特征提取, 然后对这些特征送入特征融合模块进行 特征融合, 再次将融合后的特征送入格式判断模块进行空间域和时间域上的模糊特征格 式, 判别当前帧视频图像 f(x,y) 的图像格式, 最后输出当前帧的视频格式, 控制播放装置。
30、 按照自动检测出的视频图像格式进行播放片源, 不仅可以减少视频格式检测的计算复杂 度, 而且能够很大的提高视频格式检测的准确率。 附图说明 0050 图 1 为一个完整的 3D 电视系统的系统架构图 ; 0051 图 2 为本发明一种三维视频格式自动检测方法的步骤流程图 ; 0052 图 3 为本发明较佳实施例中多特征融合计算流程图 ; 0053 图 4 为本发明较佳实施例中空间域上的视频格式判别计算流程图 ; 0054 图 5 为本发明较佳实施例中时间域上的视频格式判别计算流程图 ; 0055 图 6 为本发明一种三维视频格式自动检测装置的系统架构图。 具体实施方式 0056 以下通过特定的。
31、具体实例并结合附图说明本发明的实施方式, 本领域技术人员可 说 明 书 CN 104185023 A 8 5/13 页 9 由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。 本发明亦可通过其它不同 的具体实例加以施行或应用, 本说明书中的各项细节亦可基于不同观点与应用, 在不背离 本发明的精神下进行各种修饰与变更。 0057 因为三维 (3D) 视频图像由左右眼图像合并而成的, 如果是左右格式的三维 (3D) 图像, 则左眼图像为三维(3D)视频图像的左半部分, 右眼图像为三维(3D)视频图像的右半 部分 ; 如果是上下格式的三维 (3D) 图像, 则左眼图像为三维 (3D) 视频图像。
32、的上半部分, 右 眼图像为三维(3D)视频图像的下半部分 ; 如果是交错格式的三维(3D)图像, 则左眼图像为 三维 (3D) 视频图像的顶场图像, 右眼图像为三维 (3D) 视频图像的底场图像。 0058 不论三维 (3D) 视频图像是左右格式、 上下格式还是交错格式, 单帧图像都是由左 眼图像和右眼图像组成的, 即使左右眼图像有视差, 但左眼图像和右眼图像看起来都是十 分相似的, 这都是二维 (2D) 不具有的对称性特点。对称特点主要包括 : 直方图, 梯度模向 量, 投影向量等。针对以上三维 (3D) 视频图像的特点, 本发明提出了一种简单有效自动视 频格式检测方法, 即空间域上的多特征。
33、融合技术方法进行提取 3D 格式特征以及空间域和 时间域上的模糊特征格式判别的自动视频格式检测方法。 0059 图 2 为本发明一种三维视频格式自动检测方法的步骤流程图。如图 2 所示, 本发 明一种三维视频格式自动检测方法, 包括如下步骤 : 0060 步骤 201, 对输入的一帧视频图像进行图像分块进行维数缩减以减少特征向量维 数, 降低计算复杂度。 0061 由于三维 (3D) 视频图像分辨率往往很高, 如果直接以像素点进行单点提取特征 向量, 计算复杂度太高, 成本太大, 因此需要对特征向量进行维数缩减。又因为 3D 视频图像 的左右眼图像有视差, 所以左眼图像像素与右眼图像像素在空间。
34、位置上是有偏移的。本发 明通过对左眼图像和右眼图像以像素分辨率大小为 BhBw图像块进行图像块划分, 以像素 块为单位进行特征提取可以有效减少左右眼图像视差的负面影响, 对左右眼图像的特征向 量可以实现维数缩减, 增加特征向量的鲁棒性, 同时可以大量的减少视频格式检测方法的 计算复杂度。 0062 步骤 202, 将经维数缩减后的图像块进行多特征提取, 这里的多特征主要包含 : 块 梯度模特征, 块直方图特征, 帧直方图特征, 投影特征, 中间线边界特征。 0063 由于三维 (3D) 视频图像的左眼图像和右眼图像具有很强的相似性 (3D 视频图像 的对称性 ), 分别计算左眼图像和右眼图像的。
35、像素帧直方图向量、 块直方图 ( 分辨率 BhBw 像素块 ) 向量、 梯度模向量、 水平投影向量, 则左眼图像和右眼图像的这 4 种特征向量应该 具有相似性, 可以对其计算相应的向量距离 d 0,1( 向量距离简称特征值 ), 如果特征 值等于 0, 则左眼图像和右眼图像的特征向量几乎相同, 如果距离等于 1, 则左眼图像和右 眼图像的特征向量完全不同。4 种特征向量对应的归一化后特征值符号分别记为 dhist、 dblk_ hist、 dmag、 dprj。 0064 由于 3D 视频图像由左右眼图像合并而成的, 如果是左右格式的 3D 图像, 则通常 在中间列的水平方向有一条明显的边界线。
36、或者暗区域带, 如果是上下格式的 3D 图像, 则通 常在中间行的垂直方向有一条明显的边界线或者暗区域带。则可通过检测中带状区域的 梯度模和亮度信息检测视频图像中有没有边界线, 其归一化后的边界线特征值符号记为 dbry 0,1。对于交错格式的 3D 图像, 由于没有明显的左右眼图像的边界线, 所以交错格 说 明 书 CN 104185023 A 9 6/13 页 10 式的 3D 格式特征中没有边界线特征。 0065 这里将 dhist、 dblk_hist、 dmag、 dprj、 dbry称为 3D 格式子特征值。 0066 对于输入的未知格式的视频图像 f(x,y), 按照如下方式进行。
37、统计 3 类格式子特征 值 : 0067 第一类格式子特征值 : 取图像 f(x,y) 的左半部分图像为可能的左眼图像, 图像 f(x,y) 的右半部分图像为可能的右眼图像, 则根据 3D 格式子特征值计算方法可以计算得 到第一类格式子特征值, 符号记为 0068 第二类格式子特征值 : 取图像 f(x,y) 的上半部分图像为可能的左眼图像, 图像 f(x,y) 的下半部分图像为可能的右眼图像, 则根据 3D 格式子特征值计算方法可以计算得 到第二类格式子特征值, 符号记为 0069 第三类格式子特征值 : 取图像 f(x,y) 的顶场图像为可能的左眼图像, 图像 f(x,y) 的底场图像为可。
38、能的右眼图像, 则根据 3D 格式子特征值计算方法可以计算得到第三类格 式子特征值, 符号记为 0070 步骤 203, 对提取的特征利用 3D 格式特征的空间域上的多特征融合方法进行特征 融合。 0071 图像内容往往复杂多变, 尤其是一些难以区分特殊情形下的 2D 图像也具有对称 性特点比较强 ( 例如 : 纯白场景, 纯黑场景 ), 视差比较大的 3D 图像对称性特点比较弱, 如 果仅仅通过单一特征判断视频图像格式, 很容易产生视频格式误判。本发明提出了通过 3D 格式特征的空间域上的多特征融合进行 3D 格式特征方法, 即将多个 3D 格式子特征进行加 权融合方法, 通过该方法可以提取。
39、一个非常稳定的 3D 格式特征, 能够很大的提高视频格式 检测的准确率。多特征融合的计算流程图见图 3。 0072 若图像 f(x,y) 是左右格式的 3D 图像, 显然左半部分图像 ( 左眼图像 ) 和 右半部分图像 ( 右眼图像 ) 的各特征向量的距离比较小, 则有第一类格式子特征值 也都会同时等于 0 或者比较小。如果图像 f(x,y) 的 5 个 子特征值中仅仅有某几个子特征值比较小, 但并不能肯定判别图像f(x,y)是一个3D图像, 因为有不少的 2D 图像也满足个别子特征值小, 比如 : 纯白的 2D 场景图像, 它的子特征值 都等于 0。因此判断图像 f(x,y) 的格式, 需要。
40、同时考虑所有子特征值的特点才能 真实的反映视频格式特点, 否则仅仅依赖个别单个子特征基判别视频格式容易导致格式误 判。基于此原则, 本发明提出了多特征融合方法提取 3D 格式特征, 可以进一步提高 3D 格式 特征的表达准确度和稳定性。 0073 首先, 第一类格式子特征值的多特征融合方法计算公式如下 : 0074 0075 其式中, whist、 wblk_hist、 wprj、 wbry、 wmag分别为第一类格式子特征值 预先设定的权重比例系数, 权重比例系数定义域为 0,1 且满足等式条 说 明 书 CN 104185023 A 10 7/13 页 11 件 1 whist+wblk_。
41、hist+wprj+wbry+wmag; dlr 0,1 表示第一类 3D 格式特征值。 0076 其次, 类似的方法, 对于第二类格式子特征值进行多特征融合可以得到第二类 3D 格式特征值, 计算公式如下 : 0077 0078 其中, whist、 wblk_hist、 wprj、 wbry、 wmag预先设定的权重比例系数, 与第一类格式子特征 权重比例系数相同, dtb 0,1 表示第二类 3D 格式特征值。 0079 再次, 对于第三类格式子特征值进行多特征融合可以得到第三类 3D 格式特征值, 计算公式如下 : 0080 0081 其式中, w hist、 wblk_hist、 w。
42、prj、 wmag预先设定的权重比例系数, 权重比例系 数定义域为 0,1 且满足等式条件 1 whist+wblk_hist+wprj+wmag; dit 0,1 表示 第三类 3D 格式特征值。 0082 步骤 204, 根据融合后的特征进行空间域的格式判别以及时间域上的模糊特征格 式判别, 判断当前帧视频图像 f(x,y) 的图像格式 ( 判断是 2D 格式、 上下格式、 左右格式, 交 错格式 )。 0083 1、 空间域上的格式判别 0084 3D 视频图像只可能是左右格式、 上下格式、 交错格式中的一种, 不可能同时属于 2 种 3D 格式。如果输入的视频图像是左右格式图像, 则显。
43、然有第一类 3D 格式特征值小于第 二、 三类 3D 格式特征值 ; 如果输入的视频图像是上下格式图像, 则显然有第二类 3D 格式特 征值小于第一、 三类 3D 格式特征值 ; 如果输入的视频图像是交错格式图像, 则显然有第三 类3D格式特征值小于第一、 二类3D格式特征值 ; 所以第一、 二和三类3D格式特征值中的最 小特征值最能表达输入图像的 3D 格式特征值, 则可得数学计算表达式 : 0085 d min(dtb,dlr,dit) 0086 其中, d 表示图像 f(x,y) 的 3D 格式特征值 ; 由于 dtb 0,1, dlr 0,1, dit 0,1, 则可知格式特征值 d 。
44、0,1。 0087 从视频图像格式特征值 d 定义可知, d 描述了图像 f(x,y) 的左眼图像和右眼图 像的距离度量, 也就是说若格式特征值 d 的值越小, 3D 格式特征越强, 图像 f(x,y) 越可能 是 3D 图像 ; 反之, 格式特征值 d 的值越大, 3D 格式特征越弱, 即 2D 视频格式特征越强, 图像 f(x,y) 越可能是 2D 图像。 0088 为了更好的描述, 本发明引进符号 fmt 进行量化图像 f(x,y) 的视频格式, 如果 fmt 的值等于 0, 则表示图像 f(x,y) 是 2D 视频格式图像 ; 如果 fmt 的值等于 1, 则表示图像 f(x,y)是左。
45、右格式图像 ; 如果fmt的值等于2, 则表示图像f(x,y)是上下格式 ; 如果fmt的 值等于 3, 则表示图像 f(x,y) 是交错格式。对于判别输入图像是 2D 图像还是 3D 图像, 这 里对3D格式特征设定一个阈值dth(0,1), 例如阈值可以设为dth0.5, 如果格式特征值 d dth, 说明图像 f(x,y) 的 2D 视频格式特征偏强, f(x,y) 的 3D 格式特征偏弱, 则将图像 f(x,y)格式判别为2D视频格式, fmt的值记为0 ; 如果格式特征值ddth, 说明图像f(x,y) 的 2D 视频格式特征偏弱, 即图像 f(x,y) 的 3D 格式特征偏强, 则。
46、将图像 f(x,y) 格式判别为 3D 格式。如果格式特征值 d dth I dlr d, 说明图像 f(x,y) 的 3D 格式特征偏强且第一 说 明 书 CN 104185023 A 11 8/13 页 12 类 3D 格式特征强于第二、 三类 3D 格式特征, 即图像 f(x,y) 的左右格式特征最强, 我们则将 图像 f(x,y) 格式判别为左右格式, fmt 的值记为 1 ; 如果格式特征值 d dth I dtb d, 说 明图像 f(x,y) 的 3D 格式特征偏强且第二类 3D 格式特征强于第一、 三类 3D 格式特征, 即图 像f(x,y)的上下格式特征最强, 则将图像f(x。
47、,y)格式判别为上下格式, fmt的值记为2 ; 如 果格式特征值 d dth I dit d, 说明图像 f(x,y) 的 3D 格式特征偏强且第三类 3D 格式特 征强于第一、 二 3D 格式特征, 即图像 f(x,y) 的交错格式特征最强, 则将图像 f(x,y) 格式判 别为交错格式, fmt 的值记为 3 ; 0089 最后则可得空间域上的视频格式 fmt 判别表达式如下 : 0090 0091 其中, fmt 表示图像 f(x,y) 判别的视频格式, d 表示图像 f(x,y) 的格式特征值, dlr表示图像 f(x,y) 的第一类 3D 格式特征值, dtb表示图像 f(x,y)。
48、 的第二类 3D 格式特征 值, dit表示图像 f(x,y) 的第三类 3D 格式特征值 ; 当 fmt 0 时, 图像 f(x,y) 表示判别为 一个 2D 图像, 当 fmt 1 时, 图像 f(x,y) 表示判别为一个左右格式的 3D 图像, 当 fmt 2 时, 图像 f(x,y) 表示判别为一个上下格式的 3D 图像, 当 fmt 3 时, 图像 f(x,y) 表示判别 为一个交错格式的 3D 图像。 0092 空间域上的格式判别计算流程图见图 4。具体如下 : 计算第一、 二和三类 3D 格式 特征值中的最小特征值作为输入图像的 3D 格式特征值 d ; 判断该 3D 格式特征值 d 是否小 于 3D 格式特征值阈值 dth, 若是, 则判断视频格式为三维, 并继续后续判断, 若否, 则判断视 频格式为二维 ; 判断该 3D 格式特征值 d 是否等于第一类 3D 格式特征值 dlr, 若等于, 则判断 视频格式左右格式, 否则判断该 3D 格式特征值 d 是否等于第二类 3D 格式特征值 dtb; 若等 于, 则判断视频格式为上下格式, 否则判断为交错格式。 0093 2、 时间域上的格式判别 0094 通常对于对称性。