嵌入用于媒体内容识别的指纹数据 【技术领域】
本发明涉及将识别媒体内容的指纹嵌入到用于传送所述媒体内容的媒体传送信号中的方法和装置。
本发明还涉及从用于传送所述媒体内容的媒体传送信号取回指纹的方法和装置,和验证媒体内容的真实性的方法和装置。
背景技术
指纹,字面上还被称为签名或散列,是一个从诸如音频歌曲、图像、视频剪辑等多媒体内容导出的比特序列,并概述或标识所述媒体内容。
指纹尤其是在鉴别的领域被使用,在该领域希望验证接收的内容是否是原始的,或者检测内容是否被篡改。于是,将从接收的内容导出的指纹与原始内容的指纹比较。在这种应用中,希望将原始的指纹连通从其导出该指纹的内容一切被传送。
国际专利申请WO 01/23981概括了多个传送数字数据作品(work)地指纹及其内容的已知方法。该指纹作为分离的文件或嵌入到数字数据作品的数据文件被传送。在后一例子中,指纹被放在文件的头部内、被附着在文件的尾部、或以嵌入的水印形式被嵌入到内容中。指纹优选地被加密。
通过加水印将指纹嵌入到内容具有的优点是允许将指纹运送通过现有的处理链。通过仔细地设计,水印足够得健壮以允许嵌入的指纹即使在压缩和模拟/数字变换之后也被正确提取。但是,水印的大小随着其表示的内容的精确度的改善而迅速增加。诸如鉴别的应用要求非常大的指纹,以便提供良好的内容的被篡改部分的定位。健壮的水印方案通常具有有限的有效负载。
【发明内容】
本发明的一个发明目的是提供将识别媒体内容的指纹嵌入到用于传送所述媒体内容的媒体传送信号的方法。
由此,根据本发明的方法包括步骤:将所述指纹变换成媒体传送信号为传送所述媒体内容提供的格式,并且将变换后的指纹装入不用于传送所述媒体内容的媒体传送信号的预定部分中。
用本发明实现了指纹可被装入存在的标准媒体传送格式中,而不要求所述信号格式的任何修改或增加信号的长度。该方法具有和水印嵌入的现有技术方法同样的优点(允许将指纹运送通过现有的处理链),但却不没有有效负载的限制。
一些传送格式具有备用容量,用于装入媒体内容。例如,电视信号具有可在其间传送内容的垂直消隐期,但是该内容不能由标准的电视接收机显示。在一个根据本发明的方法的实施例中,视频的指纹或一系列视频图像被装入所述垂直消隐期的行中,装入的可能的方式与周知的图文电视数据传送兼容。
如果传送格式不提供该备用容量,一小部分的媒体内容可被牺牲,用作创建用于指纹的空间。例如,视频图像的上面和/或下面边界的几行可被用来装入(剩余的)视频图像的变换后的指纹。所述几行通常在标准电视接收机的屏幕上是不可见的。由此,根据本发明的方法的实施例包括步骤:将媒体内容划分成第一部分和第二部分,从所述媒体内容的第一部分导出指纹,以及用变换后的指纹替换所述媒体内容的第二部分。
【附图说明】
本发明的这些和其他方面通过参考在附图中示出的实施例将变得明白和清楚,其中:
图1示意性地显示包括一个用于根据本发明嵌入指纹的装置的视频监视系统。
图2显示在图1中所示的变换电路所执行的操作的流程图。
图3和4显示说明根据本发明的方法的实施例的操作的图表。
图5显示由根据本发明验证媒体内容的真实性的装置执行的操作的流程图。
【具体实施方式】
参考视频监视系统描述本发明。图1示意性地显示该系统典型的布局。它包括一个或多个监视摄像机1,其每一个提供以标准模拟(PAL、NTSC)信号格式的视频信号。每个视频信号被应用于指纹提取和嵌入单元2。数字记录器3记录以压缩格式的信号。计算机4提供到存储的视频信号的访问,用于取回、观看和鉴别。鉴别摄像机所获取的图像的能力将确实增加这些图像的值,作为法庭的证据。
指纹提取和嵌入单元2包括提取电路21,用于从每个视频图像导出指纹FP并将其嵌入到摄像机信号。单元2优选地位于摄像机1的内部,以防止在指纹计算之前对图像内容的篡改。指纹FP是概括图像内容的比特序列。它以这样的方式被生成:同一图像被篡改的版本给出基本上不同的指纹,但是不给出由可允许的操纵(比如压缩)处理的图像。从音频和视频材料导出指纹的许多方法在现有技术中是已知的。在系统中使用的提取电路21的实际实施例在Job Oostveen,TonKalker和Jaap Haitsma的“Visual Hashing of Digital Vidio:Application and Techniques”,SPIE,Application of DigitalImage Processing XXIV,July 31-August 3 2001,San Diego,USA中描述。提取的指纹FP由加密电路22加密。加密的指纹被变换器级23变换成与用作传送视频图像相同的格式。在本例中,变换器级23将指纹变换成图像象素并将所述象素装入一个或多个传统模拟电视行(lines)中。该指纹之后被嵌入电路24嵌入到电视信号中。在图1中,嵌入电路24符号表示为加法器。
图2显示由变换器级23执行的步骤的流程图。在步骤231,指纹比特被分组成每个符号M个比特的符号。在步骤232中,符号被分组成达到N个符号的块。在可选步骤233中,附加的错误检测和校正符号被附着到每个块上。在步骤234中,前同步码和同步字被放在每个符号块的开头。在接收机端可要求前同步码以便帮助接收机导出识别符号边缘的定时的时钟信号。这通常是用符号之间最大的差值来改变符号的图案,例如对于M=1为101010,或对于M=3为707070。同步字是具有良好自相关属性的符号的图案,用作标记前同步码的末尾和指纹数据的开头。另外,同步字防止通过经由模拟链接的传输所引入的行(line)抖动,因为即使数据相对于视频行的开头移动,它也能识别数据的开始。在步骤235中,应用将每个符号的序列映射到连续的信号的脉冲整形,所述连续的信号的幅度落在视频信号的范围内。脉冲整形的通常选择是“升余弦”脉冲。脉冲整形消除数据符号之间的跃迁,减少信号的带宽,并且当信号经由有线带宽的信道被传送时,帮助减少内部符号的干扰。
参数M和N的选择是根据嵌入的指纹必须经受其处理的处理操作。每个电视行的符号的数量N被选择为信号带宽足够窄的数量。每个符号的比特数M提供对数据速率和比特错误率之间进行平衡的控制。
图3显示由变换器级23提供的指纹信号的典型波形。在本例中,四个信号值被区别为符号值0、1、2和3(M=2),这对应于指纹比特对00、01、10和11。前同步码3030303030和同步字33300030030在实际的指纹数据之前。
指纹信号最终由嵌入电路24嵌入到电视信号的行中,所述行适合于但不用于图像数据的传送。在传统PAL或NTSC电视信号的情况下,指纹信号能以从图文电视得知的方式装入垂直消隐期的行中。对于M=1和N=320,指纹信号甚至与PAL图文电视数据信号相同。这具有指纹可很容易地被传统的图文电视电路取回的优点。
在一些电路中,在垂直消隐期的行中嵌入指纹是不适合的。例如,在MPEG压缩期间,这些行被剥离。在这些情况下,指纹数据被嵌入到视频的可视部分并代替实际的图像内容。在实践中,指纹的大小足够得小,使得数据仅占据图像很小的一部分,例如PAL域(filed)的288行的4行。其一个例子在图4中示出,其中参考号40表示原始的视频图像区域。在这个实施例中,原始图像区域的一个小区域41被用来装入从由原始图像区域的剩余部分52包括(cover)的图像所提取的指纹FP。区域41将通常落在传统电视接收机的屏幕的可视区域外。如果区域41是可视的,指纹将显现为黑色、灰色和白色象素,通常被称为“雪”。嵌入的指纹的可视性是有益的。其赋予用户保护内容不被篡改的视觉保证。
在许多应用中,嵌入的指纹数据可要求经受住受损压缩。这要求嵌入的指纹信号的带宽限制,该限制不仅是在水平方向(通过适当选择参数M和N以及设计升余弦滤波器),而且还在垂直的方向。保证嵌入的数据行出现在垂直方向上的低频的可能技术有(i)复制嵌入的指纹数据的行,和(ii)插入提供连续行之间平滑迁移的行。
图5显示有计算机4(参看图1)执行的验证接收的图像的真实性的步骤的流程图。在步骤51中,选择指纹被嵌入的电视信号的部分(即图4中的垂直消隐期或图像区域41)。在步骤52中,嵌入的指纹FP被取回。参考上述的嵌入实施例,该步骤52包括步骤521,其中附着的前同步码和同步字被用作确定沿着电视行的位置,表示指纹符号的“象素”位于其上,并且包括步骤522,其中象素值通过切片的方式(将象素值与相应的阈值比较)被变换成相应的符号值(图3中中对于M=2为0、1、2或3)。在步骤53中,选择图像区域(例如,在图4中的图像区域42)。在步骤54,用上述的方式从该区域中导出指纹FP’。之后在步骤55中,将嵌入的指纹FP和从接收的图像中导出的指纹FP’比较。如果它们基本匹配,接收的图像被认为是真实的(步骤56)。否则,得出图像被篡改了(步骤57)。
公开了将识别媒体内容的指纹嵌入到用于传送所述媒体内容的媒体传送信号的方法。为了实现嵌入的指纹经受住所有类型的模拟和数字处理,比如压缩,从内容提取(21)的指纹(FP)被变换(23)成与用于传送的内容的信号格式相同的信号格式。例如,从由安全摄像机(1)生成的视频信号导出的指纹被变换成图像象素。该指纹之后被装入(24)所提供但不被用作传送内容的部分信号中。例如,视频图像的指纹被装入电视信号的垂直消隐期中。变换的指纹还可代替原始内容的一小部分。