智能检测虚假数据合成方法和系统.pdf

上传人:xia****o6 文档编号:14524365 上传时间:2024-05-19 格式:PDF 页数:9 大小:924.33KB
收藏 版权申诉 举报 下载
智能检测虚假数据合成方法和系统.pdf_第1页
第1页 / 共9页
智能检测虚假数据合成方法和系统.pdf_第2页
第2页 / 共9页
智能检测虚假数据合成方法和系统.pdf_第3页
第3页 / 共9页
文档描述:

《智能检测虚假数据合成方法和系统.pdf》由会员分享,可在线阅读,更多相关《智能检测虚假数据合成方法和系统.pdf(9页完成版)》请在专利查询网上搜索。

1、(19)国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202410037557.6(22)申请日 2024.01.10(71)申请人 中国信息通信研究院地址 100191 北京市海淀区花园北路52号(72)发明人 郑威云剑郑晓玲凌霞(74)专利代理机构 北京秉文同创知识产权代理事务所(普通合伙)11859专利代理师 孙富利陈少丽(51)Int.Cl.G06F 16/45(2019.01)G06F 16/48(2019.01)G06F 18/10(2023.01)G06F 18/213(2023.01)G06F 18/22(2023.01)G06F 1。

2、8/24(2023.01)G06N 20/00(2019.01)G06Q 30/018(2023.01)(54)发明名称智能检测虚假数据合成方法和系统(57)摘要本发明提供一种智能检测虚假数据合成方法和系统,通过采集多媒体数据分别提取其中携带的预设字段的值和特征值,分别得到第一场景信息和第二场景信息,根据所述第一场景信息还可以向服务器请求下发规则模板,进而可以计算项目与项目之间、项目与下属元素之间的关联度,根据关联度的高低进行初步判断,两个场景信息的匹配判断作为再次判断,结合两个判断结果可以定位虚假合成的范围或位置,克服现有技术无法有效检测虚假合成和防止虚假合成的问题。权利要求书2页 说明书5。

3、页 附图1页CN 117540038 A2024.02.09CN 117540038 A1.一种智能检测虚假数据合成方法,其特征在于,所述方法包括:采集原始的多媒体数据,并对所述原始的多媒体数据进行整理,包括清洗和去除噪声;从整理后的多媒体数据中提取预设字段的值,所述预设字段是在多媒体数据中额外增加的帧结构字段,用于存储多媒体数据对应的场景信息;根据预设字段的值,得到对应的第一场景信息;根据所述第一场景信息向服务器请求下发规则模板;对所述整理后的多媒体数据按照下发的规则模板进行填充,发掘不同的项目以及每个项目下属的元素,计算项目与项目之间的第一关联度、以及项目与下属元素之间的第二关联度;对所述。

4、整理后的多媒体数据进行初步判断,判断所述第一关联度和第二关联度的值是否均小于阈值,如果两者均小于阈值,则表明多媒体数据存在大范围虚假合成,根据多个项目的标识定位虚假合成的范围;如果仅有一个关联度小于阈值,则表明多媒体数据存在局部虚假合成,根据项目的标识定位虚假合成的位置;如果两者均大于阈值,则表明多媒体数据初步判断不存在虚假合成;采用深度学习技术对所述整理后的多媒体数据进行特征提取,得到多个第一特征值,根据所述第一特征值确定第二场景信息;将所述第一场景信息与第二场景信息进行匹配,如果两者匹配成功,则根据初步判断的结果,给出最终判断结果,只有两个场景信息匹配成功且两个关联度均大于阈值时,所述整理。

5、后的多媒体数据为不存在虚假合成,否则,根据项目的标识定位虚假合成的范围或位置;向用户展示虚假合成的范围或位置。2.根据权利要求1所述的方法,其特征在于:所述向服务器请求下发规则模板,包括:所述规则模板中包含指定场景所要求的各种项目和元素;服务器将所需多媒体数据按照项目类别分别与模板中项目元素建立对应关系,进行存储;服务器接收请求,根据场景信息,调取出对应的规则模板,下发给终端设备。3.根据权利要求2所述的方法,其特征在于:所述服务器中存储有不同场景与特征规则的关联关系,根据场景选择若干个特征规则,生成指定场景下的规则模板,其中关联度高的特征组成一个项目,特征成为该项目里的元素。4.根据权利要求。

6、3所述的方法,其特征在于:所述将所述第一场景信息与第二场景信息进行匹配,包括:将所述第一场景信息与第二场景信息进行逐位比较、或计算两个场景信息的信息方差,若逐位比较相同、或方差小于指定阈值,则判断第一场景信息与第二场景信息匹配成功。5.一种智能检测虚假数据合成系统,其特征在于,所述系统包括:采集单元,用于采集原始的多媒体数据,并对所述原始的多媒体数据进行整理,包括清洗和去除噪声;提取字段单元,用于从整理后的多媒体数据中提取预设字段的值,所述预设字段是在多媒体数据中额外增加的帧结构字段,用于存储多媒体数据对应的场景信息;根据预设字段的值,得到对应的第一场景信息;请求单元,用于根据所述第一场景信息。

7、向服务器请求下发规则模板;权利要求书1/2 页2CN 117540038 A2填充计算单元,用于对所述整理后的多媒体数据按照下发的规则模板进行填充,发掘不同的项目以及每个项目下属的元素,计算项目与项目之间的第一关联度、以及项目与下属元素之间的第二关联度;初步判断单元,用于对所述整理后的多媒体数据进行初步判断,判断所述第一关联度和第二关联度的值是否均小于阈值,如果两者均小于阈值,则表明多媒体数据存在大范围虚假合成,根据多个项目的标识定位虚假合成的范围;如果仅有一个关联度小于阈值,则表明多媒体数据存在局部虚假合成,根据项目的标识定位虚假合成的位置;如果两者均大于阈值,则表明多媒体数据初步判断不存在。

8、虚假合成;特征提取单元,用于采用深度学习技术对所述整理后的多媒体数据进行特征提取,得到多个第一特征值,根据所述第一特征值确定第二场景信息;匹配单元,用于将所述第一场景信息与第二场景信息进行匹配,如果两者匹配成功,则根据初步判断的结果,给出最终判断结果,只有两个场景信息匹配成功且两个关联度均大于阈值时,所述整理后的多媒体数据为不存在虚假合成,否则,根据项目的标识定位虚假合成的范围或位置;展示单元,用于向用户展示虚假合成的范围或位置。6.一种智能检测虚假数据合成系统,其特征在于,所述系统包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代。

9、码中的指令执行实现权利要求14任一项所述的方法。7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行实现权利要求14任一项所述的方法。权利要求书2/2 页3CN 117540038 A3智能检测虚假数据合成方法和系统技术领域0001本申请涉及网络安全技术领域,尤其涉及一种智能检测虚假数据合成方法和系统。背景技术0002随着数字化时代的到来,数据在各行各业中扮演着越来越重要的角色。然而,与此同时,数据的真实性也面临着日益严重的挑战。虚假数据的合成与传播不仅会影响到数据的可信度,更会误导决策,造成严重后果。因此,如何有效检测并防止虚假数据的合成,已成。

10、为亟待解决的问题。0003因此,急需一种针对性的智能检测虚假数据合成方法和系统。发明内容0004本发明的目的是为了解决上述问题,提供一种智能检测虚假数据合成方法和系统。0005第一方面,本申请提供一种智能检测虚假数据合成方法,所述方法包括:采集原始的多媒体数据,并对所述原始的多媒体数据进行整理,包括清洗和去除噪声;从整理后的多媒体数据中提取预设字段的值,所述预设字段是在多媒体数据中额外增加的帧结构字段,用于存储多媒体数据对应的场景信息;根据预设字段的值,得到对应的第一场景信息;根据所述第一场景信息向服务器请求下发规则模板;对所述整理后的多媒体数据按照下发的规则模板进行填充,发掘不同的项目以及每。

11、个项目下属的元素,计算项目与项目之间的第一关联度、以及项目与下属元素之间的第二关联度;对所述整理后的多媒体数据进行初步判断,判断所述第一关联度和第二关联度的值是否均小于阈值,如果两者均小于阈值,则表明多媒体数据存在大范围虚假合成,根据多个项目的标识定位虚假合成的范围;如果仅有一个关联度小于阈值,则表明多媒体数据存在局部虚假合成,根据项目的标识定位虚假合成的位置;如果两者均大于阈值,则表明多媒体数据初步判断不存在虚假合成;采用深度学习技术对所述整理后的多媒体数据进行特征提取,得到多个第一特征值,根据所述第一特征值确定第二场景信息;将所述第一场景信息与第二场景信息进行匹配,如果两者匹配成功,则根据。

12、初步判断的结果,给出最终判断结果,只有两个场景信息匹配成功且两个关联度均大于阈值时,所述整理后的多媒体数据为不存在虚假合成,否则,根据项目的标识定位虚假合成的范围或位置;向用户展示虚假合成的范围或位置。说明书1/5 页4CN 117540038 A40006第二方面,本申请提供一种智能检测虚假数据合成系统,所述系统包括:采集单元,用于采集原始的多媒体数据,并对所述原始的多媒体数据进行整理,包括清洗和去除噪声;提取字段单元,用于从整理后的多媒体数据中提取预设字段的值,所述预设字段是在多媒体数据中额外增加的帧结构字段,用于存储多媒体数据对应的场景信息;根据预设字段的值,得到对应的第一场景信息;请求。

13、单元,用于根据所述第一场景信息向服务器请求下发规则模板;填充计算单元,用于对所述整理后的多媒体数据按照下发的规则模板进行填充,发掘不同的项目以及每个项目下属的元素,计算项目与项目之间的第一关联度、以及项目与下属元素之间的第二关联度;初步判断单元,用于对所述整理后的多媒体数据进行初步判断,判断所述第一关联度和第二关联度的值是否均小于阈值,如果两者均小于阈值,则表明多媒体数据存在大范围虚假合成,根据多个项目的标识定位虚假合成的范围;如果仅有一个关联度小于阈值,则表明多媒体数据存在局部虚假合成,根据项目的标识定位虚假合成的位置;如果两者均大于阈值,则表明多媒体数据初步判断不存在虚假合成;特征提取单元。

14、,用于采用深度学习技术对所述整理后的多媒体数据进行特征提取,得到多个第一特征值,根据所述第一特征值确定第二场景信息;匹配单元,用于将所述第一场景信息与第二场景信息进行匹配,如果两者匹配成功,则根据初步判断的结果,给出最终判断结果,只有两个场景信息匹配成功且两个关联度均大于阈值时,所述整理后的多媒体数据为不存在虚假合成,否则,根据项目的标识定位虚假合成的范围或位置;展示单元,用于向用户展示虚假合成的范围或位置。0007第三方面,本申请提供一种智能检测虚假数据合成系统,所述系统包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令。

15、执行第一方面四种可能中任一项所述的方法。0008第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面四种可能中任一项所述的方法。0009有益效果本发明提供一种智能检测虚假数据合成方法和系统,通过采集多媒体数据分别提取其中携带的预设字段的值和特征值,分别得到第一场景信息和第二场景信息,根据所述第一场景信息还可以向服务器请求下发规则模板,进而可以计算项目与项目之间、项目与下属元素之间的关联度,根据关联度的高低进行初步判断,两个场景信息的匹配判断作为再次判断,结合两个判断结果可以定位虚假合成的范围或位置,克服现有技术无法有效检测虚假合成和防。

16、止虚假合成的问题。0010本发明的智能检测虚假数据合成方法和系统具有以下优点:可以实现对数据的自动分类和识别,准确检测出虚假数据的合成,保护数据的真实性和完整性。通过采用深度学习模型和异常检测算法,提高了检测的准确性和效率。本发说明书2/5 页5CN 117540038 A5明可广泛应用于需要检测数据真实性的领域,如金融、医疗、政府等。附图说明0011为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。0012图1为本发明智能检测虚假数据合成方法的大致流程图。

17、;图2为本发明智能检测虚假数据合成系统的架构图。具体实施方式0013下面结合附图对本发明的优选实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。0014数据的真实性也面临着日益严重的挑战,虚假数据的合成与传播不仅会影响到数据的可信度,更会误导决策。0015图1为本申请提供的智能检测虚假数据合成方法的大致流程图,所述方法包括:采集原始的多媒体数据,并对所述原始的多媒体数据进行整理,包括清洗和去除噪声;从整理后的多媒体数据中提取预设字段的值,所述预设字段是在多媒体数据中额外增加的帧结构字段,用于存储多媒体数据对应的场景信息;根据预。

18、设字段的值,得到对应的第一场景信息;根据所述第一场景信息向服务器请求下发规则模板;对所述整理后的多媒体数据按照下发的规则模板进行填充,发掘不同的项目以及每个项目下属的元素,计算项目与项目之间的第一关联度、以及项目与下属元素之间的第二关联度;对所述整理后的多媒体数据进行初步判断,判断所述第一关联度和第二关联度的值是否均小于阈值,如果两者均小于阈值,则表明多媒体数据存在大范围虚假合成,根据多个项目的标识定位虚假合成的范围;如果仅有一个关联度小于阈值,则表明多媒体数据存在局部虚假合成,根据项目的标识定位虚假合成的位置;如果两者均大于阈值,则表明多媒体数据初步判断不存在虚假合成;用深度学习技术对所述整。

19、理后的多媒体数据进行特征提取,得到多个第一特征值,根据所述第一特征值确定第二场景信息;将所述第一场景信息与第二场景信息进行匹配,如果两者匹配成功,则根据初步判断的结果,给出最终判断结果,只有两个场景信息匹配成功且两个关联度均大于阈值时,所述整理后的多媒体数据为不存在虚假合成,否则,根据项目的标识定位虚假合成的范围或位置;向用户展示虚假合成的范围或位置。0016如果多媒体数据是虚假合成的,那么项目与元素、项目与项目之间的关联度会比较低,由此本领域技术人员可以判断出该多媒体数据是虚假合成的。以及,如果预设字段包含的场景与多媒体数据提取特征对应的场景不吻合,也可以由此判断该多媒体数据是虚假说明书3/。

20、5 页6CN 117540038 A6合成的。0017本申请正是通过上述原理,创造性地采用规则模板,计算项目与项目之间、项目与下属元素之间的关联度,根据关联度的高低进行初步判断。0018在一些优选实施例中,所述向服务器请求下发规则模板,包括:所述规则模板中包含指定场景所要求的各种项目和元素;服务器将所需多媒体数据按照项目类别分别与模板中项目元素建立对应关系,进行存储;服务器接收请求,根据所述场景信息,调取出对应的规则模板,下发给终端设备。0019本申请可以根据场景不同,选择不同的规则。0020在一些优选实施例中,所述服务器中存储有不同场景与特征规则的关联关系,根据场景选择若干个特征规则,生成指。

21、定场景下的规则模板,其中关联度高的特征组成一个项目,特征成为该项目里的元素。0021本申请服务器中存储了不同类型场景的特征规则,用户可以进一步扩展,丰富更多场景,也就是,本申请保持了极大的可扩展性。0022在一些优选实施例中,所述将所述第一场景信息与第二场景信息进行匹配,包括:将所述第一场景信息与第二场景信息进行逐位比较、或计算两个场景信息的信息方差,若逐位比较相同、或方差小于指定阈值,则判断第一场景信息与第二场景信息匹配成功。0023图2为本申请提供的智能检测虚假数据合成系统的架构图,所述系统包括:采集单元,用于采集原始的多媒体数据,并对所述原始的多媒体数据进行整理,包括清洗和去除噪声;提取。

22、字段单元,用于从整理后的多媒体数据中提取预设字段的值,所述预设字段是在多媒体数据中额外增加的帧结构字段,用于存储多媒体数据对应的场景信息;根据预设字段的值,得到对应的第一场景信息;请求单元,用于根据所述第一场景信息向服务器请求下发规则模板;填充计算单元,用于对所述整理后的多媒体数据按照下发的规则模板进行填充,发掘不同的项目以及每个项目下属的元素,计算项目与项目之间的第一关联度、以及项目与下属元素之间的第二关联度;初步判断单元,用于对所述整理后的多媒体数据进行初步判断,判断所述第一关联度和第二关联度的值是否均小于阈值,如果两者均小于阈值,则表明多媒体数据存在大范围虚假合成,根据多个项目的标识定位。

23、虚假合成的范围;如果仅有一个关联度小于阈值,则表明多媒体数据存在局部虚假合成,根据项目的标识定位虚假合成的位置;如果两者均大于阈值,则表明多媒体数据初步判断不存在虚假合成;特征提取单元,用于采用深度学习技术对所述整理后的多媒体数据进行特征提取,得到多个第一特征值,根据所述第一特征值确定第二场景信息;匹配单元,用于将所述第一场景信息与第二场景信息进行匹配,如果两者匹配成功,则根据初步判断的结果,给出最终判断结果,只有两个场景信息匹配成功且两个关联度均大于阈值时,所述整理后的多媒体数据为不存在虚假合成,否则,根据项目的标识定位虚假合成的范围或位置;展示单元,用于向用户展示虚假合成的范围或位置。00。

24、24本申请提供一种智能检测虚假数据合成系统,所述系统包括:所述系统包括处理说明书4/5 页7CN 117540038 A7器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行第一方面所有实施例中任一项所述的方法。0025本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面所有实施例中任一项所述的方法。0026具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可以存储有程序,该程序执行时可包括本发明各个实施例中的部分或全部步骤。所述的存储介质可以为磁碟、光盘、只读存。

25、储记忆体(简称:ROM)或随机存储记忆体(简称:RAM)等。0027本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。0028本说明书各个实施例之间相同相似的部分互相参见即可。尤其,对于实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。0029以上所述的本发明实施方式并不构成对本发明保护范围的限定。说明书5/5 页8CN 117540038 A8图1图2说明书附图1/1 页9CN 117540038 A9。

展开阅读全文
内容关键字: 智能 检测 虚假 数据 合成 方法 系统
关于本文
本文标题:智能检测虚假数据合成方法和系统.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/14524365.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1