视频概念检测方法、装置以及电子设备.pdf

上传人:梁腾 文档编号:10610677 上传时间:2021-06-25 格式:PDF 页数:18 大小:652.88KB
收藏 版权申诉 举报 下载
视频概念检测方法、装置以及电子设备.pdf_第1页
第1页 / 共18页
视频概念检测方法、装置以及电子设备.pdf_第2页
第2页 / 共18页
视频概念检测方法、装置以及电子设备.pdf_第3页
第3页 / 共18页
文档描述:

《视频概念检测方法、装置以及电子设备.pdf》由会员分享,可在线阅读,更多相关《视频概念检测方法、装置以及电子设备.pdf(18页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010234158.0 (22)申请日 2020.03.27 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 卞东海蒋帅罗雨 (74)专利代理机构 北京清亦华知识产权代理事 务所(普通合伙) 11201 代理人 王萌 (51)Int.Cl. G06K 9/00(2006.01) G06F 40/289(2020.01) G06F 16/783(2019.01) (54)发明名称 视频概念检测方法、 装置。

2、以及电子设备 (57)摘要 本申请公开了视频概念检测方法、 装置以及 电子设备, 涉及知识图谱技术领域。 具体实现方 案为: 提取待处理视频的特征信息; 根据特征信 息以及概念识别模型集合中各个概念对应的概 念识别模型, 确定待处理视频属于各个概念的概 率; 根据待处理视频属于各个概念的概率, 确定 待处理视频所属的概念; 根据待处理视频所属的 概念的概率, 对特征信息进行更新, 重新根据更 新后的特征信息以及概念识别模型集合, 确定待 处理视频所属的概念, 直至满足预设的迭代结束 条件, 从而能够根据待处理视频的特征信息以及 待处理视频所属的概念的概率, 对视频进行概念 识别, 扩展了视频的。

3、特征信息, 提高了视频概念 的识别效率。 权利要求书3页 说明书10页 附图4页 CN 111460971 A 2020.07.28 CN 111460971 A 1.一种视频概念检测方法, 其特征在于, 包括: 提取待处理视频的特征信息; 根据所述特征信息以及概念识别模型集合中各个概念对应的概念识别模型, 确定所述 待处理视频属于各个概念的概率; 根据所述待处理视频属于各个概念的概率, 确定所述待处理视频所属的概念; 根据所述待处理视频所属的概念的概率, 对所述特征信息进行更新, 重新根据更新后 的特征信息以及所述概念识别模型集合, 确定所述待处理视频所属的概念, 直至满足预设 的迭代结束条。

4、件。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述待处理视频所属的概念的概 率, 对所述特征信息进行更新, 重新根据更新后的特征信息以及所述概念识别模型集合, 确 定所述待处理视频所属的概念, 直至满足预设的迭代结束条件之后, 还包括: 针对所述待处理视频所属的每个概念, 查询概念图谱, 判断所述概念图谱中是否存在 所述概念对应的上级概念; 在所述概念图谱中存在所述概念对应的上级概念时, 将所述上级概念确定为所述待处 理视频所属的概念。 3.根据权利要求1所述的方法, 其特征在于, 所述待处理视频的特征信息包括以下特征 中的任意一种或者多种: 文本特征、 语音特征、 画面纹理特征。

5、、 运动特征、 实体特征、 实体内 容特征。 4.根据权利要求1所述的方法, 其特征在于, 所述根据所述待处理视频属于各个概念的 概率, 确定所述待处理视频所属的概念, 包括: 针对所述各个概念中的每个概念, 判断所述待处理视频属于所述概念的概率是否大于 预设概率阈值; 若所述待处理视频属于所述概念的概率大于预设概率阈值, 则将所述概念确定为所述 待处理视频所属的概念。 5.根据权利要求1所述的方法, 其特征在于, 所述根据所述特征信息以及概念识别模型 集合中各个概念对应的概念识别模型, 确定所述待处理视频属于各个概念的概率之前, 还 包括: 对视频语料库中各个视频语料的文本信息进行概念提取处。

6、理, 生成概念池; 为所述概念池中的每个概念构建概念识别模型和训练数据并进行训练, 将满足训练要 求的训练后概念识别模型添加到概念识别模型集合中; 获取对应的训练后概念识别模型不满足训练要求的第一概念, 根据概念识别模型集合 对所述第一概念的训练数据进行更新, 重新根据更新后的训练数据对所述第一概念的概念 识别模型进行训练, 直至满足预设的迭代训练结束条件。 6.根据权利要求5所述的方法, 其特征在于, 所述对视频语料库中各个视频语料的文本 信息进行概念提取处理, 生成概念池, 包括: 获取所述各个视频语料的文本信息; 对所述各个视频语料的文本信息进行分词以及语言处理, 生成概念池; 去除所述。

7、潜在概念池中对应的频率位于预设频率范围外的概念; 对所述概念池中的同义概念进行归一化处理。 权利要求书 1/3 页 2 CN 111460971 A 2 7.根据权利要求5所述的方法, 其特征在于, 所述概念池中每个概念的训练数据包括: 正样本数据和负样本数据; 所述正样本数据包括: 对应的文本信息中包括所述概念的视频对应的特征信息; 所述负样本数据包括: 对应的文本信息中不包括所述概念的视频对应的特征信息。 8.一种视频概念检测装置, 其特征在于, 包括: 提取模块, 用于提取待处理视频的特征信息; 第一确定模块, 用于根据所述特征信息以及概念识别模型集合中各个概念对应的概念 识别模型, 确。

8、定所述待处理视频属于各个概念的概率; 第二确定模块, 用于根据所述待处理视频属于各个概念的概率, 确定所述待处理视频 所属的概念; 所述第一确定模块, 还用于根据所述待处理视频所属的概念的概率, 对所述特征信息 进行更新, 重新根据更新后的特征信息以及所述概念识别模型集合, 确定所述待处理视频 所属的概念, 直至满足预设的迭代结束条件。 9.根据权利要求8所述的装置, 其特征在于, 还包括: 查询模块和第三确定模块; 所述查询模块, 用于针对所述待处理视频所属的每个概念, 查询概念图谱, 判断所述概 念图谱中是否存在所述概念对应的上级概念; 所述第三确定模块, 用于在所述概念图谱中存在所述概念。

9、对应的上级概念时, 将所述 上级概念确定为所述待处理视频所属的概念。 10.根据权利要求8所述的装置, 其特征在于, 所述待处理视频的特征信息包括以下特 征中的任意一种或者多种: 文本特征、 语音特征、 画面纹理特征、 运动特征、 实体特征、 实体 内容特征。 11.根据权利要求8所述的装置, 其特征在于, 所述第二确定模块具体用于, 针对所述各个概念中的每个概念, 判断所述待处理视频属于所述概念的概率是否大于 预设概率阈值; 若所述待处理视频属于所述概念的概率大于预设概率阈值, 则将所述概念确定为所述 待处理视频所属的概念。 12.根据权利要求8所述的装置, 其特征在于, 还包括: 生成模块。

10、和训练模块; 所述生成模块, 用于对视频语料库中各个视频语料的文本信息进行概念提取处理, 生 成概念池; 所述训练模块, 用于为所述概念池中的每个概念构建概念识别模型和训练数据并进行 训练, 将满足训练要求的训练后概念识别模型添加到概念识别模型集合中; 所述训练模块, 还用于获取对应的训练后概念识别模型不满足训练要求的第一概念, 根据概念识别模型集合对所述第一概念的训练数据进行更新, 重新根据更新后的训练数据 对所述第一概念的概念识别模型进行训练, 直至满足预设的迭代训练结束条件。 13.根据权利要求12所述的装置, 其特征在于, 所述生成模块具体用于, 获取所述各个视频语料的文本信息; 对所。

11、述各个视频语料的文本信息进行分词以及语言处理, 生成概念池; 去除所述潜在概念池中对应的频率位于预设频率范围外的概念; 对所述概念池中的同义概念进行归一化处理。 权利要求书 2/3 页 3 CN 111460971 A 3 14.根据权利要求12所述的装置, 其特征在于, 所述概念池中每个概念的训练数据包 括: 正样本数据和负样本数据; 所述正样本数据包括: 对应的文本信息中包括所述概念的视频对应的特征信息; 所述负样本数据包括: 对应的文本信息中不包括所述概念的视频对应的特征信息。 15.一种电子设备, 其特征在于, 包括: 至少一个处理器; 以及 与所述至少一个处理器通信连接的存储器; 其。

12、中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。 16.一种存储有计算机指令的非瞬时计算机可读存储介质, 其特征在于, 所述计算机指 令用于使所述计算机执行权利要求1-7中任一项所述的方法。 权利要求书 3/3 页 4 CN 111460971 A 4 视频概念检测方法、 装置以及电子设备 技术领域 0001 本申请涉及数据处理技术领域, 具体涉及知识图谱技术领域, 尤其涉及视频概念 检测方法、 装置以及电子设备。 背景技术 0002 目前获取视频的概念的方法主要是, 针对每个概念,。

13、 人工的标注样本数据, 基于标 注数据进行模型训练, 采用训练得到的模型对视频进行识别, 判断该概念是否为视频的概 念。 0003 上述方法中, 对视频进行识别时, 只采用视频的特征信息进行一次识别, 识别得到 的概念的准确度低, 训练模型时也只采用特征信息对模型进行训练, 训练得到的模型的准 确度较低, 降低了视频概念的识别效率。 发明内容 0004 本申请提出一种视频概念检测方法、 装置以及电子设备, 通过根据视频的特征信 息对视频进行识别, 确定视频所属的概念, 并根据视频所属的概念的概率对特征信息进行 更新, 重新进行识别, 从而提高了视频概念的识别效率。 0005 本申请第一方面实施。

14、例提出了一种视频概念检测方法, 包括: 0006 提取待处理视频的特征信息; 0007 根据所述特征信息以及概念识别模型集合中各个概念对应的概念识别模型, 确定 所述待处理视频属于各个概念的概率; 0008 根据所述待处理视频属于各个概念的概率, 确定所述待处理视频所属的概念; 0009 根据所述待处理视频所属的概念的概率, 对所述特征信息进行更新, 重新根据更 新后的特征信息以及所述概念识别模型集合, 确定所述待处理视频所属的概念, 直至满足 预设的迭代结束条件。 0010 在本申请一个实施例中, 所述根据所述待处理视频所属的概念的概率, 对所述特 征信息进行更新, 重新根据更新后的特征信息。

15、以及所述概念识别模型集合, 确定所述待处 理视频所属的概念, 直至满足预设的迭代结束条件之后, 还包括: 0011 针对所述待处理视频所属的每个概念, 查询概念图谱, 判断所述概念图谱中是否 存在所述概念对应的上级概念; 0012 在所述概念图谱中存在所述概念对应的上级概念时, 将所述上级概念确定为所述 待处理视频所属的概念。 0013 在本申请一个实施例中, 所述待处理视频的特征信息包括以下特征中的任意一种 或者多种: 文本特征、 语音特征、 画面纹理特征、 运动特征、 实体特征、 实体内容特征。 0014 在本申请一个实施例中, 所述根据所述待处理视频属于各个概念的概率, 确定所 述待处理。

16、视频所属的概念, 包括: 0015 针对所述各个概念中的每个概念, 判断所述待处理视频属于所述概念的概率是否 说明书 1/10 页 5 CN 111460971 A 5 大于预设概率阈值; 0016 若所述待处理视频属于所述概念的概率大于预设概率阈值, 则将所述概念确定为 所述待处理视频所属的概念。 0017 在本申请一个实施例中, 所述根据所述特征信息以及概念识别模型集合中各个概 念对应的概念识别模型, 确定所述待处理视频属于各个概念的概率之前, 还包括: 0018 对视频语料库中各个视频语料的文本信息进行概念提取处理, 生成概念池; 0019 为所述概念池中的每个概念构建概念识别模型和训练。

17、数据并进行训练, 将满足训 练要求的训练后概念识别模型添加到概念识别模型集合中; 0020 获取对应的训练后概念识别模型不满足训练要求的第一概念, 根据概念识别模型 集合对所述第一概念的训练数据进行更新, 重新根据更新后的训练数据对所述第一概念的 概念识别模型进行训练, 直至满足预设的迭代训练结束条件。 0021 在本申请一个实施例中, 所述对视频语料库中各个视频语料的文本信息进行概念 提取处理, 生成概念池, 包括: 0022 获取所述各个视频语料的文本信息; 0023 对所述各个视频语料的文本信息进行分词以及语言处理, 生成概念池; 0024 去除所述潜在概念池中对应的频率位于预设频率范围。

18、外的概念; 0025 对所述概念池中的同义概念进行归一化处理。 0026 在本申请一个实施例中, 所述概念池中每个概念的训练数据包括: 正样本数据和 负样本数据; 0027 所述正样本数据包括: 对应的文本信息中包括所述概念的视频对应的特征信息; 0028 所述负样本数据包括: 对应的文本信息中不包括所述概念的视频对应的特征信 息。 0029 本申请实施例的视频概念检测方法, 通过提取待处理视频的特征信息; 根据特征 信息以及概念识别模型集合中各个概念对应的概念识别模型, 确定待处理视频属于各个概 念的概率; 根据待处理视频属于各个概念的概率, 确定待处理视频所属的概念; 根据待处理 视频所属。

19、的概念的概率, 对特征信息进行更新, 重新根据更新后的特征信息以及概念识别 模型集合, 确定待处理视频所属的概念, 直至满足预设的迭代结束条件, 从而能够根据待处 理视频的特征信息以及待处理视频所属的概念的概率, 对视频进行概念识别, 扩展了视频 的特征信息, 提高了视频概念的识别效率。 0030 本申请第二方面实施例提出了一种视频概念检测装置, 包括: 0031 提取模块, 用于提取待处理视频的特征信息; 0032 第一确定模块, 用于根据所述特征信息以及概念识别模型集合中各个概念对应的 概念识别模型, 确定所述待处理视频属于各个概念的概率; 0033 第二确定模块, 用于根据所述待处理视频。

20、属于各个概念的概率, 确定所述待处理 视频所属的概念; 0034 所述第一确定模块, 还用于根据所述待处理视频所属的概念的概率, 对所述特征 信息进行更新, 重新根据更新后的特征信息以及所述概念识别模型集合, 确定所述待处理 视频所属的概念, 直至满足预设的迭代结束条件。 0035 在本申请一个实施例中, 所述的装置还包括: 查询模块和第三确定模块; 说明书 2/10 页 6 CN 111460971 A 6 0036 所述查询模块, 用于针对所述待处理视频所属的每个概念, 查询概念图谱, 判断所 述概念图谱中是否存在所述概念对应的上级概念; 0037 所述第三确定模块, 用于在所述概念图谱中。

21、存在所述概念对应的上级概念时, 将 所述上级概念确定为所述待处理视频所属的概念。 0038 在本申请一个实施例中, 所述待处理视频的特征信息包括以下特征中的任意一种 或者多种: 文本特征、 语音特征、 画面纹理特征、 运动特征、 实体特征、 实体内容特征。 0039 在本申请一个实施例中, 所述第二确定模块具体用于, 0040 针对所述各个概念中的每个概念, 判断所述待处理视频属于所述概念的概率是否 大于预设概率阈值; 0041 若所述待处理视频属于所述概念的概率大于预设概率阈值, 则将所述概念确定为 所述待处理视频所属的概念。 0042 在本申请一个实施例中, 所述的装置还包括: 生成模块和。

22、训练模块; 0043 所述生成模块, 用于对视频语料库中各个视频语料的文本信息进行概念提取处 理, 生成概念池; 0044 所述训练模块, 用于为所述概念池中的每个概念构建概念识别模型和训练数据并 进行训练, 将满足训练要求的训练后概念识别模型添加到概念识别模型集合中; 0045 所述训练模块, 还用于获取对应的训练后概念识别模型不满足训练要求的第一概 念, 根据概念识别模型集合对所述第一概念的训练数据进行更新, 重新根据更新后的训练 数据对所述第一概念的概念识别模型进行训练, 直至满足预设的迭代训练结束条件。 0046 在本申请一个实施例中, 所述生成模块具体用于, 0047 获取所述各个视。

23、频语料的文本信息; 0048 对所述各个视频语料的文本信息进行分词以及语言处理, 生成概念池; 0049 去除所述潜在概念池中对应的频率位于预设频率范围外的概念; 0050 对所述概念池中的同义概念进行归一化处理。 0051 在本申请一个实施例中, 所述概念池中每个概念的训练数据包括: 正样本数据和 负样本数据; 0052 所述正样本数据包括: 对应的文本信息中包括所述概念的视频对应的特征信息; 0053 所述负样本数据包括: 对应的文本信息中不包括所述概念的视频对应的特征信 息。 0054 本申请实施例的视频概念检测装置, 通过提取待处理视频的特征信息; 根据特征 信息以及概念识别模型集合中。

24、各个概念对应的概念识别模型, 确定待处理视频属于各个概 念的概率; 根据待处理视频属于各个概念的概率, 确定待处理视频所属的概念; 根据待处理 视频所属的概念的概率, 对特征信息进行更新, 重新根据更新后的特征信息以及概念识别 模型集合, 确定待处理视频所属的概念, 直至满足预设的迭代结束条件, 从而能够根据待处 理视频的特征信息以及待处理视频所属的概念的概率, 对视频进行概念识别, 扩展了视频 的特征信息, 提高了视频概念的识别效率。 0055 本申请第三方面实施例提出了一种电子设备, 包括: 至少一个处理器; 以及与所述 至少一个处理器通信连接的存储器; 其中, 所述存储器存储有可被所述至。

25、少一个处理器执 行的指令, 所述指令被所述至少一个处理器执行, 以使所述至少一个处理器能够执行如上 说明书 3/10 页 7 CN 111460971 A 7 所述的视频概念检测方法。 0056 本申请第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储 介质, 所述计算机指令用于使所述计算机执行如上所述的视频概念检测方法。 0057 上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。 附图说明 0058 附图用于更好地理解本方案, 不构成对本申请的限定。 其中: 0059 图1是根据本申请第一实施例的示意图; 0060 图2是根据本申请第二实施例的示意图; 0061 图。

26、3是根据本申请第三实施例的示意图; 0062 图4是根据本申请第四实施例的示意图; 0063 图5是根据本申请第五实施例的示意图; 0064 图6是用来实现本申请实施例的视频概念检测方法的电子设备的框图。 具体实施方式 0065 以下结合附图对本申请的示范性实施例做出说明, 其中包括本申请实施例的各种 细节以助于理解, 应当将它们认为仅仅是示范性的。 因此, 本领域普通技术人员应当认识 到, 可以对这里描述的实施例做出各种改变和修改, 而不会背离本申请的范围和精神。 同 样, 为了清楚和简明, 以下的描述中省略了对公知功能和结构的描述。 0066 下面参考附图描述本申请实施例的视频概念检测方法。

27、、 装置以及电子设备。 0067 图1是根据本申请第一实施例的示意图。 其中, 需要说明的是, 本实施例提供的视 频概念检测方法的执行主体为视频概念检测装置, 视频概念检测装置具体可以为硬件设 备, 或者硬件设备中的软件等。 其中, 硬件设备例如终端设备、 服务器等。 0068 如图1所示, 视频概念检测方法具体实现过程如下: 0069 步骤101, 提取待处理视频的特征信息。 0070 本实施例中, 待处理视频的特征信息可以包括以下特征中的任意一种或者多种: 文本特征、 语音特征、 画面纹理特征、 运动特征、 实体特征、 实体内容特征。 0071 本实施例中, 语音特征是区分音乐、 影视、 。

28、动画等等不同类型电影的重要特征。 语 音特征的获取方式为, 采用语音滤波器对待处理视频对应的音频进行滤波处理, 得到待处 理视频的语音特征。 其中, 语音滤波器例如可以为, 听觉图像滤波器SAI(stabilized auditory image)。 0072 本实施例中, 画面纹理特征的获取方式为, 提取待处理视频中的关键帧, 例如每秒 提取一个关键帧, 对关键帧采用残差网络(ResNet)进行画面纹理提取, 得到待处理视频的 画面纹理特征。 0073 本实施例中, 运动特征的获取方式为, 对待处理视频的连续多帧图像采用视频动 作识别模型进行识别, 提取待处理视频的运动特征。 0074 本实。

29、施例中, 实体特征指的是待处理视频中的实体, 例如人物、 动物、 物品等。 实体 内容特征指的是待处理视频中实体的内容, 例如明星、 演员角色、 车型等。 文本特征指的是 待处理视频的文本信息中的名词、 动词、 数字等。 说明书 4/10 页 8 CN 111460971 A 8 0075 步骤102, 根据特征信息以及概念识别模型集合中各个概念对应的概念识别模型, 确定待处理视频属于各个概念的概率。 0076 本实施例中, 概念识别模型集合中包括各个概念对应的概念识别模型, 可以将待 处理视频的特征信息依次输入各个概念对应的概念识别模型, 获取待处理视频属于各个概 念的概率。 其中, 概念例。

30、如可以为电影、 电视剧、 动作片、 喜剧片等等。 其中, 概念对应的概念 识别模型的输入可以为视频的特征信息; 输出可以为视频属于该概念的概率。 0077 步骤103, 根据待处理视频属于各个概念的概率, 确定待处理视频所属的概念。 0078 本实施例中, 视频概念检测装置执行步骤103的过程具体可以为, 针对各个概念中 的每个概念, 判断待处理视频属于所述概念的概率是否大于预设概率阈值; 若待处理视频 属于所述概念的概率大于预设概率阈值, 则将所述概念确定为待处理视频所属的概念。 其 中, 预设概率阈值例如可以为0.5等, 可以根据实际需要进行设定。 0079 步骤104, 根据待处理视频所。

31、属的概念的概率, 对特征信息进行更新, 重新根据更 新后的特征信息以及概念识别模型集合, 确定待处理视频所属的概念, 直至满足预设的迭 代结束条件。 0080 本实施例中, 视频概念检测装置根据待处理视频所属的概念的概率, 对特征信息 进行更新的过程例如可以为, 将待处理视频所属的概念的概率作为特征添加到特征信息 中, 得到更新后的特征信息。 其中, 迭代结束条件例如可以为, 迭代次数大于预设次数阈值, 或者, 相邻多次迭代中待处理视频所属的概念的数量未发生变化。 0081 本实施例中, 为了扩展待处理视频所属的概念的数量, 步骤104之后, 所述的方法 还可以包括以下步骤: 针对待处理视频所。

32、属的每个概念, 查询概念图谱, 判断概念图谱中是 否存在概念对应的上级概念; 在概念图谱中存在概念对应的上级概念时, 将上级概念确定 为待处理视频所属的概念。 0082 本申请中, 概念图谱中包括多个概念之间的关系。 针对待处理视频所属的每个概 念, 视频概念检测装置可以计算该概念与概念图谱中各个概念的距离, 将对应的距离满足 预设距离阈值的概念确定为与该概念匹配的概念, 将概念图谱中匹配的概念的上级概念, 确定为待处理视频所属的概念。 0083 本实施例中, 获取待处理视频所属的概念后, 可以基于概念, 对待处理视频进行分 类、 检索以及推荐等, 提高视频管理效率、 分类效率、 检索效率以及。

33、推荐效率等。 0084 本申请实施例的视频概念检测方法, 通过提取待处理视频的特征信息; 根据特征 信息以及概念识别模型集合中各个概念对应的概念识别模型, 确定待处理视频属于各个概 念的概率; 根据待处理视频属于各个概念的概率, 确定待处理视频所属的概念; 根据待处理 视频所属的概念的概率, 对特征信息进行更新, 重新根据更新后的特征信息以及概念识别 模型集合, 确定待处理视频所属的概念, 直至满足预设的迭代结束条件, 从而能够根据待处 理视频的特征信息以及待处理视频所属的概念的概率, 对视频进行概念识别, 扩展了视频 的特征信息, 提高了视频概念的识别效率。 0085 图2为是根据本申请第二。

34、实施例的示意图。 如图2所示, 步骤102之前, 所属的方法 还可以包括以下步骤: 0086 步骤201, 对视频语料库中各个视频语料的文本信息进行概念提取处理, 生成概念 池。 说明书 5/10 页 9 CN 111460971 A 9 0087 本实施例中, 视频语料的文本信息例如可以为, 视频的标题、 标签、 描述信息等。 视 频概念检测装置对视频语料库中各个视频语料的文本信息进行概念提取处理的过程具体 可以为, 获取各个视频语料的文本信息; 对各个视频语料的文本信息进行分词以及语言处 理, 生成概念池; 去除潜在概念池中对应的频率位于预设频率范围外的概念; 对概念池中的 同义概念进行归。

35、一化处理。 0088 其中, 语言处理可以采用N-gram模型, 其中N例如可以为2、 3、 5等。 当N为2时, N- gram模型用于对任意两个分词词语进行组合, 并判断组合得到的短语是否合理, 并输出合 理的短语作为概念。 0089 步骤202, 为概念池中的每个概念构建概念识别模型和训练数据并进行训练, 将满 足训练要求的训练后概念识别模型添加到概念识别模型集合中。 0090 本实施例中, 视频概念检测装置可以为概念池中的每个概念构建概念识别模型和 训练数据。 其中, 构建的概念识别模型可以为初始的概念识别模型。 训练数据可以包括: 正 样本数据和负样本数据。 正样本数据包括: 对应的。

36、文本信息中包括概念的视频对应的特征 信息; 负样本数据包括: 对应的文本信息中不包括概念的视频对应的特征信息。 其中, 为了 进一步提高训练后概念识别模型的准确度, 负样本数据的数量例如可以为正样本数据的数 量的3倍以上。 0091 本实施例中, 可以根据视频语料库构建每个概念对应的训练数据以及多个批次的 验证数据。 批次的数量可以与模型训练时的最大迭代数量一致。 在步骤202中每个概念的概 念识别训练完成后, 可以采用一个批次的验证数据对训练后概念识别模型进行验证, 判断 训练后概念识别模型的准确度和召回率是否满足训练要求, 将满足训练要求的训练后概念 识别模型添加到概念识别模型集合中。 0。

37、092 步骤203, 获取对应的训练后概念识别模型不满足训练要求的第一概念, 根据概念 识别模型集合对第一概念的训练数据进行更新, 重新根据更新后的训练数据对第一概念的 概念识别模型进行训练, 直至满足预设的迭代训练结束条件。 0093 本实施例中, 视频概念检测装置根据概念识别模型集合对第一概念的训练数据进 行更新的过程例如可以为, 针对第一概念的训练数据中的每个视频, 将该视频的特征信息 输入概念识别模型集合中的各个概念的概念识别模型中, 获取视频属于所述各个概念的概 率, 将视频属于所述各个概念的概率作为特征添加到视频的特征信息中, 从而得到更新后 的训练数据。 对训练数据中视频的特征信。

38、息的扩展, 能够提高训练后概念识别模型的准确 度, 使得训练后概念识别模型满足训练要求。 0094 本实施例中, 迭代训练结束条件可以为, 迭代次数大于预设的迭代次数阈值, 或 者, 相邻多次迭代过程中概念识别模型集合中的概念识别模型数量未发生变化。 0095 本申请实施例的视频概念检测方法, 通过对视频语料库中各个视频语料的文本信 息进行概念提取处理, 生成概念池; 为概念池中的每个概念构建概念识别模型和训练数据 并进行训练, 将满足训练要求的训练后概念识别模型添加到概念识别模型集合中; 获取对 应的训练后概念识别模型不满足训练要求的第一概念, 根据概念识别模型集合对第一概念 的训练数据进行。

39、更新, 重新根据更新后的训练数据对第一概念的概念识别模型进行训练, 直至满足预设的迭代训练结束条件, 从而能够自动发现新的概念, 且能够针对新的概念训 练概念识别模型, 对概念识别模型集合中的概念识别模型进行扩展, 从而能够针对新的概 说明书 6/10 页 10 CN 111460971 A 10 念对待处理视频进行识别, 提高了视频概念的识别效率。 0096 为了实现图1至图2所述实施例, 本申请实施例还提出一种视频概念检测装置。 0097 图3是根据本申请第三实施例的示意图。 如图3所示, 该视频概念检测装置300包 括: 提取模块310、 第一确定模块320和第二确定模块330。 009。

40、8 其中, 提取模块310, 用于提取待处理视频的特征信息; 0099 第一确定模块320, 用于根据所述特征信息以及概念识别模型集合中各个概念对 应的概念识别模型, 确定所述待处理视频属于各个概念的概率; 0100 第二确定模块330, 用于根据所述待处理视频属于各个概念的概率, 确定所述待处 理视频所属的概念; 0101 所述第一确定模块320, 还用于根据所述待处理视频所属的概念的概率, 对所述特 征信息进行更新, 重新根据更新后的特征信息以及所述概念识别模型集合, 确定所述待处 理视频所属的概念, 直至满足预设的迭代结束条件。 0102 在本申请一个实施例中, 结合参考图4, 所述的装。

41、置还可以包括: 查询模块340和第 三确定模块350。 0103 其中, 所述查询模块340, 用于针对所述待处理视频所属的每个概念, 查询概念图 谱, 判断所述概念图谱中是否存在所述概念对应的上级概念; 0104 所述第三确定模块350, 用于在所述概念图谱中存在所述概念对应的上级概念时, 将所述上级概念确定为所述待处理视频所属的概念。 0105 在本申请一个实施例中, 所述待处理视频的特征信息包括以下特征中的任意一种 或者多种: 文本特征、 语音特征、 画面纹理特征、 运动特征、 实体特征、 实体内容特征。 0106 在本申请一个实施例中, 所述第二确定模块330具体用于, 0107 针对。

42、所述各个概念中的每个概念, 判断所述待处理视频属于所述概念的概率是否 大于预设概率阈值; 0108 若所述待处理视频属于所述概念的概率大于预设概率阈值, 则将所述概念确定为 所述待处理视频所属的概念。 0109 在本申请一个实施例中, 结合参考图5, 所述的装置还可以包括: 生成模块360和训 练模块370; 0110 所述生成模块360, 用于对视频语料库中各个视频语料的文本信息进行概念提取 处理, 生成概念池; 0111 所述训练模块370, 用于为所述概念池中的每个概念构建概念识别模型和训练数 据并进行训练, 将满足训练要求的训练后概念识别模型添加到概念识别模型集合中; 0112 所述训。

43、练模块370, 还用于获取对应的训练后概念识别模型不满足训练要求的第 一概念, 根据概念识别模型集合对所述第一概念的训练数据进行更新, 重新根据更新后的 训练数据对所述第一概念的概念识别模型进行训练, 直至满足预设的迭代训练结束条件。 0113 在本申请一个实施例中, 所述生成模块360具体用于, 获取所述各个视频语料的文 本信息; 对所述各个视频语料的文本信息进行分词以及语言处理, 生成概念池; 去除所述潜 在概念池中对应的频率位于预设频率范围外的概念; 对所述概念池中的同义概念进行归一 化处理。 0114 在本申请一个实施例中, 所述概念池中每个概念的训练数据包括: 正样本数据和 说明书 。

44、7/10 页 11 CN 111460971 A 11 负样本数据; 所述正样本数据包括: 对应的文本信息中包括所述概念的视频对应的特征信 息; 所述负样本数据包括: 对应的文本信息中不包括所述概念的视频对应的特征信息。 0115 本申请实施例的视频概念检测装置, 通过提取待处理视频的特征信息; 根据特征 信息以及概念识别模型集合中各个概念对应的概念识别模型, 确定待处理视频属于各个概 念的概率; 根据待处理视频属于各个概念的概率, 确定待处理视频所属的概念; 根据待处理 视频所属的概念的概率, 对特征信息进行更新, 重新根据更新后的特征信息以及概念识别 模型集合, 确定待处理视频所属的概念,。

45、 直至满足预设的迭代结束条件, 从而能够根据待处 理视频的特征信息以及待处理视频所属的概念的概率, 对视频进行概念识别, 扩展了视频 的特征信息, 提高了视频概念的识别效率。 0116 为了实现上述实施例, 本申请实施例还提出一种电子设备。 0117 如图6所示, 是根据本申请实施例的视频概念检测方法的电子设备的框图。 电子设 备旨在表示各种形式的数字计算机, 诸如, 膝上型计算机、 台式计算机、 工作台、 个人数字助 理、 服务器、 刀片式服务器、 大型计算机、 和其它适合的计算机。 电子设备还可以表示各种形 式的移动装置, 诸如, 个人数字处理、 蜂窝电话、 智能电话、 可穿戴设备和其它类。

46、似的计算装 置。 本文所示的部件、 它们的连接和关系、 以及它们的功能仅仅作为示例, 并且不意在限制 本文中描述的和/或者要求的本申请的实现。 0118 如图6所示, 该电子设备包括: 一个或多个处理器501、 存储器502, 以及用于连接各 部件的接口, 包括高速接口和低速接口。 各个部件利用不同的总线互相连接, 并且可以被安 装在公共主板上或者根据需要以其它方式安装。 处理器可以对在电子设备内执行的指令进 行处理, 包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如, 耦合至接口的 显示设备)上显示GUI的图形信息的指令。 在其它实施方式中, 若需要, 可以将多个处理器 和/或多条。

47、总线与多个存储器和多个存储器一起使用。 同样, 可以连接多个电子设备, 各个 设备提供部分必要的操作(例如, 作为服务器阵列、 一组刀片式服务器、 或者多处理器系 统)。 图6中以一个处理器501为例。 0119 存储器502即为本申请所提供的非瞬时计算机可读存储介质。 其中, 所述存储器存 储有可由至少一个处理器执行的指令, 以使所述至少一个处理器执行本申请所提供的视频 概念检测方法。 本申请的非瞬时计算机可读存储介质存储计算机指令, 该计算机指令用于 使计算机执行本申请所提供的视频概念检测方法。 0120 存储器502作为一种非瞬时计算机可读存储介质, 可用于存储非瞬时软件程序、 非 瞬时。

48、计算机可执行程序以及模块, 如本申请实施例中的视频概念检测方法对应的程序指 令/模块(例如, 附图3所示的提取模块310、 第一确定模块320、 第二确定模块330; 附图4所示 的查询模块340、 第三确定模块350; 附图5所示的生成模块360、 训练模块370)。 处理器501通 过运行存储在存储器502中的非瞬时软件程序、 指令以及模块, 从而执行服务器的各种功能 应用以及数据处理, 即实现上述方法实施例中的视频概念检测方法。 0121 存储器502可以包括存储程序区和存储数据区, 其中, 存储程序区可存储操作系 统、 至少一个功能所需要的应用程序; 存储数据区可存储根据视频概念检测的。

49、电子设备的 使用所创建的数据等。 此外, 存储器502可以包括高速随机存取存储器, 还可以包括非瞬时 存储器, 例如至少一个磁盘存储器件、 闪存器件、 或其他非瞬时固态存储器件。 在一些实施 例中, 存储器502可选包括相对于处理器501远程设置的存储器, 这些远程存储器可以通过 说明书 8/10 页 12 CN 111460971 A 12 网络连接至视频概念检测的电子设备。 上述网络的实例包括但不限于互联网、 企业内部网、 局域网、 移动通信网及其组合。 0122 视频概念检测方法的电子设备还可以包括: 输入装置503和输出装置504。 处理器 501、 存储器502、 输入装置503和输。

50、出装置504可以通过总线或者其他方式连接, 图6中以通 过总线连接为例。 0123 输入装置503可接收输入的数字或字符信息, 以及产生与视频概念检测的电子设 备的用户设置以及功能控制有关的键信号输入, 例如触摸屏、 小键盘、 鼠标、 轨迹板、 触摸 板、 指示杆、 一个或者多个鼠标按钮、 轨迹球、 操纵杆等输入装置。 输出装置504可以包括显 示设备、 辅助照明装置(例如, LED)和触觉反馈装置(例如, 振动电机)等。 该显示设备可以包 括但不限于, 液晶显示器(LCD)、 发光二极管(LED)显示器和等离子体显示器。 在一些实施方 式中, 显示设备可以是触摸屏。 0124 此处描述的系统。

展开阅读全文
内容关键字: 视频 概念 检测 方法 装置 以及 电子设备
关于本文
本文标题:视频概念检测方法、装置以及电子设备.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10610677.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1