图像生成方法和装置及存储介质.pdf
《图像生成方法和装置及存储介质.pdf》由会员分享,可在线阅读,更多相关《图像生成方法和装置及存储介质.pdf(13页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010329281.0 (22)申请日 2020.04.23 (71)申请人 上海风秩科技有限公司 地址 200333 上海市普陀区真光路1473弄3 号4层、 5层、 6层 (72)发明人 黄楷梁新敏陈羲 (74)专利代理机构 北京康信知识产权代理有限 责任公司 11240 代理人 周婷婷 (51)Int.Cl. G06K 9/20(2006.01) G06F 16/583(2019.01) G06N 3/08(2006.01) G06Q 30/02(2012.01) G。
2、06T 11/60(2006.01) (54)发明名称 图像生成方法和装置及存储介质 (57)摘要 本发明公开了一种图像生成方法和装置及 存储介质。 该方法包括: 获取与待生成的目标图 像关联的多张候选图像, 多张候选图像为从数据 共享平台收集到的携带有用于推广目标主题的 文字信息的图像; 依次对多张候选图像的每张候 选图像进行特征提取, 得到多组候选特征对, 每 组候选特征对中包括从一张候选图像中提取出 的与目标主题关联的文字特征, 及从一张候选图 像中提取出的图像特征; 将多组候选特征对依次 输入图像生成模型; 根据图像生成模型的输出结 果, 获取具有目标主题的目标图像。 本发明解决 了由。
3、于手动设计图像所导致的图像生成效率较 低的问题的技术问题。 权利要求书2页 说明书7页 附图3页 CN 111553335 A 2020.08.18 CN 111553335 A 1.一种图像生成方法, 其特征在于, 包括: 获取与待生成的目标图像关联的多张候选图像, 其中, 所述多张候选图像为从数据共 享平台收集到的携带有用于推广目标主题的文字信息的图像; 依次对所述多张候选图像的每张候选图像进行特征提取, 得到多组候选特征对, 其中, 每组候选特征对中包括从一张候选图像中提取出的与所述目标主题关联的文字特征, 及从 所述一张候选图像中提取出的图像特征; 将所述多组候选特征对依次输入图像生成。
4、模型, 其中, 所述图像生成模型为利用多个 样本数据进行训练后得到的用于生成用于推广指定主题的图像的神经网络模型, 所述图像 生成模型中包括用于生成图像的生成子网络模型, 及用于识别所生成的图像是否为所述指 定主题的鉴定子网络模型; 根据所述图像生成模型的输出结果, 获取具有所述目标主题的所述目标图像。 2.根据权利要求1所述的方法, 其特征在于, 在所述将所述多组候选特征对依次输入图 像生成模型之后, 还包括: 在当前输入的为第i张候选图像的候选特征对的情况下, 利用所述第i张候选图像中提 取出的所述文字特征, 通过所述生成子网络模型生成与所述目标主题相匹配的对象图像, 其中, i为大于1,。
5、 且小于等的整数, N为所述多张候选图像的数量; 在所述鉴定子网络模型获取到所述对象图像的情况下, 鉴定所述对象图像与当前输入 的所述第i张候选图像是否为相同主题; 在所述对象图像输入的所述第i张候选图像为相同主题的情况下, 将所述对象图像确 定为所述目标图像。 3.根据权利要求1所述的方法, 其特征在于, 依次对所述多张候选图像的每张候选图像 进行特征提取, 得到多组候选特征对包括: 重复执行以下步骤, 直至遍历所述多张候选图像: 获取当前候选图像; 识别所述当前候选图像中与所述目标主题关联的文字信息; 对所述文字信息进行分词 和映射处理, 得到与所述当前候选图像对应的多个当前词向量, 并对。
6、所述多个当前词向量 进行聚合处理, 得到一组当前句向量; 将所述当前句向量确定为所述当前候选图像的文字 特征; 识别所述当前候选图像中的图像信息, 其中, 所述图像信息包括各个像素点的位置信 息及颜色信息; 根据所述图像信息确定所述图像特征。 4.根据权利要求1所述的方法, 其特征在于, 在所述获取与待生成的目标图像关联的多 张候选图像之前, 还包括: 获取多个样本数据, 其中, 所述多个样本数据包括第一类样本数据和第二类样本数据, 其中, 所述第一类样本数据为相同主题的图像数据, 所述第二类样本数据为不同主题的图 像数据; 利用所述多个样本数据对初始化的图像生成模型进行训练, 以得到所述图像。
7、生成模 型。 5.根据权利要求1所述的方法, 其特征在于, 所述获取与待生成的目标图像关联的多张 候选图像包括: 权利要求书 1/2 页 2 CN 111553335 A 2 获取搜索请求, 其中, 所述搜索请求中携带有所述目标主题的关键词; 响应所述搜索请求, 从所述数据共享平台中查找到具有所述目标主题的所述多张候选 图像。 6.根据权利要求1至5中任一项所述的方法, 其特征在于, 所述图像生成模型为基于 stackGAN模型构建。 7.一种图像生成装置, 其特征在于, 包括: 第一获取单元, 用于获取与待生成的目标图像关联的多张候选图像, 其中, 所述多张候 选图像为从数据共享平台收集到的。
8、携带有用于推广目标主题的文字信息的图像; 提取单元, 用于依次对所述多张候选图像的每张候选图像进行特征提取, 得到多组候 选特征对, 其中, 每组候选特征对中包括从一张候选图像中提取出的与所述目标主题关联 的文字特征, 及从所述一张候选图像中提取出的图像特征; 输入单元, 用于将所述多组候选特征对依次输入图像生成模型, 其中, 所述图像生成模 型为利用多个样本数据进行训练后得到的用于生成用于推广指定主题的图像的神经网络 模型, 所述图像生成模型中包括用于生成图像的生成子网络模型, 及用于识别所生成的图 像是否为所述指定主题的鉴定子网络模型; 第二获取单元, 用于根据所述图像生成模型的输出结果,。
9、 获取具有所述目标主题的所 述目标图像。 8.根据权利要求7所述的装置, 其特征在于, 还包括: 生成单元, 用于在所述将所述多组候选特征对依次输入图像生成模型之后, 在当前输 入的为第i张候选图像的候选特征对的情况下, 利用所述第i张候选图像中提取出的所述文 字特征, 通过所述生成子网络模型生成与所述目标主题相匹配的对象图像, 其中, i为大于 1, 且小于等的整数, N为所述多张候选图像的数量; 鉴定单元, 用于在所述鉴定子网络模型获取到所述对象图像的情况下, 鉴定所述对象 图像与当前输入的所述第i张候选图像是否为相同主题; 确定单元, 用于在所述对象图像输入的所述第i张候选图像为相同主题。
10、的情况下, 将所 述对象图像确定为所述目标图像。 9.根据权利要求7所述的装置, 其特征在于, 所述输入单元包括: 处理模块, 用于重复执行以下步骤, 直至遍历所述多张候选图像: 获取当前候选图像; 识别所述当前候选图像中与所述目标主题关联的文字信息; 对所述文字信息进行分词和映 射处理, 得到与所述当前候选图像对应的多个当前词向量, 并对所述多个当前词向量进行 聚合处理, 得到一组当前句向量; 将所述当前句向量确定为所述当前候选图像的文字特征; 识别所述当前候选图像中的图像信息, 其中, 所述图像信息包括各个像素点的位置信息及 颜色信息; 根据所述图像信息确定所述图像特征。 10.一种计算机。
11、可读的存储介质, 所述计算机可读的存储介质包括存储的程序, 其中, 所述程序运行时执行所述权利要求1至6任一项中所述的方法。 权利要求书 2/2 页 3 CN 111553335 A 3 图像生成方法和装置及存储介质 技术领域 0001 本发明涉及计算机领域, 具体而言, 涉及一种图像生成方法和装置及存储介质。 背景技术 0002 如今, 对于海报等图像进行创意设计时, 通常是由专业人员进行手动设计处理。 例 如运营人员进行需求发布, 请相关美工人员进行海报或者宣传报方面的设计。 但这种手动 设计海报等用于推广宣传的图像的方法, 往往耗时较长, 设计的图像数量有限, 导致图像生 成效率较低的问。
12、题。 0003 针对上述的问题, 目前尚未提出有效的解决方案。 发明内容 0004 本发明实施例提供了一种图像生成方法和装置及存储介质, 以至少解决由于手动 设计图像所导致的图像生成效率较低的问题的技术问题。 0005 根据本发明实施例的一个方面, 提供了一种图像生成方法, 包括: 获取与待生成的 目标图像关联的多张候选图像, 其中, 上述多张候选图像为从数据共享平台收集到的携带 有用于推广目标主题的文字信息的图像; 依次对上述多张候选图像的每张候选图像进行特 征提取, 得到多组候选特征对, 其中, 每组候选特征对中包括从一张候选图像中提取出的与 上述目标主题关联的文字特征, 及从上述一张候选。
13、图像中提取出的图像特征; 将上述多组 候选特征对依次输入图像生成模型, 其中, 上述图像生成模型为利用多个样本数据进行训 练后得到的用于生成用于推广指定主题的图像的神经网络模型, 上述图像生成模型中包括 用于生成图像的生成子网络模型, 及用于识别所生成的图像是否为上述指定主题的鉴定子 网络模型; 根据上述图像生成模型的输出结果, 获取具有上述目标主题的上述目标图像。 0006 作为一种可选的实施方式, 在上述将上述多组候选特征对依次输入图像生成模型 之后, 还包括: 在当前输入的为第i张候选图像的候选特征对的情况下, 利用上述第i张候选 图像中提取出的上述文字特征, 通过上述生成子网络模型生成。
14、与上述目标主题相匹配的对 象图像, 其中, i为大于1, 且小于等的整数, N为上述多张候选图像的数量; 在上述鉴定子网 络模型获取到上述对象图像的情况下, 鉴定上述对象图像与当前输入的上述第i张候选图 像是否为相同主题; 在上述对象图像输入的上述第i张候选图像为相同主题的情况下, 将上 述对象图像确定为上述目标图像。 0007 作为一种可选的实施方式, 依次对上述多张候选图像的每张候选图像进行特征提 取, 得到多组候选特征对包括: 重复执行以下步骤, 直至遍历上述多张候选图像: 获取当前 候选图像; 识别上述当前候选图像中与上述目标主题关联的文字信息; 对上述文字信息进 行分词和映射处理, 。
15、得到与上述当前候选图像对应的多个当前词向量, 并对上述多个当前 词向量进行聚合处理, 得到一组当前句向量; 将上述当前句向量确定为上述当前候选图像 的文字特征; 识别上述当前候选图像中的图像信息, 其中, 上述图像信息包括各个像素点的 位置信息及颜色信息; 根据上述图像信息确定上述图像特征。 说明书 1/7 页 4 CN 111553335 A 4 0008 作为一种可选的实施方式, 在上述获取与待生成的目标图像关联的多张候选图像 之前, 还包括: 获取多个样本数据, 其中, 上述多个样本数据包括第一类样本数据和第二类 样本数据, 其中, 上述第一类样本数据为相同主题的图像数据, 上述第二类样。
16、本数据为不同 主题的图像数据; 利用上述多个样本数据对初始化的图像生成模型进行训练, 以得到上述 图像生成模型。 0009 作为一种可选的实施方式, 上述获取与待生成的目标图像关联的多张候选图像包 括: 获取搜索请求, 其中, 上述搜索请求中携带有上述目标主题的关键词; 响应上述搜索请 求, 从上述数据共享平台中查找到具有上述目标主题的上述多张候选图像。 0010 作为一种可选的实施方式, 上述图像生成模型为基于stackGAN模型构建。 0011 根据本发明实施例的另一方面, 还提供了一种图像生成装置, 包括: 第一获取单 元, 用于获取与待生成的目标图像关联的多张候选图像, 其中, 上述多。
17、张候选图像为从数据 共享平台收集到的携带有用于推广目标主题的文字信息的图像; 提取单元, 用于依次对上 述多张候选图像的每张候选图像进行特征提取, 得到多组候选特征对, 其中, 每组候选特征 对中包括从一张候选图像中提取出的与上述目标主题关联的文字特征, 及从上述一张候选 图像中提取出的图像特征; 输入单元, 用于将上述多组候选特征对依次输入图像生成模型, 其中, 上述图像生成模型为利用多个样本数据进行训练后得到的用于生成用于推广指定主 题的图像的神经网络模型, 上述图像生成模型中包括用于生成图像的生成子网络模型, 及 用于识别所生成的图像是否为上述指定主题的鉴定子网络模型; 第二获取单元, 。
18、用于根据 上述图像生成模型的输出结果, 获取具有上述目标主题的上述目标图像。 0012 作为一种可选的实施方式, 还包括: 生成单元, 用于在上述将上述多组候选特征对 依次输入图像生成模型之后, 在当前输入的为第i张候选图像的候选特征对的情况下, 利用 上述第i张候选图像中提取出的上述文字特征, 通过上述生成子网络模型生成与上述目标 主题相匹配的对象图像, 其中, i为大于1, 且小于等的整数, N为上述多张候选图像的数量; 鉴定单元, 用于在上述鉴定子网络模型获取到上述对象图像的情况下, 鉴定上述对象图像 与当前输入的上述第i张候选图像是否为相同主题; 确定单元, 用于在上述对象图像输入的 。
19、上述第i张候选图像为相同主题的情况下, 将上述对象图像确定为上述目标图像。 0013 作为一种可选的实施方式, 上述输入单元包括: 处理模块, 用于重复执行以下步 骤, 直至遍历上述多张候选图像: 获取当前候选图像; 识别上述当前候选图像中与上述目标 主题关联的文字信息; 对上述文字信息进行分词和映射处理, 得到与上述当前候选图像对 应的多个当前词向量, 并对上述多个当前词向量进行聚合处理, 得到一组当前句向量; 将上 述当前句向量确定为上述当前候选图像的文字特征; 识别上述当前候选图像中的图像信 息, 其中, 上述图像信息包括各个像素点的位置信息及颜色信息; 根据上述图像信息确定上 述图像特。
20、征。 0014 根据本发明实施例的又一方面, 还提供了一种计算机可读的存储介质, 该计算机 可读的存储介质中存储有计算机程序, 其中, 该计算机程序被设置为运行时执行上述图像 生成方法。 0015 在本发明实施例中, 在本实施例中, 在获取与待生成的目标图像为相同目标主题 的多张候选图像之后, 从该多张候选图像中分别进行特征提取, 以得到多组候选特征对, 并 将该多组候选特征对依次输入图像生成模型, 以输出得到目标主题的目标图像。 从而实现 说明书 2/7 页 5 CN 111553335 A 5 自动生成推广宣传图像, 而不再需要专业人员手动设计大量推广宣传图像, 以达到节省图 像生成时间,。
21、 提高图像生成效率的目的, 进而解决了由于手动设计图像所导致的图像生成 效率较低的问题的技术问题。 附图说明 0016 此处所说明的附图用来提供对本发明的进一步理解, 构成本申请的一部分, 本发 明的示意性实施例及其说明用于解释本发明, 并不构成对本发明的不当限定。 在附图中: 0017 图1是根据本发明实施例的一种可选的图像生成方法的流程图; 0018 图2是根据本发明实施例的一种可选的图像生成方法的示意图; 0019 图3是根据本发明实施例的另一种可选的图像生成方法的示意图; 0020 图4是根据本发明实施例的另一种可选的图像生成方法的流程图; 0021 图5是根据本发明实施例的一种可选的。
22、图像生成装置的结构示意图。 具体实施方式 0022 为了使本技术领域的人员更好地理解本发明方案, 下面将结合本发明实施例中的 附图, 对本发明实施例中的技术方案进行清楚、 完整地描述, 显然, 所描述的实施例仅仅是 本发明一部分的实施例, 而不是全部的实施例。 基于本发明中的实施例, 本领域普通技术人 员在没有做出创造性劳动前提下所获得的所有其他实施例, 都应当属于本发明保护的范 围。 0023 需要说明的是, 本发明的说明书和权利要求书及上述附图中的术语 “第一” 、“第 二” 等是用于区别类似的对象, 而不必用于描述特定的顺序或先后次序。 应该理解这样使用 的数据在适当情况下可以互换, 以。
23、便这里描述的本发明的实施例能够以除了在这里图示或 描述的那些以外的顺序实施。 此外, 术语 “包括” 和 “具有” 以及他们的任何变形, 意图在于覆 盖不排他的包含, 例如, 包含了一系列步骤或单元的过程、 方法、 系统、 产品或设备不必限于 清楚地列出的那些步骤或单元, 而是可包括没有清楚地列出的或对于这些过程、 方法、 产品 或设备固有的其它步骤或单元。 0024 根据本发明实施例的一个方面, 提供了一种图像生成方法, 可选地, 作为一种可选 的实施方式, 如图1所示, 上述图像生成方法包括: 0025 S102, 获取与待生成的目标图像关联的多张候选图像, 其中, 多张候选图像为从数 据。
24、共享平台收集到的携带有用于推广目标主题的文字信息的图像; 0026 S104, 依次对多张候选图像的每张候选图像进行特征提取, 得到多组候选特征对, 其中, 每组候选特征对中包括从一张候选图像中提取出的与目标主题关联的文字特征, 及 从一张候选图像中提取出的图像特征; 0027 S106, 将多组候选特征对依次输入图像生成模型, 其中, 图像生成模型为利用多个 样本数据进行训练后得到的用于生成用于推广指定主题的图像的神经网络模型, 图像生成 模型中包括用于生成图像的生成子网络模型, 及用于识别所生成的图像是否为指定主题的 鉴定子网络模型; 0028 S108, 根据图像生成模型的输出结果, 获。
25、取具有目标主题的目标图像。 0029 可选地, 在本实施例中, 上述图像生成方法可以但不限于应用于生成用于推广宣 说明书 3/7 页 6 CN 111553335 A 6 传的图像的生成过程中, 如广告图像、 海报图像、 宣传图像等等。 也就是说, 在本实施例中, 在获取与待生成的目标图像为相同目标主题的多张候选图像之后, 从该多张候选图像中分 别进行特征提取, 以得到多组候选特征对, 并将该多组候选特征对依次输入图像生成模型, 以输出得到目标主题的目标图像。 从而实现自动生成推广宣传图像, 而不再需要专业人员 手动设计大量推广宣传图像, 以达到节省图像生成时间, 提高图像生成效率的目的, 进。
26、而克 服相关技术中图像生成效率较低的问题。 上述仅是一种示例, 本实施例中对此不做任何限 定。 0030 可选地, 在本实施例中, 上述图像生成模型可以但不限于为基于stackGAN模型构 建。 其中, stackGAN模型可以但不限于是树状结构的多个生成器和鉴别器生成, 从树的不同 分支生成对应于同一场景的多尺度图像。 0031 可选地, 在本实施例中, 上述图像生成模型在识别出候选图像中与目标主题关联 的文字信息之后, 将对文字信息进行分词和映射处理, 得到与候选图像对应的词向量, 并对 该词向量进行聚合处理, 得到句向量; 从而将该句向量确定为候选图像的文字特征。 上述图 像生成模型在识。
27、别出候选图像中的图像信息之后, 可以根据该图像信息确定图像特征。 0032 例如, 上述图像生成模型可以如图2所示。 在获取到多张候选图像之后, 提取候选 图像中的文字信息, 如图2中加粗实线方框所示。 然后将上述文字进行分词、 映射和聚合处 理, 得到句向量, 作为文字特征, 如图2中加粗虚线方框所示。 然后将上述文字特征输入图像 生成模型。 然后得到预测生成的候选目标图像, 如图2中加粗虚线圆框所示。 将根据上述候 选图像的图像信息确定出的图像特征与候选目标图像, 再次输入模型, 其中, 根据上述候选 图像的图像信息确定出的图像特征如图2中加粗实线圆框所示。 进一步进行分析得到目标 主题的。
28、目标图像。 0033 可选地, 在本实施例中, 获取与待生成的目标图像关联的多张候选图像包括: 获取 搜索请求, 其中, 搜索请求中携带有目标主题的关键词; 响应搜索请求, 从数据共享平台中 查找到具有目标主题的多张候选图像。 0034 需要说明的是, 上述数据共享平台可以但不限于共享空间应用、 即时通信应用等 应用平台, 如微信公众号。 上述多张候选图像可以但不限于为微信公众号中提供的图像。 例 如, 如图3所示, 在某微信公众号中包括有宣传海报, 显示有2019年12月24日发布的文字信 息:【积分兑换】 绝不能错过的红色。 红色可以出挑亮眼, 也可以低调温柔, 尤其是圣诞季必 不可少, 。
29、你是不是还差一点红色装备呢。 0035 通过本申请提供的实施例, 在获取与待生成的目标图像为相同目标主题的多张候 选图像之后, 从该多张候选图像中分别进行特征提取, 以得到多组候选特征对, 并将该多组 候选特征对依次输入图像生成模型, 以输出得到目标主题的目标图像。 从而实现自动生成 推广宣传图像, 而不再需要专业人员手动设计大量推广宣传图像, 以达到节省图像生成时 间, 提高图像生成效率的目的, 进而克服相关技术中图像生成效率较低的问题。 0036 作为一种可选的方案, 在将多组候选特征对依次输入图像生成模型之后, 还包括: 0037 S1, 在当前输入的为第i张候选图像的候选特征对的情况下。
30、, 利用第i张候选图像 中提取出的文字特征, 通过生成子网络模型生成与目标主题相匹配的对象图像, 其中, i为 大于1, 且小于等的整数, N为多张候选图像的数量; 0038 S2, 在鉴定子网络模型获取到对象图像的情况下, 鉴定对象图像与当前输入的第i 说明书 4/7 页 7 CN 111553335 A 7 张候选图像是否为相同主题; 0039 S3, 在对象图像输入的第i张候选图像为相同主题的情况下, 将对象图像确定为目 标图像。 0040 可选地, 在本实施例中, 在获取与待生成的目标图像关联的多张候选图像之前, 还 包括: 取多个样本数据, 其中, 多个样本数据包括第一类样本数据和第。
31、二类样本数据, 其中, 第一类样本数据为相同主题的图像数据, 第二类样本数据为不同主题的图像数据; 利用多 个样本数据对初始化的图像生成模型进行训练, 以得到图像生成模型。 0041 可选地, 在本实施例中, 依次对多张候选图像的每张候选图像进行特征提取, 得到 多组候选特征对包括: 0042 重复执行以下步骤, 直至遍历多张候选图像: 0043 获取当前候选图像; 0044 识别当前候选图像中与目标主题关联的文字信息; 对文字信息进行分词和映射处 理, 得到与当前候选图像对应的多个当前词向量, 并对多个当前词向量进行聚合处理, 得到 一组当前句向量; 将当前句向量确定为当前候选图像的文字特征。
32、; 0045 识别当前候选图像中的图像信息, 其中, 图像信息包括各个像素点的位置信息及 颜色信息; 根据图像信息确定图像特征。 0046 具体结合以下图4所示S402至S410进行说明: 0047 获取搜索请求, 其中, 该搜索请求中携带有目标主题的关键词(假设是目标产品的 关键词)。 响应该搜索请求, 从数据共享平台(如微信公众号)中查找到具有上述目标主题的 多张候选图像。 这里多张候选图像可以为与目标产品相关的历史海报, 也可以为与目标产 品为竞品的海报, 如步骤S402。 0048 采用图像识别技术(如光学字符识别, Optical Character Recognition, 简称 。
33、OCR), 识别每张候选图像中与目标产品的目标主题关联的文字信息, , 如步骤S404。 例如, 提 取标题(如图3所示标题 “积分兑换, 绝不能错过的红色” )或提取文章中的文字(如图3所示 文字 “红色可以出挑亮眼, 也可以低调温柔, 尤其是圣诞季必不可少, 你是不是还差一点红 色装备呢” )。 0049 然后对上述提取到的文字信息进行分词处理, (如使用jieba分词、 SnowNLP、 FoolNLTK、 ansj、 等等分词工具), 如步骤S406。 0050 进一步, 使用wordembedding(词向量)映射算法, 将每个词映射到稠密维度中(例 如200维度), 得到多个词向量。
34、。 其中, wordembedding映射算法可以但不限于是将文本空间 中的词, 映射到另一个数值向量空间。 在获得全部词向量之后, 对这些词向量进行聚合, 得 到句向量, 作为候选图像的文字特征。 这里句向量可以但不限于视作每个词向量对应维度 求平均的结果, 如步骤S408。 0051 然后将上述从候选图像中提取到的文字特征及提取到的图像特征输入基于 stackGAN构建的训练好的图像生成模型, 以得到对应的目标图像, , 如步骤S410, 从而实现 辅助设计人员快速生成用于推广宣传的海报。 0052 通过本申请提供的实施例, 通过基于stackGAN构建的训练好的图像生成模型来识 别候选图。
35、像, 从而实现基于候选图像来自动生成目标图像, 而无需专业人员再手动设计, 提 高了图像生成效率, 进而提高了基于目标图像进行推广的效率。 说明书 5/7 页 8 CN 111553335 A 8 0053 需要说明的是, 对于前述的各方法实施例, 为了简单描述, 故将其都表述为一系列 的动作组合, 但是本领域技术人员应该知悉, 本发明并不受所描述的动作顺序的限制, 因为 依据本发明, 某些步骤可以采用其他顺序或者同时进行。 其次, 本领域技术人员也应该知 悉, 说明书中所描述的实施例均属于优选实施例, 所涉及的动作和模块并不一定是本发明 所必须的。 0054 根据本发明实施例的另一个方面, 。
36、还提供了一种用于实施上述图像生成方法的图 像生成装置。 如图5所示, 该装置包括: 0055 1)第一获取单元502, 用于获取与待生成的目标图像关联的多张候选图像, 其中, 多张候选图像为从数据共享平台收集到的携带有用于推广目标主题的文字信息的图像; 0056 2)提取单元504, 用于依次对多张候选图像的每张候选图像进行特征提取, 得到多 组候选特征对, 其中, 每组候选特征对中包括从一张候选图像中提取出的与目标主题关联 的文字特征, 及从一张候选图像中提取出的图像特征; 0057 3)输入单元506, 用于将多组候选特征对依次输入图像生成模型, 其中, 图像生成 模型为利用多个样本数据进。
37、行训练后得到的用于生成用于推广指定主题的图像的神经网 络模型, 图像生成模型中包括用于生成图像的生成子网络模型, 及用于识别所生成的图像 是否为指定主题的鉴定子网络模型; 0058 4)第二获取单元508, 用于根据图像生成模型的输出结果, 获取具有目标主题的目 标图像。 0059 本方案中的实施例, 可以但不限于参照上述方法实施例, 本实施例中对此不作任 何限定。 0060 作为一种可选的方案, 还包括: 0061 1)生成单元, 用于在将多组候选特征对依次输入图像生成模型之后, 在当前输入 的为第i张候选图像的候选特征对的情况下, 利用第i张候选图像中提取出的文字特征, 通 过生成子网络模。
38、型生成与目标主题相匹配的对象图像, 其中, i为大于1, 且小于等的整数, N 为多张候选图像的数量; 0062 2)鉴定单元, 用于在鉴定子网络模型获取到对象图像的情况下, 鉴定对象图像与 当前输入的第i张候选图像是否为相同主题; 0063 3)确定单元, 用于在对象图像输入的第i张候选图像为相同主题的情况下, 将对象 图像确定为目标图像。 0064 本方案中的实施例, 可以但不限于参照上述方法实施例, 本实施例中对此不作任 何限定。 0065 作为一种可选的方案, 输入单元包括: 0066 1)处理模块, 用于重复执行以下步骤, 直至遍历多张候选图像: 获取当前候选图 像; 识别当前候选图。
39、像中与目标主题关联的文字信息; 对文字信息进行分词和映射处理, 得 到与当前候选图像对应的多个当前词向量, 并对多个当前词向量进行聚合处理, 得到一组 当前句向量; 将当前句向量确定为当前候选图像的文字特征; 识别当前候选图像中的图像 信息, 其中, 图像信息包括各个像素点的位置信息及颜色信息; 根据图像信息确定图像特 征。 0067 本方案中的实施例, 可以但不限于参照上述方法实施例, 本实施例中对此不作任 说明书 6/7 页 9 CN 111553335 A 9 何限定。 0068 根据本发明的实施例的又一方面, 还提供了一种计算机可读的存储介质, 该计算 机可读的存储介质中存储有计算机程。
40、序, 其中, 该计算机程序被设置为运行时执行上述任 一项方法实施例中的步骤。 0069 可选地, 在本实施例中, 上述计算机可读的存储介质可以被设置为存储用于执行 以下步骤的计算机程序: 0070 可选地, 在本实施例中, 本领域普通技术人员可以理解上述实施例的各种方法中 的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成, 该程序可以存储于 一计算机可读存储介质中, 存储介质可以包括: 闪存盘、 只读存储器(Read-Only Memory, ROM)、 随机存取器(Random Access Memory, RAM)、 磁盘或光盘等。 0071 上述本发明实施例序号仅仅为了描述,。
41、 不代表实施例的优劣。 0072 上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品 销售或使用时, 可以存储在上述计算机可读取的存储介质中。 基于这样的理解, 本发明的技 术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软 件产品的形式体现出来, 该计算机软件产品存储在存储介质中, 包括若干指令用以使得一 台或多台计算机设备(可为个人计算机、 服务器或者网络设备等)执行本发明各个实施例所 述方法的全部或部分步骤。 0073 在本发明的上述实施例中, 对各个实施例的描述都各有侧重, 某个实施例中没有 详述的部分, 可以参见其他实施例的相关描述。 00。
42、74 在本申请所提供的几个实施例中, 应该理解到, 所揭露的客户端, 可通过其它的方 式实现。 其中, 以上所描述的装置实施例仅仅是示意性的, 例如所述单元的划分, 仅仅为一 种逻辑功能划分, 实际实现时可以有另外的划分方式, 例如多个单元或组件可以结合或者 可以集成到另一个系统, 或一些特征可以忽略, 或不执行。 另一点, 所显示或讨论的相互之 间的耦合或直接耦合或通信连接可以是通过一些接口, 单元或模块的间接耦合或通信连 接, 可以是电性或其它的形式。 0075 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的, 作为单元显 示的部件可以是或者也可以不是物理单元, 即可以位于一个。
43、地方, 或者也可以分布到多个 网络单元上。 可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目 的。 0076 另外, 在本发明各个实施例中的各功能单元可以集成在一个处理单元中, 也可以 是各个单元单独物理存在, 也可以两个或两个以上单元集成在一个单元中。 上述集成的单 元既可以采用硬件的形式实现, 也可以采用软件功能单元的形式实现。 0077 以上所述仅是本发明的优选实施方式, 应当指出, 对于本技术领域的普通技术人 员来说, 在不脱离本发明原理的前提下, 还可以做出若干改进和润饰, 这些改进和润饰也应 视为本发明的保护范围。 说明书 7/7 页 10 CN 111553335 A 10 图1 图2 说明书附图 1/3 页 11 CN 111553335 A 11 图3 图4 说明书附图 2/3 页 12 CN 111553335 A 12 图5 说明书附图 3/3 页 13 CN 111553335 A 13 。
- 内容关键字: 图像 生成 方法 装置 存储 介质
一体式安全吊钳.pdf
漂浮电缆.pdf
线缆托架.pdf
防腐防潮的海洋监测设备固定装置.pdf
超声波布面预湿分解设备.pdf
道路边坡结构.pdf
多工位伺服系统.pdf
智慧采油装备.pdf
油气分离滤芯.pdf
公路裂缝修补装置.pdf
电解槽的极距测量装置.pdf
混凝土抗裂检测装置.pdf
多相流泵.pdf
高电压高倍率球形锰酸锂球磨混料机.pdf
卷扬机卷筒结构.pdf
防尘防砂式排气嘴结构.pdf
外科临床管路固定装置.pdf
免维护激振器.pdf
流延机自动对刀装置.pdf
全氢强对流罩式炉.pdf
表演机器人模型控制系统.pdf
亚跨超声速流场可控喷管的设计方法、装置、设备和介质.pdf
区块链协助搜索的物联网数据共享方法.pdf
油侧膜头装置及隔膜式压缩机.pdf
自动化PCB板测试系统.pdf
海洋藻类污染治理作业装备.pdf
抗鸡PML单克隆抗体及其应用.pdf
矿用液压油缸的定时养护装置.pdf
射频复电容率测量装置及方法.pdf
便携式一体化海水淡化器.pdf
快速定位及自动退料的冲压模具.pdf
基于灰水足迹的减污降碳协同度分析方法.pdf
一种采集图像信息的方法及电子设备.pdf
太阳能电子手表.pdf
一种利用逆变器与蓄电池充电装置的绿化修剪机.pdf
一种润滑膜温度试验方法与装置.pdf
偏斜滚子摩擦副润滑油膜测量实验台.pdf
用于确定接地故障的位置的方法和设备.pdf
一种冷饮用上淋果酱及其制备方法.pdf
MOS晶体管测试电路及对应的测试方法.pdf
电能质量数据可视化展示方法及装置.pdf
设置荧光层和水位标示层的水杯.pdf
一种基于ASU策略的多目标粒子群优化算法.pdf
一种低码率语音编码器以及解码器.pdf
一种电力输电线路在线监测系统.pdf
一种核桃树下种鸡腿菇的拱棚.pdf
利用野生茄种子驯化及培育优良砧木种苗的方法.pdf
一种快速判断药品真伪及报警的系统.pdf
一种自助点餐方法.pdf
一种污泥含水率的分析方法.pdf
一种染料敏化太阳能电池织物光阳极及其制备方法.pdf