基于深度学习的全卷积网络的哈希检索方法.pdf

上传人:v**** 文档编号:11047658 上传时间:2021-08-31 格式:PDF 页数:6 大小:378.37KB
收藏 版权申诉 举报 下载
基于深度学习的全卷积网络的哈希检索方法.pdf_第1页
第1页 / 共6页
基于深度学习的全卷积网络的哈希检索方法.pdf_第2页
第2页 / 共6页
基于深度学习的全卷积网络的哈希检索方法.pdf_第3页
第3页 / 共6页
文档描述:

《基于深度学习的全卷积网络的哈希检索方法.pdf》由会员分享,可在线阅读,更多相关《基于深度学习的全卷积网络的哈希检索方法.pdf(6页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910801726.8 (22)申请日 2019.08.28 (71)申请人 宁波大学 地址 315211 浙江省宁波市江北区风华路 818号 (72)发明人 袁明汶钱江波辛宇谢锡炯 陈海明 (74)专利代理机构 宁波奥圣专利代理事务所 (普通合伙) 33226 代理人 程天鹏 (51)Int.Cl. G06F 16/51(2019.01) G06F 16/55(2019.01) G06F 16/58(2019.01) G06K 9/62(2006.01) (54)发明名称。

2、 一种基于深度学习的全卷积网络的哈希检 索方法 (57)摘要 本发明公开了一种基于深度学习的全卷积 网络的哈希检索方法, 特点是首先从待检索图像 数据所在的原始图像数据集中选取训练数据集, 定义待训练的哈希模型, 将训练数据集随机打乱 后输入待训练的哈希模型, 根据输出结果与对应 的原始标签信息修正模型参数, 最终得到训练后 的哈希模型, 再用训练后的哈希模型分别对原始 图像数据集及待检索图像数据进行哈希编码, 最 后对待检索图像数据进行哈希检索; 优点是利用 哈希编码重构原始标签信息, 使得待训练的哈希 模型在学习二进制编码的同时, 能更加精细地利 用标签信息, 其中损失函数用于减少实值哈希。

3、编 码与二进制编码的损失, 从而提高检索效率和准 确性。 权利要求书1页 说明书3页 附图1页 CN 110688501 A 2020.01.14 CN 110688501 A 1.一种基于深度学习的全卷积网络的哈希检索方法, 其特征在于包括以下步骤: 定义待检索图像数据所在的图像数据集为原始图像数据集, 将原始图像数据集的M 个图像数据中任意选取m个图像数据作为训练数据集, m0.2M, 并对训练数据集中的每一 个图像数据设置对应的原始标签信息; 定义待训练的哈希模型, 包括输入数据层、 卷积子网络层、 全卷积层、 哈希层、 哈希编 码输出层和采用softmax分类器的分类输出层, 其中, 。

4、输入数据层用于输入训练数据集里的 图像数据, 卷积子网络层由五个卷积池化模块组成, 全卷积层连续两次的采用1024个11 的卷积核, 哈希层采用K个11的卷积核并采用光滑的tanh激活函数, 哈希编码输出层用于 输出哈希层得到的哈希编码; 随机打乱训练数据集中的m个图像数据得到打乱后的数据集, 将打乱后的数据集输 入待训练的哈希模型, 根据输出结果修正模型参数, 最终得到训练后的哈希模型, 具体过程 如下: -1设置最大迭代次数, 定义待训练的哈希模型的损失函数如下: minLT(W,b) 1Lc+ 2Lq, 其中,10.5,20.5, Lc表示softmax分类器输出的分类标签 信息与原始标。

5、签信息的误差,其中, h表示对哈希层输出的哈希编码进行离 散化操作后得到的二进制编码, s表示哈希层输出的哈希编码,表示h-s的2-范数的 平方; -2根据待训练的哈希模型的损失函数, 使用RMSProp优化算法对待训练的哈希模型 进行迭代优化, 直到达到设置的最大迭代次数时, 停止迭代过程, 得到训练后的哈希模型; 使用训练后的哈希模型对原始图像数据集进行哈希编码, 得到对应的原始图像数据 哈希编码, 使用训练后的哈希模型对待检索图像数据进行编码, 得到对应的待检索图像哈 希编码; 在原始图像数据哈希编码中查找出与待检索图像哈希编码的海明距离最近的数据, 并将该数据在原始图像数据集中对应的图。

6、像作为最终的检索结果, 完成对待检索图像数据 的哈希检索过程。 2.根据权利要求1所述的一种基于深度学习的全卷积网络哈希检索方法, 其特征在于 所述的步骤-1中设置最大迭代次数为10000次。 权利要求书 1/1 页 2 CN 110688501 A 2 一种基于深度学习的全卷积网络的哈希检索方法 技术领域 0001 本发明涉及一种图像检索方法, 尤其是一种基于深度学习的全卷积网络的哈希检 索方法。 背景技术 0002 随着数据规模和维度增大, 图像检索的代价急剧增加。 哈希作为一种实现图像高 效检索的重要方式, 受到了广泛的关注。 然而, 大多数图像哈希算法都是直接利用机器学习 机制将图像的。

7、特征映射为二进制编码, 这些特征无法有效地保证图像之间的语义相似性, 导致得到的编码检索效率较低。 发明内容 0003 本发明所要解决的技术问题是提供一种检索准确度较高的基于深度学习的全卷 积网络的哈希检索方法。 0004 本发明解决上述技术问题所采用的技术方案为: 一种基于深度学习的全卷积网络 哈希检索方法, 包括以下步骤: 0005 定义待检索图像数据所在的图像数据集为原始图像数据集, 将原始图像数据集 的M个图像数据中任意选取m个图像数据作为训练数据集, m0.2M, 并对训练数据集中的每 一个图像数据设置对应的原始标签信息; 0006 定义待训练的哈希模型, 包括输入数据层、 卷积子网。

8、络层、 全卷积层、 哈希层、 哈 希编码输出层和采用softmax分类器的分类输出层, 其中, 输入数据层用于输入训练数据集 里的图像数据, 卷积子网络层由五个卷积池化模块组成, 全卷积层连续两次的采用1024个1 1的卷积核, 哈希层采用K个11的卷积核并采用光滑的tanh激活函数, 哈希编码输出层 用于输出哈希层得到的哈希编码; 0007 随机打乱训练数据集中的m个图像数据得到打乱后的数据集, 将打乱后的数据 集输入待训练的哈希模型, 根据输出结果与对应的原始标签信息修正模型参数, 最终得到 训练后的哈希模型; 0008 使用训练后的哈希模型对原始图像数据集进行哈希编码, 得到对应的原始图。

9、像 数据哈希编码, 使用训练后的哈希模型对待检索图像数据进行编码, 得到对应的待检索图 像哈希编码; 0009 在原始图像数据哈希编码中查找出与待检索图像哈希编码的海明距离最近的 数据, 并将该数据在原始图像数据集中对应的图像作为最终的检索结果, 完成对待检索图 像数据的哈希检索过程。 0010 所述的步骤中将打乱后的数据集输入待训练的哈希模型, 根据输出结果与对应 的原始标签信息修正模型参数, 最终得到训练后的哈希模型的具体过程如下: 0011 -1设置最大迭代次数, 定义待训练的哈希模型的损失函数如下: 0012 minLT(W,b) 1Lc+ 2Lq, 其中,10.5,20.5, Lc表。

10、示softmax分类器输出的分类 说明书 1/3 页 3 CN 110688501 A 3 标签信息与原始标签信息的误差,其中, h表示对哈希层输出的哈希编码进 行离散化操作后得到的二进制编码, s表示哈希层输出的哈希编码,表示h-s的2-范 数的平方; 0013 -2根据待训练的哈希模型的损失函数, 使用RMSProp优化算法对待训练的哈希 模型进行迭代优化, 直到达到设置的最大迭代次数时, 停止迭代过程, 得到训练后的哈希模 型。 0014 所述的步骤-1中设置最大迭代次数为10000次。 保证哈希检索的准确度, 经过测 验, 最大迭代次数至少为10000次及以上。 0015 与现有技术相。

11、比, 本发明的优点在于首先从待检索图像数据所在的原始图像数据 集中选取训练数据集, 定义包括输入数据层、 卷积子网络层、 全卷积层、 哈希层、 哈希编码输 出层和采用softmax分类器的分类输出层的待训练的哈希模型, 该哈希模型采用卷积神经 网络, 将训练数据集随机打乱后输入待训练的哈希模型, 根据输出结果与对应的原始标签 信息修正模型参数, 最终得到训练后的哈希模型, 再用训练后的哈希模型分别对原始图像 数据集及待检索图像数据进行哈希编码, 最后在原始图像数据哈希编码中查找出与待检索 图像哈希编码的海明距离最近的数据, 并将该数据在原始图像数据集中对应的图像作为最 终的检索结果, 完成对待。

12、检索图像数据的哈希检索过程; 该方法中的哈希模型首先利用卷 积神经网络提取图像的高层语义特征; 接着为了增强网络对图像的学习能力, 增加全卷积 层进一步提升特征的表达能力; 最后, 在全卷积层与分类输出层之间添加隐藏层作为哈希 层, 利用哈希编码重构原始标签信息, 使得待训练的哈希模型在学习二进制编码的同时, 能 更加精细地利用标签信息, 其中损失函数用于减少实值哈希编码与二进制编码的损失, 从 而提高检索效率和准确性, 通过在标准图像数据集上的对比实验, 显示了采用本发明的哈 希检索方法对待检索图像数据进行检索的检索准确率较高。 附图说明 0016 图1为本发明的步骤流程图。 具体实施方式 。

13、0017 以下结合附图实施例对本发明作进一步详细描述。 0018 一种基于深度学习的全卷积网络的哈希检索方法, 包括以下步骤: 0019 定义待检索图像数据所在的图像数据集为原始图像数据集, 将原始图像数据集 的M个图像数据中任意选取m个图像数据作为训练数据集, m0.2M, 并对训练数据集中的每 一个图像数据设置对应的原始标签信息。 0020 定义待训练的哈希模型, 包括输入数据层、 卷积子网络层、 全卷积层、 哈希层、 哈 希编码输出层和采用softmax分类器的分类输出层, 其中, 输入数据层用于输入训练数据集 里的图像数据, 卷积子网络层由五个卷积池化模块组成, 全卷积层连续两次的采用。

14、1024个1 1的卷积核, 哈希层采用K个11的卷积核并采用光滑的tanh激活函数, 哈希编码输出层 用于输出哈希层得到的哈希编码。 0021 随机打乱训练数据集中的m个图像数据得到打乱后的数据集, 将打乱后的数据 说明书 2/3 页 4 CN 110688501 A 4 集输入待训练的哈希模型, 根据输出结果修正模型参数, 最终得到训练后的哈希模型,具体 过程如下: 0022 -1设置最大迭代次数为10000次, 定义待训练的哈希模型的损失函数如下: 0023 minLT(W,b) 1Lc+ 2Lq, 其中,10.5,20.5, Lc表示softmax分类器输出的分类 标签信息与原始标签信息。

15、的误差,其中, h表示对哈希层输出的哈希编码进 行离散化操作后得到的二进制编码, s表示哈希层输出的哈希编码,表示h-s的2-范 数的平方; 0024 -2根据待训练的哈希模型的损失函数, 使用RMSProp优化算法对待训练的哈希 模型进行迭代优化, 直到达到设置的最大迭代次数时, 停止迭代过程, 得到训练后的哈希模 型。 0025 使用训练后的哈希模型对原始图像数据集进行哈希编码, 得到对应的原始图像 数据哈希编码, 使用训练后的哈希模型对待检索图像数据进行编码, 得到对应的待检索图 像哈希编码。 0026 在原始图像数据哈希编码中查找出与待检索图像哈希编码的海明距离最近的 数据, 并将该数据在原始图像数据集中对应的图像作为最终的检索结果, 完成对待检索图 像数据的哈希检索过程。 说明书 3/3 页 5 CN 110688501 A 5 图1 说明书附图 1/1 页 6 CN 110688501 A 6 。

展开阅读全文
内容关键字: 基于 深度 学习 卷积 网络 检索 方法
关于本文
本文标题:基于深度学习的全卷积网络的哈希检索方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/11047658.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1