目标检测网络训练方法、装置及电子设备.pdf

上传人:sha****007 文档编号:11717670 上传时间:2021-10-15 格式:PDF 页数:27 大小:1.25MB
收藏 版权申诉 举报 下载
目标检测网络训练方法、装置及电子设备.pdf_第1页
第1页 / 共27页
目标检测网络训练方法、装置及电子设备.pdf_第2页
第2页 / 共27页
目标检测网络训练方法、装置及电子设备.pdf_第3页
第3页 / 共27页
文档描述:

《目标检测网络训练方法、装置及电子设备.pdf》由会员分享,可在线阅读,更多相关《目标检测网络训练方法、装置及电子设备.pdf(27页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910277616.6 (22)申请日 2019.04.08 (71)申请人 北京奇艺世纪科技有限公司 地址 100080 北京市海淀区海淀北一街2号 鸿城拓展大厦10、 11层 (72)发明人 王冬冬 (74)专利代理机构 北京柏杉松知识产权代理事 务所(普通合伙) 11413 代理人 丁芸项京 (51)Int.Cl. G06K 9/00(2006.01) G06K 9/32(2006.01) G06N 3/04(2006.01) (54)发明名称 一种目标检测网络训练方。

2、法、 装置及电子设 备 (57)摘要 本发明实施例提供了一种目标检测网络训 练方法、 装置及电子设备, 其中, 该方法包括: 获 取携带目标的样本和未携带目标的样本, 将携带 目标的样本输入至第一SSD网络, 得到第一SSD网 络中的第一输出层输出的类别损失和位置损失; 并将未携带目标的样本输入至第二SSD网络, 得 到第二SSD网络中的第二输出层输出的类别损 失, 其中, 第二SSD网络与第一SSD网络具有相同 的网络参数; 对第一输出层输出的类别损失和位 置损失以及第二输出层输出的类别损失求和, 得 到总损失, 并基于总损失更新第一SSD网络中的 网络参数和第二SSD网络中的网络参数。 可。

3、以降 低第一SSD网络从非目标位置检测出目标的可能 性, 从而提高训练后的第一SSD网络检测的准确 度。 权利要求书4页 说明书17页 附图5页 CN 109977913 A 2019.07.05 CN 109977913 A 1.一种目标检测网络训练方法, 其特征在于, 所述方法包括: 获取携带目标的样本和未携带所述目标的样本, 其中, 所述携带目标的样本中标注有 所述目标的类别和所述目标的位置; 将所述携带目标的样本输入至第一单次多框检测器SSD网络, 得到所述第一SSD网络中 的第一输出层输出的类别损失和位置损失; 并将所述未携带所述目标的样本输入至第二 SSD网络, 得到所述第二SSD。

4、网络中的第二输出层输出的类别损失, 其中, 所述第二SSD网络 与所述第一SSD网络具有相同的网络参数; 对所述第一输出层输出的类别损失和位置损失以及所述第二输出层输出的类别损失 求和, 得到总损失, 并基于所述总损失更新所述第一SSD网络中的网络参数和所述第二SSD 网络中的网络参数。 2.根据权利要求1所述的方法, 其特征在于, 在所述获取携带目标的样本和未携带所述 目标的样本之前, 所述方法还包括: 获取多个携带所述目标的样本; 采用所述多个携带所述目标的样本对预先建立的第一SSD网络和预先建立的第二SSD 进行训练, 得到所述第一SSD网络和所述第二SSD网络; 所述获取携带目标的样本。

5、和未携带所述目标的样本, 包括: 获取未携带所述目标的图片集, 并采用所述第一SSD网络对所述未携带所述目标的图 片集进行检测, 得到第一误检测图片, 其中, 所述第一误检测图片中未携带所述目标; 将获取的多个携带所述目标的样本作为所述携带目标的样本, 将所述第一误检测图片 作为所述未携带所述目标的样本。 3.根据权利要求1或2所述的方法, 其特征在于, 所述第二SSD网络包括: 基础特征层、 第 一卷积层、 第二卷积层、 第三卷积层、 第四卷积层、 池化层以及第二输出层, 所述第二输出层 包括: 第一输出子层、 第二输出子层、 第三输出子层、 第四输出子层、 第五输出子层以及第六 输出子层;。

6、 所述将所述未携带所述目标的样本输入至第二SSD网络, 得到所述第二SSD网络中的第 二输出层输出的类别损失, 包括: 将所述未携带所述目标的样本输入至所述第二SSD网络的基础特征层, 得到所述基础 特征层输出的基础特征图; 将所述基础特征图输入至所述第二SSD网络的第一卷积层和所述第一输出子层, 得到 所述第一卷积层输出的卷积后的第一特征图和所述第一输出子层输出的第一类别损失; 将所述第一特征图输入至所述第二SSD网络的第二卷积层和所述第二输出子层, 得到 所述第二卷积层输出的卷积后的第二特征图和所述第二输出子层输出的第二类别损失; 将所述第二特征图输入至所述第二SSD网络的第三卷积层和所述。

7、第三输出子层, 得到 所述第三卷积层输出的卷积后的第三特征图和所述第三输出子层输出的第三类别损失; 将所述第三特征图输入至所述第二SSD网络的第四卷积层和所述第四输出子层, 得到 所述第四卷积层输出的卷积后的第四特征图和所述第四输出子层输出的第四类别损失; 将所述第四特征图输入至所述第二SSD网络的池化层和所述第五输出子层, 得到所述 池化层输出的池化后的特征图和所述第五输出子层输出的第五类别损失; 将所述池化后的特征图输入至所述第六输出子层, 得到所述第六输出子层输出的第六 权利要求书 1/4 页 2 CN 109977913 A 2 类别损失; 将所述第一类别损失、 所述第二类别损失、 所。

8、述第三类别损失、 所述第四类别损失、 所 述第五类别损失以及所述第六类别损失, 作为所述第二输出层输出的类别损失。 4.根据权利要求3所述的方法, 其特征在于, 在所述对所述第一输出层输出的类别损失 和位置损失以及所述第二输出层输出的类别损失求和, 得到总损失, 并基于所述总损失更 新所述第一SSD网络中的网络参数和所述第二SSD网络中的网络参数之前, 所述方法还包 括: 对所述第二输出层输出的类别损失按照从大到小的顺序进行排序, 得到排序后的类别 损失; 获取预设的类别损失阈值, 并在所述排序后的类别损失中, 选择大于或等于所述预设 的类别损失阈值的类别损失; 所述对所述第一输出层输出的类别。

9、损失和位置损失以及所述第二输出层输出的类别 损失求和, 得到总损失, 并基于所述总损失更新所述第一SSD网络中的网络参数和所述第二 SSD网络中的网络参数, 包括: 对所述选择的大于或等于所述预设的类别损失阈值的类别损失以及所述第一输出层 输出的类别损失和位置损失求和, 得到总损失, 并基于所述总损失更新所述第一SSD网络中 的网络参数和所述第二SSD网络中的网络参数。 5.根据权利要求2所述的方法, 其特征在于, 在所述基于所述总损失更新所述第一SSD 网络中的网络参数和所述第二SSD网络中的网络参数之后, 所述方法还包括: 获取多个新的携带所述目标的样本和多个新的未携带所述目标的样本; 采。

10、用所述多个新的携带所述目标的样本和多个新的未携带所述目标的样本, 对所述更 新参数后的第一SSD网络和所述更新参数后的第二SSD网络进行训练, 得到训练完成的第一 SSD网络和训练完成的第二SSD网络。 6.根据权利要求5所述的方法, 其特征在于, 所述方法还包括: 采用所述训练完成的第一SSD网络, 对除所述第一误检测图片外的未携带所述目标的 图片集进行检测, 得到第二误检测图片, 其中, 所述第二误检测图片中未携带所述目标; 将所述第二误检测图片、 所述第一误检测图片以及所述多个携带所述目标的样本作为 训练样本, 对所述训练完成的第一SSD网络和所述训练完成的第二SSD网络进行训练。 7.。

11、一种目标检测网络训练装置, 其特征在于, 所述装置包括: 第一样本获取模块, 用于获取携带目标的样本和未携带所述目标的样本, 其中, 所述携 带目标的样本中标注有所述目标的类别和所述目标的位置; 样本输入模块, 用于将所述携带目标的样本输入至第一单次多框检测器SSD网络, 得到 所述第一SSD网络中的第一输出层输出的类别损失和位置损失; 并将所述未携带所述目标 的样本输入至第二SSD网络, 得到所述第二SSD网络中的第二输出层输出的类别损失, 其中, 所述第二SSD网络与所述第一SSD网络具有相同的网络参数; 更新模块, 用于对所述第一输出层输出的类别损失和位置损失以及所述第二输出层输 出的类。

12、别损失求和, 得到总损失, 并基于所述总损失更新所述第一SSD网络中的网络参数和 所述第二SSD网络中的网络参数。 8.根据权利要求7所述的装置, 其特征在于, 所述装置还包括: 权利要求书 2/4 页 3 CN 109977913 A 3 携带目标样本获取模块, 用于获取多个携带所述目标的样本; 第一训练模块, 用于采用所述多个携带所述目标的样本对预先建立的第一SSD网络和 预先建立的第二SSD进行训练, 得到所述第一SSD网络和所述第二SSD网络; 所述第一样本获取模块, 包括: 检测子模块, 用于获取未携带所述目标的图片集, 并采用所述第一SSD网络对所述未携 带所述目标的图片集进行检测。

13、, 得到第一误检测图片, 其中, 所述第一误检测图片中未携带 所述目标; 样本获取子模块, 将获取的多个携带所述目标的样本作为所述携带目标的样本, 将所 述第一误检测图片作为所述未携带所述目标的样本。 9.根据权利要求7或8所述的装置, 其特征在于, 所述第二SSD网络包括: 基础特征层、 第 一卷积层、 第二卷积层、 第三卷积层、 第四卷积层、 池化层以及第二输出层, 所述第二输出层 包括: 第一输出子层、 第二输出子层、 第三输出子层、 第四输出子层、 第五输出子层以及第六 输出子层; 所述样本输入模块, 包括: 第一输入子模块, 用于将所述未携带所述目标的样本输入至所述第二SSD网络的基。

14、础 特征层, 得到所述基础特征层输出的基础特征图; 第二输入子模块, 用于将所述基础特征图输入至所述第二SSD网络的第一卷积层和所 述第一输出子层, 得到所述第一卷积层输出的卷积后的第一特征图和所述第一输出子层输 出的第一类别损失; 第三输入子模块, 用于将所述第一特征图输入至所述第二SSD网络的第二卷积层和所 述第二输出子层, 得到所述第二卷积层输出的卷积后的第二特征图和所述第二输出子层输 出的第二类别损失; 第四输入子模块, 用于将所述第二特征图输入至所述第二SSD网络的第三卷积层和所 述第三输出子层, 得到所述第三卷积层输出的卷积后的第三特征图和所述第三输出子层输 出的第三类别损失; 第。

15、五输入子模块, 用于将所述第三特征图输入至所述第二SSD网络的第四卷积层和所 述第四输出子层, 得到所述第四卷积层输出的卷积后的第四特征图和所述第四输出子层输 出的第四类别损失; 第六输入子模块, 用于将所述第四特征图输入至所述第二SSD网络的池化层和所述第 五输出子层, 得到所述池化层输出的池化后的特征图和所述第五输出子层输出的第五类别 损失; 第七输入子模块, 用于将所述池化后的特征图输入至所述第六输出子层, 得到所述第 六输出子层输出的第六类别损失; 转换子模块, 用于将所述第一类别损失、 所述第二类别损失、 所述第三类别损失、 所述 第四类别损失、 所述第五类别损失以及所述第六类别损失。

16、, 作为所述第二输出层输出的类 别损失。 10.根据权利要求9所述的装置, 其特征在于, 所述装置还包括: 类别损失排序模块, 用于对所述第二输出层输出的类别损失按照从大到小的顺序进行 排序, 得到排序后的类别损失; 权利要求书 3/4 页 4 CN 109977913 A 4 类别损失选择模块, 用于获取预设的类别损失阈值, 并在所述排序后的类别损失中, 选 择大于或等于所述预设的类别损失阈值的类别损失; 所述更新模块, 具体用于: 对所述选择的大于或等于所述预设的类别损失阈值的类别损失以及所述第一输出层 输出的类别损失和位置损失求和, 得到总损失, 并基于所述总损失更新所述第一SSD网络中。

17、 的网络参数和所述第二SSD网络中的网络参数。 11.根据权利要求8所述的装置, 其特征在于, 所述装置还包括: 第二样本获取模块, 用于获取多个新的携带所述目标的样本和多个新的未携带所述目 标的样本; 第二训练模块, 用于采用所述多个新的携带所述目标的样本和多个新的未携带所述目 标的样本, 对所述更新参数后的第一SSD网络和所述更新参数后的第二SSD网络进行训练, 得到训练完成的第一SSD网络和训练完成的第二SSD网络。 12.根据权利要求11所述的装置, 其特征在于, 所述装置还包括: 检测模块, 用于采用所述训练完成的第一SSD网络, 对除所述第一误检测图片外的未携 带所述目标的图片集进。

18、行检测, 得到第二误检测图片, 其中, 所述第二误检测图片中未携带 所述目标; 第三训练模块, 用于将所述第二误检测图片、 所述第一误检测图片以及所述多个携带 所述目标的样本作为训练样本, 对所述训练完成的第一SSD网络和所述训练完成的第二SSD 网络进行训练。 13.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理 器, 通信接口, 存储器通过通信总线完成相互间的通信; 存储器, 用于存放计算机程序; 处理器, 用于执行存储器上所存放的程序时, 实现权利要求1-6任一所述的方法步骤。 权利要求书 4/4 页 5 CN 109977913 A 5 一种目。

19、标检测网络训练方法、 装置及电子设备 技术领域 0001 本发明涉及图像识别技术领域, 特别是涉及一种目标检测网络训练方法、 装置及 电子设备。 背景技术 0002 Logo(LOGO type, 徽标)是企业综合信息传递的媒介, 通过形象的Logo可以让消费 者记住公司主体和品牌文化, 起到对Logo拥有公司的识别和推广的作用, 可以是文字、 图标 以及二者的混合, Logo也常常被加入到公司的产品中, 以表明生产该产品的公司的身份, 例 如, 在视频媒体领域中, 许多公司会把公司的Logo嵌入到其创作或播放的图片或者视频中, 例如, 视频网站在播放视频时, 会将该视频网站的Logo嵌入到播。

20、放的视频中, 以表明该视频 网站对该视频的播放的权利。 0003 视频网站在将拥有的Logo嵌入到在该视频网站播放的视频中时, 可以对该视频进 行Logo检测, 以避免该视频中有其他公司的Logo, 还可以避免在该视频中重复添加该视频 网站的Logo。 0004 目前, 常用的Logo检测方法主要是基于深度学习的目标检测方法, 该目标检测方 法可以检测Logo在图片或视频帧中的位置, 并同时可以检测出Logo的类别。 在采用该基于 深度学习的目标检测方法进行Logo检测时, 首先需要对该基于深度学习的目标检测方法中 的深度学习网络进行训练, 然后采用训练好的深度学习网络对待检测图片或视频帧进行。

21、检 测。 0005 在对该深度学习网络时, 需要提供标注有Logo的样本集, 该样本集的每个样本中 必须至少含有一个Logo, 并且, 每个样本中必须要标注出Logo的位置和类型。 这样, 在对该 深度学习网络进行训练时, 该深度学习网络可以将把Logo以外的区域作为背景, 从而可以 学会区分Logo和背景。 0006 然而, 发明人在实现本发明的过程中发现, 现有技术至少存在如下问题: 0007 若仅采用标注有Logo的样本集对深度学习网络进行训练, 并采用训练好的深度学 习网络进行Logo检测时, 容易将待检测图片或视频帧中, 与该样本集中样本的Logo相似的 图形检测为Logo, 从而造。

22、成误检。 发明内容 0008 本发明实施例的目的在于提供一种目标检测网络训练方法、 装置及电子设备, 以 实现提高训练后的神经网络对目标进行检测的准确度。 具体技术方案如下: 0009 在本发明实施例的一个方面, 本发明实施例提供了一种目标检测网络训练方法, 该方法包括: 0010 获取携带目标的样本和未携带目标的样本, 其中, 携带目标的样本中标注有目标 的类别和目标的位置, 未携带目标的样本为除标注有目标的类别的样本外的样本; 0011 将携带目标的样本输入至第一SSD(Single Shot MultiBox Detector, 单次多框 说明书 1/17 页 6 CN 10997791。

23、3 A 6 检测器)网络, 得到第一SSD网络中的第一输出层输出的类别损失和位置损失; 并将未携带 目标的样本输入至第二SSD网络, 得到第二SSD网络中的第二输出层输出的类别损失, 其中, 第二SSD网络与第一SSD网络具有相同的网络参数; 0012 对第一输出层输出的类别损失和位置损失以及第二输出层输出的类别损失求和, 得到总损失, 并基于总损失更新第一SSD网络中的网络参数和第二SSD网络中的网络参数。 0013 可选的, 在获取携带目标的样本和未携带目标的样本之前, 该目标检测网络训练 方法, 还包括: 0014 获取多个携带目标的样本; 0015 采用多个携带目标的样本对预先建立的第。

24、一SSD网络和预先建立的第二SSD进行 训练, 得到第一SSD网络和第二SSD网络; 0016 可选的, 获取携带目标的样本和未携带目标的样本, 包括: 0017 获取未携带目标的图片集, 并采用第一SSD网络对未携带目标的图片集进行检测, 得到第一误检测图片, 其中, 第一误检测图片中未携带目标; 0018 将获取的多个携带目标的样本作为携带目标的样本, 将第一误检测图片作为未携 带目标的样本。 0019 可选的, 第二SSD网络包括: 基础特征层、 第一卷积层、 第二卷积层、 第三卷积层、 第 四卷积层、 池化层以及第二输出层, 第二输出层包括: 第一输出子层、 第二输出子层、 第三输 出。

25、子层、 第四输出子层、 第五输出子层以及第六输出子层; 0020 可选的, 将未携带目标的样本输入至第二SSD网络, 得到第二SSD网络中的第二输 出层输出的类别损失, 包括: 0021 将未携带目标的样本输入至第二SSD网络的基础特征层, 得到基础特征层输出的 基础特征图; 0022 将基础特征图输入至第二SSD网络的第一卷积层和第一输出子层, 得到第一卷积 层输出的卷积后的第一特征图和第一输出子层输出的第一类别损失; 0023 将第一特征图输入至第二SSD网络的第二卷积层和第二输出子层, 得到第二卷积 层输出的卷积后的第二特征图和第二输出子层输出的第二类别损失; 0024 将第二特征图输入。

26、至第二SSD网络的第三卷积层和第三输出子层, 得到第三卷积 层输出的卷积后的第三特征图和第三输出子层输出的第三类别损失; 0025 将第三特征图输入至第二SSD网络的第四卷积层和第四输出子层, 得到第四卷积 层输出的卷积后的第四特征图和第四输出子层输出的第四类别损失; 0026 将第四特征图输入至第二SSD网络的池化层和第五输出子层, 得到池化层输出的 池化后的特征图和第五输出子层输出的第五类别损失; 0027 将池化后的特征图输入至第六输出子层, 得到第六输出子层输出的第六类别损 失; 0028 将第一类别损失、 第二类别损失、 第三类别损失、 第四类别损失、 第五类别损失以 及第六类别损失。

27、, 作为第二输出层输出的类别损失。 0029 可选的, 在对第一输出层输出的类别损失和位置损失以及第二输出层输出的类别 损失求和, 得到总损失, 并基于总损失更新第一SSD网络中的网络参数和第二SSD网络中的 网络参数之前, 本发明实施例的一种目标检测网络训练方法还包括: 说明书 2/17 页 7 CN 109977913 A 7 0030 对第二输出层输出的类别损失按照从大到小的顺序进行排序, 得到排序后的类别 损失; 0031 获取预设的类别损失阈值, 并在排序后的类别损失中, 选择大于或等于预设的类 别损失阈值的类别损失; 0032 对第一输出层输出的类别损失和位置损失以及第二输出层输出。

28、的类别损失求和, 得到总损失, 并基于总损失更新第一SSD网络中的网络参数和第二SSD网络中的网络参数, 包括: 0033 对选择的大于或等于预设的类别损失阈值的类别损失以及第一输出层输出的类 别损失和位置损失求和, 得到总损失, 并基于总损失更新第一SSD网络中的网络参数和第二 SSD网络中的网络参数。 0034 可选的, 在基于总损失更新第一SSD网络中的网络参数和第二SSD网络中的网络参 数之后, 本发明实施例的一种目标检测网络训练方法还包括: 0035 获取多个新的携带目标的样本和多个新的未携带目标的样本; 0036 采用多个新的携带目标的样本和多个新的未携带目标的样本, 对更新参数后。

29、的第 一SSD网络和更新参数后的第二SSD网络进行训练, 得到训练完成的第一SSD网络和训练完 成的第二SSD网络。 0037 可选的, 本发明实施例的一种目标检测网络训练方法还包括: 0038 采用训练完成的第一SSD网络, 对除第一误检测图片外的未携带目标的图片集进 行检测, 得到第二误检测图片, 其中, 第二误检测图片中未携带目标; 0039 将第二误检测图片、 第一误检测图片以及多个携带目标的样本作为训练样本, 对 训练完成的第一SSD网络和训练完成的第二SSD网络进行训练。 0040 在本发明实施例的又一方面, 本发明实施例还提供了一种目标检测网络训练装 置, 该装置包括: 0041。

30、 第一样本获取模块, 用于获取携带目标的样本和未携带目标的样本, 其中, 携带目 标的样本中标注有目标的类别和目标的位置, 未携带目标的样本为除标注有目标的类别的 样本外的样本; 0042 样本输入模块, 用于将携带目标的样本输入至第一SSD网络, 得到第一SSD网络中 的第一输出层输出的类别损失和位置损失; 并将未携带目标的样本输入至第二SSD网络, 得 到第二SSD网络中的第二输出层输出的类别损失, 其中, 第二SSD网络与第一SSD网络具有相 同的网络参数; 0043 更新模块, 用于对第一输出层输出的类别损失和位置损失以及第二输出层输出的 类别损失求和, 得到总损失, 并基于总损失更新。

31、第一SSD网络中的网络参数和第二SSD网络 中的网络参数。 0044 可选的, 目标检测网络训练装置还包括: 0045 携带目标样本获取模块, 用于获取多个携带目标的样本; 0046 第一训练模块, 用于采用多个携带目标的样本对预先建立的第一SSD网络和预先 建立的第二SSD进行训练, 得到第一SSD网络和第二SSD网络; 0047 第一样本获取模块, 包括: 0048 检测子模块, 用于获取未携带目标的图片集, 并采用第一SSD网络对未携带目标的 说明书 3/17 页 8 CN 109977913 A 8 图片集进行检测, 得到第一误检测图片, 其中, 第一误检测图片中未携带目标; 0049。

32、 样本获取子模块, 将获取的多个携带目标的样本作为携带目标的样本, 将第一误 检测图片作为未携带目标的样本。 0050 可选的, 第二SSD网络包括: 基础特征层、 第一卷积层、 第二卷积层、 第三卷积层、 第 四卷积层、 池化层以及第二输出层, 第二输出层包括: 第一输出子层、 第二输出子层、 第三输 出子层、 第四输出子层、 第五输出子层以及第六输出子层; 0051 可选的, 样本输入模块, 包括: 0052 第一输入子模块, 用于将未携带目标的样本输入至第二SSD网络的基础特征层, 得 到基础特征层输出的基础特征图; 0053 第二输入子模块, 用于将基础特征图输入至第二SSD网络的第一。

33、卷积层和第一输 出子层, 得到第一卷积层输出的卷积后的第一特征图和第一输出子层输出的第一类别损 失; 0054 第三输入子模块, 用于将第一特征图输入至第二SSD网络的第二卷积层和第二输 出子层, 得到第二卷积层输出的卷积后的第二特征图和第二输出子层输出的第二类别损 失; 0055 第四输入子模块, 用于将第二特征图输入至第二SSD网络的第三卷积层和第三输 出子层, 得到第三卷积层输出的卷积后的第三特征图和第三输出子层输出的第三类别损 失; 0056 第五输入子模块, 用于将第三特征图输入至第二SSD网络的第四卷积层和第四输 出子层, 得到第四卷积层输出的卷积后的第四特征图和第四输出子层输出的。

34、第四类别损 失; 0057 第六输入子模块, 用于将第四特征图输入至第二SSD网络的池化层和第五输出子 层, 得到池化层输出的池化后的特征图和第五输出子层输出的第五类别损失; 0058 第七输入子模块, 用于将池化后的特征图输入至第六输出子层, 得到第六输出子 层输出的第六类别损失; 0059 转换子模块, 用于将第一类别损失、 第二类别损失、 第三类别损失、 第四类别损失、 第五类别损失以及第六类别损失, 作为第二输出层输出的类别损失。 0060 可选的, 本发明实施例的一种目标检测网络训练装置还包括: 0061 类别损失排序模块, 用于对第二输出层输出的类别损失按照从大到小的顺序进行 排序。

35、, 得到排序后的类别损失; 0062 类别损失选择模块, 用于获取预设的类别损失阈值, 并在排序后的类别损失中, 选 择大于或等于预设的类别损失阈值的类别损失; 0063 更新模块, 具体用于: 0064 对选择的大于或等于预设的类别损失阈值的类别损失以及第一输出层输出的类 别损失和位置损失求和, 得到总损失, 并基于总损失更新第一SSD网络中的网络参数和第二 SSD网络中的网络参数。 0065 可选的, 本发明实施例的一种目标检测网络训练装置还包括: 0066 第二样本获取模块, 用于获取多个新的携带目标的样本和多个新的未携带目标的 样本; 说明书 4/17 页 9 CN 109977913。

36、 A 9 0067 第二训练模块, 用于采用多个新的携带目标的样本和多个新的未携带目标的样 本, 对更新参数后的第一SSD网络和更新参数后的第二SSD网络进行训练, 得到训练完成的 第一SSD网络和训练完成的第二SSD网络。 0068 可选的, 本发明实施例的一种目标检测网络训练装置还包括: 0069 检测模块, 用于采用训练完成的第一SSD网络, 对除第一误检测图片外的未携带目 标的图片集进行检测, 得到第二误检测图片, 其中, 第二误检测图片中未携带目标; 0070 第三训练模块, 用于将第二误检测图片、 第一误检测图片以及多个携带目标的样 本作为训练样本, 对训练完成的第一SSD网络和训。

37、练完成的第二SSD网络进行训练。 0071 在本发明实施例的又一方面, 本发明实施例还提供了一种电子设备, 该电子设备 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理器, 通信接口, 存储器通过通信总线 完成相互间的通信; 0072 存储器, 用于存放计算机程序; 0073 处理器, 用于执行存储器上所存放的程序时, 实现上述任一所述的目标检测网络 训练方法。 0074 在本发明实施例的又一方面, 本发明实施例还提供了一种计算机可读存储介质, 计算机可读存储介质中存储有指令, 当其在计算机上运行时, 使得计算机执行上述任一所 述的目标检测网络训练方法。 0075 在本发明实施例的又。

38、一方面, 本发明实施例还提供了一种包含指令的计算机程序 产品, 当其在计算机上运行时, 使得计算机执行上述任一所述的目标检测网络训练方法。 0076 本发明实施例提供的一种目标检测网络训练方法、 装置及电子设备, 可以将标注 有目标类别和目标位置的样本输入至第一SSD网络, 将未携带目标的样本输入至与第一SSD 网络具有相同网络参数的第二SSD网络, 这样, 可以使得该第一SSD网络输出与该标注有目 标类别和目标位置的样本对应的类别损失和位置损失, 使得第二SSD网络输出与该未携带 目标的样本对应的类别损失, 由于该未携带目标的样本中未携带目标, 当该类别损失较大 时, 则说明该未携带目标的样。

39、本中存在与该携带目标的样本中的目标相似的对象, 使得该 第二SSD网络将该未携带目标的样本中的对象预测为该携带目标的样本中的目标。 通过对 第一输出层输出的类别损失和位置损失以及第二输出层输出的类别损失求和, 得到总损 失, 并基于总损失更新第一SSD网络中的网络参数和第二SSD网络中的网络参数。 可以使得 在对该第一SSD网络的网络参数和第二SSD网络的网络参数更新后, 降低该第二SSD网络将 未携带目标的样本中的对象预测为目标的可能性, 由于第一SSD网络和第二SSD网络共享参 数, 因此, 可以使得该第一SSD网络在对待检测的图片进行检测时, 能够更好的识别出该待 检测图片中与目标相似的。

40、对象, 提高该第一SSD网络检测的准确度, 减少误检。 当然, 实施本 发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。 附图说明 0077 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍。 0078 图1为本发明实施例一种目标检测网络训练方法第一种实施方式的流程图; 0079 图2a为图1所示的目标检测网络中第一SSD网络示例性的结构示意图; 说明书 5/17 页 10 CN 109977913 A 10 0080 图2b为图1所示的目标检测网络中第二SSD网络示例性的结构示意图; 0081 图3为本发明实施例一。

41、种目标检测网络训练方法第二种实施方式的流程图; 0082 图4为本发明实施例一种目标检测网络训练方法第三种实施方式的流程图; 0083 图5为本发明实施例一种目标检测网络训练方法第四种实施方式的流程图; 0084 图6为本发明实施例的一种目标检测网络训练装置的结构示意图; 0085 图7为本发明实施例的一种电子设备的结构示意图。 具体实施方式 0086 下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行描述。 0087 为了解决现有技术存在的问题, 本发明实施例提供了一种目标检测网络训练方 法、 装置及电子设备, 以实现提高训练后的神经网络对目标进行检测的准确度。 0088 下面。

42、, 首先对本发明实施例的一种目标检测网络训练方法进行介绍, 如图1所示, 为本发明实施例一种目标检测网络训练方法第一种实施方式的流程图, 该方法可以包括: 0089 S110, 获取携带目标的样本和未携带目标的样本。 0090 其中, 携带目标的样本中标注有目标的类别和目标的位置, 未携带目标的样本为 除标注有目标的类别的样本外的样本。 0091 在对神经网络进行训练时, 可以首先为该待训练的神经网络设置样本, 这样, 在对 神经网络进行训练时, 该神经网络可以获取到训练时使用的样本。 0092 在一些示例中, 为了为本发明实施例的目标检测网络训练方法中使用的神经网络 进行训练, 本发明实施例。

43、为该目标检测网络设置了两种样本, 该两种样本可以是携带目标 的样本和未携带目标的样本。 0093 在一些示例中, 该目标可以是该目标检测网络训练完成时, 能够检测出来的对象, 例如, 该目标可以是Logo, 也可以是人物、 动物等。 这样, 在采用携带有目标的样本训练完成 后, 该目标检测网络可以检测出各个待检测图片中是否含有该目标。 0094 在一些示例中, 为了提高该目标检测网络的检测准确度, 本发明实施例采用了辅 助网络对该目标检测网络进行辅助训练。 因此, 该未携带目标的样本可以是为该辅助网络 设置的样本。 0095 当将待训练的目标检测网络和辅助网络设置在一个电子设备上时, 可以在该。

44、电子 设备上预先存储携带目标的样本和未携带目标的样本, 这样, 该电子设备可以获取到该携 带有目标的样本和未携带目标的样本。 0096 在一些示例中, 还可以在于该电子设备通信连接的另一电子设备上预先存储携带 目标的样本和未携带目标的样本, 该电子设备可以从该另一电子设备上获取该预先存储的 携带目标的样本和未携带目标的样本。 0097 在一些示例中, 该未携带目标的样本可以是预先设置的多个样本中, 除标注有目 标的类别的样本外的样本, 该预先设置的多个样本中的每个样本中, 都至少标注有该样本 携带的对象的类别。 例如, 假设一电子设备中设置有携带Logo的样本、 携带有建筑的样本、 携带有人物。

45、的样本以及携带有动物的样本, 又假设目标为Logo, 则该未携带目标的样本可 以包括: 携带有建筑的样本、 携带有人物的样本以及携带有动物的样本。 0098 S120, 将携带目标的样本输入至第一SSD网络, 得到第一SSD网络中的第一输出层 说明书 6/17 页 11 CN 109977913 A 11 输出的类别损失和位置损失; 并将未携带目标的样本输入至第二SSD网络, 得到第二SSD网 络中的第二输出层输出的类别损失。 0099 其中, 第二SSD网络与第一SSD网络具有相同的网络参数。 0100 在一些示例中, 在获取到携带目标的样本和未携带目标的样本后, 为了对第一SSD 网络进行。

46、训练, 可以将该携带目标的样本输入至第一SSD网络, 将未携带目标的样本输入至 第二SSD网络, 这样, 第一SSD网络可以对该携带目标的样本进行预测, 得到该携带目标的样 本中目标的类别信息和位置信息, 也即对该携带目标的样本进行预测的预测值, 以计算该 第一SSD网络对携带目标的样本进行预测的预测值与真实值之间的误差, 也即第一输出层 输出的类别损失和位置损失。 0101 将未携带目标的样本输入至第二SSD网络, 这样, 第二SSD网络可以使用与第一SSD 网络相同的网络参数对该未携带目标的样本进行预测, 得到该未携带目标的样本的对象预 测为目标的类别信息, 然后与该未携带目标的样本中标注。

47、的类别信息进行对比, 以计算该 第二SSD网络对未携带目标的样本进行预测的预测值与真实值之间的误差, 也即, 第二输出 层输出的类别损失。 0102 在一些示例中, 该类别信息可以是对携带目标的样本进行预测时, 预测的对象为 目标的概率, 或者对未携带目标的样本进行预测时, 预测的对象为目标的概率, 该位置信息 可以是预测的对象的位置。 0103 在一些示例中, 该第二SSD网络可以是基于第一SSD网络改变得到的, 该第一SSD网 络或第二SSD网络可以包括多个特征提取层, 该第一SSD网络还可以包括第一输出层, 该第 一输出层可以接收第一SSD网络的各个特征提取层输出的各个特征图, 然后可以。

48、计算出该 携带目标的样本对应的类别损失和位置损失。 该第二SSD网络还可以包括第二输出层, 该第 二输出层可以接收该第二SSD网络的各个特征提取层输出的各个特征图, 然后可以计算出 该未携带目标的样本对应的类别损失。 0104 例如, 该第一SSD网络可以是如图2a所示的神经网络, 该第二SSD网络可以是如图 2b所示的神经网络。 0105 在图2a中, 该多个特征提取层可以包括基础特征层210、 第一卷积层220、 第二卷积 层230、 第三卷积层240、 第四卷积层250、 池化层260以及第一输出层270。 该第一输出层可以 接收基础特征层210输出的基础特征图、 第一卷积层220输出的。

49、第一特征图、 第二卷积层230 输出的第二特征图、 第三卷积层240输出的第三特征图、 第四卷积层250输出的第四特征图、 以及池化层260输出的池化后的特征图。 然后可以计算出该携带目标的样本的类别损失和 位置损失。 0106 在一些示例中, 该第一输出层270中可以包括多个输出子层, 例如, 如图2a所示的 多个输出子层271。 该输出子层271的数量与特征提取层的数量相对应。 该输出子层271可以 包括类别损失计算单元和位置损失计算单元。 各个输出子层271在接收到各个特征提取层 输入的特征图后, 可以计算出各个特征图的类别损失和位置损失, 然后对各个特征图的类 别损失和位置损失进行合并。

50、, 从而可以得到携带目标的样本的类别损失和位置损失。 0107 在图2b中, 该多个特征提取层可以包括基础特征层210、 第一卷积层220、 第二卷积 层230、 第三卷积层240、 第四卷积层250、 池化层260以及第二输出层280。 0108 在一些示例中, 该基础特征层210可以是VGG16网络或VGG19网络, 可以提取出该未 说明书 7/17 页 12 CN 109977913 A 12 携带目标的样本的基础特征图, 该基础特征层输出的基础特征图的尺寸为38*38, 通道数为 512。 该基础特征层210可以将得到的基础特征图输出至第一卷积层220和第二输出层280。 0109 在。

展开阅读全文
内容关键字: 目标 检测 网络 训练 方法 装置 电子设备
关于本文
本文标题:目标检测网络训练方法、装置及电子设备.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/11717670.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1