训练数据的筛选方法、装置、电子设备及存储介质.pdf
《训练数据的筛选方法、装置、电子设备及存储介质.pdf》由会员分享,可在线阅读,更多相关《训练数据的筛选方法、装置、电子设备及存储介质.pdf(25页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202011253325.2 (22)申请日 2020.11.11 (71)申请人 北京达佳互联信息技术有限公司 地址 100085 北京市海淀区上地西路6号1 幢1层101D1-7 (72)发明人 刘家怡王华彦 (74)专利代理机构 广州华进联合专利商标代理 有限公司 44224 代理人 张彬彬 (51)Int.Cl. G06K 9/34(2006.01) G06K 9/62(2006.01) G06T 7/62(2017.01) (54)发明名称 训练数据的筛选方法、 装置、。
2、 电子设备及存 储介质 (57)摘要 本公开关于一种训练数据的筛选方法、 装 置、 电子设备及存储介质, 该方法包括: 获取训练 数据; 训练数据中包括多个待识别图像; 将各个 待识别图像输入图像分割模型, 得到各个待识别 图像的预测分割区域; 根据各个待识别图像的标 记分割区域和预测分割区域, 确定各个待识别图 像的交并比和分割区域面积; 根据各个待识别图 像的交并比, 确定训练数据的平均交并比; 根据 各个待识别图像的分割区域面积, 确定训练数据 的平均分割区域面积; 分别将各个待识别图像的 交并比、 分割区域面积、 平均交并比和平均分割 区域面积输入数据判别模型, 得到各个待识别图 像的。
3、评价值, 并根据评价值确定错误标记图像。 采用本方法, 提高了错误标记图像的识别准确 率。 权利要求书3页 说明书15页 附图6页 CN 112070094 A 2020.12.11 CN 112070094 A 1.一种训练数据的筛选方法, 其特征在于, 包括: 获取训练数据; 所述训练数据中包括多个待识别图像以及各个所述待识别图像对应的 标记分割区域; 分别将各个所述待识别图像输入预先训练的图像分割模型, 得到各个所述待识别图像 对应的预测分割区域; 根据各个所述待识别图像对应的标记分割区域和预测分割区域, 确定各个所述待识别 图像的交并比和分割区域面积; 根据各个所述待识别图像的交并比,。
4、 确定所述训练数据的平均交并比; 根据各个所述待识别图像的分割区域面积, 确定所述训练数据的平均分割区域面积; 分别将各个所述待识别图像的交并比、 分割区域面积、 所述平均交并比和所述平均分 割区域面积输入预先构建的数据判别模型, 得到各个所述待识别图像的评价值, 并根据所 述评价值确定错误标记图像。 2.根据权利要求1所述的训练数据的筛选方法, 其特征在于, 所述根据各个所述待识别 图像对应的标记分割区域和预测分割区域, 确定各个所述待识别图像的交并比和分割区域 面积, 包括: 确定各个所述待识别图像的标记分割区域对应的第一权重和预测分割区域对应的第 二权重; 所述第一权重与所述第二权重之和。
5、恒等于1; 分别根据所述第一权重和所述第二权重对各个所述待识别图像的标记分割区域和预 测分割区域进行加权求和, 得到各个所述待识别图像的分割区域面积。 3.根据权利要求1所述的训练数据的筛选方法, 其特征在于, 所述根据各个所述待识别 图像的交并比, 确定所述训练数据的平均交并比, 包括: 分别获取各个所述待识别图像的交并比与所述交并比对应的第三权重的第三乘积; 将各个所述待识别图像对应的第三乘积进行相加, 得到所述训练数据的平均交并比。 4.根据权利要求1所述的训练数据的筛选方法, 其特征在于, 所述根据各个所述待识别 图像的分割区域面积, 确定所述训练数据的平均分割区域面积, 包括: 分别。
6、获取各个所述待识别图像的分割区域面积与所述分割区域面积对应的第四权重 的第四乘积; 将各个所述待识别图像对应的第四乘积进行相加, 得到所述训练数据的平均分割区域 面积。 5.根据权利要求1所述的训练数据的筛选方法, 其特征在于, 各个所述待识别图像的评 价值通过下述方法得到: 获取各个所述待识别图像的交并比与所述平均交并比之间的差值, 以及各个所述待识 别图像的分割区域面积与所述平均分割区域面积之间的比值; 根据所述差值与所述比值的乘积, 确定各个所述待识别图像的评价值。 6.根据权利要求1至5任一项所述的训练数据的筛选方法, 其特征在于, 在分别将各个 所述待识别图像的交并比、 分割区域面积。
7、、 所述平均交并比和所述平均分割区域面积输入 预先构建的数据判别模型, 得到各个所述待识别图像的评价值, 并根据所述评价值确定错 误标记图像之后, 还包括: 剔除所述训练数据中的所述错误标记图像, 得到剩余的训练数据; 权利要求书 1/3 页 2 CN 112070094 A 2 根据所述剩余的训练数据, 对待训练的图像分割模型进行训练, 得到训练完成的第一 图像分割模型; 将所述预先训练的图像分割模型, 更新为所述第一图像分割模型。 7.根据权利要求1至5任一项所述的训练数据的筛选方法, 其特征在于, 在分别将各个 所述待识别图像的交并比、 分割区域面积、 所述平均交并比和所述平均分割区域面。
8、积输入 预先构建的数据判别模型, 得到各个所述待识别图像的评价值, 并根据所述评价值确定错 误标记图像之后, 还包括: 重新获取所述训练数据中的所述错误标记图像的标记分割区域, 得到新的训练数据; 根据所述新的训练数据, 对待训练的图像分割模型进行训练, 得到训练完成的第二图 像分割模型; 将所述预先训练的图像分割模型, 更新为所述第二图像分割模型。 8.一种训练数据的筛选装置, 其特征在于, 包括: 训练数据获取单元, 被配置为执行获取训练数据; 所述训练数据中包括多个待识别图 像以及各个所述待识别图像对应的标记分割区域; 预测分割区域确定单元, 被配置为执行分别将各个所述待识别图像输入预先。
9、训练的图 像分割模型, 得到各个所述待识别图像对应的预测分割区域; 分割区域面积确定单元, 被配置为执行根据各个所述待识别图像对应的标记分割区域 和预测分割区域, 确定各个所述待识别图像的交并比和分割区域面积; 平均交并比确定单元, 被配置为执行根据各个所述待识别图像的交并比, 确定所述训 练数据的平均交并比; 平均分割区域面积确定单元, 被配置为执行根据各个所述待识别图像的分割区域面 积, 确定所述训练数据的平均分割区域面积; 错误标记图像确定单元, 被配置为执行分别将各个所述待识别图像的交并比、 分割区 域面积、 所述平均交并比和所述平均分割区域面积输入预先构建的数据判别模型, 得到各 个。
10、所述待识别图像的评价值, 并根据所述评价值确定错误标记图像。 9.根据权利要求8所述的训练数据的筛选装置, 其特征在于, 所述分割区域面积确定单 元, 还被配置为执行确定各个所述待识别图像的标记分割区域对应的第一权重和预测分割 区域对应的第二权重; 所述第一权重与所述第二权重之和恒等于1; 分别根据所述第一权重 和所述第二权重对各个所述待识别图像的标记分割区域和预测分割区域进行加权求和, 得 到各个所述待识别图像的分割区域面积。 10.根据权利要求8所述的训练数据的筛选装置, 其特征在于, 所述平均交并比确定单 元, 还被配置为执行分别获取各个所述待识别图像的交并比与所述交并比对应的第三权重 。
11、的第三乘积; 将各个所述待识别图像对应的第三乘积进行相加, 得到所述训练数据的平均 交并比。 11.根据权利要求8所述的训练数据的筛选装置, 其特征在于, 所述平均分割区域面积 确定单元, 还被配置为执行分别获取各个所述待识别图像的分割区域面积与所述分割区域 面积对应的第四权重的第四乘积; 将各个所述待识别图像对应的第四乘积进行相加, 得到 所述训练数据的平均分割区域面积。 12.根据权利要求8所述的训练数据的筛选装置, 其特征在于, 所述错误标记图像确定 单元, 还被配置为执行获取各个所述待识别图像的交并比与所述平均交并比之间的差值, 权利要求书 2/3 页 3 CN 112070094 A。
12、 3 以及各个所述待识别图像的分割区域面积与所述平均分割区域面积之间的比值; 根据所述 差值与所述比值的乘积, 确定各个所述待识别图像的评价值。 13.根据权利要求8至12任一项所述的训练数据的筛选装置, 其特征在于, 所述装置还 包括第一模型更新单元, 被配置为执行剔除所述训练数据中的所述错误标记图像, 得到剩 余的训练数据; 根据所述剩余的训练数据, 对待训练的图像分割模型进行训练, 得到训练完 成的第一图像分割模型; 将所述预先训练的图像分割模型, 更新为所述第一图像分割模型。 14.根据权利要求8至12任一项所述的训练数据的筛选装置, 其特征在于, 所述装置还 包括第二模型更新单元, 。
13、被配置为执行重新获取所述训练数据中的所述错误标记图像的标 记分割区域, 得到新的训练数据; 根据所述新的训练数据, 对待训练的图像分割模型进行训 练, 得到训练完成的第二图像分割模型; 将所述预先训练的图像分割模型, 更新为所述第二 图像分割模型。 15.一种电子设备, 其特征在于, 包括: 处理器; 用于存储所述处理器可执行指令的存储器; 其中, 所述处理器被配置为执行所述指令, 以实现如权利要求1至7中任一项所述的训 练数据的筛选方法。 16.一种存储介质, 当所述存储介质中的指令由电子设备的处理器执行时, 使得所述电 子设备能够执行如权利要求1至7中任一项所述的训练数据的筛选方法。 权利。
14、要求书 3/3 页 4 CN 112070094 A 4 训练数据的筛选方法、 装置、 电子设备及存储介质 技术领域 0001 本公开涉及图像识别技术领域, 尤其涉及一种训练数据的筛选方法、 装置、 电子设 备及存储介质。 背景技术 0002 随着图像识别技术的发展, 通过图像分割模型, 可以分割出特定的区域, 比如指甲 区域、 头发区域、 面部区域等; 然而, 为了训练出符合要求的图像分割模型, 需要大量标记图 像; 但是, 大量标记图像中可能存在错误标记图像, 这类错误标记图像将直接降低用其训练 的模型精度。 因此, 对其进行有效地识别可以进一步提高模型的质量。 0003 相关技术中, 对。
15、错误标记图像的识别方法, 一般是在大量标记图像是正确标注的 情况下, 先训练出一个相对鲁棒的图像分割模型, 利用该图像分割模型在错误标记图像上 会预测出相对正确的分割结果, 使得该图像分割模型在该图像上的IOU (Intersection over Union, 交并比) 会比较低的特点, 将IOU比较低的图像识别为错误标记图像; 但是, IOU 比较低的图像更多是图像复杂度较高, 而图像分割模型的预测能力不足所造成的, 有可能 并不是真正的错误标记图像, 从而导致错误标记图像的识别准确率较低。 发明内容 0004 本公开提供一种训练数据的筛选方法、 装置、 电子设备及存储介质, 以至少解决相。
16、 关技术中错误标记图像的识别准确率较低的问题。 本公开的技术方案如下: 根据本公开实施例的第一方面, 提供一种训练数据的筛选方法, 包括: 获取训练数据; 所述训练数据中包括多个待识别图像以及各个所述待识别图像对应的 标记分割区域; 分别将各个所述待识别图像输入预先训练的图像分割模型, 得到各个所述待识别图像 对应的预测分割区域; 根据各个所述待识别图像对应的标记分割区域和预测分割区域, 确定各个所述待识别 图像的交并比和分割区域面积; 根据各个所述待识别图像的交并比, 确定所述训练数据的平均交并比; 根据各个所述待识别图像的分割区域面积, 确定所述训练数据的平均分割区域面积; 分别将各个所述。
17、待识别图像的交并比、 分割区域面积、 所述平均交并比和所述平均分 割区域面积输入预先构建的数据判别模型, 得到各个所述待识别图像的评价值, 并根据所 述评价值确定错误标记图像。 0005 在一示例性实施例中, 所述根据各个所述待识别图像对应的标记分割区域和预测 分割区域, 确定各个所述待识别图像的交并比和分割区域面积, 包括: 确定各个所述待识别图像的标记分割区域对应的第一权重和预测分割区域对应的第 二权重; 所述第一权重与所述第二权重之和恒等于1; 分别根据所述第一权重和所述第二权重对各个所述待识别图像的标记分割区域和预 说明书 1/15 页 5 CN 112070094 A 5 测分割区域。
18、进行加权求和, 得到各个所述待识别图像的分割区域面积。 0006 在一示例性实施例中, 所述根据各个所述待识别图像的交并比, 确定所述训练数 据的平均交并比, 包括: 分别获取各个所述待识别图像的交并比与所述交并比对应的第三权重的第三乘积; 将各个所述待识别图像对应的第三乘积进行相加, 得到所述训练数据的平均交并比。 0007 在一示例性实施例中, 所述根据各个所述待识别图像的分割区域面积, 确定所述 训练数据的平均分割区域面积, 包括: 分别获取各个所述待识别图像的分割区域面积与所述分割区域面积对应的第四权重 的第四乘积; 将各个所述待识别图像对应的第四乘积进行相加, 得到所述训练数据的平均。
19、分割区域 面积。 0008 在一示例性实施例中, 各个所述待识别图像的评价值通过下述方法得到: 获取各个所述待识别图像的交并比与所述平均交并比之间的差值, 以及各个所述待识 别图像的分割区域面积与所述平均分割区域面积之间的比值; 根据所述差值与所述比值的乘积, 确定各个所述待识别图像的评价值。 0009 在一示例性实施例中, 在分别将各个所述待识别图像的交并比、 分割区域面积、 所 述平均交并比和所述平均分割区域面积输入预先构建的数据判别模型, 得到各个所述待识 别图像的评价值, 并根据所述评价值确定错误标记图像之后, 还包括: 剔除所述训练数据中的所述错误标记图像, 得到剩余的训练数据; 根。
20、据所述剩余的训练数据, 对待训练的图像分割模型进行训练, 得到训练完成的第一 图像分割模型; 将所述预先训练的图像分割模型, 更新为所述第一图像分割模型。 0010 在一示例性实施例中, 在分别将各个所述待识别图像的交并比、 分割区域面积、 所 述平均交并比和所述平均分割区域面积输入预先构建的数据判别模型, 得到各个所述待识 别图像的评价值, 并根据所述评价值确定错误标记图像之后, 还包括: 重新获取所述训练数据中的所述错误标记图像的标记分割区域, 得到新的训练数据; 根据所述新的训练数据, 对待训练的图像分割模型进行训练, 得到训练完成的第二图 像分割模型; 将所述预先训练的图像分割模型, 。
21、更新为所述第二图像分割模型。 0011 根据本公开实施例的第二方面, 提供一种训练数据的筛选装置, 包括: 训练数据获取单元, 被配置为执行获取训练数据; 所述训练数据中包括多个待识别图 像以及各个所述待识别图像对应的标记分割区域; 预测分割区域确定单元, 被配置为执行分别将各个所述待识别图像输入预先训练的图 像分割模型, 得到各个所述待识别图像对应的预测分割区域; 分割区域面积确定单元, 被配置为执行根据各个所述待识别图像对应的标记分割区域 和预测分割区域, 确定各个所述待识别图像的交并比和分割区域面积; 平均交并比确定单元, 被配置为执行根据各个所述待识别图像的交并比, 确定所述训 练数据。
22、的平均交并比; 平均分割区域面积确定单元, 被配置为执行根据各个所述待识别图像的分割区域面 说明书 2/15 页 6 CN 112070094 A 6 积, 确定所述训练数据的平均分割区域面积; 错误标记图像确定单元, 被配置为执行分别将各个所述待识别图像的交并比、 分割区 域面积、 所述平均交并比和所述平均分割区域面积输入预先构建的数据判别模型, 得到各 个所述待识别图像的评价值, 并根据所述评价值确定错误标记图像。 0012 在一示例性实施例中, 所述分割区域面积确定单元, 还被配置为执行确定各个所 述待识别图像的标记分割区域对应的第一权重和预测分割区域对应的第二权重; 所述第一 权重与所。
23、述第二权重之和恒等于1; 分别根据所述第一权重和所述第二权重对各个所述待 识别图像的标记分割区域和预测分割区域进行加权求和, 得到各个所述待识别图像的分割 区域面积。 0013 在一示例性实施例中, 所述平均交并比确定单元, 还被配置为执行分别获取各个 所述待识别图像的交并比与所述交并比对应的第三权重的第三乘积; 将各个所述待识别图 像对应的第三乘积进行相加, 得到所述训练数据的平均交并比。 0014 在一示例性实施例中, 所述平均分割区域面积确定单元, 还被配置为执行分别获 取各个所述待识别图像的分割区域面积与所述分割区域面积对应的第四权重的第四乘积; 将各个所述待识别图像对应的第四乘积进行。
24、相加, 得到所述训练数据的平均分割区域面 积。 0015 在一示例性实施例中, 所述错误标记图像确定单元, 还被配置为执行获取各个所 述待识别图像的交并比与所述平均交并比之间的差值, 以及各个所述待识别图像的分割区 域面积与所述平均分割区域面积之间的比值; 根据所述差值与所述比值的乘积, 确定各个 所述待识别图像的评价值。 0016 在一示例性实施例中, 所述装置还包括第一模型更新单元, 被配置为执行剔除所 述训练数据中的所述错误标记图像, 得到剩余的训练数据; 根据所述剩余的训练数据, 对待 训练的图像分割模型进行训练, 得到训练完成的第一图像分割模型; 将所述预先训练的图 像分割模型, 更。
25、新为所述第一图像分割模型。 0017 在一示例性实施例中, 所述装置还包括第二模型更新单元, 被配置为执行重新获 取所述训练数据中的所述错误标记图像的标记分割区域, 得到新的训练数据; 根据所述新 的训练数据, 对待训练的图像分割模型进行训练, 得到训练完成的第二图像分割模型; 将所 述预先训练的图像分割模型, 更新为所述第二图像分割模型。 0018 根据本公开实施例的第三方面, 提供一种电子设备, 包括: 处理器; 用于存储所述 处理器可执行指令的存储器; 其中, 所述处理器被配置为执行所述指令, 以实现如第一方面 的任一项实施例中所述的训练数据的筛选方法。 0019 根据本公开实施例的第四。
26、方面, 提供一种存储介质, 包括: 当所述存储介质中的指 令由电子设备的处理器执行时, 使得所述电子设备能够执行第一方面的任一项实施例中所 述的训练数据的筛选方法。 0020 根据本公开实施例的第五方面, 提供一种计算机程序产品, 所述程序产品包括计 算机程序, 所述计算机程序存储在可读存储介质中, 设备的至少一个处理器从所述可读存 储介质读取并执行所述计算机程序, 使得设备执行第一方面的任一项实施例中所述的训练 数据的筛选方法。 0021 本公开的实施例提供的技术方案至少带来以下有益效果: 说明书 3/15 页 7 CN 112070094 A 7 获取训练数据; 训练数据中包括多个待识别图。
27、像以及各个待识别图像对应的标记分割 区域; 分别将各个待识别图像输入预先训练的图像分割模型, 得到各个待识别图像对应的 预测分割区域; 接着根据各个待识别图像对应的标记分割区域和预测分割区域, 确定各个 待识别图像的交并比和分割区域面积; 然后根据各个待识别图像的交并比, 确定训练数据 的平均交并比; 最后根据各个待识别图像的分割区域面积, 确定训练数据的平均分割区域 面积; 分别将各个待识别图像的交并比、 分割区域面积、 平均交并比和平均分割区域面积输 入预先构建的数据判别模型, 得到各个待识别图像的评价值, 并根据评价值确定错误标记 图像; 实现了根据待识别图像的交并比、 分割区域面积、 。
28、平均交并比和平均分割区域面积, 确定待识别图像是否为错误标记图像的目的, 综合考虑了待识别图像的交并比、 分割区域 面积、 平均交并比和平均分割区域面积, 有利于提高错误标记图像的识别准确率, 避免了仅 仅考虑待识别图像的交并比, 导致错误标记图像的识别准确率较低的缺陷。 0022 应当理解的是, 以上的一般描述和后文的细节描述仅是示例性和解释性的, 并不 能限制本公开。 附图说明 0023 此处的附图被并入说明书中并构成本说明书的一部分, 示出了符合本公开的实施 例, 并与说明书一起用于解释本公开的原理, 并不构成对本公开的不当限定。 0024 图1是根据一示例性实施例示出的一种训练数据的筛。
29、选方法的应用环境图。 0025 图2是根据一示例性实施例示出的一种训练数据的筛选方法的流程图。 0026 图3A是根据一示例性实施例示出的数据判别模型的识别效果曲线图。 0027 图3B是根据一示例性实施例示出的基于IOU的识别效果曲线图。 0028 图4是根据一示例性实施例示出的图像分割模型的更新步骤的流程图。 0029 图5是根据一示例性实施例示出的另一种训练数据的筛选方法的流程图。 0030 图6是根据一示例性实施例示出的一种训练数据的筛选装置的框图。 0031 图7是根据一示例性实施例示出的一种电子设备的内部结构图。 具体实施方式 0032 为了使本领域普通人员更好地理解本公开的技术方。
30、案, 下面将结合附图, 对本公 开实施例中的技术方案进行清楚、 完整地描述。 0033 需要说明的是, 本公开的说明书和权利要求书及上述附图中的术语 “第一” 、“第 二” 等是用于区别类似的对象, 而不必用于描述特定的顺序或先后次序。 应该理解这样使用 的数据在适当情况下可以互换, 以便这里描述的本公开的实施例能够以除了在这里图示或 描述的那些以外的顺序实施。 以下示例性实施例中所描述的实施方式并不代表与本公开相 一致的所有实施方式。 0034 本公开所提供的训练数据的筛选方法, 可以应用于如图1所示的应用环境中。 参照 图1, 该应用环境图包括终端110。 终端110是具有训练数据筛选功能。
31、的电子设备, 该电子设 备可以是智能手机、 平板电脑或个人计算机等等。 参考图1, 终端110获取训练数据; 所述训 练数据中包括多个待识别图像以及各个所述待识别图像对应的标记分割区域; 分别将各个 所述待识别图像输入预先训练的图像分割模型, 得到各个所述待识别图像对应的预测分割 说明书 4/15 页 8 CN 112070094 A 8 区域; 根据各个所述待识别图像对应的标记分割区域和预测分割区域, 确定各个所述待识 别图像的交并比和分割区域面积; 根据各个所述待识别图像的交并比, 确定所述训练数据 的平均交并比; 根据各个所述待识别图像的分割区域面积, 确定所述训练数据的平均分割 区域面。
32、积; 分别将各个所述待识别图像的交并比、 分割区域面积、 所述平均交并比和所述平 均分割区域面积输入预先构建的数据判别模型, 得到各个所述待识别图像的评价值, 并根 据所述评价值确定错误标记图像。 0035 需要说明的是, 本公开的训练数据的筛选方法也可以应用于服务器, 还可以应用 于包括终端和服务器的系统, 并通过终端和服务器的交互实现。 为了方便说明, 在下面示例 性实施例中, 本公开主要以终端为例进行说明。 0036 图2是根据一示例性实施例示出的一种训练数据的筛选方法的流程图, 如图2所 示, 训练数据的筛选方法用于如图1所示的终端中, 包括以下步骤: 在步骤S210中, 获取训练数据。
33、; 训练数据中包括多个待识别图像以及各个待识别图像 对应的标记分割区域。 0037 其中, 待识别图像是指用来训练图像分割模型的标记图像, 具有对应的标记分割 区域; 标记分割区域是指通过人工标记出的待识别图像中的目标区域, 目标区域是指从待 识别图像中分割出来的感兴趣区域, 可以是头发区域、 指甲区域、 脸部区域等, 具体根据实 际场景确定, 在此不做具体限定。 0038 在步骤S220中, 分别将各个待识别图像输入预先训练的图像分割模型, 得到各个 待识别图像对应的预测分割区域。 0039 其中, 预测分割区域是指通过图像分割模型预测出的待识别图像中的目标区域; 预先训练的图像分割模型是一。
34、种能够从图像中分割出目标区域 (比如头发区域) 的深度神 经网络模型, 比如头发分割模型、 指甲分割模型等。 0040 具体地, 终端分别将各个待识别图像输入预先训练的图像分割模型, 通过预先训 练的图像分割模型分别对各个待识别图像进行分割处理, 得到各个待识别图像的预测分割 区域; 其中, 预先训练的图像分割模型是根据各个待识别图像以及对应的标记分割区域, 基 于待训练的图像分割模型训练得到的, 待训练的图像分割模型是指深度神经网络。 0041 进一步地, 预先训练的图像分割模型可以通过下述方式训练得到: 终端分别将各 个待识别图像输入待训练的图像分割模型, 得到各个待识别图像的预测分割区域。
35、; 根据各 个待识别图像的预测分割区域和标记分割区域之间的差值, 结合损失函数, 得到待训练的 图像分割模型的损失值; 根据损失值调整待训练的图像分割模型的网络参数, 直至损失值 低于第一预设阈值时, 将训练后的图像分割模型作为预先训练的图像分割模型。 0042 举例说明, 终端将待识别图像输入待训练的图像分割模型, 并获得待训练的图像 分割模型输出的预测分割区域; 对比待识别图像的预测分割区域和标记分割区域, 得到损 失函数, 并以此训练优化待训练的图像分割模型的模型参数; 在通过大量训练数据优化待 训练的图像分割模型之后, 根据测试数据集的数据衡量图像分割模型的IOU, 作为图像分割 模型。
36、准确性的标准。 0043 在步骤S230中, 根据各个待识别图像对应的标记分割区域和预测分割区域, 确定 各个待识别图像的交并比和分割区域面积。 0044 其中, 交并比是指IOU (Intersection over Union, 交并比) , 可以通过待识别图像 说明书 5/15 页 9 CN 112070094 A 9 对应的标记分割区域和预测分割区域确定, 用于衡量从待识别图像中分割出目标区域的准 确度; 在实际场景中, 交并比具体是指 “标记分割区域和预测分割区域之间的交集” 与 “标记 分割区域和预测分割区域之间的并集” 的比值。 0045 其中, 分割区域面积是指待识别图像对应的。
37、标记分割区域或者预测分割区域所占 用的面积, 可以通过标记分割区域或者预测分割区域中的像素点个数确定; 当然, 分割区域 面积还可以由待识别图像对应的标记分割区域所占用的面积和预测分割区域所占用的面 积综合确定。 0046 具体地, 终端获取每个待识别图像对应的标记分割区域和预测分割区域之间的交 集和并集, 并统计每个待识别图像对应的标记分割区域和预测分割区域之间的交集与并集 之间的比值, 作为每个待识别图像的交并比; 获取每个待识别图像对应的标记分割区域或 者预测分割区域所占用的面积, 作为每个待识别图像的分割区域面积。 0047 在步骤S240中, 根据各个待识别图像的交并比, 确定训练数。
38、据的平均交并比。 0048 其中, 平均交并比可以是指各个待识别图像对应的交并比的平均值, 也可以是指 各个待识别图像对应的交并比的加权和; 在实际场景中, 平均交并比是指训练数据的平均 IOU。 0049 在步骤S250中, 根据各个待识别图像的分割区域面积, 确定训练数据的平均分割 区域面积。 0050 其中, 平均分割区域面积可以是指各个待识别图像对应的分割区域面积的平均 值, 也可以是指各个待识别图像对应的分割区域面积的加权和。 0051 在步骤S260中, 分别将各个待识别图像的交并比、 分割区域面积、 平均交并比和平 均分割区域面积输入预先构建的数据判别模型, 得到各个待识别图像的。
39、评价值, 并根据评 价值确定错误标记图像。 0052 其中, 预先构建的数据判别模型是指能够根据输入的待识别图像的交并比、 分割 区域面积、 平均交并比和平均分割区域面积, 输出待识别图像的评价值的标记坏数据判别 器。 0053 其中, 待识别图像的评价值用于衡量待识别图像是否标记错误, 一般地, 评价值越 高, 表示待识别图像为错误标记图像的可能性越大; 比如, 待识别图像的评价值大于预设阈 值 (比如2.5) , 则说明待识别图像标记错误, 即待识别图像为错误标记图像。 0054 其中, 错误标记图像是指目标区域标记错误的待识别图像, 具体是指评价值大于 预设阈值的待识别图像。 0055 。
40、具体地, 终端获取预先构建的数据判别模型, 然后将各个待识别图像的交并比、 分 割区域面积、 平均交并比和平均分割区域面积输入预先构建的数据判别模型, 通过预先构 建的数据判别模型输出各个待识别图像的错误标记度; 从各个待识别图像中, 将评价值大 于预设阈值的待识别图像, 作为错误标记图像。 这样, 综合考虑了各个待识别图像的交并 比、 分割区域面积、 平均交并比和平均分割区域面积, 有利于提高错误标记图像的识别准确 率, 避免了仅仅考虑待识别图像的交并比, 导致错误标记图像的识别准确率较低的缺陷。 0056 例如, 终端将各个待识别图像的评价值与预设阈值 (比如2.5) 进行比较, 得到比较。
41、 结果; 根据比较结果, 从各个待识别图像中筛选出评价值大于预设阈值的待识别图像, 作为 错误标记图像。 需要说明的是, 预设阈值可以根据实际情况进行调整, 在此不做具体限定。 说明书 6/15 页 10 CN 112070094 A 10 这样, 实现了根据待识别图像的评价值, 确定待识别图像是否为错误标记图像的目的, 无需 通过人工复核, 从而节省了大量人力成本, 进而提高了错误标记图像的识别效率, 同时有利 于剔除错误标记图像。 0057 进一步地, 终端还可以将确定出的错误标记图像发送至对应的审核终端, 通过审 核终端的终端界面展示接收到的错误标记图像, 便于用户及时知晓哪些图像是错误。
42、标记图 像。 0058 此外, 终端还可以剔除训练数据中的错误标记图像, 得到剩余的训练数据, 并根据 剩余的训练数据重新对待训练的图像分割模型进行训练; 这样, 有利于提高训练得到的图 像分割模型的模型精度。 0059 上述训练数据的筛选方法中, 获取训练数据; 训练数据中包括多个待识别图像以 及各个待识别图像对应的标记分割区域; 分别将各个待识别图像输入预先训练的图像分割 模型, 得到各个待识别图像对应的预测分割区域; 接着根据各个待识别图像对应的标记分 割区域和预测分割区域, 确定各个待识别图像的交并比和分割区域面积; 然后根据各个待 识别图像的交并比, 确定训练数据的平均交并比; 最后。
43、根据各个待识别图像的分割区域面 积, 确定训练数据的平均分割区域面积; 分别将各个待识别图像的交并比、 分割区域面积、 平均交并比和平均分割区域面积输入预先构建的数据判别模型, 得到各个待识别图像的评 价值, 并根据评价值确定错误标记图像; 实现了根据待识别图像的交并比、 分割区域面积、 平均交并比和平均分割区域面积, 确定待识别图像是否为错误标记图像的目的, 综合考虑 了待识别图像的交并比、 分割区域面积、 平均交并比和平均分割区域面积, 有利于提高错误 标记图像的识别准确率, 避免了仅仅考虑待识别图像的交并比, 导致错误标记图像的识别 准确率较低的缺陷。 0060 在一示例性实施例中, 在。
44、步骤S230中, 根据各个待识别图像对应的标记分割区域 和预测分割区域, 确定各个待识别图像的交并比和分割区域面积, 包括: 确定各个待识别图 像的标记分割区域对应的第一权重和预测分割区域对应的第二权重; 第一权重与第二权重 之和恒等于1; 分别根据第一权重和第二权重对各个待识别图像的标记分割区域和预测分 割区域进行加权求和, 得到各个待识别图像的分割区域面积。 0061 具体地, 终端确定各个待识别图像的标记分割区域对应的第一权重和预测分割区 域对应的第二权重; 分别获取各个待识别图像的标记分割区域所占用的面积与标记分割区 域对应的第一权重的第一乘积, 以及各个待识别图像的预测分割区域所占用。
45、的面积与预测 分割区域对应的第二权重的第二乘积; 分别将各个待识别图像对应的第一乘积和第二乘积 进行相加, 得到各个待识别图像的图像标记区域面积。 0062举例说明, 终端先计算单张待识别图像的交并比: ; 其中,是指第张待识别图像,是指待识别图像的交并比,是指待识别 图像的标记分割区域;是指待识别图像的预测分割区域, 通过预先训练的图 说明书 7/15 页 11 CN 112070094 A 11 像分割模型得到: ; 参照上述方法, 可以得到各个待识别图像的交并比。 0063然后, 服务器计算单张待识别图像的分割区域面积: ; 其中,表示待识别图像的分割区域面积, 代表遍历待识别图像中的每。
46、个 像素点, 表示第一权重,表示第二权重; 当时, 表示待识别图像的分割区 域面积等于待识别图像的标记分割区域所占用的面积; 当时, 表示待识别 图像的分割区域面积等于待识别图像的预测分割区域所占用的面积; 当 时, 表示待识别图像的分割区域面积等于待识别图像的标记分割区域 所占用的面积和预测分割区域所占用的面积的平均值; 当然的值也可以根据 实际情况进行调整。 0064 本公开实施例提供的技术方案, 通过待识别图像的标记分割区域和预测分割区域 的加权和, 确定待识别图像的分割区域面积, 综合考虑了待识别图像的标记分割区域和预 测分割区域, 有利于提高待识别图像的分割区域面积的确定准确率。 0。
47、065 在一示例性实施例中, 在步骤S240中, 根据各个待识别图像的交并比, 确定训练数 据的平均交并比, 包括: 分别获取各个待识别图像的交并比与交并比对应的第三权重的第 三乘积; 将各个待识别图像对应的第三乘积进行相加, 得到训练数据的平均交并比。 0066 举例说明, 终端通过下述计算公式, 统计训练数据的平均交并比: ; 其中,是指训练数据的平均交并比,是指第张待识别图像的交并比 对应的第三权重; 若针对所有待识别图像 (总共张) , 均相同, 则等于。 0067 本公开实施例提供的技术方案, 通过获取训练数据的平均交并比, 有利于后续分 别将各个待识别图像的交并比、 分割区域面积、。
48、 平均交并比和平均分割区域面积输入预先 构建的数据判别模型, 得到各个待识别图像的评价值, 进而根据评价值即可直接确定错误 标记图像, 无需通过人工复核, 从而提高了错误标记图像的识别效率。 0068 在一示例性实施例中, 在步骤S250中, 根据各个待识别图像的分割区域面积, 确定 说明书 8/15 页 12 CN 112070094 A 12 训练数据的平均分割区域面积, 包括: 分别获取各个待识别图像的分割区域面积与分割区 域面积对应的第四权重的第四乘积; 将各个待识别图像对应的第四乘积进行相加, 得到训 练数据的平均分割区域面积。 0069 举例说明, 终端通过下述计算公式, 统计训练。
49、数据的平均分割区域面积: ; 其中,是指训练数据的平均分割区域面积,是指第张待识别图像的分割 区域面积对应的第四权重; 若针对所有待识别图像 (总共张) ,均相同, 则等 于。 0070 本公开实施例提供的技术方案, 通过获取训练数据的平均分割区域面积, 有利于 后续分别将各个待识别图像的交并比、 分割区域面积、 平均交并比和平均分割区域面积输 入预先构建的数据判别模型, 得到各个待识别图像的评价值, 进而根据评价值即可直接确 定错误标记图像, 避免了仅仅考虑待识别图像的交并比, 导致错误标记图像的识别准确率 较低的缺陷。 0071 在一示例性实施例中, 在步骤S260中, 各个待识别图像的评。
50、价值通过下述方法得 到: 获取各个待识别图像的交并比与平均交并比之间的差值, 以及各个待识别图像的分割 区域面积与平均分割区域面积之间的比值; 根据差值与比值的乘积, 确定各个待识别图像 的评价值。 0072 具体地, 终端通过下述计算公式, 确定各个待识别图像的评价值; ; 其中,是指待识别图像的评价值,是指待识别图像的交并比, 是指平均交并比,表示待识别图像的分割区域面积,是指平均分割区 域面积。 0073 进一步地, 终端还可以根据 “待识别图像的交并比与平均交并比之间的差值” 与 “待识别图像的分割区域面积与平均分割区域面积之间的比值” 的乘积, 构建对应的数据判 别模型, 比如, 作。
- 内容关键字: 训练 数据 筛选 方法 装置 电子设备 存储 介质
电动车玩具车配件清洗设备.pdf
电缆架设用缓冲夹具.pdf
保温墙体连接结构.pdf
卧式液压装配机.pdf
密封胶圈结构.pdf
电缆挤出设备.pdf
自动数控陶瓷茶壶磨口机.pdf
用于锂云母矿的浮选装置.pdf
汽车用线性灯光模块.pdf
多腔体注压成型模具的均匀冷却结构.pdf
空气环境监测装置.pdf
污水净化处理装置.pdf
自动反清洗管道过滤器.pdf
智慧采油系统.pdf
内科护理诊断监测呼吸装置.pdf
压滤机接液翻板支撑结构.pdf
工程材料切割装置.pdf
双侧气囊压榨机罐体.pdf
滚动筛.pdf
均温板.pdf
活塞止转销压力检测装置.pdf
数据抽取与加载方法、装置、电子设备及存储介质.pdf
路面隔离装置.pdf
基于中继技术的UWB传输方法及电子设备、存储介质.pdf
膨化食品原料清洗装置.pdf
低GI冲泡速食米组合物及其制备方法和应用.pdf
基于人工智能的电路故障监测方法及系统.pdf
生态旅游资源卫星遥感数据批量处理及下载系统.pdf
焦炉烟气去除焦油的装置及方法.pdf
基于物联网的智能海洋牧场投喂系统.pdf
脉冲信号的时间及电荷测量方法及装置.pdf
废钢破碎的防阻塞布袋除尘器.pdf
圆盘给料机排水装置.pdf
农产品质量检测装置.pdf
液控针形阀.pdf
自动化口服液液体灌装机.pdf
勘察测绘用支架.pdf
可清洁杯口的水杯.pdf
从下往上安装石块的带有扣件的茶盘.pdf
电气工程机房通风除尘设备.pdf
具有远程故障自诊断及维护管理功能的液压启闭机.pdf
大颗粒土过滤装置.pdf
对口锁扣盒.pdf
5G移动通讯设备用卡固定器.pdf
建筑施工用的材料运输装置.pdf
炸药包装箱标签的自动送料装置.pdf
免缝纫牵拉钩扣.pdf
带地暖功能的复合地板.pdf
塑料片材高效挤出机.pdf
便携式胸压急救辅助训练的按压垫.pdf
纸箱包装设备的纸箱坯片码齐装置.pdf