联合性别属性训练的人脸识别网络模型构建方法.pdf

上传人:GAME****980 文档编号:10594544 上传时间:2021-06-25 格式:PDF 页数:9 大小:511.84KB
收藏 版权申诉 举报 下载
联合性别属性训练的人脸识别网络模型构建方法.pdf_第1页
第1页 / 共9页
联合性别属性训练的人脸识别网络模型构建方法.pdf_第2页
第2页 / 共9页
联合性别属性训练的人脸识别网络模型构建方法.pdf_第3页
第3页 / 共9页
文档描述:

《联合性别属性训练的人脸识别网络模型构建方法.pdf》由会员分享,可在线阅读,更多相关《联合性别属性训练的人脸识别网络模型构建方法.pdf(9页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010115979.2 (22)申请日 2020.02.25 (71)申请人 四川翼飞视科技有限公司 地址 610000 四川省成都市高新区天府大 道中段530号2栋22层2202号 (72)发明人 黄俊洁闫超孙亚楠 (74)专利代理机构 成都佳划信知识产权代理有 限公司 51266 代理人 史姣姣 (51)Int.Cl. G06K 9/00(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种联合性别属性训练。

2、的人脸识别网络模 型构建方法 (57)摘要 本发明公开了一种联合性别属性训练的人 脸识别网络模型构建方法, 包括以下步骤: 从前 至后按卷积层、 批正则化层、 参数修正线性单元 层和挤压激活单元模块的顺序封装成残差块, 并 以预设的数量复制依次排布; 从前至后按照卷积 层、 批正则化层、 参数修正线性单元层、 数个残差 块的顺序依次堆叠, 得到网络块; 复制并依次排 布以构成主干特征提取网络结构; 在主干特征提 取网络结构添加随机失活层, 并在尾端加入并行 分支的标准全连接层和带正则化的全连接层, 得 到网络结构模型; 求得输出值的总损失值; 采用 带动量的随机梯度下降法优化网络结构模型参 数。

3、; 设定迭代次数, 并重复总损失值计算和网络 结构模型参数优化, 直至获得最优的人脸识别网 络模型。 权利要求书2页 说明书5页 附图1页 CN 111339931 A 2020.06.26 CN 111339931 A 1.一种联合性别属性训练的人脸识别网络模型构建方法, 其特征在于, 包括以下步骤: 从前至后按卷积层、 批正则化层、 参数修正线性单元层和挤压激活单元模块的顺序封 装成残差块, 并以预设的数量复制依次排布; 从前至后按照卷积层、 批正则化层、 参数修正线性单元层、 数个残差块的顺序依次堆 叠, 得到网络块; 复制并依次排布网络块, 以构成主干特征提取网络结构; 在所述主干特征。

4、提取网络结构添加随机失活层, 并在尾端加入并行分支的标准全连接 层和带正则化的全连接层, 得到网络结构模型; 分别求得标准全连接层和带正则化的全连接层的输出值的总损失值; 采用带动量的随机梯度下降法优化网络结构模型参数; 设定迭代次数, 并重复总损失值计算和网络结构模型参数优化, 直至获得最优的人脸 识别网络模型。 2.根据权利要求1所述的一种联合性别属性训练的人脸识别网络模型构建方法, 其特 征在于, 所述分别求得标准全连接层和带正则化的全连接层的输出值的总损失值, 包括以 下步骤: 采用柔性最大值损失函数求得标准全连接层分支的输出值的第一损失值; 采用附加间隔的柔性最大值损失函数求得带正则。

5、化的全连接层分支的输出值的第二 损失值; 将第一损失值与第二损失值按比例求和, 得到输出值的总损失值。 3.根据权利要求2所述的一种联合性别属性训练的人脸识别网络模型构建方法, 其特 征在于, 所述总损失值对应的损失函数推导过程如下: 所述柔性最大损失函数的表达式如下: 其中, 参数N表示批处理样本的大小, n表示类数, xi表示第i个样本的特征向量,表 示真实样本标签yi对应的网络权重值的转置,表示预测为j类标签对应的网络权重值的 转置; 所述附加间隔的柔性最大值损失函数的表达式如下: 其中, s表示缩放因子, m表示距离调节因子, c表示类别的总数; 总损失值对应的损失函数的表达式为: L。

6、ossL2+ L1 其中, 表示权重因子, 即性别分类分支损失值的量级和加快网络损失值的收敛速度。 4.根据权利要求3所述的一种联合性别属性训练的人脸识别网络模型构建方法, 其特 征在于, 所述权重因子 的取值为0.1。 权利要求书 1/2 页 2 CN 111339931 A 2 5.根据权利要求1所述的一种联合性别属性训练的人脸识别网络模型构建方法, 其特 征在于, 所述人脸识别网络模型由4个网络块依次堆叠构成; 所述网络块中包含的残差块数 量依次为2、 4、 8、 2, 且人脸识别网络模型包含36层卷积层。 6.根据权利要求1所述的一种联合性别属性训练的人脸识别网络模型构建方法, 其特 。

7、征在于, 所述采用带动量的随机梯度下降法优化网络结构模型参数, 包括以下步骤: 设定学习率为0.01, 并采用预热余弦学习率下降调整目标函数的收敛程度; 设定随机梯度下降法的动量参数为0.9; 网络结构进行一次前馈传播计算出总损失值; 采用带动量的随机梯度下降法优化网络参数, 重复计算总损失值, 直至损失值收敛得 到最优解。 7.根据权利要求1所述的一种联合性别属性训练的人脸识别网络模型构建方法, 其特 征在于, 所述迭代次数为15000次。 8.根据权利要求1所述的一种联合性别属性训练的人脸识别网络模型构建方法, 其特 征在于, 所述缩放因子S取值为40, 且距离调节因子m取值为0.4。 权。

8、利要求书 2/2 页 3 CN 111339931 A 3 一种联合性别属性训练的人脸识别网络模型构建方法 技术领域 0001 本发明涉及人脸识别技术领域, 尤其是一种联合性别属性训练的人脸识别网络模 型构建方法。 背景技术 0002 近几年, 随着计算机技术与深度学习技术的快速发展, 人们的生活水平不断得到 提高。 与此同时, 人们开始更加注重个人隐私信息的安全性, 已有的传统身份鉴定方法已经 不能满足当代社会人们的需求了, 比如证件、 密码等方式。 这种安全需求推动了生物识别技 术的发展, 生物识别是计算机视觉技术中的热门研究之一, 主要是依据人类特有的一些生 理特征(比如人脸、 指纹、 。

9、声音等)通过模式识别算法进行身份鉴别。 在生物识别技术中, 人 脸识别技术因其人脸特征的独特性成为了极其重要的识别方法。 人脸识别技术主要通过提 取算法提取需要对比人脸的视觉特征信息, 再进行身份鉴别, 即使是双胞胎的人脸相似度 也无法达到100, 任何人脸都存在差异。 所以, 人脸识别技术被广泛应用在身份验证、 公共 安全等领域中, 可以为个人身份验证提供安全、 方便、 高效的解决方案。 0003 但是, 目前人脸识别技术主要通过学习可区别的特征或者使用损失函数强制将不 同类别的人脸特征分开, 将同类的人脸特征聚集。 基于传统图像处理的技术大多依赖于手 工特征, 但手工特征受很多外界因素的制。

10、约, 识别效果非常不好, 而基于深度学习的技术在 人脸识别领域出现了显著的识别效果, 与传统的方法对比具有更强的泛化性。 0004 目前, 基于深度学习的人脸识别算法主要分为两类: 0005 第一类, 是基于深度度量学习的人脸识别算法, 这些算法将人脸识别看成距离度 量问题, 自动学习卷积神经网络提取的人脸特征之间计算出来的距离度量, 比如欧几里得 距离、 曼哈顿距离。 为了减小其他因素带来的影响, 可以通过损失函数优化参数, 从而减小 类内距离, 增大类间距离, 最常用的损失函数有对比损失和三元组损失。 虽然这类算法简 洁、 易于理解, 但是训练方式较为复杂, 需要有经验地挑选训练样本, 并。

11、且网络训练时容易 出现不收敛情况。 0006 第二类, 是基于间隔的人脸识别算法, 这类算法的核心思想是通过对柔性最大值 损失函数的改进, 在计算损失值时加上间隔这个约束, 从而得到更具有辨别力的损失函数, 期望在特征空间上得到最大类内距离小于最小类间距离的结果。 但是这类算法需视情况增 减约束, 施加太强的约束会大大降低算法的性能, 或者在训练时容易出现不收敛, 反之, 太 弱的约束会使算法达不到期望的分类效果。 0007 目前现有的基于深度学习的算法偏重于优化人脸特征的邻接关系, 忽略了人脸样 本之间的邻接关系, 从而会受样本密度不均匀的影响, 造成精度上的偏差。 因此, 急需要提 出一种。

12、原理简单、 实施便捷的人脸识别训练方案, 以解决受外界因素影响的问题。 发明内容 0008 针对上述问题, 本发明的目的在于提供一种联合性别属性训练的人脸识别网络模 说明书 1/5 页 4 CN 111339931 A 4 型构建方法, 本发明采用的技术方案如下: 0009 一种联合性别属性训练的人脸识别网络模型构建方法, 包括以下步骤: 0010 从前至后按卷积层、 批正则化层、 参数修正线性单元层和挤压激活单元模块的顺 序封装成残差块, 并以预设的数量复制依次排布; 0011 从前至后按照卷积层、 批正则化层、 参数修正线性单元层、 数个残差块的顺序依次 堆叠, 得到网络块; 复制并依次排。

13、布网络块, 以构成主干特征提取网络结构; 0012 在所述主干特征提取网络结构添加随机失活层, 并在尾端加入并行分支的标准全 连接层和带正则化的全连接层, 得到网络结构模型; 0013 分别求得标准全连接层和带正则化的全连接层的输出值的总损失值; 0014 采用带动量的随机梯度下降法优化网络结构模型参数; 0015 设定迭代次数, 并重复总损失值计算和网络结构模型参数优化, 直至获得最优的 人脸识别网络模型。 0016 进一步地, 所述分别求得标准全连接层和带正则化的全连接层的输出值的总损失 值, 包括以下步骤: 0017 采用柔性最大值损失函数求得标准全连接层分支的输出值的第一损失值; 00。

14、18 采用附加间隔的柔性最大值损失函数求得带正则化的全连接层分支的输出值的 第二损失值; 0019 将第一损失值与第二损失值按比例求和, 得到输出值的总损失值。 0020 更进一步地, 所述总损失值对应的损失函数推导过程如下: 0021 所述柔性最大损失函数的表达式如下: 0022 0023 其中, 参数N表示批处理样本的大小, n表示类数, xi表示第i个样本的特征向量, 表示真实样本标签yi对应的网络权重值的转置, 而表示预测为j类标签对应的网络 权重值的转置。 0024 所述附加间隔的柔性最大值损失函数的表达式如下: 0025 0026 其中s表示缩放因子, 用于缩放余弦值, 参数m是一。

15、个距离调节因子, 用于调节类间 距离, c参数表示类别的总数。 0027 总损失值对应的损失函数的表达式为: 0028 LossL2+ L1 0029 其中, 表示权重因子, 即性别分类分支损失值的量级和加快网络损失值的收敛速 度。 0030 优选地, 所述权重因子 的取值为0.1。 0031 优选地, 所述人脸识别网络模型由4个网络块依次堆叠构成; 所述网络块中包含的 说明书 2/5 页 5 CN 111339931 A 5 残差块数量依次为2、 4、 8、 2, 且人脸识别网络模型包含36层卷积层。 0032 优选地, 所述采用带动量的随机梯度下降法优化网络结构模型参数, 包括以下步 骤:。

16、 0033 设定学习率为0.01, 并采用预热余弦学习率下降调整目标函数的收敛; 0034 设定随机梯度下降法的动量参数为0.9; 0035 网络结构进行一次前馈传播计算出总损失值; 0036 采用带动量的随机梯度下降法优化网络参数, 重复计算总损失值, 直至损失值收 敛得到最优解。 0037 优选地, 所述迭代次数为15000次。 0038 进一步地, 所述缩放因子S取值为40,且距离调节因子m取值为0.4。 0039 与现有技术相比, 本发明具有以下有益效果: 0040 (1)本发明巧妙地设置批正则化层, 并根据数据集调整超参数, 既可以加快算法的 收敛速度, 也可以一定程度上预防过拟合情。

17、况。 0041 (2)本发明巧妙地引入挤压激活单元模块, 对每个通道的特征进行权重重标定, 给 予特征不同的权重, 类似注意力机制, 帮助算法学习重要的特征信息。 0042 (3)本发明提出了一种联合性别属性训练的人脸识别网络模型构建方法, 从多任 务学习机制中受到启发, 算法通过学习多个任务的知识来增强学习能力, 在学习过程中看 重任务之间的联系, 从而学习到人脸样本之间的关系, 解决受样本密度不均匀影响的问题, 提高算法模型的泛化性和精度。 0043 (4)本发明在主干特征提取网络之后添加随机失活层, 减少参数量和防止过拟合。 0044 (5)本发明在网络模型在前几十次迭代训练时学习率较小。

18、, 让网络模型在这期间 损失值慢慢下降, 逐渐趋于稳定, 待模型损失值相对稳定之后再使用最开始设定的学习率 进行训练, 这样操作之后模型的收敛速度变得更快, 在一定程度下使模型效果达到最佳。 其 次, 采用带动量参数的随机梯度下降法可以减小参数优化时产生的震荡, 加速模型训练, 从 而使网络模型更优, 收敛效果更加稳定。 0045 (6)本发明采用神经元不同的全连接层; 输入到附加间隔柔性最大值损失函数的 特征值需先正则化, 以减少计算量。 附图说明 0046 为了更清楚地说明本发明实施例的技术方案, 下面将对实施例中所需使用的附图 作简单介绍, 应当理解, 以下附图仅示出了本发明的某些实施例。

19、, 因此不应被看作是对保护 范围的限定, 对于本领域技术人员来说, 在不付出创造性劳动的前提下, 还可以根据这些附 图获得其他相关的附图。 0047 图1为本发明的网络残差块封装示意图。 0048 图2为本发明的网络结构示意图。 0049 图3为本发明的人脸图像特征簇分布对比示意图。 。 具体实施方式 0050 为使本申请的目的、 技术方案和优点更为清楚, 下面结合附图和实施例对本发明 说明书 3/5 页 6 CN 111339931 A 6 作进一步说明, 本发明的实施方式包括但不限于下列实施例。 基于本申请中的实施例, 本领 域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例。

20、, 都属于本申请 保护的范围。 0051 实施例 0052 如图1至图3所示, 本实施例提供了一种联合性别属性训练的人脸识别网络模型构 建方法, 在本实施例中, 联合性别标签训练人脸识别算法为全新方法, 因此, 先说明本实施 例的联合训练网络模型的构建方法, 包括以下步骤: 0053 第一步, 从前至后按卷积层、 批正则化层、 参数修正线性单元层和挤压激活单元模 块的顺序封装成残差块, 按设置的数量复制依次排布。 如图1所示, 在本实施例中, 将这四层 封装成一个残差块, 他们的顺序是卷积层-批正则化层-参数修正线性单元层-卷积层- 批正则化层-参数修正线性单元层-挤压激活单元模块。 其中挤压。

21、激活单元模块主要由平 均池化层、 卷积层、 修正线性单元层、 通道特征权重重定义层构成。 0054 第二步, 从前至后按照卷积层、 批正则化层、 参数修正线性单元层、 数个残差块的 顺序依次堆叠, 得到网络块, 复制并依次排布构成主干特征提取网络结构。 然后, 在主干特 征提取网络之后添加随机失活层, 减少参数量和防止过拟合。 最后, 在网络末端添加两个并 行的分支, 一个是标准的全连接层, 另一个是带正则化的全连接层, 完成整体网络结构的搭 建。 如图2所示, 网络块中包含的残差块数量依次为2、 4、 8、 2, 整个网络结构包含36层卷积 层。 0055 第三步, 分别对不同全连接层输出值。

22、计算损失, 在标准的全连接层分支使用传统 的柔性最大值损失函数, 而在带正则化的全连接层分支用附加间隔的柔性最大值损失函 数, 并设定权重因子, 调整损失值比例, 相加得到总损失值。 所述总损失值对应的损失函数 推导过程如下: 0056 所述柔性最大损失函数的表达式如下: 0057 0058 其中, 参数N表示批处理样本的大小, n表示共有多少类, xi表示第i个样本的特征 向量,表示真实样本标签yi对应的网络权重值的转置, 而表示预测为j类标签对应的 网络权重值的转置。 0059 所述附加间隔的柔性最大值损失函数的表达式如下: 0060 0061 其中s表示缩放因子, 用于缩放余弦值, 参数。

23、m是一个距离调节因子, 用于调节类间 距离, c参数表示类别的总数。 0062 总损失值对应的损失函数的表达式为: 0063 LossL2+ L1 0064 其中, 表示权重因子, 即性别分类分支损失值的量级和加快网络损失值的收敛速 说明书 4/5 页 7 CN 111339931 A 7 度。 在本发明中 参数设为0.1, 该参数为了平衡两种损失的权重, 通过调整权重因子能设置 性别分类分支损失值的量级和加快网络损失值的收敛速度。 在训练过程中需将全连接层的 偏移项设为0, 缩放因子s能提高收敛速度, 设定s为40, 参数因子m调节类间距离, 设定m为 0.4。 0065 第四步, 采用带动。

24、量的随机梯度下降法优化模型参数, 包括以下步骤: 0066 (1)设定学习率为0.01, 并采用预热余弦学习率下降来控制目标函数的收敛; 0067 (2)设定随机梯度下降法的动量参数为0.9, 加速目标损失函数的收敛程度; 0068 上述步骤属于算法模型的优化步骤。 采用的预热余弦学习率下降法可以使网络模 型在前几十次迭代训练时学习率较小, 从而让网络模型在这期间损失值慢慢下降, 逐渐趋 于稳定, 待模型损失值相对稳定之后再使用最开始设定的学习率进行训练, 这样操作之后 模型的收敛速度变得更快, 在一定程度下使模型效果达到最佳。 其次, 采用带动量参数的随 机梯度下降法可以减小参数优化时产生的。

25、震荡, 加速模型训练, 从而使网络模型更优, 收敛 效果更加稳定。 0069 第五步, 设定迭代次数为15000次, 网络结构进行一次前馈传播计算出总损失值, 再使用带动量的随机梯度下降法优化网络参数, 重复计算直至损失值收敛得到最优解。 0070 为了验证本发明的有效性, 在实施例中构建了一个简单的数据集, 包含8个人, 每 个人有姓名和性别两种标签, 共1356张照片, 如图3所示, (a)为单标签训练之后提取的特征 分布图, (b)联合性别属性训练之后提取的特征分布图, 其中蓝色代表男性, 红色代表女性, 由图可以看出(a)中的类内距离比(b)中的类内距离大, (b)中样本簇的分布更为集。

26、中, 分类 效果更好。 0071 在本实施例中使用LFW人脸数据集作为测试集, 将采用本发明中提出的联合性别 属性训练的人脸识别方法和单标签训练的人脸识别方法进行对比, 使用准确度作为评价指 标。 单标签训练的模型测试精度为89.35, 而本发明训练的模型测试精度为90.35, 明显 优于单标签的训练方式。 因此, 本发明具有突出的实质性特点和显著的进步, 在人脸识别技 术领域具有很高的实用价值和推广价值上述实施例仅为本发明的优选实施例, 并非对本发 明保护范围的限制, 但凡采用本发明的设计原理, 以及在此基础上进行非创造性劳动而作 出的变化, 均应属于本发明的保护范围之内。 说明书 5/5 页 8 CN 111339931 A 8 图1 图2 图3 说明书附图 1/1 页 9 CN 111339931 A 9 。

展开阅读全文
内容关键字: 联合 性别 属性 训练 识别 网络 模型 构建 方法
关于本文
本文标题:联合性别属性训练的人脸识别网络模型构建方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10594544.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1