基于FOA-RBF神经网络的信用评分方法.pdf
《基于FOA-RBF神经网络的信用评分方法.pdf》由会员分享,可在线阅读,更多相关《基于FOA-RBF神经网络的信用评分方法.pdf(12页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010819195.8 (22)申请日 2020.08.14 (71)申请人 百维金科 (上海) 信息科技有限公司 地址 201913 上海市崇明区长兴镇潘园公 路1800号3号楼22264室(上海泰和经 济发展区) (72)发明人 江远强韩璐李兰 (51)Int.Cl. G06Q 40/02(2012.01) G06N 3/00(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于FOA-RBF神经网络的。
2、信用评分方法 (57)摘要 本发明提供一种基于FOARBF神经网络的信 用评分方法, 包括: 采集数据; 数据预处理; 初始 化基本RBF神经网络模型参数; 采用果蝇优化算 法迭代隐藏层神经元的中心向量ci和激励函数 的中心宽度i, 构造FOARBF神经网络信用评分 预测模型; 将测试集数据输入FOARBF神经网络 模型得到预测结果, 训练RBF网络, 以预测准确率 为指标, 与最小均方误差法、 遗传算法、 粒子群算 法优化的RBF神经网络模型的进行对比; 将FOA RBF神经网络的信用评分模型部署至申请平台输 出实时申请信用评分, 实现申请客户的实时审批 和模型的在线更新; 本发明具有参数易。
3、调整和全 局搜索能力强等优点, FOARBF神经网络的信用 评分具有更高的预测精度和较强的稳定性, 适合 互金行业的信用评分需求。 权利要求书4页 说明书6页 附图1页 CN 112037011 A 2020.12.04 CN 112037011 A 1.一种基于FOA-RBF神经网络的信用评分方法, 其特征在于: 包括以下步骤: 步骤1: 采集数据, 从互联网金融平台后端根据贷后表现选取额定比例的正常还款和逾 期还款的客户作为建模样本, 采集样本客户账户注册申请时的个人基本信息、 监测软件中 获取操作行为埋点数据; 步骤2: 数据预处理, 对采集的数据进行缺失补全、 异常值处理和归一化处理后。
4、按照7:3 的比例切分成训练集和测试集; 步骤3: 初始化基本RBF神经网络模型参数, 在训练集上利用迭代误差收敛速度和精度 稳定性确定RBF网络隐藏层节点数; 步骤4: 采用果蝇优化算法迭代隐藏层神经元的中心向量ci和激励函数的中心宽度 i, 构造FOA-RBF神经网络信用评分预测模型; 步骤5: 将测试集数据输入FOA-RBF神经网络模型得到预测结果, 并进一步训练RBF网 络, 以预测准确率为指标, 与最小均方误差法、 遗传算法、 粒子群算法优化的RBF神经网络模 型的进行对比; 步骤6: 将FOA-RBF神经网络的信用评分模型部署至申请平台输出实时申请信用评分, 实现申请客户的实时审批。
5、, 并定期将有表现数据输入到模型训练, 实现模型的在线更新。 2.根据权利要求1所述的一种基于FOA-RBF神经网络的信用评分方法, 其特征在于: 在 步骤1中, 从互联网金融平台后端根据贷后表现选取额定比例的正常还款和逾期客户作为 建模样本, 采集样本客户账户注册申请时的个人基本信息、 监测软件中获取操作行为埋点 数据; 所述个人基本信息包括: 手机号、 学历、 婚姻状况、 工作单位、 住址、 联系人信息, 征信报 告获取的个人基本信息、 信用交易信息、 公共信息、 特别记录数据; 所述埋点数据包括埋点 时采集的设备行为数据和日志数据; 所述设备行为数据包括: 登录本平台次数、 点击次数、 。
6、点击频率、 输入总耗时及平均耗 时、 手机号数据、 GPS位置、 地理信息申请频次、 MAC地址、 IP地址数据、 IP申请频次、 设备电量 占比、 陀螺仪平均加速度; 所述日志数据包括: 7天内登录次数、 首次点击到申请授信时长、 一天内最多的session 数、 申请授信前一周的行为统计, 其还包括, 在合规要求下, 不限于获取移动互联网行为数 据、 贷款APP内行为数据、 信贷历史、 运营商数据在内的全域多维度大数据。 3.根据权利要求1所述的一种基于FOA-RBF神经网络的信用评分方法, 其特征在于: 在 步骤2中, 采用离差(Min-Max)标准化法来对数值归一化处理将其映射到0,1。
7、区间, 可以有 效地消除原变量因量纲不同和数值差异太大而带来数据噪音的影响, 实现了建模数据特征 的提取, Min-Max标准化的公式如下: 其中, 是归一化后的值, xmin是特征中的最小值, xmax是特征中的最大值, x为特征的初 始值; 将归一化处理的数据集按照申请时间按照7: 3比例进行划分为训练集数据和测试集。 4.根据权利要求1所述的一种基于FOA-RBF神经网络的信用评分方法, 其特征在于: 在 步骤3中, 建立一个具有输入层、 隐藏层、 输出层的三层RBF神经网络模型, 包括以下步骤: 权利要求书 1/4 页 2 CN 112037011 A 2 步骤3-1: 初步确定RBF。
8、神经网络隐藏层节点数n范围 输入层x(x1,x2,xm)表示m个输入结点向量, 输出层Y(y1,y2,yq)表示q个输出 结点向量, 根据专家经验, 隐藏层节点数和输入节点数、 输出节点数满足以下的关系: 其中, n为隐藏层节点数, m为输入层节点数, q为输出层节点数, a为110的随机数, 并 满足nm; 步骤3-2: 计算各隐藏层神经元的输出值 其中,为隐藏层第i个神经元节点的激励函数, 一般选用高斯函数作为隐藏层激 励函数, i1,2,n是隐藏层神经元节点数, x为输入矢量, ciRn表示第i个隐藏层神经元 的中心向量, Rn是欧式空间, i为隐藏层第i个神经元节点的激励函数的中心宽度。
9、; 步骤3-3: 在RBF神经网络中, 输出层是隐藏层神经元输出的线性加权和, 即隐藏层神经 元的输出值乘以隐藏层与输出层的连接权值i作为输出层节点的输入, 计算公式如下: 其中, x(x1,x2,xn)表示隐藏层n个输入结点向量, i1,2,n是隐藏层神经元节 点数, Y(x)表示网络的输出变量, |通常为欧氏范数, |x-ci|表示输入结点向量到第 i个隐藏层神经元的中心向量的径向距离, ci表示第i个隐藏层神经元的中心向量, i表示 第i个隐藏层和输出层之间的连接权值, i为隐藏层第i个神经元节点的激励函数的中心宽 度; 步骤3-4: 在训练集上利用迭代误差收敛速度和精度稳定性确定RBF。
10、网络隐藏层最优节 点数; 具体为: 随机初始化网络参数, 在训练集上取输出最大相对误差和均方差作为评价标 准, 并给出目标值, 隐藏层节点数从最小值开始向最大值迭代, 记录误差变化并根据目标值 确定隐藏层最优节点数。 5.根据权利要求1所述的一种基于FOA-RBF神经网络的信用评分方法, 其特征在于: 在 步骤4中, 根据输出层计算公式, 隐藏层神经元的中心向量ci和隐藏层各节点的激励函数 的中心宽度 i对输出结果影响最大, 需要对该两个参数进行组合寻优, 本申请采用的 果蝇算法对RBF神经网络参数优化包含以下的步骤: 步骤4-1: 初始化果蝇算法参数, 包括种群规模P、 迭代次数Gmax, 。
11、初始搜索步长L0, 初始迭 代次数t0, 在0,1范围内, 随机生成果蝇的初始位置(x0,y0), 其中, x0C0, y0 0, 即对 应隐藏层神经元的中心向量ci和隐藏层各节点的激励函数的中心宽度 i组合(C0, 0); 步骤4-2: 设置果蝇优化算法每代搜索步长, 其中每代搜索步长公式如下: 其中, L(t)为当前代搜索步长, L0为初始搜索步长, Gmax最大迭代次数, G(t)为当前优化 权利要求书 2/4 页 3 CN 112037011 A 3 代数; 生成当前代搜索步长后赋予果蝇个体在随机方向和随机移动距离, 公式如下: xix0+L(t)*rand() yiy0+L(t)*r。
12、and() 其中, xi、 yi为果蝇种群中每个个体在本代搜索范围中的横纵坐标, i1,2,P是果蝇 个体, x0、 y0为本代果蝇种群初始位置的横纵坐标, rand()表示在(0,1)范围的随机值; 步骤4-3: 定义RBF神经网络模型输入输出的误差函数作为适应度函数Fitness, 公式如 下: 其中, Fitness为适应度函数, 作为味道判定函数, 求出该果蝇位置味道浓度, i1, 2,N为训练集样本, j1,2,q为输出层节点, Yi,j是第i个样本第j个输出的预测值, yi,j是第i个样本第j个输出的实际值; 步骤4-4: 找到当前时刻所有果蝇所在位置对应的适应度的最小值Fitne。
13、ss(x(t)min以 及适应度最小值对应的位置(xt,yt), 判断此时的Fitness(x(t)min是否比起始位置的适应 度函数值小, 如果小, 则用(xt,yt)代替更新初始位置(x0,y0), 同时保存Fitness(x(t)min, 然后迭代次数tt+1进行下一次迭代; 如果此时的Fitness(x(t)min比起始位置的适应度 函数值大, 则重复执行步骤4-2至步骤4-4, 直到迭代次数t达到Gmax, 结束操作, 得到果蝇最 优的位置(xbest, ybest); 步骤4-5: 将果蝇最优的位置(xbest, ybest)得到RBF隐藏层神经元的中心向量ci和隐藏层 各节点的隐。
14、藏层各节点的激励函数的中心宽度 i最优参数组合, 再使用有导师的学习方法 计算每个隐藏层节点到输出层的连接权值i, 导师的学习方法如下: 其中, cmax为所选取中心点中心点之间的最大距离, 即为ci的最大值; 步骤4-6: 最终代入输出层节点计算公式: 得到FOA-RBF神经网络的信用评分预测模型。 6.根据权利要求1所述的一种基于FOA-RBF神经网络的信用评分方法, 其特征在于: 在 步骤5中, 将验证集样本用作测试数据带入到训练集的FOA-RBF神经网络的信用评分预测模 型, 进行对贷款申请者的信用风险评估, 计算评估准确率, 与预设误差进行比较, 若目前误 差大于预设误差, 则改变网。
15、络训练函数参数并重新训练RBF网络, 并采用均方根误差、 相关 系数及收敛次数作为评价指标与最小均方误差法的LMS-RBF、 遗传算法优化的GA-RBF、 粒子 群优化的PSO-RBF模型效果进行对比, 然后以模型的AUC、 KS为评估指标, 与SVM、 GBDT、 逻辑 回归、 随机森林的等其他模型效果进行对比。 7.根据权利要求1所述的一种基于FOA-RBF神经网络的信用评分方法, 其特征在于: 在 步骤6中, 将FOA-RBF神经网络的信用评分模型部署至申请平台输出实时申请信用评分, 实 权利要求书 3/4 页 4 CN 112037011 A 4 现申请客户的实时审批, 并定期将有表现。
16、数据输入到模型训练, 实现模型的在线更新。 权利要求书 4/4 页 5 CN 112037011 A 5 一种基于FOA-RBF神经网络的信用评分方法 技术领域 0001 本发明属于互联网金融行业的风控技术领域, 具体提供一种利用果蝇算法优化 RBF神经网络的信用评分方法。 背景技术 0002 随着银行、 第三方支付、 P2P、 互联网借贷平台的发展, 互联网金融对于个人信用评 价的需求越来越高, 除了使用基于逻辑回归、 支持向量机、 随机森林等各种算法的评分卡模 型, 使用神经网络进行信用评价是一个很大的研究领域, 其中最为常用的神经网络主要为: BP(Back Propagation, 反。
17、向传播)神经网络和RBF(Redial Basis Function, 径向基)神经 网络。 0003 BP神经网络具备结构简单和适用性强的优点, 但BP神经网络采用全局逼近算法, 训练时间过长, 且容易陷入局部最优。 与BP神经网络相比, RBF神经网络在输入层与隐藏层 之间使用具有光滑对称和任意阶导数的高斯函数作为径向基函数, 在隐藏层与输出层之间 采用线性函数, 使得输出和节点权值具有线性关系, RBF神经网络具有非线性拟合能力强、 全局最优逼近、 训练速度快等优点。 0004 RBF神经网络的性能在很大程度上取决于所选的隐藏层各径向基函数的中心c以 及激励的中心宽度 的参数选择。 传统。
18、的最小均方算法(Least Mean Square, LMS)、 粒子群 算法(Particle Swarm Optimization, PSO)、 遗传算法(Genetic Algorithm, GA)优化RBF神 经网络参数组合(c, )的优化算法都存在收敛速度慢、 耗时长、 容易陷入局部最优等缺陷。 发明内容 0005 为了解决上述技术问题, 本发明中披露了一种基于FOA-RBF神经网络的信用评分 方法, 本发明的技术方案是这样实施的: 0006 一种基于FOA-RBF神经网络的信用评分方法, 包括步骤: 0007 步骤1: 采集数据, 从互联网金融平台后端根据贷后表现选取一定比例和数量。
19、正常 还款和逾期客户作为建模样本, 采集样本客户账户注册申请时的个人基本信息、 监测软件 中获取操作行为埋点数据; 0008 步骤2: 数据预处理, 对采集的数据进行缺失补全、 异常值处理和归一化处理后按 照7:3的比例切分成训练集和测试集; 0009 步骤3: 初始化基本RBF神经网络模型参数, 在训练集上利用迭代误差收敛速度和 精度稳定性确定RBF网络隐藏层节点数; 0010 步骤4: 采用果蝇优化算法迭代隐藏层神经元的中心向量ci和激励函数的中心宽 度 i, 构造FOA-RBF神经网络信用评分预测模型; 0011 步骤5: 将测试集数据输入FOA-RBF神经网络模型得到预测结果, 并进一。
20、步训练RBF 网络, 以预测准确率为指标, 与最小均方误差法、 遗传算法、 粒子群算法优化的RBF神经网络 模型的进行对比; 说明书 1/6 页 6 CN 112037011 A 6 0012 步骤6: 将FOA-RBF神经网络的信用评分模型部署至申请平台输出实时申请信用评 分, 实现申请客户的实时审批, 并定期将有表现数据输入到模型训练, 实现模型的在线更 新。 0013 进一步地, 在步骤2中, 采用离差(Min-Max)标准化法来对数值归一化处理将其映 射到0,1区间, 有效地消除了原变量因量纲不同和数值差异太大而带来数据噪音的影响, 实现了建模数据特征的提取, Min-Max标准化的公。
21、式如下: 0014 0015其中, 是归一化后的值, xmin是特征中的最小值, xmax是特征中的最大值, x为特征 的初始值。 0016 将归一化处理的数据集按照申请时间按照7: 3比例进行划分为训练集数据和测试 集。 0017 进一步地, 在步骤3中, 建立一个具有输入层、 隐藏层、 输出层的三层RBF神经网络 模型, 包括以下步骤: 0018 步骤3-1: 初步确定RBF神经网络隐藏层节点数n范围 0019 输入层x(x1,x2,xm)表示m个输入结点向量, 输出层Y(y1,y2,yq)表示q个 输出结点向量, 根据专家经验, 隐藏层节点数和输入、 输出节点数满足以下的关系: 0020。
22、 0021 其中, n为隐藏层节点数, m为输入层节点数, q为输出层节点数, a为110的随机 数, 并满足nm; 0022 步骤3-2: 计算各隐藏层神经元的输出值: 0023 0024其中,为隐藏层第i个神经元节点的激励函数, 一般选用高斯函数作为隐藏 层激励函数, i1,2,n是隐藏层神经元节点数, x为输入矢量, ciRn表示第i个隐藏层神 经元的中心向量, Rn表示欧式空间, i为隐藏层第i个神经元节点的激励函数的中心宽度; 0025 步骤3-3: 在RBF神经网络中, 输出层是隐藏层神经元输出的线性加权和, 即隐藏层 神经元的输出值乘以隐藏层与输出层的连接权值i作为输出层节点的输。
23、入, 计算公式如 下: 0026 0027 其中, x(x1,x2,xn)表示隐藏层n个输入结点向量, i1,2,n是隐藏层神经 元节点数, Y(x)表示网络的输出变量, |通常为欧氏范数, |x-ci|表示输入结点向量 到第i个隐藏层神经元的中心向量的径向距离, ci表示第i个隐藏层神经元的中心向量, i 表示第i个隐藏层和输出层之间的连接权值, i为隐藏层第i个神经元节点的激励函数的中 心宽度; 0028 步骤3-4: 在训练集上利用迭代误差收敛速度和精度稳定性确定RBF网络隐藏层最 说明书 2/6 页 7 CN 112037011 A 7 优节点数 0029 具体为: 随机初始化网络参数。
24、, 在训练集上取输出最大相对误差和均方差作为评 价标准, 并给出目标值, 隐藏层节点数从最小值开始向最大值迭代, 记录误差变化并根据目 标值确定隐藏层最优节点数。 0030 进一步地, 在步骤4中, 根据输出层计算公式, 隐藏层神经元的中心向量ci和隐藏 层各节点的激励函数的中心宽度 i对输出结果影响最大, 需要对该两个参数进行组 合寻优, 本申请采用的果蝇算法对RBF神经网络参数优化包含以下的步骤: 0031 步骤4-1: 初始化果蝇算法参数, 包括种群规模P、 迭代次数Gmax, 初始搜索步长L0, 初始迭代次数t0, 在0,1范围内, 随机生成果蝇的初始位置(x0,y0), 其中, x0。
25、C0, y0 0, 即对应隐藏层神经元的中心向量ci和隐藏层各节点的激励函数的中心宽度 i组合(C0, 0); 0032 步骤4-2: 设置果蝇优化算法每代搜索步长, 其中每代搜索步长公式如下: 0033 0034 其中, L(t)为当前代搜索步长, L0为初始搜索步长, Gmax最大迭代次数, G(t)为当前 优化代数; 0035 生成当前代搜索步长后赋予果蝇个体在随机方向和随机移动距离, 公式如下: 0036 xix0+L(t)*rand(), 0037 yiy0+L(t)*rand() 0038 其中, xi、 yi为果蝇种群中每个个体在本代搜索范围中的横纵坐标, i1,2,P是 种群规。
26、模, x0、 y0为本代果蝇种群初始位置的横纵坐标, rand()表示在(0,1)范围的随机值; 0039 步骤4-3: 定义RBF神经网络模型的输入输出的误差函数作为适应度函数Fitness, 公式如下: 0040 0041 其中, Fitness为适应度函数, 作为味道判定函数, 求出该果蝇位置味道浓度, i 1,2,N为训练集样本数, j1,2,q为输出层节点数, Yi,j是第i个样本第j个输出的预 测值, yi,j是第i个样本第j个输出的实际值; 0042 步骤4-4: 找到当前时刻所有果蝇所在位置对应的适应度的最小值Fitness(x (t)min以及适应度最小值对应的位置(xt,y。
27、t), 判断此时的Fitness(x(t)min是否比起始位 置的适应度函数值小, 如果小, 则用(xt,yt)代替初始位置(x0,y0), 同时保存Fitness(x (t)min, 然后迭代次数tt+1进行下一次迭代; 如果此时的Fitness(x(t)min比起始位置的 适应度函数值大, 则重复执行步骤4-2至步骤4-4, 直到迭代次数t达到Gmax, 结束操作, 得到 果蝇最优的位置(xbest, ybest); 0043 步骤4-5: 将果蝇最优的位置(xbest, ybest)得到RBF隐藏层神经元的中心向量ci和隐 藏层各节点的隐藏层各节点的激励函数的中心宽度 i最优参数组合, 。
28、再使用有导师的学习 方法计算每个隐藏层节点到输出层的连接权值i, 导师的学习方法如下: 说明书 3/6 页 8 CN 112037011 A 8 0044 0045 其中, cmax为所选取中心点中心点之间的最大距离, 即为ci的最大值, i1,2,n 是隐藏层神经元节点数。 0046 步骤4-6: 最终代入输出层节点计算公式: 0047 0048 得到FOA-RBF神经网络的信用评分预测模型。 0049 进一步地, 在步骤5中, 将验证集样本用作测试数据带入到训练集的FOA-RBF神经 网络的信用评分预测模型, 进行对贷款申请者的信用风险评估, 计算评估准确率, 与预设误 差进行比较, 若目。
29、前误差大于预设误差, 则改变网络训练函数参数并重新训练RBF网络, 并 采用均方根误差、 相关系数及收敛次数作为评价指标与最小均方误差法的LMS-RBF、 遗传算 法优化的GA-RBF、 粒子群优化的PSO-RBF模型效果进行对比, 然后以模型的AUC、 KS为评估指 标, 与SVM、 GBDT、 逻辑回归、 随机森林的等其他模型效果进行对比。 0050 进一步地, 在步骤6中, 将FOA-RBF神经网络的信用评分模型部署至申请平台输出 实时申请信用评分, 实现申请客户的实时审批, 并定期将有表现数据输入到模型训练, 实现 模型的在线更新。 0051 与现有技术相比, 本发明具有以下有益的技术。
30、效果: 0052 (1)相比BP神经网络, RBF神经网络网络结构简单, 训练速度, 能够更好的克服神经 网络局部最小值和收敛速度慢等缺点; 0053 (2)果蝇算法(FOA)是基于果蝇觅食行为推演出寻求全局优化的一种新兴群体智 能优化算法, 与粒子群算法和遗传算法对比, 参数易调整和很全局搜索能力强, 具有更高的 预测精度和较强的稳定性, 适合互金行业的信用评分的需求。 附图说明 0054 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本 发明的一种实施例, 对于本领域普通技术人员来讲。
31、, 在不付出创造性劳动的前提下, 还可以 根据这些附图获得其他的附图。 0055 图1为本发明流程图。 具体实施方式 0056 为了使本发明实现的技术手段、 创作特征、 达成目的与功效易于明白了解, 下面结 合具体实施例, 进一步阐述本发明, 但下述实施例仅仅为本发明的优选实施例, 并非全部。 基于实施方式中的实施例, 本领域技术人员在没有做出创造性劳动的前提下所获得其它实 施例, 都属于本发明的保护范围。 下述实施例中的实验方法, 如无特殊说明, 均为常规方法, 下述实施例中所用的材料、 试剂等, 如无特殊说明, 均可从商业途径得到。 0057 一种基于FOA-RBF神经网络的信用评分方法,。
32、 其特征在于: 包括步骤: 0058 步骤1: 采集数据, 从互联网金融平台后端根据贷后表现选取一定比例和数量正常 说明书 4/6 页 9 CN 112037011 A 9 还款和逾期客户作为建模样本, 采集样本客户账户注册申请时的个人基本信息、 监测软件 中获取操作行为埋点数据; 0059 步骤2: 数据预处理, 对采集的数据进行缺失补全、 异常值处理和归一化处理后按 照7:3的比例切分成训练集和测试集; 0060 步骤3: 初始化基本RBF神经网络模型参数, 在训练集上利用迭代误差收敛速度和 精度稳定性确定RBF网络隐藏层节点数; 0061 步骤4: 采用果蝇优化算法迭代隐藏层神经元的中心。
33、向量ci和激励函数的中心宽 度 i, 构造FOA-RBF神经网络信用评分预测模型; 0062 步骤5: 将测试集数据输入FOA-RBF神经网络模型得到预测结果, 并进一步训练RBF 网络, 以预测准确率为指标, 与最小均方误差法、 遗传算法、 粒子群算法优化的RBF神经网络 模型的进行对比; 0063 步骤6: 将FOA-RBF神经网络的信用评分模型部署至申请平台输出实时申请信用评 分, 实现申请客户的实时审批, 并定期将有表现数据输入到模型训练, 实现模型的在线更 新。 0064 在一种优选的实施方式中, 结合图1所示, 在步骤1中, 从互联网金融平台后端根据 贷后表现选取一定比例和数量正常。
34、还款和逾期客户作为建模样本, 采集样本客户账户注册 申请时的个人基本信息、 监测软件中获取操作行为埋点数据。 其中用户的个人申请信息包 括: 手机号、 学历、 婚姻状况、 工作单位、 住址、 联系人信息, 征信报告获取的个人基本信息、 信用交易信息、 公共信息、 特别记录数据; 所述埋点数据包括埋点时采集的设备行为数据和 日志数据, 其中设备行为数据包括登录本平台的次数、 点击次数、 点击频率、 输入总耗时及 平均耗时、 手机号数据、 GPS位置、 MAC地址、 IP地址数据、 地理信息申请频次、 IP的申请频次、 设备电量占比、 陀螺仪的平均加速度, 另外日志数据包括: 7天内登录次数、 首。
35、次点击到申请 授信时长、 一天内最多的session数、 申请授信前一周的行为统计等。 另外在合规要求下, 不 限于获取移动互联网行为数据、 贷款APP内行为数据、 信贷历史、 运营商数据在内的全域多 维度大数据。 0065 在一种优选的实施方式中, 结合图1所示, 步骤2中所述的归一化处理是除了采用 离差归一化, 还可以采用Z-score标准化统一量纲, 使数据满足标准的高斯分布分布, 避免 了放大某些数量级较大的值的影响, 从而使模型结果更加准确。 0066 在一种优选的实施方式中, 结合图1所示, 步骤3-1采用经验法初步确定RBF神经网 络隐藏层节点数n范围, x(x1,x2,xm)表。
36、示m个输入结点向量, Y(y1,y2,yq)表示q个 输出结点向量, 其中满足nm, , 隐藏层节点数和输入输出节点数有如下的关系: 0067 0068 其中, n为隐藏层节点数, m为输入层节点数, q为输出层节点数, a为110的随机整 数。 0069 RBF神经网络具体为由输入层、 隐藏层、 输出层构成, 输入层节点的个数由预测的 影响因素个数决定, 该层仅起到输入数据的作用, 输入层与隐藏层之间的连接权重为1; 隐 藏层节点个数一般大于输入层, 将低维非线性可分的输入映射到高维线性可分的空间。 0070 另一方面, 本发明还提供一种基于FOA-RBF神经网络的信用评分系统, 包括: 0。
37、071 样本获取单元, 用于根据贷后表现选取一定比例和数量正常还款和逾期客户的申 说明书 5/6 页 10 CN 112037011 A 10 请和操作行为数据作为建模样本的获取; 0072 数据处理单元: 对采集的数据特征提取, 进行缺失补全、 异常值处理和归一化处理 后; 0073 RBF神经网络模型构建单元: 在训练集上利用迭代误差收敛速度和精度稳定性确 定RBF网络隐藏层节点数; 0074 果蝇优化算法优化单元: 采用果蝇优化算法迭代寻优隐藏层神经元的中心向量和 高斯函数的中心宽度, 构造FOA-RBF神经网络信用评分预测模型; 0075 欺诈检测单元: 对实时申请客户的个人信息及操作。
38、行为数据进行特征提取处理后 输入训练后FOA-RBF神经网络预测模型得到信用评分结果。 0076 在本发明中, 除非另有明确的规定和限定, 第一特征在第二特征之 “上” 或之 “下” 可以包括第一和第二特征直接接触, 也可以包括第一和第二特征不是直接接触而是通过它 们之间的另外的特征接触。 而且, 第一特征在第二特征 “之上” 、“上方” 和 “上面” 包括第一特 征在第二特征正上方和斜上方, 或仅仅表示第一特征水平高度高于第二特征。 第一特征在 第二特征 “之下” 、“下方” 和 “下面” 包括第一特征在第二特征正下方和斜下方, 或仅仅表示 第一特征水平高度小于第二特征。 0077 以上显示和描述了本发明的基本原理、 主要特征和本发明的优点。 本行业的技术 人员应该了解, 本发明不受上述实施例的限制, 上述实施例和说明书中描述的仅为本发明 的优选例, 并不用来限制本发明, 在不脱离本发明精神和范围的前提下, 本发明还会有各种 变化和改进, 这些变化和改进都落入要求保护的本发明范围内。 本发明要求保护范围由所 附的权利要求书及其等效物界定。 说明书 6/6 页 11 CN 112037011 A 11 图1 说明书附图 1/1 页 12 CN 112037011 A 12 。
- 内容关键字: 基于 FOA RBF 神经网络 信用 评分 方法
纳米气泡布面除油预缩设备.pdf
半导体老化冷热测试装置.pdf
RFID芯片剪切力测试仪.pdf
可按摩式颈托睡眠头枕及汽车座椅.pdf
汽车点火装饰圈.pdf
起落架部件机加工同心度辅助工装.pdf
园林绿化垃圾处理装置.pdf
施工物料分筛装置.pdf
鸡粪螺旋挤出设备.pdf
用于分砖的压砖装置.pdf
故障电池包防护箱.pdf
耐磨型泥沙挖掘齿.pdf
阀门锁盖设备.pdf
用于多肽固相合成的后处理系统及多肽固相合成设备.pdf
高压线圈导线拉紧装置.pdf
可调式带锯机切割辅助工装.pdf
温度压力一体化检测的波码通信控制装置.pdf
屋面防水卷材辅助施工设备.pdf
桥梁支座变形角度测量装置.pdf
便于冷却烘干的塑料玩具注塑机.pdf
防护插板.pdf
基于特征融合Transformer的多对比度核磁共振图像超分辨率方法.pdf
复叠制冷压缩机组.pdf
盾构管片拼装定位分体测量装置.pdf
自组装多肽RAKA 16的合成方法.pdf
基于机器学习的盾构掘进机姿态分项预测方法.pdf
宫颈TCT切片的多类型细胞核标注及多任务处理方法.pdf
基于自然资源工程勘测面积的测量装置.pdf
数据处理方法、装置及电子设备.pdf
基于人工智能的生物质电厂燃烧控制决策优化方法及系统.pdf
低功率的医院污水处理装置.pdf
基于FV-MViT的指静脉识别方法、装置及相关介质.pdf