基于SVM的新型地沟油检测方法及检测装置.pdf

上传人:三** 文档编号:12174352 上传时间:2021-11-29 格式:PDF 页数:14 大小:665.84KB
收藏 版权申诉 举报 下载
基于SVM的新型地沟油检测方法及检测装置.pdf_第1页
第1页 / 共14页
基于SVM的新型地沟油检测方法及检测装置.pdf_第2页
第2页 / 共14页
基于SVM的新型地沟油检测方法及检测装置.pdf_第3页
第3页 / 共14页
文档描述:

《基于SVM的新型地沟油检测方法及检测装置.pdf》由会员分享,可在线阅读,更多相关《基于SVM的新型地沟油检测方法及检测装置.pdf(14页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910084360.7 (22)申请日 2019.01.29 (71)申请人 淮阴工学院 地址 223005 江苏省淮安市洪泽区东七街 三号高新技术产业园A12-2 (淮阴工学 院技术转移中心洪泽分中心) (72)发明人 陈奇何理旭陈贤龙袁章 黄金霞余亚东龚平 (74)专利代理机构 南京苏高专利商标事务所 (普通合伙) 32204 代理人 颜盈静 (51)Int.Cl. G06K 9/62(2006.01) G01N 33/28(2006.01) (54)发明名称 一种基于。

2、SVM的新型地沟油检测方法及检测 装置 (57)摘要 本发明公开了一种基于SVM的新型地沟油检 测方法及检测装置, 采集已知油样的电导率、 折 光率和酸价值, 所述油样包括正常油和非正常 油; 通过上位机将S1中的电导率、 折光率和酸价 值数据生成数据文件, 将该数据文件分为训练集 和测试集; 上位机建立SVM模型, 并将训练集导入 SVM模型进行训练, 再使用测试集对训练好的SVM 模型进行测试, 判断SVM模型建立的正确性; 使用 训练好的SVM模型对待测油样进行分析处理, 输 出处理结果。 权利要求书2页 说明书7页 附图4页 CN 109871887 A 2019.06.11 CN 1。

3、09871887 A 1.一种基于SVM的新型地沟油检测方法, 其特征在于: 包括以下步骤: S1; 采集已知油样的电导率、 折光率和酸价值, 所述油样包括正常油和非正常油; S2: 将S1中的电导率、 折光率和酸价值数据生成数据文件, 并将该数据文件分为训练集 和测试集; S3: 建立SVM模型, 并将训练集导入SVM模型进行训练, 再使用测试集对训练好的SVM模 型进行测试, 判断SVM模型建立的正确性; S4: 使用训练好的SVM模型对待测油样进行分析处理, 输出处理结果。 2.根据权利要求1所述的一种基于SVM的新型地沟油检测方法, 其特征在于: 在S2中, 所 述数据文件中包括各种不。

4、同的油样的电导率、 酸价值、 折光率和对应的标签变量, 该标签变 量包括正常油和非正常油。 3.根据权利要求1所述的一种基于SVM的新型地沟油检测方法, 其特征在于: 在S2中, 通 过randperm函数随机生成训练集与测试集。 4.根据权利要求1所述的一种基于SVM的新型地沟油检测方法, 其特征在于: 在S3中, 对 输入至SVM模型的电导率、 酸价值、 折光率数据进行数据归一化。 5.根据权利要求1所述的一种基于SVM的新型地沟油检测方法, 其特征在于: 在S3中, 训 练SVM模型时, 假设大小为m的样本训练集(xi,yi),i1,2,, m由两个类别组成, 若xi属 于第一类, 则记。

5、yi1; 若xi属于第二类, 则记yi-1; 寻找分类超平面: 其中, 是n维向量, b为偏移量; 定义一个样本点xi到分类超平面的几何间隔最小的样本集: min i (5) 几何间隔的大小与样本的误分次数N有关, 关系式为 其中, Rmax|xi|,i1,2,m, 为样本中向量长度最长的值; 在满足式(2)的条件下, 选取一个最优超平面, 使得 最大获得最小的误分次数N; 最优分类超平面为: 式中, 为支持向量样本权重, yi表示训练样本属性, b为待优化参数; 其中, x表示x1, x2, xl中的任意一个, 为核函数的扩展常数。 6.一种基于SVM的新型地沟油检测装置, 其特征在于: 包。

6、括用于测量油样电导率的电导 率检测模块、 用于测量油样酸价值的酸价值检测模块、 用于测量油样折光率的折光率检测 模块、 单片机和上位机; 所述单片机与电导率检测模块、 酸价值检测模块、 折光率检测模块 相连; 所述上位机与单片机相连, 用于接收单片机发送过来的数据, 建立和训练SVM模型, 并 权利要求书 1/2 页 2 CN 109871887 A 2 判断测试油样是否为地沟油。 7.根据权利要求6所述的一种基于SVM的新型地沟油检测装置, 其特征在于: 所述上位 机将接收到的数据分为训练集和测试集, 分别对建立的SVM模型进行训练和测试。 8.根据权利要求6所述的一种基于SVM的新型地沟油。

7、检测装置, 其特征在于: 所述SVM模 型中的最优分类函数为: 式中, 为支持向量样本权重, yi表示训练样本属性, b为待优化参数; 其中, x表示x1, x2, xl中的任意一个, 为核函数的扩展常数。 权利要求书 2/2 页 3 CN 109871887 A 3 一种基于SVM的新型地沟油检测方法及检测装置 技术领域 0001 本发明属于地沟油检测技术领域, 具体涉及一种基于SVM的新型地沟油检测方法 及检测装置。 背景技术 0002 地沟油是一个泛指概念, 是对各类劣质油的统称, 一般包括潲水油、 煎炸废油、 食 品及相关企业产生的废弃油脂等。 0003 通俗地讲, 地沟油可分为以下几。

8、类: 一是狭义的地沟油, 即将下水道中的油腻漂浮 物或者将宾馆、 酒楼的剩饭、 剩菜(通称泔水)经过简单加工、 提炼出的油; 二是劣质猪肉、 猪 内脏、 猪皮加工以及提炼后产出的油; 三是用于油炸食品的油使用次数超过规定要求后, 再 被重复使用或往其中添加一些新油后重新使用的油。 0004 地沟油的酸价、 过氧化值、 溶剂残留、 重金属污染物含量、 黄曲霉毒素b1、 苯并芘等 均严重超标, 对人体具有很大的危害性, 然而现有的技术手段对地沟油的判断还有待提高。 0005 现有的技术手段主要有电导率检测法、 折光率检测法、 荧光分析法、 色谱法、 核磁 共振鉴别法、 显色法、 酸价检测法、 水分。

9、含量测定法等等。 其中, 据研究表明电导率法只能用 于食用油中泔水油含量达20以上的油样的鉴别。 通过实验发现各种油脂的折光率值相差 较小, 都在1.4713-1.4768之间, 如果用来区分油样种类具有一定的困难。 同时, 现在随着地 沟油生产技术的提高, 部分地沟油的酸价符合国家标准4mg/g,所以通过仅仅测量酸价来判 断地沟油并不是十分的准确。 由于各种问题都存在一定的缺点, 因此现在急需一种能够对 新型地沟油进行检测的方法。 发明内容 0006 发明目的: 对于电导率法、 酸价检测法、 折光率检测法每种方法单独检测地沟油识 别度不高的问题, 本发明提出将三种检测方法相结合以用来提高对地。

10、沟油的识别度, 同时, 针对用折光率数值相差较小, 用来区分较为困难的问题, 本发明提出将折光率值导入SVM进 行训练, 以折光率、 电导率、 酸价作为SVM的输入矩阵变量构建分类超平面对地沟油进行检 测的方法。 0007 本发明公开了一种基于SVM的新型地沟油检测方法, 包括以下步骤: 0008 S1; 采集已知油样的电导率、 折光率和酸价值, 所述油样包括正常油和非正常油; 0009 S2: 通过上位机将S1中的电导率、 折光率和酸价值数据生成数据文件, 将该数据文 件分为训练集和测试集; 0010 S3: 上位机建立SVM模型, 并将训练集导入SVM模型进行训练, 再使用测试集对训练 好。

11、的SVM模型进行测试, 判断SVM模型建立的正确性; 0011 S4: 使用训练好的SVM模型对待测油样进行分析处理, 输出处理结果。 0012 进一步的, 在S2中, 所述数据文件中包括各种不同的油样的电导率、 酸价值、 折光 率和对应的标签变量, 该标签变量包括正常油和非正常油。 说明书 1/7 页 4 CN 109871887 A 4 0013 进一步的, 在S2中, 通过randperm函数随机生成训练集与测试集。 0014 进一步的, 在S3中, 对输入至SVM模型的电导率、 酸价值、 折光率数据进行数据归一 化。 0015 进一步的, 在S3中, 训练SVM模型时, 假设大小为m的。

12、样本训练集(xi,yi) ,i1, 2,, m由两个类别组成。 若xi属于第一类, 则记yi1; 若xi属于第二类, 则记yi-1; 寻找 分类超平面: 0016 0017 其中, 是n维向量, b为偏移量; 0018 定义一个样本点xi到分类超平面的几何间隔最小的样本集: 0019 min i (5) 0020 0021 几何间隔的大小与样本的误分次数N有关, 关系式为 0022 0023 其中, Rmax|xi|,i1,2,m, 为样本中向量长度最长的值; 0024 在满足式(2)的条件下, 选取一个最优超平面, 使得 最大获得最小的误分次数N; 0025 最优分类超平面为: 0026 0。

13、027式中, 为支持向量样本权重, yi表示训练样本属性, b为待优化参数; 0028 0029 其中, x表示x1, x2, xl中的任意一个, 为核函数的扩展常数。 0030 本发明还公开了一种基于SVM的新型地沟油检测装置, 包括用于测量油样电导率 的电导率检测模块、 用于测量油样酸价值的酸价值检测模块、 用于测量油样折光率的折光 率检测模块、 单片机和上位机; 所述单片机与电导率检测模块、 酸价值检测模块、 折光率检 测模块相连; 所述上位机与单片机相连, 用于接收单片机发送过来的数据, 建立和训练SVM 模型, 并判断测试油样是否为地沟油。 0031 进一步的, 所述上位机将接收到的。

14、数据分为训练集和测试集, 分别对建立的SVM模 型进行训练和测试。 0032 进一步的, 所述SVM模型中的最优分类函数为: 0033 0034式中, 为支持向量样本权重, yi表示训练样本属性, b为待优化参数; 0035 0036 其中, x表示x1, x2, xl中的任意一个, 为核函数的扩展常数。 0037 有益效果: 本发明与现有技术相比, 本发明具有以下优点: 说明书 2/7 页 5 CN 109871887 A 5 0038 1、 对于电导率只能检测食用油中泔水油含量达20以上的油样, 酸价测量对于现 阶段新型地沟油判别不准, 折光率数值过于接近不太区分的问题, 本发明通过将三个。

15、输入 属性导入SVM进行训练, 构建分类超平面, 以多种方式相结合的方法提高了对地沟油检测的 识别度。 0039 2、 测量范围更为广泛, 传统的地沟油检测方法, 只能对部分油样进行检测, 不能检 测其他的特殊油样, 而本发明只需提供多种不同已知油样, 进行多组训练, 即可检测出绝大 部分地沟油。 0040 3、 成本低廉, 与其他检测地沟油的方法对比, 本发明仪器的价格更为低廉。 附图说明 0041 图1为本发明的新型地沟油检测装置; 0042 图2为下位机主流程图; 0043 图3为上位机主流程图; 0044 图4为SVM(支持向量机)的结构; 0045 图5为SVM算法流程图; 具体实施。

16、方式 0046 下面结合附图进一步阐述本发明。 0047 本发明的一种基于SVM的新型地沟油检测方法, 具体步骤如下: 0048 S1; 通过传感器采集已知油样的电导率、 折光率、 酸价值, 这里的已知油样包括正 常油和非正常油; 0049 S2: 单片机将收集到的数据发送到上位机, 生成数据文件包括训练集和测试集; 0050 S3: 将训练集导入SVM模型进行训练, 再使用测试集对模型进行测试, 判断模型建 立的正确性; 0051 S4: 使用训练好的模型对待测油样进行分析处理, 输出处理结果。 0052 在S3中, 建立/训练SVM模型时, 假设大小为m的样本训练集(xi,yi),i1,2。

17、,, m 由两个类别组成。 若xi属于第一类。 则记yi1; 若xi属于第二类, 则记yi-1。 寻找分类超平 面: 0053 x+b0 (1) 0054 其中, 是n维向量, b为偏移量。 0055 其中, 分类超平面可以将样本正确地划分为两类, 即将相同类别的样本划分在分 类超平面的一侧, 可将油样分为正常油和非正常油(地沟油)。 即 0056 0057 定义一个样本点xi到式(1)所指的分类超平面的间隔为 0058 iyi(xi+b)|xi+b| (3) 0059为了简化计算, 将式(2)中的的和b进行归一化处理, 用和代替原来的 和b, 将归一化的间隔定义为几何间隔, 即为 说明书 3。

18、/7 页 6 CN 109871887 A 6 0060 0061 与此同时, 定义一个样本点到分类超平面的几何间隔最小(即到分类超平面的距 离最近)的样本集。 即 0062 min i (5) 0063 几何间隔的大小与样本的误分次数N有关, 关系式为 0064 0065 其中, Rmax|xi|,i1,2,m, 为样本中向量长度最长的值。 0066 由式(6)可知误分次数N的最大值由 决定, 即 越大, N越小, 在满足式(2)的条件 下, 在无数的分类超平面中选取一个最优超平面, 使得 最大, 即样本集到分类超平面的距 离, 即超平面之间的距离最大。 0067 最优分类超平面可以通过解下。

19、面的二次优化问题来获得: 0068 0069该式是当间隔 |xi+b|1时, 两样本点间的距离即为在满足 式(2)的条件下寻找最优分类超平面, 欲使最大, 即最小化所得。 0070 该式可以通过求解拉格朗日函数的鞍点得到, 即 0071 0072 其中, ai0, i1,2,.,m,为拉格朗日系数。 0073 这里根据拉格朗日对偶理论将原问题转换为对偶问题, 即 0074 0075 需要特别提及的是, 由于本发明所研究的问题是非线性的, 所以通过非线性映射 : RdH, 将原输入空间的样本映射到高维的特征空间H中, 将非线性问题转换为线性问 题。 再在高维特征空间H中构造最优分类超平面, 由于。

20、在高维特征空间中需要计算点积, 计 算量较为庞大。 因此用核函数来代替点积运算, 即用K(xi, xj)代替xixj,采用的核函数为径 向基核函数(RBF): 0076 0077 其中x表示x1, x2, xi中的任意一个, 为径向基函数的扩展常数。 映射到高维特征 空间后, 对应的对偶问题变为 0078 说明书 4/7 页 7 CN 109871887 A 7 0079 与此同时, 可能有少数几个样本为异常点, 导致原本线性可分的问题变为线性不 可分问题, 因此规则需要针对异常样本点作出修改, 即引入松弛变量, 对优化目标及约束项 进行修正, 将其转换为线性可分问题。 这里对式7的约束项和优。

21、化目标进行修改, 即 0080 0081 由于计算的复杂性, 这里将其转换为对偶问题, 其他不变, 只是约束条件变为 0082 0083 其中, C为惩罚因子, 作用是控制错分样本惩罚程度, 实现在错分样本的比例与复 杂度间的折中。 C越大, 表示惩罚力度越大, 对错分样本考虑占的权重越多, 若C比较小, 则可 以忽略不计。 0084 最终, 映射到高维特征空间且引入了松弛变量的对偶问题变为 0085 0086设求解得到的最优解为则最优的*和b*为 0087 0088 其中, xr和xs为两个类别中任意的一对支持向量。 0089 最终的最优分类函数为: 0090 0091其中, 为待优化参数,。

22、 物理意义即为支持向量样本权重, yi表示训练样本属性, 正样本或者负样本, 为计算内积的核函数, b为待优化参数。 0092 最终的分类超平面: 0093 0094 这里需要注意的是, 在引入松弛变量时所说的将非线性问题转换为线性问题与将 样本映射到高维空间将非线性问题转换为线性问题不同。 引入松弛变量将非线性问题转换 为线性问题时, 原本的问题是线性可分的, 只是因为少数的几个样本点的异常, 导致问题变 为非线性问题。 而将样本映射到高维空间时, 在原始的低维空间中, 样本就是不可分的, 无 论怎么寻找分类平面, 总会有大量的离群点, 此时用核函数向高维空间映射一下, 虽然结果 仍然是不可。

23、分的, 但比原始空间里的要更加接近线性可分的状态(就是达到了近似线性可 说明书 5/7 页 8 CN 109871887 A 8 分的状态)。 即将非线性问题转换为线性问题。 为了更好的的寻找超平面, 此时再用松弛变 量处理异常点, 那么效果将会十分显著。 0095 将训练集导入SVM模型进行训练, 此外还要将测试集导入SVM模型来进行测试, 判 断模型建立的正确性。 当模型建立完成后, 将未知油样送入装置即可得知其类别。 0096 如图1所示, 一种基于SVM的新型地沟油检测装置包括电导率检测探头1、 酸价值检 测探头2、 折光率样品槽3、 电导率检测模块4、 酸价值检测模块5、 折光率检测。

24、模块6、 MSP430 单片机7、 显示屏8和上位机9。 0097 电导率检测探头1与电导率检测模块4相连, 用于测量油样的电导率。 每测量一次 过后, 电导率检测探头1都要用无离子水进行清洗, 探头摆放的位置要注意, 要使探头完全 浸没在溶液中。 测量油样水相电导率之前, 由于部分油样的黏度过大, 需要加一些适当的石 油醚使油样的黏度变小, 使导电物质能更快更完全地被水浸提, 从而减小电导率测定的误 差。 0098 酸价值检测探头2与酸价值检测模块5相连, 用于测量油样的酸价值, 在进行测量 之前, 要对酸价值检测模块5进行校准。 同时, 每测完一次样品过后, 酸价值检测探头2都要 用蒸馏水。

25、进行清洗。 0099 折光率检测样品槽3与折光率检测模块6相连, 用于测量油样的折光率, 每测完一 次数据后, 用清水对折光率检测样品槽3进行冲洗。 0100 电导率检测模块4、 酸价值检测模块5、 折光率检测模块6与MSP430单片机7相连, 通 过串口将检测数据发送到单片机。 0101 显示屏8与MSP430单片机7相连, 用于显示检测结果。 0102 上位机9与MSP430单片机7相连, 用于接收单片机发送过来的数据, 建立/训练SVM 模型, 同时判断测试油样是否为地沟油, 并将结果下发到下位机。 0103 如图2所示, 下位机部分的具体流程如下: 首先通过各个模块分别测量已知油样的 。

26、电导率, 酸价值, 折光率, 然后通过串口将数据传输到单片机, 再由单片机对数据进行打包, 发送到上位机, 上位机用SVM算法训练模型。 当装置训练完成后, 将未知油样送入装置进行 测试, 上位机将结果反馈给下位机, 最后再由单片机上的显示屏将判别结果显示出来。 0104 如图3所示, 上位机部分的具体流程如下: 首先由下位机发送数据到上位机, 上位 机判断是否接收到下位机的数据。 如果上位机接收到下位机的数据, 上位机再判断下位机 发送的数据是否足够其用来训练, 数据足够上位机用来训练, 那么, 上位机建立SVM模型, 开 始对装置进行训练。 如果数据不够用来训练, 那么上位机一直等待, 等。

27、到数据足够训练后, 再建立模型。 模型建立后, 再将随机生成的测试集送入SVM模型, 用来验证模型建立的正确 性。 当模型正确建立后, 一个能够判别未知油样的装置已经完成。 这时, 将一份未知油样送 入仪器检测, 上位机通过一系列处理, 判断出油样类别, 发送到下位机。 0105 如图4所示, 支持向量机的结构与神经网络的结构类似, 其输出是中间节点的线性 组合, 每个中间节点对应一个支持向量, 最终得到的最优分类函数是: 0106 0107 如图5所示, 上位机接受到下位机发送的数据, 建立训练集与测试集, 数据文件中 存放输入属性矩阵变量, 即各种不同的油样的电导率、 酸价值、 以及折光率。

28、和对应的标签变 量, 即非地沟油(类别1)和地沟油(类别2), 为了数据的随机性, 用randperm函数随机生成训 说明书 6/7 页 9 CN 109871887 A 9 练集与测试集。 0108 由于电导率、 酸价值、 折光率这三个输入属性不属于同一个数量级, 输入变量的差 异较大, 不利于处理数据, 因此在建立模型之前, 还要对输入矩阵进行数据归一化。 即把数 据映射到01范围之类处理, 提高模型的精度和收敛速度。 这里运用mapminmax归一化函 数, 同时为了满足mapminmax归一化函数的需要, 需要对输入矩阵进行转置, 为了满足SVM工 具箱的需要, 还要对输入矩阵再进行一。

29、次转置。 0109 在创建/训练SVM之前, 要考虑到核函数以及相关参数对模型的影响, 即样本训练 集中的部分异常点会对模型精度产生影响, 因此引入了松弛变量。 通过参数C(惩罚因子), 来实现错分样本的比例与算法复杂度间的折中。 同时, 核函数的选择对SVM的分类性能也有 着重要的影响, 为了模型的性能最优化, 本发明选用RBF核函数。 考虑到和核函数以及相关 参数的影响, 本发明运用网格法对C/g(核函数中的方差)进行取值。 每产生一组新的C/g, 就 用svmtrain函数对模型进行训练, 如果新产生的一组C/g使得模型的性能最好, 则保留最新 的一组C/g, 如果没有使得模型的性能变得。

30、更好, 则保留以前的一组C/g。 由此确定最佳的参 数训练模型, 然后再对模型进行训练。 同时, 当模型的性能相同时, 为了减少计算时间, 选择 C(惩罚因子)较小的参数组合。 在模型进行训练后, 再将随机生成的测试集送入模型进行测 试, 以此来验证模型的正确性。 至此, 整个装置已经训练完成。 如需检测未知油样的类别, 只 要将其送入装置进行检测, 即可得出其类别。 说明书 7/7 页 10 CN 109871887 A 10 图1 图2 说明书附图 1/4 页 11 CN 109871887 A 11 图3 说明书附图 2/4 页 12 CN 109871887 A 12 图4 说明书附图 3/4 页 13 CN 109871887 A 13 图5 说明书附图 4/4 页 14 CN 109871887 A 14 。

展开阅读全文
内容关键字: 基于 SVM 新型 地沟 检测 方法 装置
关于本文
本文标题:基于SVM的新型地沟油检测方法及检测装置.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/12174352.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1