《一种基于模糊C均值聚类的农田划分方法.pdf》由会员分享,可在线阅读,更多相关《一种基于模糊C均值聚类的农田划分方法.pdf(10页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102867115 A (43)申请公布日 2013.01.09 C N 1 0 2 8 6 7 1 1 5 A *CN102867115A* (21)申请号 201210312253.3 (22)申请日 2012.08.29 G06F 19/00(2006.01) (71)申请人南京农业大学 地址 210000 江苏省南京市玄武区卫岗1号 (72)发明人曹卫星 刘乃森 倪军 朱艳 田永超 姚霞 (74)专利代理机构南京经纬专利商标代理有限 公司 32200 代理人朱小兵 (54) 发明名称 一种基于模糊c均值聚类的农田划分方法 (57) 摘要 本发明公开了一种基于模。
2、糊c均值聚类的农 田划分方法,该方法包括以下步骤:对取样点农 田土壤养分数据进行空间插值,生成栅格数据,将 不同养分的栅格数据组织成样本矩阵。在给定分 类范围内利用模糊c均值聚类对样本矩阵进行聚 类分析,对分类范围内的所有聚类结果计算聚类 效果指数S,最小S值对应的聚类结果为农田划分 结果。本发明通过确定农田最佳分类数的方法,解 决了FPI和NCE评价函数的缺陷,提高了农田划 分时对土壤养分差异的区分度,可较好地满足农 田精确管理或作物生长信息监测对农田划分的需 要。 (51)Int.Cl. 权利要求书2页 说明书4页 附图3页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利。
3、要求书 2 页 说明书 4 页 附图 3 页 1/2页 2 1.一种基于模糊c均值聚类的农田划分方法,其特征在于采用如下步骤: 步骤(1),根据农田采样点的土壤养分数据及其位置信息,对不同的土壤养分数据分别 做普通克里格插值,得到各土壤养分的栅格数据;然后将不同土壤养分的栅格数据按对应 的栅格位置组成数据对,得到所有土壤养分的样本矩阵; 步骤(2),根据土壤养分差异给定农田的最大分类数C max ,C max 为大于2的自然数; 步骤(3),利用模糊c均值聚类对样本矩阵进行聚类分析,聚类分析的分类数为2, C max ,得到C max -2+1种聚类结果; 步骤(4),分别对每种聚类结果计算聚。
4、类效果指数S,最小聚类效果指数S min 的值所对 应的分类数为最佳分类数,最佳分类数对应的聚类结果为农田划分结果。 2.根据权利要求1所述的一种基于模糊c均值聚类的农田划分方法,其特征在于:所 述步骤(1)的样本矩阵为n行l列,其中n为数据对个数,即样本数;l为土壤养分指标个 数,即样本矩阵中的每列代表一种土壤养分指标。 3.根据权利要求1所述的一种基于模糊c均值聚类的农田划分方法,其特征在于:步 骤(3)所述利用模糊c均值聚类对样本矩阵进行聚类分析的具体步骤为: 1)构建目标函数: 其中,n为样本数,c是分类数,m为模糊加权指数,u ik 表示样本矩阵X中第k个样本x k 属于聚类中心矩阵。
5、V中第i个聚类中心 i 的隶属度值,U为隶属度矩阵,d ik 2 为样本x k 与 i在特征向量上的距离平方,i、k均为自然数; 2)通过迭代,最小化(1)式J m (U,V),其中u ik 由(2)式替换,d ik 2 计算所需的 i 由(3) 式替换, 3)如果两次循环中聚类中心的变化小于设定的阈值,则停止迭代,否则重复步骤2),直 至聚类中心的变化小于设定的阈值或达到设定的迭代次数,其中所述阈值取10 -3 -10 -5 ,迭 代次数取50-500次。 4.根据权利要求1所述的一种基于模糊c均值聚类的农田划分方法,其特征在于所述 步骤(3)聚类效果指数S计算公式为, 其中,c是分类数,c。
6、2,C max ,l为土壤养分指标个数,即样本矩阵的列数;n为样本 矩阵的行数,即土壤养分的样本数,n ij 为养分指标j在分类i中的数据个数,CV ij 为养分指 权 利 要 求 书CN 102867115 A 2/2页 3 标j的第i个分类的变异系数,i1,c,j1,l,CV vf 为通过养分指标f所有聚类中 心计算的变异系数,f1,l。 权 利 要 求 书CN 102867115 A 1/4页 4 一种基于模糊 c 均值聚类的农田划分方法 技术领域 0001 本发明涉及一种农田划分方法,尤其涉及一种利用土壤养分信息对农田进行划分 的方法。 背景技术 0002 精确农作管理通过监测作物生长。
7、及农田环境信息,根据农田小区环境及作物长势 差异,实施定位、定量、定时的农业精确管理,在保证作物产量和品质的前提下,可获得最佳 经济和生态效益。作物的长势差异主要受农田土壤养分差异的影响,而土壤养分在空间上 具有相关性,因此利用土壤养分信息对农田进行划分,使养分相似的农田区域划分为一类, 可减少农田监测点的数量,对实现作物生长信息的快速、低成本监测有着重要的现实意义。 0003 模糊c均值聚类因其具备的人工智能特性,在农田的分区研究中成为热点,并得 到广泛的应用,但使用该方法划分农田时最佳分类数仍需其它评价函数来确定。 0004 普遍使用的评价函数有模糊性能指数FPI和归一化分类熵NCE。 0。
8、005 其中,其中c为分类数,n为样本数,u ik 为样本X k 属 于第i类的隶属度值。FPI的值在0到1之间,该值接近0表示聚类时共用数据少,类的划 分明显,若该值接近1,则表示有较多的共用数据,类的划分不明显,因此FPI越小聚类效果 越好。对数的底数a可为任意正整数,NCE也是值越 小,分类效果越好。一般FPI和NCE需联合使用,即取FPI和NCE均为最小值所对应的分类 数为最佳分类数。 0006 上述利用FPI和NCE评价函数来确定模糊c均值聚类划分农田的最佳分类数 的方法在以下文献中有描述:李艳,史舟,吴次芳,等.基于模糊聚类分析的田间精确 管理分区研究J.中国农业科学,2007(1。
9、):114-122;Moral F J,Terron J M,Silva J R.Delineation of management zones using mobile measurements of soil apparent electrical conductivity and multivariate geostatistical techniquesJ.Soil and Tillage Research,2010,106(2):335-343。 0007 使用FPI和NCE评价函数来确定模糊c均值聚类划分农田的最佳分类数的方法存 在缺陷:FPI和NCE对农田养分差异的区分度不高,导。
10、致了最终的分类数偏少,而且常有FPI 和NCE最小值所对应的分类数不一致的现象发生,导致无法确定合适的分类数。 发明内容 0008 本发明所要解决的技术问题是克服上述利用模糊c均值聚类对农田进行划分时, 利用FPI和NCE评价函数确定最佳分类数的缺陷,提供一种更有效的利用模糊c均值聚类 对农田进行划分的方法,提高农田划分时对土壤养分的区分度。 0009 本发明为解决上述技术问题采用以下技术方案: 说 明 书CN 102867115 A 2/4页 5 0010 一种基于模糊c均值聚类的农田划分方法,采用如下步骤: 0011 步骤(1),根据农田采样点的土壤养分数据及其位置信息,对不同的土壤养分数。
11、据 分别做普通克里格插值,得到各土壤养分的栅格数据;然后将不同土壤养分的栅格数据按 对应的栅格位置组成数据对,得到所有土壤养分的样本矩阵; 0012 步骤(2),根据土壤养分差异给定农田的最大分类数C max ,C max 为大于2的自然数; 0013 步骤(3),利用模糊c均值聚类对样本矩阵进行聚类分析,聚类分析的分类数为 2,C max ,得到C max -2+1种聚类结果; 0014 步骤(4),分别对每种聚类结果计算聚类效果指数S,最小聚类效果指数S min 的值 所对应的分类数为最佳分类数,最佳分类数对应的聚类结果为农田划分结果。 0015 进一步的,本发明的一种基于模糊c均值聚类的。
12、农田划分方法,所述步骤(1)的样 本矩阵为n行l列,其中n为数据对个数,即样本数;l为土壤养分指标个数,即样本矩阵中 的每列代表一种土壤养分指标。 0016 进一步的,本发明的一种基于模糊c均值聚类的农田划分方法,步骤(3)所述利用 模糊c均值聚类对样本矩阵进行聚类分析的具体步骤为: 0017 1)构建目标函数: 0018 0019 其中,n为样本数,c是分类数,m为模糊加权指数,u ik 表示样本矩阵X中第k个样 本x k 属于聚类中心矩阵V中第i个聚类中心 i 的隶属度值,U为隶属度矩阵,d ik 2 为样本 x k 与 i 在特征向量上的距离平方,i、k均为自然数; 0020 2)通过迭。
13、代,最小化(1)式J m (U,V),其中u ik 由(2)式替换,d ik 2 计算所需的 i 由 (3)式替换, 0021 0022 0023 3)如果两次循环中聚类中心的变化小于设定的阈值,则停止迭代,否则重复步 骤2),直至聚类中心的变化小于设定的阈值或达到设定的迭代次数,其中所述阈值取 10 -3 -10 -5 ,迭代次数取50-500次。 0024 进一步的,本发明的一种基于模糊c均值聚类的农田划分方法,所述步骤(3)聚类 效果指数S计算公式为, 0025 0026 其中,c是分类数,c2,C max ,l为土壤养分指标个数,即样本矩阵的列数;n为 样本矩阵的行数,即土壤养分的样本。
14、数,n ij 为养分指标j在分类i中的数据个数,CV ij 为养 说 明 书CN 102867115 A 3/4页 6 分指标j的第i个分类的变异系数,i1,c,j1,l,CV vf 为通过养分指标f所有聚 类中心计算的变异系数,f1,l。 0027 本发明采用以上技术方案与现有技术相比,具有以下技术效果: 0028 本发明解决了背景技术中FPI和NCE的缺陷,提供了一种模糊c均值聚类对农田 进行划分确定最佳分类数的方法,提高了农田划分时对土壤养分差异的区分度,可较好的 满足农田精确管理或作物生长信息监测对农田划分的需要。 附图说明 0029 图1为本发明的农田划分流程图。 0030 图2为土。
15、壤养分的普通克里格插值结果图;其中(a)为有机质含量插值结果图, (b)为全氮含量插值结果图,(c)为速效钾含量插值结果图,(d)为速效磷含量插值结果图。 0031 图3为各分类情况下聚类效果指数S曲线图。 0032 图4农田划分结果示意图。 具体实施方式 0033 下面结合附图对本发明的技术方案做进一步的详细说明: 0034 如图1所示,本发明的农田划分方法具体包括以下几个步骤: 0035 1.将农田采样点的土壤养分数据及位置信息输入GIS软件,对不同的养分数据分 别做普通克里格插值,将插值结果输出为ASCII格式的栅格数据。不同ASCII文件同一栅 格位置的土壤养分数据组成数据对作为一个样。
16、本,将所有样本组织成样本矩阵。样本矩阵 为n行l列,n为数据对个数,即样本数,l为土壤养分指标个数,样本矩阵每列代表一种土 壤养分指标。 0036 2.给定农田最大分类数C max ,C max 通常取10左右。 0037 3.利用常规模糊c均值聚类对样本矩阵进行聚类分析,聚类分析的分类数为2, C max ,得到C max -2+1种聚类结果,对每种聚类结果分别计算聚类效果指数S,最小聚类效果指 数S min 的值所对应的分类数为最佳分类数,最佳分类数对应的聚类结果为农田划分结果。 0038 上述技术方案中,模糊c均值聚类对农田划分的具体步骤为: 0039 1)构建目标函数 0040 004。
17、1 其中,n为样本数,c是分类数,m为模糊加权指数,通常取m=1.3,u ik 表示样本矩 阵X中第k个样本x k 属于聚类中心矩阵V中第i个聚类中心 i 的隶属度值,U为隶属度 矩阵。d ik 2 为样本x k 与 i 在特征向量上的距离平方。 0042 2)通过迭代,最小化(1)式J m (U,V),其中u ik 由(2)式替换,d ik 2 计算所需的 i 由 (3)式替换, 0043 说 明 书CN 102867115 A 4/4页 7 0044 0045 如果两次循环中聚类中心的变化小于设定的阈值,则停止迭代,否则重复步骤2), 直至聚类中心的变化小于设定的阈值或达到设定的迭代次数。。
18、阈值通常取10 -3 -10 -5 ,迭代 次数通常取50-500次。 0046 上述技术方案中,聚类效果指数S的计算方法为: 0047 0048 其中,c是分类数,c2,C max ,l为土壤养分指标个数,即样本矩阵的列数,通 常为3-10,n为样本矩阵的行数,即土壤养分的样本数,其取值由实际情况决定,n ij 为养分 指标j在分类i中的数据个数,CV ij 为养分指标j的第i个分类的变异系数,i1,c, j1,l,CV vf 为通过养分指标f所有聚类中心计算的变异系数,f1,l。 0049 具体实施例: 0050 1)将江苏省如皋市土壤有机质含量、全氮含量、速效钾含量和速效磷含量及坐标 位。
19、置信息输入ArcGIS 9.2,对土壤的4个养分指标分别做普通克里格插值,插值结果见图 2。其中(a)为有机质含量插值结果图,(b)为全氮含量插值结果图,(c)为速效钾含量插值 结果图,(d)为速效磷含量插值结果图。插值结果以ASCII文件的形式输出,将4个ASCII 文件中同一栅格位置的土壤养分数据组织成一个样本,得到n行4列的样本矩阵,n为样本 数,样本矩阵每列代表一种土壤养分数据。 0051 2)给定农田的最大分类数C max =10。 0052 3)聚类分析。通过常规模糊c均值聚类对样本矩阵进行聚类分析,模糊c均值聚 类运行的参数中,模糊加权指数m=1.3,迭代次数取100,阈值为10 -5 ,分类数为2,10,经过 运算得到9种聚类结果。 0053 4)确定农田划分结果。对步骤3)得到的9种聚类结果分别计算聚类效果指数S, 结果见图3。由图3可知,分8类时S值最小,即最佳分类数为8,分类数8所对应的聚类即 为农田划分结果,见图4。 说 明 书CN 102867115 A 1/3页 8 图1 说 明 书 附 图CN 102867115 A 2/3页 9 图2 说 明 书 附 图CN 102867115 A 3/3页 10 图3 图4 说 明 书 附 图CN 102867115 A 10 。