《基于RSS的农用土地信息发送方法和系统.pdf》由会员分享,可在线阅读,更多相关《基于RSS的农用土地信息发送方法和系统.pdf(17页完整版)》请在专利查询网上搜索。
1、10申请公布号CN104199938A43申请公布日20141210CN104199938A21申请号201410455932522申请日20140909G06F17/30200601G06Q50/0220120171申请人北京师范大学地址100000北京市海淀区新街口外大街19号72发明人岳建伟关茜刘方陈云浩宫阿都李京74专利代理机构北京京万通知识产权代理有限公司11440代理人许天易马云超54发明名称基于RSS的农用土地信息发送方法和系统57摘要本发明涉及一种基于RSS的农用土地信息发送方法,以解决在提供RSS信息推送服务时,为使用者提供更准确更全面的农用土地信息。其特征在于包括步骤用于发。
2、布农用土地信息的服务器根据XML生成至少一种RSSFEED信息;服务器根据用户在订阅该RSSFEED信息时,接收该用户所输入的至少一个关注区域信息;服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息;以及,服务器将包含有该地名信息的RSSFEED信息推送给用户。本发明还涉及一种基于RSS的农用土地信息发送系统。51INTCL权利要求书2页说明书10页附图4页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书10页附图4页10申请公布号CN104199938ACN104199938A1/2页21一种基于RSS的农用土地信息发送方法,其特征在于包括步骤用于发布农用土地信息的。
3、服务器根据XML生成至少一种RSSFEED信息;服务器根据用户在订阅该RSSFEED信息时,接收该用户所输入的至少一个关注区域信息;服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息;以及服务器将包含有该地名信息的RSSFEED信息推送给用户。2根据权利要求1所述的基于RSS的农用土地信息发送方法,其特征在于所述地名匹配算法包括步骤A将所述关注区域在基准行政区划数据库中进行匹配,找到该关注区域所对应的行政区划编码并存储;B根据该行政区划编码查找是否包含有下级行政区;C若有,则存储该行政区划代码并返回步骤B;D将所有存储的行政区划代码转换成对应的区域地名;以及E输出该区域地名信息。3根据权。
4、利要求1或2所述的基于RSS的农用土地信息发送方法,其特征在于还包括步骤服务器获取来自于客户的浏览信息;将该浏览信息根据文本分词算法进行分词处理,得到至少一个关键词;从该关键词中获取至少一个地名关键词,根据所述关注区域获取该地名关键词所对应的空间临近度因子,该空间临近度因子与所述关注区域到该地名地区之间的距离相关;将各关键词进行TFIDF权值计算,将地名关键词的TFIDF权值乘以其所对应的空间临近度因子;将TFIDF权值满足一定条件的关键词放入到RSSFEED模型中的用户兴趣子集中;以及服务器根据该用户兴趣子集中的关键词为用户推荐信息。4根据权利要求3所述的基于RSS的农用土地信息发送方法,其。
5、特征在于还包括步骤所述服务器建立地名数据库并在RSSFEED信息模型中建立地名数据层;将所述地名关键词和空间临近度因子放入该地名数据库中;以及将地名关键词放入该地名数据层中并且所述用户兴趣子集中不包括该地名关键词,从而形成个性化RSSFEED信息模型。5根据权利要求3或4所述的基于RSS的农用土地信息发送方法,其特征在于所述TFIDF权值由公式TFIDFI,JTFI,JIDFI获得,其中NI,J是该关键词在文件中的出现次数;|D|表示的是总的文件数量,表示的是包含词语TI的文件数量。6根据权利要求5所述的基于RSS的农用土地信息发送方法,其特征在于所述TF值权利要求书CN104199938A2。
6、/2页3进一步由公式获得,其中、分别表示关键词出现在标题、摘要和信息体原文中的频率,PTITLE、PDES、PTEXT分别代表关键词出现在标题、摘要和信息体原文时的权重值。7根据权利要求3或4所述的基于RSS的农用土地信息发送方法,其特征在于所述空间临近度因子QZEXPAX,其中A是拉伸系数,当A等于0时QZ等于1,表示不考虑空间位置对关键词权重计算结果的影响,当A不等于0时,X为两地区之间的距离。8根据权利要求3或4所述的基于RSS的农用土地信息发送方法,其特征在于还包括步骤所述服务器对所述包含有该地名信息的RSSFEED信息进行查全率和/或查准率验证,如果该查全率和/或查准率满足一定阙值时。
7、,服务器将包含有该地名信息的RSSFEED信息推送给用户;所述RSSFEED模型分为四层,分别为用户信息层、信息类别层、用户兴趣子集层和地名数据层;该信息类别层包括农地转出信息、农地转入信息、行政法规信息和/或交易流程信息。9一种基于RSS的农用土地信息发送方法,其特征在于包括步骤客户端接收自农用土地服务器根据XML生成至少一种RSSFEED信息;客户端的用户在订阅该RSSFEED信息时,输入至少一个关注区域信息,客户端将该信息发送至服务器;服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息;以及客户端接收自包含有该地名信息的RSSFEED信息。10一种基于RSS的农用土地信息发送系统,。
8、其特征在于包括如下模块RSS信息发布模块用于发布农用土地信息的服务器根据XML生成至少一种RSSFEED信息;信息接收模块用于根据用户在订阅该RSSFEED信息时,接收该用户所输入的至少一个关注区域信息;信息匹配模块用于根据地名匹配算法筛选出该关注区域内所包含的地名信息;RSS信息推送模块用于将包含有该地名信息的RSSFEED信息推送给用户;信息反馈模块用于获取来自于客户的浏览信息;关键词处理模块用于将该浏览信息根据文本分词算法进行分词处理,得到至少一个关键词;从该关键词中获取至少一个地名关键词,根据所述关注区域获取该地名关键词所对应的空间临近度因子,该空间临近度因子与所述关注区域到该地名地区。
9、之间的距离相关;将各关键词进行TFIDF权值计算,将地名关键词的TFIDF权值乘以其所对应的空间临近度因子;将TFIDF权值满足一定条件的关键词放入到RSSFEED模型中的用户兴趣子集中;以及信息推荐模块用于根据该用户兴趣子集中的关键词为用户推荐信息。权利要求书CN104199938A1/10页4基于RSS的农用土地信息发送方法和系统技术领域0001本发明涉及一种土地信息的发送方法,特别涉及一种基于RSS机制的农用土地信息发送方法和系统。背景技术0002RSSREALLYSIMPLESYNDICATION,真正简易的聚合是目前较为成熟和成功的信息推送技术之一。RSS信息推送技术具有实时性强、无。
10、垃圾信息、信息获取高效便捷、成本低、跨平台性好等特点。它是基于XMLEXTENSIBLEMARKUPLANGUAGE,可扩展标记语言的一种格式,并且所有的RSS文件都必须遵守W3C万维网联盟发布的XML20规范。XML是一种标准通用语言SGML,STANDARDGENERALIZEDMARKUPLANGUAGE。XML存储简单,数据采用创建简易、扩展便捷的一系列标记描述。0003RSS在人性化服务方面探索了一个全新的信息服务理念,在跟踪用户浏览行为的基础上,对用户浏览的信息进行统计和整理,并通过一系列数学方法建立用户兴趣模型,利用用户兴趣模型挖掘出用户可能感兴趣的信息,将这些信息主动推送给用户。
11、。0004RSSFEED是RSS技术中的核心部分,每一个RSSFEED文件就是一个RSS数据源,里面封装了符合特定XML格式的数据。网站通过RSSFEED将信息传播给用户,网站提供RSSFEED服务是用户能够订阅网站信息的先决条件。0005常规的基于RSS信息推送技术的农用土地流转信息发送流程如图1所示,可以分为以下几步00061RSSFEED信息生成过程农地流转的网站提供者根据XML生成算法发布RSSFEED。网站的信息提供者将每一个类别信息的内容,比如农地转出信息,写入到一个XML文件中,这个XML文件也就是RSSFEED,每个RSSFEED都遵照RSS20标准,之后将这个RSSFEED的。
12、链接发布在网站上,并以一定的方式对RSSFEED进行更新。网站有几个提供这种服务的信息类别,就发布几个对应的RSSFEED文件。00072RSSFEED信息推送过程信息浏览者使用客户端,对相应的RSSFEED进行订阅查看。根据浏览者需要,服务者将信息推送给客户,客户从而获取相应类别的信息内容。客户端软件负责对相应的RSSFEED进行解析,将RSSFEED中的内容以列表的形式展现给用户,用户根据自己的需要点击相应的内容条目浏览信息。00083RSSFEED信息推荐过程有些网站还提供用户兴趣信息推荐的功能,即根据用户日常的浏览行为记录,通过模型计算出用户潜在的可能感兴趣的信息,将这些信息也推荐给用。
13、户。具体的,通常RSS信息模型采用的是三层结构的树状用户兴趣模型,该模型由用户根节点、信息类别和用户兴趣子集三层构成,通过获取用户点击等隐式信息,将这些信息根据文本分词算法进行分析处理,得到关键词,将这些关键词进行权值计算,将权值较高的关键词作为用户感兴趣关键词放入到用户兴趣子集中,提供服务者按该用户兴趣子集中的关键词为用户推荐信息。0009这种常规的基于RSS的信息推送机制还存在以下不足说明书CN104199938A2/10页500101在进行RSSFEED信息推送时,由于只涉及到信息分类过程,而对每个类别中信息内容没有进一步的筛选,因而每个类别中仍包含一些用户并不关心的信息,信息冗余程度较。
14、高。00112在进行RSSFEED信息推荐时,RSS兴趣模型也没有考虑到农地流转用户对地名信息的关注度,忽略了信息推荐的地域性差异,RSS用户兴趣模型将地名信息与其它关键词“一视同仁”,显然不满足用户的需求。因为,地名信息常常不是孤立的而是有内在联系的,原始的RSS用户兴趣模型没有考虑到地名信息之间的内在联系,因而降低了信息推荐的准确度。发明内容0012针对现有技术中的不足,本发明提供了一种基于RSS机制的农用土地信息发送方法,以解决在提供RSS信息推送服务时,为使用者提供更准确更全面的农用土地信息。0013进一步地,在此基础上,本发明中的方法还可解决在提供RSS信息推荐服务时,为使用者提供更。
15、准确的用户感兴趣农用土地信息。0014为了解决上述问题,该种基于RSS的农用土地信息发送方法,其包括步骤0015用于发布农用土地信息的服务器根据XML生成至少一种RSSFEED信息;0016服务器根据用户在订阅该RSSFEED信息时,接收该用户所输入的至少一个关注区域信息;0017服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息;以及0018服务器将包含有该地名信息的RSSFEED信息推送给用户。0019优选地,所述地名匹配算法包括步骤0020A将所述关注区域在基准行政区划数据库中进行匹配,找到该关注区域所对应的行政区划编码并存储;0021B根据该行政区划编码查找是否包含有下级行政区;。
16、0022C若有,则存储该行政区划代码并返回步骤B;0023D将所有存储的行政区划代码转换成对应的区域地名;以及0024E输出该区域地名信息。0025优选地,还包括步骤0026服务器获取来自于客户的浏览信息;0027将该浏览信息根据文本分词算法进行分词处理,得到至少一个关键词;0028从该关键词中获取至少一个地名关键词,根据所述关注区域获取该地名关键词所对应的空间临近度因子,该空间临近度因子与所述关注区域到该地名地区之间的距离相关;0029将各关键词进行TFIDF权值计算,将地名关键词的TFIDF权值乘以其所对应的空间临近度因子;0030将TFIDF权值满足一定条件的关键词放入到RSSFEED模。
17、型中的用户兴趣子集中;以及0031服务器根据该用户兴趣子集中的关键词为用户推荐信息。0032优选地,还包括步骤说明书CN104199938A3/10页60033所述服务器建立地名数据库并在RSSFEED信息模型中建立地名数据层;0034将所述地名关键词和空间临近度因子放入该地名数据库中;以及0035将地名关键词放入该地名数据层中并且所述用户兴趣子集中不包括该地名关键词,从而形成个性化RSSFEED信息模型。0036更优选地,所述TFIDF权值由公式TFIDFI,JTFI,JIDFI获得,其中NI,J是该关键词在文件中的出现次数;|D|表示的是总的文件数量,表示的是包含词语TI的文件数量。003。
18、7更优选地,所述TF值进一步由公式获得,其中、分别表示关键词出现在标题、摘要和信息体原文中的频率,PTITLE、PDES、PTEXT分别代表关键词出现在标题、摘要和信息体原文时的权重值。0038优选地,所述空间临近度因子QZEXPAX,其中A是拉伸系数,当A等于0时QZ等于1,表示不考虑空间位置对关键词权重计算结果的影响,当A不等于0时,X为两地区之间的距离。0039优选地,还包括步骤0040所述服务器对所述包含有该地名信息的RSSFEED信息进行查全率和/或查准率验证,如果该查全率和/或查准率满足一定阙值时,服务器将包含有该地名信息的RSSFEED信息推送给用户;0041所述RSSFEED模。
19、型分为四层,分别为用户信息层、信息类别层、用户兴趣子集层和地名数据层;该信息类别层包括农地转出信息、农地转入信息、行政法规信息和/或交易流程信息。0042本发明的一种基于RSS的农用土地信息发送方法,其包括步骤0043客户端接收自农用土地服务器根据XML生成至少一种RSSFEED信息;0044客户端的用户在订阅该RSSFEED信息时,输入至少一个关注区域信息,客户端将该信息发送至服务器;0045服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息;以及0046客户端接收自包含有该地名信息的RSSFEED信息。0047本发明的一种基于RSS的农用土地信息发送系统,其包括如下模块0048RSS。
20、信息发布模块用于发布农用土地信息的服务器根据XML生成至少一种RSSFEED信息;0049信息接收模块用于根据用户在订阅该RSSFEED信息时,接收该用户所输入的至少一个关注区域信息;0050信息匹配模块用于根据地名匹配算法筛选出该关注区域内所包含的地名信息;0051RSS信息推送模块用于将包含有该地名信息的RSSFEED信息推送给用户;0052信息反馈模块用于获取来自于客户的浏览信息;0053关键词处理模块用于将该浏览信息根据文本分词算法进行分词处理,得到至少一个关键词;从该关键词中获取至少一个地名关键词,根据所述关注区域获取该地名关键说明书CN104199938A4/10页7词所对应的空间。
21、临近度因子,该空间临近度因子与所述关注区域到该地名地区之间的距离相关;将各关键词进行TFIDF权值计算,将地名关键词的TFIDF权值乘以其所对应的空间临近度因子;将TFIDF权值满足一定条件的关键词放入到RSSFEED模型中的用户兴趣子集中;以及0054信息推荐模块用于根据该用户兴趣子集中的关键词为用户推荐信息。0055本发明的有益效果是本发明由于将地名匹配技术结合到RSS信息推送技术中,并将改进后的RSS信息推送技术应用到农地流转信息推送领域,使得农地流转信息推送的准确性有显著提高,因而有益于促进农地流转业务发展的速度和规模。附图说明0056图1为现有技术中基于RSS的农用土地信息发送方法的。
22、流程图;0057图2为本发明的基于RSS的农用土地信息发送方法的流程图;0058图3为本发明的地名匹配方法流程图;0059图4为本发明的涉及空间临近度因子的个性化RSS模型方框图;0060图5为我国县级及以上的行政区划代码图;0061图6为我国县级以下行政区划代码图。具体实施方式0062下面结合附图对本发明做进一步地说明。0063本发明主要涉及两部分一部分是基于地名匹配步骤的RSS的农用土地信息推送方法的改进,另一部分是在该基础上,对基于地名匹配步骤的RSS的农用土地信息推荐方法的改进。该RSS信息推送和信息推荐方法在这里统称为信息发送方法。0064如图1所示,该种基于RSS的农用土地信息发送。
23、方法,包括如下步骤0065步骤101,建立农用土地信息网站,该网站服务器用于发布农用土地信息。步骤102,网站服务器根据XML生成算法生成至少一种RSSFEED信息。具体的农地流转的网站提供者,将每一个类别的内容,例如所有的农地转出信息,按照RSS20的标准,将这部分信息写入到一个XML文件中,也就是RSSFEED中,之后将这个RSSFEED的链接发布在网站上,并以一定的方式对这个RSSFEED进行实时的更新,网站有几个提供订阅服务的信息类别,就发布几个对应类别的RSSFEED文件。0066步骤103,服务器根据用户在订阅该RSSFEED信息时,接收该用户所输入的至少一个关注区域信息。用户在订。
24、阅RSS信息时,除了订阅信息类别,还需要用户指明或输入所关心的行政区域范围,例如重庆市长寿区和/或重庆市双龙区。该步骤的功能通常可以由安装在电脑或手机上的客户端软件实现。0067步骤104,服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息。由于地名信息是土地流转信息中非常重要的一部分,大多数用户会通过地名来寻找土地。而且地名之间存在包含与被包含的空间关系,所以在进行土地流转信息推送时要着重关注地名信息。0068该地名匹配算法如图2所示,地名匹配即将地名与基准行政区划数据库中的地名属性做比较,找到其对应的行政区划编码,根据编码规则判断是否含有下级行政区划。如果说明书CN104199938。
25、A5/10页8含有,则返回下级行政区划名,并根据这些行政区划名排除干扰信息的过程,最后输出所有匹配出的地名信息。若对一组地名进行匹配分析,则找到对应行政区划编码后选取较小行政区域的行政区划编码进行判断。0069其中,行政区划代码标准是支我国经济发展和社会发展必不可少的基础标准之一,已经被广泛应用到各个政府部门和企事业单位的信息化工作中。中华人民共和国行政区划代码也称为行政代码,是国家各级行政机关的识别符号。目前描述全国行政区划代码的国家标准有两个,一个是中华人名共和国行政区划代码GB/T2260,另一个是县级以下行政区划代码编制规则GB/T10114。GB/T2260规定了我国县级及以上的行政。
26、区划代码,由中华人名共和国国家统计局公布,其中前两位代表省自治区、直辖市、特别行政区,第三、四位代表市地区、自治州、盟及国家直属市所属市辖区和县的汇总码、第五六位代表县市辖区、县级市、旗。如图5所示0070GB/T10114规定了县级以下行政区代码的编码规则,在规则中规定县级及以下的行政区代码分为两段,由九位阿拉伯数字构成,前一段使用GB/T2260中规定的六位数字代码,用来表示县级及县级以上的行政区划,后一段的三位阿拉伯数字表示县级以下的行政区划,其中以“0”开头表示街道或地区,以“1”开头表示镇或民族镇,以“2”或“3”开头表示民族乡、苏木,具体表示为0071001099表征的是街道地区0。
27、072100199表征的是镇民族镇0073200399表征的是乡、民族乡、苏木0074县级以下行政区划代码如图6所示0075县级以下的行政区划代码根据行政从属关系和上面列出的区划类型,经过统一排序后再进行编码。0076步骤105,服务器将包含有该地名信息的RSSFEED信息推送给用户。通过地名匹配步骤筛选出包含用户订阅的行政区范围下地名信息的信息条目,将这些信息条目推送给用户。0077最后,步骤106,通过XML解析算法,该RSSFEED信息在用户的客户端展示,用户通过客户端浏览信息。0078在此基础之上,本发明拟针对农地流转业务流程,对原RSS的用户兴趣模型进行改进,在地名匹配的基础上,将空。
28、间位置邻近度因子引入到推荐模型中,通过空间位置邻近度因子对不同的地名关键词赋予不同的权重。0079该个性化RSS模型如图4所示,RSS的三层用户兴趣模型是一个树状的层次结构,树冠是用户模型的标识用户名或设备ID,只是一个虚节点;第二层是频道类别,就是信息体归属的大抵种类主题;第三层是用户兴趣的子集,这一层通过文本的相似度判断后利用自动聚类生成。本发明的农地流转信息的三层用户兴趣模型,树冠为移动设备的ID;第二层为信息的类别,与流转信息网站的信息归类相对应;第三层为主题信息的子类;最下面一层是用户兴趣地名数据层,这是本发明中新加的一层。0080RSS用户兴趣模型可基于TFIDF算法计算关键词权重。
29、,从而挖掘用户潜在的感兴趣的信息,是系统信息推荐的基础。分词是TFIDF算法的前期准备工作,经过分词步骤提取出关键词后,使用TFIDF计算每个关键词的权重,权重值越大的关键词则更能代表用户说明书CN104199938A6/10页9感兴趣的信息内容,系统就可以将包含这些关键词的类似信息推送给用户了。0081本发明在RSS的TFIDF关键词权重计算方法中,对地名关键词添加空间位置邻近度因子,体现信息推荐的地域性特点。新模型的基本思想是00821在现有的RSS三层用户兴趣模型的基础上,引入地名数据层,构成基于RSS数据源的四层用户模型结构。00832在关键词权重TFIDF算法中添加空间位置邻近度因子。
30、,在横向上,地名关键词权重与空间邻近度成正相关关系;从纵向上,地名之间属于包含关系,则空间位置邻近度因子为1。0084现结合图1和图4,该方法进一步包括步骤107,服务器获取来自于客户的浏览信息,该浏览信息可以通过日常用户点击或用户反馈等方式获取。0085步骤108,将该浏览信息根据文本分词算法进行分词处理,得到至少一个关键词;从该关键词中获取至少一个地名关键词,根据所述关注区域信息获取该地名关键词所对应的空间临近度因子,该空间临近度因子与关注区域到该地名地区之间的距离相关,将各关键词进行TFIDF权值计算,将地名关键词的TFIDF权值乘以空间临近度因子,之后,将TFIDF权值满足一定条件的关。
31、键词放入到RSSFEED模型中的用户兴趣子集中形成个性化RSSFEED。这里TFIDF的满足条件可以为大于一个阙值或者将所有关键词进行排序,选择TFIDF权值靠前的关键词。TFIDF权值的满足条件可以由用户自己定义,这里不再额外举例。0086其中,基于RSS数据源的用户兴趣模型关键词权重TFIDF算法00870088其中,NI,J是该关键词在文件DJ中的出现次数,关键词就是将文件DJ文本分词后,删除当中对于用户兴趣建模没有帮助的词如感叹词、介词、连词、拟声词和助词等之后剩下的词,分母则是在文件DJ中所有关键词的出现次数之和。考虑到关键词出现的位置,那么00890090式中,、分别表示关键词出现。
32、在标题、摘要和信息体原文中的频率,PTITLE、PDES、PTEXT分别代表关键词出现在标题、摘要和信息体原文时的权重值,其取值范围为0,100910092其中,|D|表示的是总的文件数量;表示的是包含词语TI的文件数量。0093TFIDFI,JTFI,JIDFI40094转入和转出地块信息包含共同的关键信息地块所在行政区域、地块面积、地块价格和土地利用类型,提取以上四类关键词作为农地转入用户和农地转出用户的兴趣信息模型关键词;就组织管理者而言,需要可能对农地转入、农地转出、交易动态、法律法规等一个类别或多个类别感兴趣,因此使用行政区区域关键词构建该类用户的用户兴趣信息模型。进行分词时,构建行。
33、政区域、地块面积、地块价格和土地类型词库样本,准确提取上述四类说明书CN104199938A7/10页10信息,并对四类关键词赋予较高的权重值,对于行政区域关键词,还需要在原权重值的基础上考虑空间邻近度因子。考虑空间位置邻近度因子的关键词权重TFIDF算法0095TFIDFI,JTFI,JIDFIQZ50096式5中,QZ代表空间位置邻近度因子,是行政区之间距离的归一化函数,满足QZEXPAX,其中A是拉伸系数,当A等于0时QZ等于1,表示不考虑空间位置对关键词权重计算结果的影响,当A不等于0时,X为行政区间距离,X值越大,则QZ值越小。0097在初始阶段,系统根据用户的类别按照上述用户兴趣信。
34、息模型提取关键词,计算关键词的权重并将相关信息推送给用户;通过用户浏览反馈积累一定数量的用户兴趣样本后,可以对某个用户的兴趣数据进行TFIDF关键词权重计算,得到该用户感兴趣的其他关键词加入该用户的兴趣信息关键词模型,从而更新该用户兴趣信息关键词模型。0098其中,所述服务器可以建立地名数据库并在RSSFEED信息模型中建立地名数据层;将所述地名关键词和空间临近度因子放入该地名数据库中;将地名关键词放入该地名数据层中并且所述用户兴趣子集中可以不包括该地名关键词,从而形成个性化RSSFEED信息模型。在生成个性化RSSFEED时,需要计算提取出的关键词的权重值。由于农地流转信息对地名信息十分敏感。
35、,所以在进行分词提取关键词时,应建立相应的地名词库,以便分词程序能准确提取出地名信息。0099该个性化RSSFEED模型分为四层分别为用户信息层、信息类别层、用户兴趣子集层和地名数据层,其中该信息类别层可包括农地转出信息、农地转入信息、行政法规信息和交易流程等信息。0100最后,该服务器还可对所述包含有该地名信息的RSSFEED信息进行查全率和/或查准率验证,如果该查全率和/或查准率满足一定阙值时,服务器将包含有该地名信息的RSSFEED信息推送给用户。0101实施例0102本发明以重庆市长寿区为例,建立基于RSS和地名匹配的农地流转信息推送机制。流程包括01031建立农地流转网站,在网站中设。
36、置农地转入、农地转出、最新动态、政策法规四个频道,在每个频道下面录入包含地名信息的信息体,并给每一个频道发布添加地名匹配步骤的RSS服务。01042开发基于ANDROID的RSS客户端软件,在软件登录时,模拟买方、卖方和组织管理者三类用户,分别订阅农地转出信息A、农地转入信息B和最新动态信息C三类信息,并假定三类用户关心的行政区范围为重庆市长寿区。01053计算空间位置邻近度因子,开发系统的信息推荐模块。根据重庆市长寿区各乡镇间距离计算得出空间位置临近度因子,结果如下表所示。0106重庆市长寿区各乡镇间空间位置临近度因子0107说明书CN104199938A108/10页11010801094。
37、采用信息获取中的监测评估标准查准率RPRECISION、召回率RRECALL和F1综合分类率进行模型验证。0110查准率、召回率和F1测试值的计算公式如下说明书CN104199938A119/10页120111011201130114式中,M为系统推送的相关信息体数目,L为系统总的推送的信息体数目,N为所有相关的信息体数目。0115经试验,改进前后的RSS信息推送及推荐模型的实验结果比对如下表中以斜线分隔改进前后的数据0116改进的RSS信息推送及推荐模型测试结果前后对比01170118注实验中,公式2的、均设为1,即不考虑关键词出现位置的影响0119原RSS信息推送模型只是粗略的对信息类别提。
38、供定制和聚合,并没有对信息内容提供进一步的筛选和过滤,信息推荐时也没有根据信息推送对象建立用户兴趣信息模型,由实验结果可以看出其应用于农地流转信息推送领域存在了大量的信息冗余,信息的查全率、查准率和综合分类率不高;在原RSS信息推送模型中添加地名匹配步骤,应用于农地流转领域得到了较好的查全率、查准率和综合分类率,说明添加地名匹配步骤的信息推送模型改进是有效的。0120本发明还涉及一种基于RSS的农用土地信息发送方法,其包括步骤客户端接收自农用土地服务器根据XML生成至少一种RSSFEED信息。客户端的用户在订阅该RSSFEED信息时,输入至少一个关注区域信息,客户端将该信息发送至服务器。服务器。
39、根据地名匹配算法筛选出该关注区域内所包含的地名信息。客户端接收自包含有该地名信息的RSSFEED信息。0121与上述方法对应的,本发明还涉及一种基于RSS的农用土地信息发送系统,其包括如下模块0122RSS信息发布模块用于发布农用土地信息的服务器根据XML生成至少一种RSSFEED信息。0123信息接收模块用于根据用户在订阅该RSSFEED信息时,接收该用户所输入的至少一个关注区域信息。0124信息匹配模块用于根据地名匹配算法筛选出该关注区域内所包含的地名信息。0125RSS信息推送模块用于将包含有该地名信息的RSSFEED信息推送给用户。0126信息反馈模块用于获取来自于客户的浏览信息。说明。
40、书CN104199938A1210/10页130127关键词处理模块用于将该浏览信息根据文本分词算法进行分词处理,得到至少一个关键词;从该关键词中获取至少一个地名关键词,根据所述关注区域获取该地名关键词所对应的空间临近度因子,该空间临近度因子与所述关注区域到该地名地区之间的距离相关;将各关键词进行TFIDF权值计算,将地名关键词的TFIDF权值乘以其所对应的空间临近度因子;将TFIDF权值满足一定条件的关键词放入到RSSFEED模型中的用户兴趣子集中。0128信息推荐模块用于根据该用户兴趣子集中的关键词为用户推荐信息。0129需要注意的是,具体实施方式仅仅是对本发明技术方案的解释和说明,不应将其理解为对本发明技术方案的限定,任何采用本发明的技术方案而仅作局部改变的,仍应落入本发明的保护范围内。说明书CN104199938A131/4页14图1图2说明书附图CN104199938A142/4页15图3说明书附图CN104199938A153/4页16图4说明书附图CN104199938A164/4页17图5图6说明书附图CN104199938A17。