书签 分享 收藏 举报 版权申诉 / 11

基于调用数据的服务参数关系匹配方法及系统.pdf

  • 上传人:1****2
  • 文档编号:1090850
  • 上传时间:2018-03-30
  • 格式:PDF
  • 页数:11
  • 大小:496.22KB
  • 摘要
    申请专利号:

    CN200910063205.3

    申请日:

    2009.07.17

    公开号:

    CN101610284A

    公开日:

    2009.12.23

    当前法律状态:

    终止

    有效性:

    无权

    法律详情:

    未缴年费专利权终止IPC(主分类):H04L 29/08申请日:20090717授权公告日:20120704终止日期:20130717|||授权|||实质审查的生效|||公开

    IPC分类号:

    H04L29/08; G06F17/30

    主分类号:

    H04L29/08

    申请人:

    武汉大学

    发明人:

    彭智勇; 王 科; 欧伟杰; 曾 承; 张 莹

    地址:

    430072湖北省武汉市武昌珞珈山

    优先权:

    专利代理机构:

    武汉华旭知识产权事务所

    代理人:

    周宗贵

    PDF完整版下载: PDF下载
    内容摘要

    本发明涉及Web服务技术领域,尤其涉及一种基于调用数据的服务参数关系匹配方法及系统。本发明的基于调用数据的服务参数关系匹配方法,包括获取服务的调用数据的服务调用数据获取步骤;对服务调用数据粗样本进行处理,去除噪声信息,进行初步的数据挖掘的服务调用数据取样步骤;通过取样数据进行匹配,得到服务参数之间的关系得关系匹配步骤;通过新挖掘出的服务关系更新服务发现与组合结果的匹配结果应用步骤。本发明具备脱离服务的语义标注得到服务参数匹配关系,随着调用数据量的增大,准确率提高,并且可以保证准确率的特点。

    权利要求书

    1.  一种基于调用数据的服务参数关系匹配方法,其特征在于,包括以下步骤:
    服务调用数据获取步骤,获取服务的调用数据;
    服务调用数据取样步骤,对服务调用数据粗样本进行处理,去除噪声信息,进行初步的数据挖掘;
    关系匹配步骤,通过取样数据进行匹配,得到服务参数之间的关系;
    匹配结果应用步骤,通过新挖掘出的服务关系更新服务发现与组合结果。

    2.
      一种基于调用数据的服务参数关系匹配系统,其特征在于,包括:
    服务调用数据获取模块,用于获取服务的调用数据;
    服务调用数据取样模块,用于对服务调用数据粗样本进行处理,去除噪声信息,进行初步的数据挖掘;
    关系匹配模块,用于通过取样数据进行匹配,得到服务参数之间的关系;
    匹配结果应用模块,用于通过新挖掘出的服务关系更新服务发现与组合结果。

    3.
      根据权利要求2所述的基于调用数据的服务参数关系匹配系统,其特征在于:
    所述服务调用数据获取模块包括服务调用通用模块、客户端创建模块、服务调用数据存储文件。

    4.
      根据权利要求2或3所述的基于调用数据的服务参数关系匹配系统,其特征在于:
    所述服务调用数据取样模块包括服务调用缓存取样模块、随机取样模块、服务取样存储库。

    5.
      根据权利要求2或3所述的基于调用数据的服务参数关系匹配系统,其特征在于:
    所述关系匹配模块包括数据对比模块、特征向量匹配模块、文本相似度匹配模块、匹配结果存储库。

    6.
      根据权利要求5所述的基于调用数据的服务参数关系匹配系统,其特征在于:
    所述特征向量匹配模块的特征向量信息包括通过服务调用结果抽取的数据统计信息、服务模式层文字类统计信息、服务设计约束信息。

    说明书

    基于调用数据的服务参数关系匹配方法及系统
    技术领域
    本发明涉及Web服务技术领域,尤其涉及一种基于调用数据的服务参数关系匹配方法及系统。
    背景技术
    在服务发现领域,服务匹配是指对用户输入的关键字或者概念,进行与服务注册库中的服务描述信息匹配;在服务组合领域,服务匹配是指匹配服务参数之间的关系,通过这样的关系判断服务能否可以组合;所以,服务匹配是服务发现与服务组合基础环节,其旨在得到服务参数之间或者服务参数与输入关键词之间的关系或者匹配度。
    目前,Web服务匹配方法包括语法服务匹配、语义服务匹配。其中,语法服务匹配通过服务描述(WSDL文档)中已有的模式层信息,如服务参数名称等,或者用户对其的标注进行服务匹配;然而,通过模式层信息得到的服务匹配显然无法保证正确率,同样的服务参数描述可能对应着完全不同语义的参数;语法服务匹配仅仅可以寻找到服务匹配的备选集合,进一步需要用户通过对数据的观察再次进行筛选,对用户依赖性很高,实用性很差;目前应用比较广泛的UDDI系统属于语法服务匹配方法。
    语义服务匹配利用已经存在的服务的参数与概念之间的对应关系进行服务匹配,也就是说利用本体论方法来解决传统语法级服务描述的异构性,增强对主体服务的功能、行为的语义描述;这些匹配算法通常依赖于逻辑演绎和推理,具有查准率高、匹配效率不佳,实用性、灵活性较差等特点。目前的研究中,大多假设服务的语义信息是可以信赖的,然而当前的服务的语义信息主要来源于本体文件(OWL),本体文件是由人工构建的,不可避免将出现错误,同时用户所处的领域不同或者命名方式不同,都可能导致服务语义标注不统一;因此,语义服务匹配无法保证正确率,在当下更加无法真正应用。
    发明内容
    本发明的目的是提供一种基于调用数据的服务参数关系匹配方法及系统,以提出一种脱离语义标注,并且能较准确地获得服务匹配关系的系统。
    为达到上述目的,本发明采用如下的技术方案:
    基于调用数据的服务参数关系匹配方法,包括以下步骤:
    服务调用数据获取步骤,获取服务的调用数据;
    服务调用数据取样步骤,对服务调用数据粗样本进行处理,去除噪声信息,进行初步的数据挖掘;
    关系匹配步骤,通过取样数据进行匹配,得到服务参数之间的关系;
    匹配结果应用步骤,通过新挖掘出的服务关系更新服务发现与组合结果。
    基于调用数据的服务参数关系匹配系统,包括:
    服务调用数据获取模块,用于获取服务的调用数据;
    服务调用数据取样模块,用于对服务调用数据粗样本进行处理,去除噪声信息,进行初步的数据挖掘;
    关系匹配模块,用于通过取样数据进行匹配,得到服务参数之间的关系;
    匹配结果应用模块,用于通过新挖掘出的服务关系更新服务发现与组合结果。
    所述服务调用数据获取模块包括服务调用通用模块、客户端创建模块、服务调用数据存储文件。
    所述服务调用数据取样模块包括服务调用缓存取样模块、随机取样模块、服务取样存储库。
    所述关系匹配模块包括数据对比模块、特征向量匹配模块、文本相似度匹配模块、匹配结果存储库。
    所述特征向量匹配模块的特征向量信息包括通过服务调用结果抽取的数据统计信息、服务模式层文字类统计信息、服务设计约束信息。
    本发明具有以下优点和积极效果:
    1)脱离服务的语义标注得到服务参数匹配关系;
    2)随着调用数据量的增大,准确率提高,并且可以保证准确率。
    附图说明
    图1是本发明基于调用数据的服务参数关系匹配方法的流程图。
    图2是本发明基于调用数据的服务参数关系匹配系统的详细模块结构图。
    图3是本发明中通过新得到的服务参数关系更新服务检索索引的实例示意图。
    图4是本发明中通过新得到的服务参数关系更新服务组合网络的实例示意图。
    其中,
    11-服务调用数据获取步骤、12-服务调用数据取样步骤、13-关系匹配步骤、14-匹配结果应用步骤、21-服务调用数据获取模块、22-服务调用数据取样模块、23-关系匹配模块、24-匹配结果应用模块、25-服务调用客户端、26-服务调用数据。
    具体实施方式
    下面以具体实施例结合附图对本发明作进一步说明:
    图1所示为构成本发明的基于调用数据的服务参数关系匹配方法的流程图,包括服务调用数据获取步骤11、服务调用数据取样步骤12、关系匹配步骤13、匹配结果应用步骤14,其具体的实现步骤详细描述如下:
    服务调用数据获取步骤11,获取服务的调用数据;
    服务调用数据取样步骤12,对服务调用数据粗样本进行处理,去除噪声信息,进行初步的数据挖掘;
    关系匹配步骤13,通过取样数据进行匹配,得到服务参数之间的关系;
    匹配结果应用步骤14,通过新挖掘出的服务关系更新服务发现与组合结果。
    下面结合图2进一步详细描述本发明基于调用数据的服务参数关系匹配系统,该系统包括服务调用数据获取模块21、服务调用数据取样模块22、关系匹配模块23、匹配结果应用模块24、服务调用客户端25、服务调用数据26,其中服务调用数据获取模块21、服务调用数据取样模块22、关系匹配模块23、匹配结果应用模块24构成了系统运行端,服务调用客户端25、服务调用数据26构成了服务调用端。
    服务调用数据获取模块21用于获取服务的调用数据,其数据获取来源主要包括客户端与系统运行端。服务调用数据获取模块21包括服务调用通用子模块、客户端创建子模块,以及服务调用数据存储文件。服务调用客户端25调用服务调用数据26,并将数据输送至服务调用数据获取模块21。
    客户端创建子模块,由系统通过服务信息生成对服务进行调用的代码,即客户端,用户下载客户端后进行编译运行,实现对服务的调用。在客户端的服务调用中,系统创建内嵌服务调用数据获取代码的客户端提供用户下载,用户对服务进行使用后,将调用数据自动上传到系统运行端,也可以由用户手动将其上传至服务器端;
    在系统运行端,服务调用通用子模块由系统通过服务信息生成调用界面,直接对服务进行调用,其数据采集方式为服务在系统运行端对服务进行使用后,对服务的调用结果直接进行保存。
    服务调用数据初步保存为XML文档,可以使用XML的解析技术将其进行解析后存储入其他媒介中,比如数据库或者物理文件,服务调用客户端构建方法可以使用Axis的WSDL2JAVA等工具。服务调用即为HTTP+XML的请求,本系统所采用的保存方法是每个WSDL对应一个文件夹,其中的操作对应一个存储服务调用结果的XML文件的文件夹,每次对服务的调用结果直接存储为一个XML文件,以操作名与序号结合命名。
    服务调用数据存储文件,通过各类方法获得的服务调用数据,可以采用很多方式存储,比如文本或者数据库;用数据库存储的方法可以通过服务的WSDL中的服务描述生成数据库表结构生成SQL语句;当调用次数到达一定上限时,首先运行数据库表结构的生成SQL语句生成表结构,然后使用XML解析技术将存储调用结果XML文档导入到对应的数据库表中。使用文本的存储方式可以采用如下方法,即使用XML暂存服务调用结果,使用解析程序将其批量解析入以参数命名的文档中,嵌套参数生成以父参数名命名的文件夹,将嵌套数据再存储入文件夹中。
    服务调用数据取样模块22用于对服务调用数据粗样本进行处理,去除噪声信息,进行初步的数据挖掘。服务调用数据取样模块22包括服务调用缓存、服务取样存储库。
    调用信息的取样不是必需的,调用信息的取样是为了获取调用数据中同偏重的数据,去掉噪声,以代替初始样本进行匹配。取样的方法包括缓存取样、随机取样,然而并不局限于这两种取样方法。
    对于缓存取样来说,用户服务调用缓存数据用于服务语义匹配意义重大。其一,由于服务是为用户提供功能存在的,所以用户常用的数据对服务调用数据分析的权重更大。例如,一个提供中国全部省市的天气预报服务由于用户使用的偏向性,查询省会城市的用户占绝大多数,那么其与一个只能提供省会城市天气预报的服务可以视为是基本等同的;其二,Web服务背后的数据库的数据量往往非常庞大,并且没有统一的检索接口,所以无法获得其全部的数据;我们试图通过分析数据集中具有共同倾向的数据集合关系,探索全部数据的关系。
    一般情况下,用户对服务的使用往往具有相似的时间分布与聚集分布,所以不同服务的调用缓存可以视为带有相同偏向的数据集合;具体的实现方式可以使用最近最少使用置换(LRU)、先进先出置换(FIFO)和最佳置换(OPT)策略分析服务调用数据,获取保留于缓存中的样本。
    对于随机取样来说,由于无法获取Web服务对应的数据库所有数据,而随机取样数据可以很好的代表整体数据特点;通过这些特征的对比,可以得到两个数据集合的是否相关相似的结论。
    关系匹配模块23用于通过取样数据进行匹配,得到服务参数之间的关系。关系匹配模块23包括如下子模块,即数据对比模块、特征向量匹配模块、文本相似度匹配模块、匹配结果存储库、匹配结果在计算模块,所采用的方法有集合对比匹配、文本相似度匹配、特征向量匹配,然而并不局限于上述各方法。
    数据对比模块,类Join匹配,通过两两比较调用结果,获得数据集合关系,适用于缓存取样等同侧重取样;特征向量匹配模块,特征向量可以包含的信息很多,比如如下信息:①通过服务调用结果抽取的数据统计信息,例如期望、方差、是否存在空、取值范围(最大值,最小值),这类信息来自于对服务调用数据的统计分析;②服务模式层文字类统计信息,如模式名称长度。这类信息在服务领域指服务的模式描述名称,即参数名;③服务设计约束信息,包括数据类型、数据长度、是否可为空。这类信息主要来自中间件中对WSDL已经解析得到的服务描述。
    特征向量匹配模块,即是通过计算服务参数额特征向量之间的距离或者夹角来测度两个参数之间关系。
    另外还有文本相似度匹配,信息指纹匹配等方式,适用于长度较大的同侧重数据。
    匹配结果应用模块24用于通过新挖掘出的服务关系更新服务发现与组合结果。
    服务发现的方法是多种多样的,主要的包括UDDI,P2P网络,Petri网,散列表等,其中应用较为广泛的是倒排索引的方法,图3是本发明中通过新得到的服务参数关系更新服务检索索引的实例示意图。服务的倒排索引是通过服务元素与关键词之间的关系构建的。系统首先通过服务描述信息中服务属性名(参数,操作等)以及属性值构建初步的倒排索引,再通过新得到的服务匹配关系对索引进行修正,由于倒排索引的具备检索速度快的特点,通过这样的索引增量构建方式,可以在基本不降低检索效率的情况下,将与关键词相关的服务逐渐全部与之建立联系,提高系统的查全率。
    服务组合结果更新:服务组合是指将两个服务连接起来形成一个新的服务,以满足更多的用户需求,数个服务的组合形成一个组合链条。图4是本发明中通过新得到的服务参数关系更新服务组合网络的实例示意图。途中服务组合链条中衔接关系通过新得到的服务参数关系得到更新。现实中服务的组合索引更加复杂,存储方式也比较多样,在此不进行详细陈述。

    关 键  词:
    基于 调用 数据 服务 参数 关系 匹配 方法 系统
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:基于调用数据的服务参数关系匹配方法及系统.pdf
    链接地址:https://www.zhuanlichaxun.net/p-1090850.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1