书签 分享 收藏 举报 版权申诉 / 20

在分级的基于信任的配置中结构化并搜索数据.pdf

  • 上传人:xia****o6
  • 文档编号:1037841
  • 上传时间:2018-03-27
  • 格式:PDF
  • 页数:20
  • 大小:624.56KB
  • 摘要
    申请专利号:

    CN201080017874.8

    申请日:

    2010.01.26

    公开号:

    CN102365640A

    公开日:

    2012.02.29

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情:

    发明专利申请公布后的视为撤回IPC(主分类):G06F 17/30申请公布日:20120229|||实质审查的生效IPC(主分类):G06F 17/30申请日:20100126|||公开

    IPC分类号:

    G06F17/30; G06F17/00

    主分类号:

    G06F17/30

    申请人:

    罗威科技有限公司

    发明人:

    J.N.韦斯林; R.D.卡尔鲍姆; D.J.威廉斯

    地址:

    美国加利福尼亚州

    优先权:

    2009.01.28 US 12/321,997

    专利代理机构:

    北京市柳沈律师事务所 11105

    代理人:

    胡琪

    PDF完整版下载: PDF下载
    内容摘要

    提供了用于在分级的基于信任的配置中结构化并搜索数据的方法和系统。在一个示例中,该系统接收数据并将信任质量等级分配给该数据。所述信任质量等级在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。将特定信任质量等级的数据配置为在相对较低的信任质量等级的数据之前被搜索。该系统根据所述信任质量等级在服务器系统的所选服务器中组织数据。所选服务器在跨越从所述最高信任质量等级到所述最低信任质量等级并包含所述最高信任质量等级和所述最低信任质量等级在内的范围中。

    权利要求书

    1: 一种用于结构化数据的方法, 所述方法包括 : 接收数据 ; 将信任质量等级分配给所述数据, 其中所述信任质量等级在跨越从最高信任质量等级 到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中, 并且其 中将特定信任质量等级的数据配置为在相对较低的信任质量等级的数据之前被搜索 ; 以及 根据所述信任质量等级在服务器系统的所选服务器中组织所述数据, 其中所选服务器 在跨越从所述最高信任质量等级到所述最低信任质量等级并包含所述最高信任质量等级 和所述最低信任质量等级在内的所述范围中。
    2: 如权利要求 1 所述的方法, 其中信任质量等级是与特定信任质量的数据关联的特定 信任质量级别, 并且其中信任质量是已经用于将数据输入到所述服务器系统的服务器中的 已知关注和已知控制的最小量。
    3: 如权利要求 1 所述的方法, 还包括至少下列步骤之一 : 根据与服务器系统的服务器关联的数据的信任质量等级, 组织所述服务器 ; 从等级 1 服务器到等级 n 服务器来布置所述服务器, 其中 n 是正整数, 并且其中所述等 级 1 服务器处于所述最高信任质量等级, 并且其中所述等级 n 服务器处于所述最低信任质 量等级。
    4: 如权利要求 1 所述的方法, 其中不考虑找到对查询的匹配的可能性而进行所述数据 的组织。
    5: 如权利要求 1 所述的方法, 其中所述服务器系统被配置为耦接至存储从一个或多个 客户端计算机收集的数字媒体数据的数据库系统。
    6: 如权利要求 1 所述的方法, 其中所述服务器系统被配置用于模糊搜索, 其中模糊搜 索搜索基本上匹配给定文本字符串模式的字符串, 并且其中组织所述数据最优化模糊搜 索。
    7: 一种用于搜索数据的方法, 所述方法包括 : 将查询接收至服务器系统中, 其中从最高信任质量等级到最低信任质量等级组织服务 器系统中的数据, 并且其中将特定信任质量等级的数据配置为在相对较低的信任质量等级 的数据之前被搜索 ; 以及 搜索所述最高信任质量等级的数据以力图满足所述查询, 其中在搜索较低信任质量等 级的数据之前进行所述最高信任质量等级的数据的搜索。
    8: 如权利要求 7 所述的方法, 还包括至少下列步骤之一 : 在最高信任质量等级中找到对所述查询的一个或多个基本匹配 ; 以及 返回所述一个或多个基本匹配。
    9: 如权利要求 7 所述的方法, 还包括至少下列步骤之一 : 在最高信任质量等级中找不到对所述查询的匹配 ; 搜索下一信任质量等级的数据以力图满足所述查询 ; 在所述下一信任质量等级中找到对所述查询的一个或多个基本匹配 ; 以及 返回所述一个或多个基本匹配。
    10: 如权利要求 7 所述的方法, 还包括至少下列步骤之一 : 在最高信任质量等级找不到对所述查询的匹配 ; 2 搜索下一信任质量等级的数据以力图满足所述查询 ; 在所述下一信任质量等级找不到对所述查询的基本匹配 ; 确定已经搜索了所述最低信任质量等级 ; 以及 返回对所述查询的结果。
    11: 一种用于结构化数据的系统, 其中所述系统被配置用于 : 接收数据 ; 将信任质量等级分配给所述数据, 其中所述信任质量等级在跨越从最高信任质量等级 到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中, 并且其 中将特定信任质量等级的数据配置为在相对较低的信任质量等级的数据之前被搜索 ; 以及 根据所述信任质量等级在服务器系统的所选服务器中组织所述数据, 其中所选服务器 在跨越从所述最高信任质量等级到所述最低信任质量等级并包含所述最高信任质量等级 和所述最低信任质量等级在内的所述范围中。
    12: 如权利要求 11 所述的系统, 其中信任质量等级是与特定信任质量的数据关联的特 定信任质量级别, 并且其中信任质量是已经用于将数据输入到所述服务器系统的服务器中 的已知关注和已知控制的最小量。
    13: 如权利要求 11 所述的系统, 其中所述系统还被配置用于至少下列之 根据与服务器系统的服务器关联的数据的信任质量等级, 组织所述服务器 ; 从等级 1 服务器到等级 n 服务器来布置所述服务器, 其中 n 是正整数, 并且其中所述等 级 1 服务器处于所述最高信任质量等级, 并且其中所述等级 n 服务器处于所述最低信任质 量等级。
    14: 如权利要求 11 所述的系统, 其中不考虑找到对查询的匹配的可能性而进行所述数 据的组织。
    15: 如权利要求 11 所述的系统, 其中所述服务器系统被配置为耦接至存储从一个或多 个客户端计算机收集的数字媒体数据的数据库系统。
    16: 如权利要求 11 所述的系统, 其中所述服务器系统被配置用于模糊搜索, 其中模糊 搜索搜索基本上匹配给定文本字符串模式的字符串, 并且其中组织所述数据最优化模糊搜 索。
    17: 一种用于搜索数据的系统, 其中所述系统被配置用于 : 将查询接收至服务器系统中, 其中从最高信任质量等级到最低信任质量等级组织服务 器系统中的数据, 并且其中将特定信任质量等级的数据配置为在相对较低的信任质量等级 的数据之前被搜索 ; 以及 搜索所述最高信任质量等级的数据以力图满足所述查询, 其中在搜索较低信任质量等 级的数据之前进行所述最高信任质量等级的数据的搜索。
    18: 如权利要求 17 所述的系统, 其中所述系统还被配置用于至少下列之一 : 在最高信任质量等级中找到对所述查询的一个或多个基本匹配 ; 以及 返回所述一个或多个基本匹配。
    19: 如权利要求 17 所述的系统, 其中所述系统还被配置用于至少下列之一 : 在最高信任质量等级中找不到对所述查询的匹配 ; 搜索下一信任质量等级的数据以力图满足所述查询 ; 3 在下一信任质量等级中找到对所述查询的一个或多个基本匹配 ; 以及 返回所述一个或多个基本匹配。
    20: 如权利要求 17 所述的系统, 其中所述系统还被配置用于至少下列之一 : 在最高信任质量等级找不到对所述查询的匹配 ; 搜索下一信任质量等级的数据以力图满足所述查询 ; 在所述下一信任质量等级找不到对所述查询的基本匹配 ; 确定已经搜索了所述最低信任质量等级 ; 以及 返回对所述查询的结果。
    21: 一种执行用于结构化数据的一个或多个指令的计算机可读介质, 其中当由一个或 多个处理器执行时, 所述一个或多个指令使得所述一个或多个处理器执行下列步骤 : 接收数据 ; 将信任质量等级分配给所述数据, 其中所述信任质量等级在跨越从最高信任质量等级 到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中, 并且其 中将特定信任质量等级的数据配置为在相对较低的信任质量等级的数据之前被搜索 ; 以及 根据所述信任质量等级在服务器系统的所选服务器中组织所述数据, 其中所选服务器 在跨越从所述最高信任质量等级到所述最低信任质量等级并包含所述最高信任质量等级 和所述最低信任质量等级在内的所述范围中。

    说明书


    在分级的基于信任的配置中结构化并搜索数据

        【技术领域】
         本发明涉及在服务器系统和 / 或数据库系统上结构化 (structuring) 数据。更具 体地, 本发明涉及在分级的基于信任 (confidence) 的配置中结构化并搜索数据。背景技术
         搜索服务器的数据是客户端计算机可以通过诸如因特网的网络发起的操作。 在客 户端计算机向其发送查询的服务器中以某种方式组织数据。数字媒体 ( 例如, 音频、 视频和 元数据 ) 的出现已经使数据的绝对尺寸 (sheer size) 变得庞大。当客户端计算机查询服 务器时, 服务器可能必须搜索非常大量的数据以提供针对该查询的结果。检索数据的传统 方法效率正在降低, 因为搜索数据集的方法的演进并不像数据集的变大一样迅速。 发明内容
         在传统服务器中, 数据的范围可以从高信任质量数据到低信任质量数据。高信任 质量数据是以相对高的已知关注量和已知控制量而输入的数据。 低信任质量数据是以相对 低的已知关注量和已知控制量而输入的数据。 高信任质量数据的示例是由拥有服务器的公 司的编辑部员工输入到该服务器中的数据。 低信任质量数据的示例是由服务器的非附属的 公众用户输入到该服务器的数据。
         不幸的是, 传统服务器上的数据通常不是根据数据的信任质量而组织的。 因此, 当 将查询发送至传统服务器用以搜索时, 传统服务器不在高信任质量数据与低信任质量数据 之间区分。因此, 搜索很可能是低效的, 因为传统服务器可能搜索所有的数据, 而不是首先 集中于最高信任质量数据。
         需要一种具有用于解决上述问题的特征以及还未讨论的新特征的改进方法。 一般 来说, 这里提供的创造性实施例通过提供用于在分级的基于信任的配置中结构化并搜索数 据的方法和系统, 来满足这些需要。下面描述创造性实施例。
         在一个实施例中, 提供了用于在分级的基于信任的配置中结构化数据的方法。该 方法包括接收数据并将信任质量等级分配给该数据。 信任质量等级在跨越从最高信任质量 等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。 将 特定信任质量等级的数据配置为优选地在相对较低的信任质量等级的数据之前被搜索。 该 方法还包括根据信任质量等级在服务器系统的所选服务器中组织该数据。 所选服务器在跨 越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等 级在内的范围中。
         在第二实施例中, 提供了用于在分级的基于信任的配置中搜索数据的方法。该方 法包括将查询接收至服务器系统中。 从最高信任质量等级到最低信任质量等级组织服务器 系统中的数据。 将特定信任质量等级的数据配置为优选地在相对较低的信任质量等级的数 据之前被搜索。该方法还包括搜索最高信任质量等级的数据以力图满足查询。在搜索较低 信任质量等级的数据之前进行最高信任质量等级的数据的搜索。在第三实施例中, 提供了用于在分级的基于信任的配置中结构化数据的系统。该 系统被配置用于接收数据并向数据分配信任质量等级。 信任质量等级在跨越从最高信任质 量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。 将特定信任质量等级的数据配置为优选地在相对较低的信任质量等级的数据之前被搜索。 该方法还被配置用于根据信任质量等级在服务器系统的所选服务器中组织数据。 所选服务 器在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任 质量等级在内的范围中。
         在第四实施例中, 提供了用于在分级的基于信任的配置中搜索数据的系统。该系 统被配置用于将查询接收至服务器系统中。 从最高信任质量等级到最低信任质量等级组织 服务器系统中的数据。 将特定信任质量等级的数据配置为优选地在相对较低的信任质量等 级的数据之前被搜索。该系统还被配置用于搜索最高信任质量等级的数据以力图满足查 询。在搜索较低信任质量等级的数据之前进行最高信任质量等级的数据的搜索。
         一种计算机可读介质包括一个或多个指令用于结构化数据。 当由一个或多个处理 器执行所述一个或多个指令时, 所述一个或多个指令使所述一个或多个处理器执行下列步 骤: 接收数据 ; 向数据分配信任质量等级, 其中信任质量等级在跨越从最高信任质量等级 到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中, 并且其 中将特定信任质量等级的数据配置为在相对较低的信任质量等级的数据之前被搜索 ; 以及 根据信任质量等级在服务器系统的所选服务器中组织数据, 其中所选服务器在跨越从最高 信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的 范围中。
         本发明涵盖如上所述配置的以及具有其它特征和替代的其它实施例。应当理解, 这些实施例可以以许多方式来实施, 包括作为方法、 处理、 装置、 系统或设备。附图说明 通过结合附图的下列详细描述, 将容易地理解创造性实施例。 为了便于此描述, 相 同的参考数字指代相同的结构单元。
         图 1 是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的 系统的框图 ;
         图 2 是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的 图 1 的系统的示意图 ;
         图 3 是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的 另一系统的框图 ;
         图 4 是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的 图 3 的系统的示意图 ;
         图 5 是根据某些实施例的用于在分级的基于信任的配置中结构化数据的方法的 流程图 ; 以及
         图 6 是根据某些实施例的用于在分级的基于信任的配置中搜索数据的方法的流 程图。
         具体实施方式
         对于用于在分级的基于信任的配置中结构化并搜索数据的方法和系统公开了发 明。阐述了许多具体细节以便提供对各个实施例的全面理解。然而, 本领域技术人员将理 解所述实施例可以通过其它具体细节而实现。
         定义
         为了清楚起见, 下面定义一些术语。这些术语并非严格限制于这些定义。这些术 语和其它术语也可以通过它们在此描述的上下文中的使用而定义。
         “计算机” ( 例如, “客户端计算机” 或 “客户端” 或 “服务器” ) 可以指单个计算机或 互联计算机的系统。计算机是硬件系统、 软件操作系统以及或许一个或多个软件应用程序 的组合。计算机的示例包括 ( 并非限制 ) 膝上型计算机、 掌上型计算机、 智能电话、 蜂窝电 话、 移动电话、 mp3 播放器、 数字音频记录器、 数字录像机、 CD 播放器、 DVD 播放器、 具有诸如 Microsoft 的 作站。 “信任质量” 意思是已经用于将数据输入服务器和 / 或数据库的已知关注和已知控 制的最小量。 高信任质量数据的示例是由拥有服务器的公司的编辑部员工手动输入服务器 的数据。 这样的公司可以是例如 低信任质量数据的示例是由服务器的非附 属的公众用户输入该服务器的数据。
         “信任质量等级 (tier)” ( 例如, “等级” ) 意思是与特定信任质量的数据关联的信 任质量级别。当相关联的数据具有特定信任质量时, 服务器和 / 或数据库可被称为在特定 信任质量等级内。
         “数据库” 意思是以计算机程序可以迅速选择所期望的数据的方式所组织的数据 的集合。数据库是电子编档 (filing) 系统。在某些实例中, 术语 “数据库” 用作 “数据库管 理系统” 的简略表示。
         “设备” 意思是硬件、 软件或它们的组合。设备有时可以称为装置。每个设备被配 置为执行在分级的基于信任的配置中结构化并搜索数据的方法的一个或多个步骤。
         “指纹” ( 例如, “音频指纹 (audio fingerpoint)” 或 “声学指纹” ) 是从可用于识 别音频样本和 / 或在音频数据库中迅速定位相似项的音频信号确定性地生成的对某些声 学属性的数字度量。 “指纹识别 (fingerprinting)” 是生成指纹的过程。对音频指纹识别 的实际使用包括 : 识别歌曲、 记录、 旋律、 曲调或广告 ; 无线电广播和对等网络监视 ; 音效库 管理 ; 视频文件识别 ; 等等。指纹是不受元数据影响的独立数据。 公司具
         的操作系统的 IBM 式个人计算机 (PC)、 具有诸如 MAC-OS 的操作系统计算机、 具有 JAVA-OS 操作系统的硬件、 以及具有 UNIX 操作系统的 Sun 微系统工有存储针对各个音频样本的超过两千五百万个唯一的指纹的数据库。题目为 “Method and System for Analyzing Digital Audio Files” 的美国专利 7,277,766(’ 766 专利 ) 通过引 用合并在此, 其提供了用于对音频波形进行指纹识别的装置的示例。题目为 “Methods and Apparatus for Identifying Media Objects” 的美国专利 7,451,078(’ 078 专利 ) 通过引 用将其合并在此, 其提供了用于生成音频记录的音频指纹的装置的示例。
         “模糊搜索” ( 例如, “模糊字符串搜索” 或 “近似字符串搜索” ) 意思是对于近似地 或基本上匹配给定文本字符串模式的文本字符串的搜索。 模糊搜索还可以称为近似或非精 确匹配。在执行模糊搜索时可以发生精确匹配。“元数据” 通常意思是描述数据的数据。更具体地, 元数据的意思是描述数字音 频记录的内容的数据。这样的元数据可以包括例如歌曲名称、 艺术家信息 ( 例如, 姓名、 生 日、 唱片分类目录等 )、 曲集信息 ( 例如, 曲集标题、 评论、 音轨列表、 声音样本等 )、 相关信息 ( 例如, 相似的艺术家和曲集、 流派等 )、 以及其它类型的补充信息。传统的光盘 ( 例如, CD、 DVD 和蓝光盘 (Blu-ray Discs)) 典型地并不包含元数据。 可以在数据记录已经被从光盘分 离 (rip) 之后将元数据附至数字记录 ( 例如, 歌曲、 曲集、 影片或视频 ), 将所述元数据转换 为另一数据音频格式并存储在硬盘驱动器上。
         “网络” 意思是任何两个或多个计算机之间的连接, 其允许数据的传输。网络可以 是包括 ( 并非限制 ) 因特网、 局域网、 广域网、 无线网络和蜂窝式网络的网络的任何组合。
         “服务器” 意思是向同一或其它计算机中的其它计算机程序 ( 和它们的用户 ) 提 供服务的软件应用。服务器还可以指已经被留出以运行专用服务器应用的物理计算机。例 如, 当软件 Apache HTTP Server 用作用于公司的网站的网络服务器时, 运行 Apache 的计算 机也称为网络服务器。依赖于工作负荷, 可以在极端范围上在服务器计算机之中划分服务 器应用。
         “内容表” (TOC) 意思是光盘 ( 诸如, 蓝光盘、 CD 或 DVD) 上的音轨 ( 章节 )、 音轨 ( 章 节 ) 起始时间和结束时间的列表。盘上的音轨起始时间典型地被表示为六位十六进制值。 题目为 “Digital Audio Track Set Recognition System” 的美国专利 7,359,900(’ 900 专 利 ) 通过引用合并在此, 其提供了使用 TOC 数据来识别 CD 或 DVD 的方法的示例。 ’ 900 专利 还描述了使用盘的识别在数据库中查找元数据、 然后将该元数据发送至终端用户的方法。 “音轨” 意思是诸如 CD 的光盘上的音频数据块。音轨至少存储音频记录的一部分。
         “网 络 浏 览 器”意 思 是 可 以 显 示 来 自 网 站 上 的 网 页 的 文 本、 图形或两者的任
         何 软 件 应 用。 网 络 浏 览 器 的 示 例 包 括 ( 并 非 限 制 )Mozilla Internet
         和 Microsoft“网页” 意思是以包括 ( 并非限制 )HTML( 超文本标记语言 ) 或 VRML( 虚拟现实建 模语言 )、 动态 HTML、 XML( 可扩展标记语言 ) 或其有关计算机语言的标记语言所写的任何 文档, 以及意思是通过一个具体因特网地址可达或在一个具体网站的文档的任何集合、 或 通过特定 URL( 统一资源定位符 ) 可获得的任何文档。
         “网络服务器” 指能够向网络浏览器提供至少一个网页的应用、 计算机或其它电子 设备。网络服务器的示例是 Apache 网络服务器。
         “网 站”意 思 是 至 少 一 个 网 页, 更一般是意思是虚拟地连接以形成相关组 (coherent group) 的多个网页。
         对于本系统的实施, 软件应用可以以基本上任何可由本领域普通技术人员容易 地选择的合适的编程语言来编写。所选的编程语言应当与要执行软件应用的计算机兼 容, 特别地与该计算机的操作系统兼容。合适的编程语言的示例包括 ( 并非限制 )Object Pascal、 C、 C++、 Java 和 JavaScript。另外, 当被描述为方法的一系列步骤时, 某些实施例 的功能可以实施为用于由处理器操作的一系列软件指令, 从而实施例可以实施为软件、 硬 件或它们的组合。下面在单独的部分中更详细地讨论计算机可读介质。
         在服务器系统上结构化并搜索数据
         图 1 是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的系统 100 的框图。网络 105 将客户端计算机 110 和服务器系统 115 耦接在一起。网络 105 还可以耦接至其它客户端计算机 ( 未示出 )。服务器系统 115 耦接至 ( 或包括 ) 数据库系 统 130。
         服务器系统 115 包括多个服务器, 范围从等级 1 服务器到等级 n 服务器。服务器 系统 115 的全部服务器可以共同耦接至数据库系统 130。 作为选择, 服务器系统 115 的每个 服务器可以各自分别耦接至其自己的数据库。服务器系统 115 可以存储和 / 或有权访问从 一个或多个客户端计算机 110 收集和 / 或生成的数字媒体数据。例如, 服务器系统 115 可 以存储和 / 或有权访问指纹和关联的元数据。
         服务器系统 115 包括结构化设备 120 和搜索设备 125。结构化设备 120 和搜索设 备 125 执行系统 100 的更重要的操作。服务器系统 115 的组件以使得服务器系统 115 能够 结构化数据并为客户端计算机 110 执行搜索的这样的方式连接。
         图 1 的客户端计算机 110 包括配置用于与服务器系统 115 通信以搜索服务器系统 115 的分级的基于信任的配置的硬件和 / 或软件。例如, 客户端计算机 110 可以具有带有 图形用户界面 (GUI) 以访问因特网的操作系统, 并优选地配备有可操作以从和向网络上的 超文本传输协议 (HTTP) 服务器读取和发送超文本标记语言 (HTML) 形式的万维网 ( 网络 ) 浏览器软件, 诸如 Mozillar 单机盘播放器 ( 例如, CD 播放器、 DVD 播放器或蓝光 盘播放器 ) 可以具有内置接口, 其使得盘播放器能够通过网络 105、 直接地或通过另一计算 机与服务器系统 115 通信。例如, CD 播放器可以具有数据接口 ( 例如, IDE 接口或 USB 接 口 ), 其使得 CD 播放器能够发送并从膝上型计算机接收数据, 所述膝上型计算机转而耦接 至网络 105。 同样, 服务器系统 115 包括用于与客户端计算机 110 通信的硬件和 / 或软件。例 如, 服务器系统 115 可以具有 HTTP 兼容软件、 操作系统和公共网关接口 (CGI) 软件, 用于通 过网络 105 与客户端计算机 110 相连接。作为选择, 服务器系统 115 和客户端计算机 110 可以运行使得它们能够通过网络 105 通信的专有软件。
         容易理解, 图 1 的框图中的配置是为了说明的目的, 并且许多变型是可能的。例 如, 服务器系统 115 可以耦接至局域网 (LAN), 该局域网转而可以耦接至网络 105。 在另一示 例中, 服务器系统 115 可以耦接至多个网络服务器。系统 100 还可以包括以不同于这里描 绘的数据库系统 130 的配置而布置的数据库系统。例如, 下面在下一个部分中, 参照图 1-4 讨论混合配置。
         图 2 是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的 图 1 的系统 100 的示意图。系统 100 被结构化为最优化从客户端计算机 110 发起的模糊搜 索。模糊搜索意思是对于近似地或基本上匹配给定模式字符串的字符串的搜索。
         在搜索发生之前, 图 1 的结构化设备 120 被配置为基于信任质量来对服务器系统 115 中的数据进行分类。信任质量意思是已经投入到将数据存储到服务器和 / 或数据库中 的已知关注和已知控制的最小量。最高信任质量数据对查询提供最高信任结果。最低信任 质量数据对查询提供最低信任结果。
         结构化设备 120 被配置为分解数据, 并从最高信任质量到最低信任质量跨越多个 服务器而分布数据。结构化设备 120 将数据结构化到分等级的服务器中, 从等级 1 服务器 到等级 n 服务器, 其中 n 是正整数。例如, 等级 1 数据包含在等级 1 服务器中。等级 2 数据
         包含在等级 2 服务器中, 等等。
         将数据按照需要分等级到 n 个服务器中。等级 1 数据是最高信任质量数据。等级 1 数据的示例可以是由拥有服务器系统 115 的公司的编辑部员工手动输入服务器系统 115 的编辑数据。这样的公司可以是例如 等级 2 是次高的信任质量数据。等级 2 数据的示例可以是从拥有服务器系统 115 的公司的合作伙伴提交的数据。数据的等级按 照需要以更小的信任质量继续。更小的信任质量数据的示例包括下列 : 从服务器系统 115 的非附属的公众用户挖掘的数据 ; 和 / 或由服务器系统 115 的非附属的公众用户输入的数 据。
         图 1 的搜索设备 125 被配置为首先搜索等级 1 数据。搜索设备 125 试图通过搜 索等级 1 数据来满足查询。如果等级 1 服务器返回对该查询的结果, 那么搜索设备 125 不 需要汇总 (aggregate) 来自服务器系统 115 中的全部服务器的全部结果。然而, 如果等级 1 服务器未返回对该查询的结果, 那么搜索设备 125 继续前进, 并优选地接下来搜索等级 2 数据。等级 2 服务器试图从等级 2 数据来满足查询。如果等级 2 服务器返回对该查询的结 果, 那么搜索设备 125 不需要汇总来自服务器系统 115 中的全部服务器的全部结果。该处 理按照需要继续至等级 n 服务器中的等级 n 数据。
         重要的是, 注意, 结构化设备 120 被配置为不考虑找到对查询的匹配的可能性而 组织数据。在多个搜索中, 最不可能找到查询匹配的源可能结果是等级 1 数据。然而, 此基 于信任的方法可以以至少两种方式改善搜索效率。第一, 搜索设备 125 可以立即找到结果 并且不需要查看所有数据。 第二, 通过首先找到并返回最高信任质量数据, 该结果不需要在 被返回至客户端计算机 110 之前对于优先级而分类。在执行搜索之前, 已经通过信任质量 而存储了该数据。因此, 在找到结果之后对于优先级而分类是不必要的。
         因此, 客户端计算机 110 可以通过网络 105 访问服务器系统 115。客户端计算机 110 可以例如发送对与服务器系统 115 中的经识别的唯一标识符关联的元数据的查询。服 务器系统 115 中的每个唯一标识符可能已经例如从 CD 的内容表 (TOC) 生成。作为选择, 每 个唯一标识符可以是例如从音轨生成的指纹。指纹是从可用于识别音频样本和 / 或在数据 库中迅速定位相似项的音频信号确定性地生成的某些声学属性的数字度量。 在另一实施例 中, 客户端计算机 110 可以使用网络浏览器向服务器系统 115 发出字符串查询。也存在搜 索配置的其它示例。
         在数据库系统上结构化并搜索数据
         图 3 是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的 另一系统 300 的框图。图 3 的系统 300 基本上与图 1 的系统 100 相同。然而, 在图 3 的系 统 300 中, 将数据库系统 330 组织为等级, 并且服务器系统 315 优选地包括一个服务器。网 络 105 将客户端计算机 110 与服务器系统 315 耦接在一起。网络 105 还可以耦接至其它客 户端计算机 ( 未示出 )。服务器系统 315 耦接至数据库系统 330。
         数据库系统 330 包括多个数据库, 范围从等级 1 数据库到等级 n 数据库。数据库 系统 330 的全部数据库都可以共同耦接至服务器系统 315。数据库系统 330 可以存储从一 个或多个客户端计算机 110 收集和 / 或生成的数字媒体数据。例如, 数据库系统 330 可以 存储指纹和关联的元数据。
         服务器系统 315 包括结构化设备 320 和搜索设备 325。结构化设备 320 和搜索设备 325 执行系统 300 的更重要的操作。服务器系统 315 的组件以使得服务器系统 315 能够 结构化数据并为客户端计算机 110 执行搜索的方式连接。
         图 3 的客户端计算机 110 包括配置用于与服务器系统 315 通信以搜索数据库系统 330 的分级的基于信任的配置的硬件和 / 或软件。例如, 客户端计算机 110 可以具有带有 图形用户界面 (GUI) 的操作系统以访问因特网, 并优选地配备有可操作以从和向网络上的 超文本传输协议 (HTTP) 服务器读取和发送超文本标记语言 (HTML) 形式的万维网 ( 网络 ) 浏览器软件, 诸如, 独立的盘播放器 ( 例如, CD 播放器、 DVD 播放器或蓝 光盘播放器 ) 可以具有内置接口, 其使得盘播放器能够通过网络 105 直接地或通过另一计 算机与数据库系统 330 通信。例如, CD 播放器可以具有数据接口 ( 例如, IDE 接口或 USB 接 口 ), 其使得 CD 播放器能够发送并从膝上型计算机接收数据, 所述膝上型计算机转而耦接 至网络 105。
         同样, 服务器系统 315 包括用于与客户端计算机 110 通信的硬件和 / 或软件。例 如, 服务器系统 315 可以具有 HTTP 兼容软件、 操作系统和公共网关接口 (CGI) 软件, 用于通 过网络 105 与客户端计算机 110 相接。作为选择, 服务器系统 315 和客户端计算机 110 可 以运行使得它们能够通过网络 105 通信的专有软件。
         将易于理解, 图 3 的框图中的配置是为了说明的目的, 并且许多变型是可能的。例 如, 数据库系统 330 可以耦接至局域网 (LAN), 该局域网转而可以耦接至网络 105。在另一 示例中, 数据库系统 330 可以耦接至多个网络服务器。系统 300 还可以包括以不同于这里 描绘的数据库系统 330 的配置而布置的数据库系统。例如, 下面参照图 1-4 讨论混合配置。
         图 4 是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的 图 3 的系统 300 的示意图。在实施例中, 图 4 的系统 300 可以与图 2 的系统 100 基本上类 似。然而, 在此系统 300 中, 将数据库系统 330 组织为等级, 并且服务器系统 315 优选地具 有一个服务器。系统 300 被结构化为最优化从客户端计算机 110 发起的模糊搜索。模糊搜 索意思是对于近似地或基本上匹配给定模式字符串的字符串的搜索。
         在搜索发生之前, 图 3 的结构化设备 320 被配置为基于信任质量来对服务器系统 315 中的数据进行分类。最高信任质量数据对查询提供最高信任结果。最低信任质量数据 对查询提供最低信任结果。如上面参照图 1 所述, 信任质量意思是已经投入到将数据存储 到服务器和 / 或数据库中的已知关注和已知控制的最小量。
         结构化设备 320 被配置为分解数据, 并从最高信任质量到最低信任质量跨越多个 服务器而分布数据。结构化设备 320 将数据结构化到分等级的数据库中, 从等级 1 数据库 到等级 n 数据库, 其中 n 是正整数。例如, 等级 1 数据包含在等级 1 数据库中。等级 2 数据 包含在等级 2 数据库中, 等等。
         数据按照需要分等级到 n 个数据库中。等级 1 数据是最高信任质量数据。等级 1 数据的示例是由拥有数据库系统 315 的公司的编辑部员工手动输入数据库系统 315 的编辑 数据。这样的公司可以是例如 等级 2 是次高的信任质量数据。等级 2 数据 的示例是从拥有数据库系统 330 的公司的合作伙伴提交的数据。数据的等级按照需要以更 小的信任质量继续。更小的信任质量数据的示例包括下列 : 从数据库系统 315 的非附属的 公众用户挖掘的数据 ; 和 / 或由数据库系统 315 的非附属的公众用户输入的数据。
         图 3 的搜索设备 325 被配置为首先搜索等级 1 数据。搜索设备 325 试图从等级 1数据来满足查询。如果等级 1 数据库返回对该查询的结果, 则搜索设备 325 不需要汇总来 自数据库系统 330 中的全部数据库的全部结果。然而, 如果等级 1 数据库不具有对该查询 的结果, 那么搜索设备 325 继续前进, 并优选地接下来搜索等级 2 数据。等级 2 数据库可能 从等级 2 数据来满足查询。如果等级 2 数据库具有对该查询的结果, 则搜索设备 325 不需 要汇总来自数据库系统 330 中的全部数据库的全部结果。该处理按照需要继续至等级 n 数 据库中的等级 n 数据。
         重要的是, 注意, 结构化设备 320 被配置为不考虑找到对查询的匹配的可能性而 组织数据。在多个搜索中, 最不可能找到查询匹配的源可能结果是等级 1 数据。然而, 该基 于信任的方法可以以至少两种方式改善搜索效率。第一, 搜索设备 325 可以立即找到结果 并不需要查看所有数据。 第二, 通过首先找到并返回最高信任质量数据, 该结果不需要在被 返回至客户端计算机 110 之前对于优先级而分类。例如, 在执行搜索之前, 已经通过信任质 量而分类了该数据。因此, 在找到结果之后对于优先级而分类是不必要的。
         因此, 客户端计算机 110 可以通过网络 105 访问数据库系统 330。客户端计算机 110 可以例如发送对与数据库系统 330 中的经识别的唯一标识符关联的元数据的查询。数 据库系统 330 中的每个唯一标识符可能已经例如从 CD 的内容表 (TOC) 生成。作为选择, 每 个唯一标识符可以是例如从音轨生成的指纹。指纹是从可用于识别音频样本和 / 或在数据 库中迅速定位相似项的音频信号确定性地生成的对某些声学属性的数字度量。 在另一实施 例中, 客户端计算机 110 可以使用网络浏览器向数据库系统 330 发出字符串查询。也存在 搜索配置的其它示例。 参见图 1-4, 注意, 某些实施例可以包括上面讨论的实施例的混合。 例如, 服务器系 统可以包括多个服务器, 同时服务器系统中的至少一个服务器耦接至多个数据库。可以根 据信任质量等级以预定方式对多个服务器和多个数据库分等级。同样, 可以跨越多个服务 器和多个数据库, 根据信任质量等级结构化数据。还存在其它变型。
         方法概述
         图 5 是根据某些实施例的用于在分级的基于信任的配置中结构化数据的方法 500 的流程图。在某些实施方式中, 可以由图 1 的结构化设备 120 执行方法 500 的步骤。
         方法 500 在步骤 505 中开始, 在步骤 505 系统接收数据。方法 500 然后移动至步 骤 510, 在步骤 510 系统将信任质量等级分配至数据。 信任质量等级在跨越从最高信任质量 等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。 优 选地, 系统预先确定服务器和 / 或数据库中的数据的信任质量等级。例如, 系统可以预先确 定信任质量等级以包括最高信任质量等级、 最低信任质量等级和一个或多个中间信任质量 等级。 特定信任质量等级的数据被配置为优选地在相对较低的信任质量等级的数据之前被 搜索。因此, 在步骤 515 中, 系统根据信任质量等级在所选服务器中组织数据。所选服务器 在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质 量等级在内的范围中。
         方法然后进行至判定操作 520, 在判定操作 520 中系统确定是否要接收更多的数 据。例如, 服务器系统的编辑可以手动输入更多的数据。如果要接收更多的数据, 那么方法 500 返回至步骤 505, 在步骤 505 系统接收数据。方法 500 从那里继续。然而, 如果系统在 判定操作 520 确定将不接收更多数据, 那么方法 500 在判定操作 520 之后结束。
         图 6 是根据某些实施例的用于在分级的基于信任的配置中搜索数据的方法 600 的 流程图。在某些实施方式中, 可以由图 1 的搜索设备 125 执行方法 600 的步骤。
         方法在步骤 605 中开始, 在步骤 605 系统将来自客户端计算机的查询接收至服务 器系统中。 从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任 质量等级在内地组织服务器系统中的数据。某些实施例使用图 5 的方法 500 以在搜索发生 之前在服务器和 / 或数据库中组织数据。如上面参照图 5 讨论的, 系统优选地预先确定服 务器和 / 或数据库的信任质量等级。例如, 系统可以预先确定信任质量等级以包括最高信 任质量等级、 最低信任质量等级和一个或多个中间信任质量等级。特定信任质量等级的数 据被配置为优选地在相对较低的信任质量等级的数据之前被搜索。因此, 在步骤 610 中, 系 统通过搜索最高信任质量等级的数据以力图满足该查询而开始搜索。
         接下来, 在判定操作 615 中, 系统确定该查询是否被处于最高信任质量等级的任 何数据所满足。如果该查询被满足, 那么方法 600 移动至步骤 635, 在步骤 635 系统将查询 结果返回至客户端计算机。然而, 如果系统在判定操作 615 确定该查询未被满足, 那么该方 法进行至步骤 620, 在步骤 620 系统搜索下一信任质量等级的数据以力图满足该查询。 优选 地, 在此步骤 620 搜索的数据具有比在上面的步骤 610 搜索的数据低的信任质量。
         接下来, 在判定操作 625 中, 系统确定该查询是否被在上面的步骤 620 搜索的信任 质量等级的任何数据所满足。 如果该查询被满足, 那么方法 600 移动至步骤 635, 在步骤 635 系统将查询结果返回至客户端计算机。然而, 如果系统在判定操作 625 中确定该查询未被 满足, 那么该方法 600 进行至判定操作 630。
         在判定操作 630 中, 系统确定是否已经搜索了最低信任质量等级的数据。如果还 未搜索最低信任质量等级的数据, 那么方法 600 返回至步骤 620, 在步骤 620 系统搜索下一 信任质量等级的数据。优选地, 在步骤 620 搜索的数据具有比之前搜索的数据低的信任质 量。方法 600 从步骤 620 继续, 直到找到结果或者搜索了所有的信任质量等级为止。
         在判定操作 630 中, 如果系统确定已经搜索了最低信任质量等级的数据, 那么方 法 600 移动至步骤 635, 在步骤 635 系统将查询结果返回至发送该查询的客户端计算机。 在 步骤 635, 该查询结果可能是系统不能找到对该查询的匹配。在步骤 635 之后, 方法 600 结 束。
         注意, 这些方法可以包括此方法概述中未讨论的其它细节和步骤。上面参照适当 的附图讨论了其它细节和步骤, 并且取决于实施例, 其它细节和步骤可以是方法的一部分。
         计算机可读介质实施方式
         如将对计算机领域内的技术人员所显然的, 可以通过使用根据本公开的教示编程 的传统通用计算机或专用数字计算机或者微处理器来方便地实施某些实施例的部分。 可以 由熟练的程序员基于本公开的教示来容易地准备适当的软件编码。 还可以通过准备专用集 成电路或者通过互联传统组件电路的适当网络来实施所述方法和系统。
         一种实施方式可以包括计算机程序产品, 其是具有存储在其上 / 其中的指令的存 储介质, 所述指令可用于控制或使计算机执行实施方式的任何处理。存储介质可以包括 ( 并非限制 ) 任何类型的盘, 包括软盘、 迷你盘 (MD)、 光盘、 DVD、 CD-ROM、 微驱动器、 以及磁光 盘、 ROM、 RAM、 EPROM、 EEPROM、 DRAM、 VRAM、 闪存设备 ( 包括闪卡 )、 磁或光卡、 纳米系统 ( 包 括分子存储器 IC)、 RAID 设备、 远程数据存储器 / 存档库 / 储存库、 或适于存储指令和 / 或数据的任何类型的介质或设备。
         存储在计算机可读介质的任何一个上, 某些实施方式包括用于控制通用 / 专用计 算机或微处理器的硬件并用于使得计算机或微处理器与利用特定实施例的结果的人类用 户或其它机构交互的软件。这样的软件可以包括 ( 并非限制 ) 设备驱动器、 操作系统和用 户应用。最后, 这样的计算机可读介质还包括用于执行如上所述的方法和系统的方面的软 件。
         包括在通用 / 专用计算机或微处理器的编程 ( 软件 ) 中的是用于实施上述处理的 软件模块。上述处理包括 ( 并非限制 ) 下列步骤 : 接收数据 ; 将信任质量等级分配给数据, 其中信任质量等级在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量 等级和最低信任质量等级在内的范围中, 并且其中特定信任质量等级的数据被配置为在相 对较低的信任质量等级的数据之前被搜索 ; 以及根据信任质量等级在服务器系统的所选服 务器中组织数据, 其中所选服务器在跨越从最高信任质量等级到最低信任质量等级并包含 最高信任质量等级和最低信任质量等级在内的范围中。
         优点
         系统的实施例允许根据数据的信任质量在服务器上结构化并搜索所述数据。 系统 高效地跨越服务器结构化数据以改善响应性并降低总体负荷。 系统以至少两种方式改善搜 索的效率。第一, 系统可以立即找到结果并不需要查看所有数据。第二, 通过首先找到并返 回最高信任质量数据, 该结果不需要在被返回至客户端计算机之前对于优先级而分类。在 执行搜索之前, 已经通过信任质量而分类了数据。 因此, 不必在找到结果之后对于优先级而 分类。所述改善向用户和客户提供改善的体验, 同时消耗较少的昂贵的服务器资源。
         在前面的说明书中, 已经参照本发明的具体实施例而讨论了本发明。 然而, 将显而 易见的是, 在不脱离本发明的较宽泛的精神和范围的情况下, 可以对其进行各种修改和改 变。因此, 说明书和附图被认为在说明性的意义上而非限制性的意义上。

    关 键  词:
    分级 基于 信任 配置 结构 搜索 数据
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:在分级的基于信任的配置中结构化并搜索数据.pdf
    链接地址:https://www.zhuanlichaxun.net/p-1037841.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1