书签 分享 收藏 举报 版权申诉 / 23

用于管理元数据的方法和系统.pdf

  • 上传人:n****g
  • 文档编号:1744819
  • 上传时间:2018-07-09
  • 格式:PDF
  • 页数:23
  • 大小:1.47MB
  • 摘要
    申请专利号:

    CN201380052553.5

    申请日:

    2013.10.08

    公开号:

    CN104756067A

    公开日:

    2015.07.01

    当前法律状态:

    实审

    有效性:

    审中

    法律详情:

    实质审查的生效IPC(主分类):G06F 7/00申请日:20131008|||公开

    IPC分类号:

    G06F7/00

    主分类号:

    G06F7/00

    申请人:

    约翰·班缇沃格里欧

    发明人:

    约翰·班缇沃格里欧

    地址:

    美国华盛顿特区

    优先权:

    61/710,882 2012.10.08 US

    专利代理机构:

    中原信达知识产权代理有限责任公司11219

    代理人:

    陈依虹; 刘光明

    PDF完整版下载: PDF下载
    内容摘要

    提供了一种用于管理元数据的基于计算机的方法和记分系统。在优选实施例中,元数据通过与一个或多个标准或规则相比较被记分,并且产生了错误、警告以及推荐的报告。在另外的实施例中,所述方法提供用于所述元数据的校正和/或编辑及改进、以及经改进的元数据的分发的手段;记分系统还被提供来估计所述元数据的质量。

    权利要求书

    权利要求书
    1.  一种用于管理元数据的基于计算机的方法,所述方法包括:
    (a)将元数据文件上传到计算机处理器中;
    (b)经由所述计算机处理器对于所上传的元数据文件中的需要字段的完整进行评估;
    (c)经由所述计算机处理器将所上传的元数据与一个或多个选择的规则、标准和/或最佳实践相比较,以识别由在所选学科的有关元数据的所述规则、标准和最佳实践方面具有多年经验的专家先前仅通过视觉审查识别的错误;
    (d)根据步骤(c)中的所述比较产生错误和警告的分解;以及
    (e)提供用来校正和/或编辑和/或增强和/或改进和/或跟上和/或导出所述元数据的手段。

    2.  根据权利要求1所述的用于管理元数据的基于计算机的方法,进一步包括:基于步骤(b)中的所述评估和/或步骤(c)中的所述比较,将一个或多个分数分配给所述元数据。

    3.  根据权利要求1所述的用于管理元数据的基于计算机的方法,进一步包括:用于在校正和/或编辑和/或增强和/或改进所述元数据之前,对所述元数据的任何潜在校正和/或编辑和/或增强和/或改进的审查和批准的手段。

    4.  根据权利要求1所述的用于管理元数据的基于计算机的方法,其中,用来校正和/或编辑和/或增强和/或改进所述元数据的所述手段自动地定位和校正错误,并且遍及数据库或目录添加所述元数据方面的增强和/或改进。

    5.  一种用于元数据的记分系统,包括:用于接收元数据的计算机处理器;用于估计元数据文件中的需要字段的完整的装置;用于将所 接收到的元数据与一个或多个选择的规则、标准和/或最佳实践相比较,以识别由在所选学科的有关元数据的所述规则、标准和最佳实践方面具有多年经验的专家先前仅通过视觉审查识别的错误的装置;用于基于所述比较来计算一个或多个分数的装置;以及用于显示所述一个或多个分数的装置。

    6.  根据权利要求5所述的记分系统,其中,所计算出的分数进一步基于所述元数据的丰富性。

    说明书

    说明书用于管理元数据的方法和系统
    本专利申请要求2012年10月8日提交的美国临时专利申请No.61/710,882的优先权的权益,其教导通过引用整体地并入在本文中。
    技术领域
    本发明提供用于元数据的管理的基于计算机的方法,其中元数据被输入、通过与一个或多个标准或规则相比较被记分,并且产生了错误、警告以及推荐的报告。该基于计算机的方法还提供用于元数据的校正和/或编辑及改进、以及经改进的元数据的分发的手段。同样由本发明所提供的是用于元数据的质量的记分系统。
    背景技术
    元数据或元内容提供关于数据的一个或多个方面的信息,包括但不限于数据的创建、数据的目的、创建的时间和日期、数据的创建者或作者、以及所使用的标准的手段。
    诸如美国国家标准协会(ANSI)和国际标准化组织(ISO)、书业研究集团(BISG)、EDiTEUR(定义)的许多组织已为元数据建立了广泛详细的规则和/或标准,并且在各种学科中登记。在恰当标准化的目录(诸如书籍、艺术、图像、音乐以及电影)是重要的字段方面,这些标准常常调整被用于目录信息在各方之间的共享的.xml标准计算机代码。
    这样的目录的管理者试图使成百、成千并且有时成千上万个单独记录保持完整,具有如例如通过可搜索性、相关性以及丰富性并且按照这些标准而确定的最高质量。
    基于计算机的方法存在以用于估计和/或验证包含.xml元数据的文件的必要标签是否完整,或者处于恰当顺序或对于特定标签具有正确的代码。
    然而,估计字段中所提供的元数据相对于准确性和/或格式和/或质量是否满足所选学科的已建立规则和/或标准和/或最佳实践、和/或相关性和/或完整性需要通过对于所选学科在元数据的规则和/或标准和/或最佳实践和/或质量方面具有高级专门知识的人为审查。这样的人为审查是极其费时且费力的并且常常是不准确的。另外,对于人或一群人来说不可能在符合非常细微且特定的工业标准和/或其它定性标准、常常保持在不同地方和/或数据库中的这些目录中维持大量记录。当前,这样的审查通过目录条目的随机选择来执行以得到人为审查。这个方法既不提供元数据的质量的准确表示,也不为需要在大目录内维持准确性和一致性的那些人提供成本效益合算的手段。
    发明内容
    本发明的一个方面涉及用于管理元数据的基于计算机的方法。在这个方法中,选择学科的元数据被上传到计算机处理器。首先经由计算机为必要字段的完整而检查元数据文件。所上传的元数据然后针对准确性和/或格式和/或完整性和/或质量经由计算机与所选学科的一个或多个选择的规则、标准和/或最佳实践相比较,并且根据这些比较提供错误和/或警告的分解。由计算机在这些比较步骤中识别的错误包括数据文件中的遗漏字段以及由对于该选择学科在有关元数据的规则和/或标准和/或最佳实践方面具有多年经验的专家先前仅在视觉上识别的元数据中的错误。然后提供了用来校正和/或编辑和/或增强和/或改进元数据的手段。
    在一个实施例中,一个或多个分数基于必要字段的完整、所输入的元数据与所选学科的所选一个或多个规则、标准和/或最佳实践的比较、和/或元数据的质量而被分配给元数据。
    因此,本发明的另一方面涉及用于元数据的记分系统,通过所述记分系统这种数据的用户和/或消费者能够评估元数据的准确性和/或可靠性和/或完整性和/或丰富性和/或质量。在这个系统中,计算机处理器被提供用于选择学科的元数据文件的输入。提供了用于为必要字段的完整而检查元数据文件的装置。还提供了用于将元数据与所选学科的一个或多个选择的规则、标准和/或最佳实践相比较的装置。通过这个比较装置所识别的错误包括由对于所选学科在有关元数据的规则和/或标准和/或最佳实践和/或质量方面具有多年经验的专家先前仅通过视觉检查所识别的元数据中的错误。记分卡被生成,并且指示元数据的质量和/或准确性和/或完整性和/或丰富性的一个或多个分数基于该比较被分配给元数据。
    附图说明
    图1是描绘本发明的方法中的信息的流程的框图。
    图2A至图2C是用本发明的方法和记分系统生成的记分卡的示例。
    图3A-3H提供数个工业标准或规则、标准或规则的限定词(如果需要)、以及用于将元数据与规则或标准相比较的逻辑的非限制性示例。
    图4提供包含错误的.xml数据文件、其经由本发明的方法的识别以及紧跟错误的校正之后的.xml数据文件的示例。
    图5A至图5E是举例说明识别并且校正元数据中的错误的过程的来自本发明的方法的屏幕快照。图5A是遵循的规则比特的列表的屏幕快照,并且指示存在正错过必要年龄资格的标题。图5B是示出具有问题的标题的书页的屏幕快照。在这个示例中,这个标题有数个问题并且全部被突出。图5C是示出标题已添加美国学校年级的紧跟校正之后的书页的屏幕快照。图5D是示出能够添加必要信息的数据管理器系统的屏幕快照,并且图5E是示出数据管理器添加学校年级的屏幕快照。
    具体实施方式
    本发明提供用于管理元数据的基于计算机的方法以及用于元数据的记分系统。采用本发明的方法,能够上传、估计、记分、校正并且维持选择学科的元数据文件。
    在一个实施例中,基于计算机的方法提供有可经由任何web浏览器访问的用户友好基于云的环境。替换地,可以在用户自己的网络上托管基于计算机的方法。本发明的方法能够在单用户平台或多用户平台上执行,所述多用户平台使得多个用户能够协作地估计并且校正、维持和/或增强来自网站的元数据。
    能够依照本发明管理元数据所针对的各种选择学科的示例包括但不限于书籍、图像、电影、音乐、艺术以及文化合集的元数据。
    图1示出本发明的基于计算机的方法中的信息的流程。
    在本发明的方法中,选择学科的元数据首先被上传到计算机处理器。参见图1的步骤101。能够以各种方式上传数据。在一个非限制性实施例中,数据作为.xml文件被上传。在一个非限制性实施例中,诸如经由EXCEL文件以电子表格格式上传数据。
    在本发明的一个非限制性实施例中,所上传、记分、校正和/或维持的元数据是针对书籍的。书籍元数据在被正确地编码时帮助书籍卖方、数据提供方、经销商、搜索引擎以及消费者发现并且访问关于书籍的信息。它还帮助做库存跟踪等。这个元数据包括但决不限于书籍格式和价格、标题、出版者/印象/品牌视频以及关于书籍的其它多媒体、描述和标识符。ONIX或在线信息交换(用于用电子学方法传送信息的基于.XML的标准化格式)是出版工业的标准元数据格式的示例。因此,在本发明的一个实施例中,本发明的基于计算机的方法可以被设计成导出由用户上传的基于.XML的ONIX数据。
    然而,如由技术人员在阅读本公开时将理解的,本文所描述的计算机方法和记分系统例行地可适于牵涉特别是基于.xml标准的那些模式的元数据的其它选择学科。在本发明的方法中,首先为必要数据字段的完整性而检查元数据文件。例如,在牵涉.xml文件的实施例中,为标签、模式等的完整而检查.xml文件,参见图1的步骤102。并且参见图4,图4依照本发明的步骤102提供包含错误、具体地遗漏数据的.xml数据文件、其经由本发明的方法的识别、以及紧跟这个错误的校正之后的.xml数据文件的非限制性示例。
    在本发明的方法中,所上传的元数据然后还与所选学科的一个或多个选择的规则、标准和/或最佳实践相比较。参见图1的步骤103。出于本发明的目的,规则、标准和/或最佳实践可以来自消费者和/或来自工业和/或是质量标准或评估质量度量和/或基于发明人的推荐、建议和/或提议。例如,对于涉及书籍的元数据,可以将该元数据与一个或多个ONIX工业标准和/或一个或多个最佳实践(包括但决不限于由书业集团和/或Editeur.org所阐述的那些、以及发明人在本文中的那些推荐、提议和/或建议)相比较。在一个非限制性实施例中,发明人在本文中的推荐、提议和/或建议可以增强元数据质量。在另一非限制性实施例中,发明人在本文中的推荐、提议和/或建议可以增强目录中的项目的可发现性、可搜索性、可销售性和/或收益性。依照本发明的方法,已经创建了按其比较元数据的规则。这些规则可以包括由工业标准设定主体所阐述的单个实体的最佳实践或基于如由发明人和/或用户所确定的工业最佳实践、推荐、建议和/或提议的组合所选择的规则集合。在一个实施例中,比较可以基于由发明人在本文中从分析其它数据集合而开发的规则集合。还基于逻辑为用户编写规则。这些规则不仅检查.xml而且在.xml内。对于这个步骤,用户可以选择它们要他们的元数据被比较的一个或多个消费者或工业规则或标准和/或最佳实践。该方法可以提供用户可以从中选择以用于比较的消费者或工业规则或标准和/或最佳实践的列表。替换地,或此外,用户可以选择他们自己的 他们将他们的元数据与其相比较的标准、规则和/或最佳实践的列表。在一个实施例中,用户可以选择用来生成特定记分卡的规则,所述特定记分卡的非限制性示例在图2A-2C中被描绘。用户可以为比较选择多于一个列表,并且为他们的元数据生成多于一个错误和/或警告列表以及多于一个分数。在本发明的基于计算机的方法的这个步骤中,错误经由由本发明的发明人编写的算法来识别,这在本发明之前需要通过在所选学科的有关元数据的规则、标准和最佳实践方面具有多年经验的专家的视觉审查。这样的人为审查既费时又费力,因为在选择学科中用于元数据的规则、标准以及最佳实践是广泛且复杂的,在不同国家和/或主管机构和/或工业之间不同。此外,规则、标准以及最佳实践在频繁地改变,并且正在添加新的规则以跟上技术的改变和/或以改进给定工业内的目录项目的可发现性、可搜索性、可销售性和/或收益性。
    在这个步骤处识别的错误的非限制性示例是用所有大写字母编写和/或当存在volume的单独字段时包含单词“volume 27”作为ONIX的一部分的标题的错误。作为另一非限制性示例,在这个步骤处,识别了法国出版者以除仅第一单词和适当名词的大写外的任何其它格式呈现书籍标题的错误、或美国出版者以仅第一单词被大写的格式代替在大标题情况下呈现书籍标题的错误。作为另一非限制性示例,在这个步骤处,识别了仅具有关于被卖的书籍的英语语言描述的错误是不说英语的国家。作为另一非限制性示例,如果用户对书籍的数字版权包括世界的所有国家并且用户正在仅基于出版者的本币卖数字版权,则识别了这个错误。在本发明之前,这样微妙的又明显的错误仅能够通过随机选择的文件通过所选学科的元数据规则、标准和/或最佳实践方面的专家的视觉检查来识别。
    在图3A-3H中阐述了数个工业标准或规则、标准或规则的限定词(如果需要)以及用于将元数据与规则或标准相比较的逻辑的非限制性示例。本发明的方法包括其它标准和规则的多个相似算法、以及发 明人推荐、提议和/或建议以用于在本发明中使用。
    来自比较的错误和警告的分解然后被生成并且提供给用户。参见图1的步骤104。通过错误,它意指为了文件与工业标准兼容必须被修复的问题。通过警告,它意指可能引起问题的问题,或事实上为错误但是必须被检查以查看用户是否想要为它们破个例。
    例如,对于书籍元数据,可以对照选择记分卡的所有规则来扫描元数据,所述记分卡的非限制性示例被描绘在图2A-2C中。用户然后查看按优先级或类型和/或数据字段所列举的结果的列表。用户然后能够审查具有产生警告的这个错误或数据的标题的列表,并且然后他们能够对在元数据中被立即更新的所有或选择的标题应用全局或选择的更新或校正。他们还能够在审查其中错误和/或警告被突出的所有该标题的元数据之后审查、校正并且更新单独的标题。因此,能够自动地或通过用户对待校正的数据错误和产生警告的数据的选择在逐案例基础上校正数据错误和/或产生警告的数据。
    因此,基于计算机的方法还提供用来校正和/或编辑和/或增强和/或改进和/或跟上元数据的手段。参见图1的步骤105。并且参见图5A至图5E,图5A至图5E提供举例说明识别并且校正元数据中的错误的过程的来自本发明的方法的屏幕快照。在生成了错误和/或警告的分解后,用户可以例行地导航到需要工作、排序、探索以修复问题并且调查图案的区域。该方法提供搜索和排序工具,所述搜索和排序工具提供用来定位和隔离元数据内的问题的能力。该方法还提供用来创建元数据子集以通过浏览或搜索继续工作的能力,从而使得用户易于容易地访问需要管理和/或校正和/或改进或者增强的元数据。
    另外,该方法提供用来向其它人示出潜在问题、提出编辑并且在提交它们之前批准改变的手段。
    使用本发明的方法,能够自动地定位错误并且能够校正数据中的递归失误、错误以及不足之处,从而提供能够通过其更快且容易地校正和增强整个数据库的手段。
    然后,能够经由本发明的方法将经校正、编辑和/或增强的元数据容易地导出给贸易伙伴。
    在一个实施例中,本发明的方法还包括基于在例如记分卡中向用户报告的元数据的比较来分配一个或多个分数。参见图1的步骤106。在图2A至图2C中描绘了记分卡的各种非限制性示例。分配的分数可以基于许多因素,包括但不限于元数据的完整性和准确性、其与工业标准、规则和/或最佳实践和/或发明人推荐、建议和/或提议的符合性及其丰富性,意指附加元数据在由该工业所需要的之上或之外的包括。
    本发明的另一优点是,至少对于一些用户来说,这可能是首次他们的元数据中的全部被维持在它能够被参考和引用的一个地方中。
    本发明还提供的是用于元数据的记分系统。通过本发明的记分系统所生成的分数提供能够通过其估计元数据的可靠性和/或可理解性的手段。
    本发明的系统包括用于接收与选择学科有关的元数据的计算机处理器。
    该系统还包括:用于评估元数据文件的完整性(意味着元数据文件的诸如标签、模式等的所需字段完整)的装置;以及用于将所接收到的元数据与所选学科的一个或多个选择的消费者或工业规则或标准和/或最佳实践相比较,以识别由在所选学科的有关元数据的规则、标准和最佳实践方面具有多年经验的专家先前仅通过视觉审查以其它方式识别的错误的装置这二者。然后,基于许多因素来分配一个或多个 分数,所述许多因素包括但不限于元数据的完整性和准确性、其与工业标准、规则和/或最佳实践的符合性及其丰富性,意指附加元数据在由该工业所需要的之上或之外的包括。在图2A至图2C中描绘了记分卡的非限制性示例。基于一个或多个分数,用户能够确定元数据的校正和/或增强和/或改进是否是期望的。一旦数据被校正、增强和/或改进,用户可以重新提交元数据以用于比较以基于改变接收新的分数。分数能够在内部以及由元数据的贸易伙伴和其它元数据接收者用来估计提供方的产品和其中所提供的信息。

    关 键  词:
    用于 管理 数据 方法 系统
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:用于管理元数据的方法和系统.pdf
    链接地址:https://www.zhuanlichaxun.net/p-1744819.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1