欢迎来到专利查询网! | 帮助中心 查专利用我们更专业!
专利查询网
换一换
首页 专利查询网 > 资源分类 > PDF文档下载
分享到微信 分享到微博 分享到QQ空间

丰富时间线和时间顺序文本描述定义的内容的方法和设备.pdf

  • 资源ID:6179840       资源大小:1.71MB        全文页数:13页
  • 资源格式: PDF        下载积分:30金币
快捷下载 游客一键下载
账号登录下载
三方登录下载: 微信开放平台登录 QQ登录
下载资源需要30金币
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 
账号:
密码:
验证码:   换一换
  忘记密码?
    
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

丰富时间线和时间顺序文本描述定义的内容的方法和设备.pdf

1、(10)申请公布号 CN 103984693 A (43)申请公布日 2014.08.13 CN 103984693 A (21)申请号 201410047322.1 (22)申请日 2014.02.11 13305163.1 2013.02.11 EP G06F 17/30(2006.01) (71)申请人 汤姆逊许可公司 地址 法国伊西莱穆利诺 (72)发明人 M. 格甘 J. 拉纳甘 P. 施莫克 A. 兰伯特 (74)专利代理机构 北京市柳沈律师事务所 11105 代理人 吕晓章 (54) 发明名称 丰富时间线和时间顺序文本描述定义的内容 的方法和设备 (57) 摘要 本发明涉及一种用

2、于丰富由时间线和由按时 间顺序排列的文本描述定义的多媒体内容的方 法, 其特征在于它包括以下步骤 : 使用自然语言 处理来至少在从网络 (N) 取得的文本文档 (Pi) 的 部分中识别 (E3) 至少一个特征 (F1、 F2) , 自动将 所述文本文档的确定部分对齐 (E4) 到语义对应 于所述文本文档的确定部分的按时间顺序排列的 文本描述的至少一部分, 使得至少将文本文档的 该部分自动地与所述多媒体内容的时间线同步, 按时间顺序排列的文本描述本身与时间线同步。 (30)优先权数据 (51)Int.Cl. 权利要求书 1 页 说明书 8 页 附图 3 页 (19)中华人民共和国国家知识产权局

3、(12)发明专利申请 权利要求书1页 说明书8页 附图3页 (10)申请公布号 CN 103984693 A CN 103984693 A 1/1 页 2 1. 一种用于丰富包括时间线和按时间顺序排列的文本描述的多媒体内容的方法, 其特 征在于它包括以下步骤 : - 使用自然语言处理来至少在从网络 (N) 取得的文本文档 (Pi) 的部分中识别 (E3) 至 少一个特征 (F1、 F2) , - 自动将所述文本文档 (Pi) 的确定部分对齐 (E4) 到语义对应于所述文本文档 (Pi) 的 确定部分的按时间顺序排列的文本描述的至少一部分, 使得至少将文本文档 (Pi) 的该部分自动地与所述多媒

4、体内容的时间线同步。 2. 根据权利要求 1 所述的方法, 其中, 从一组文本文档 (Pi) 识别 (E1) 所述文本文档 (Pi) , 作为涉及所述多媒体内容。 3. 根据权利要求 2 所述的方法, 其中, 从因特网网络 (N) 取得 (E2) 所述一组文本文档。 4. 根据前述权利要求中的一项所述的方法, 其中, 在所述对齐 (E4) 步骤期间, 实施首 语重复分辨技术以执行所述文本文档 (Pi) 的确定部分和按时间顺序排列的文本描述之间 的语义对应。 5. 根据前述权利要求中的一项所述的方法, 其中, 在多个文本文档 (Pi) 上应用识别 (E3) 步骤和对齐 (E4) 步骤以自动地使所

5、述文本文档 (Pi) 与多媒体内容的时间线同步。 6. 根据前述权利要求中的一项所述的方法, 其中, 所述特征 (F1、 F2) 属于下列特征分 组, 其至少包括 : - 字词的组合 ; - 语义实体 ; - 字词列表 ; - 事件。 7. 根据前述权利要求中的一项所述的方法, 其中, 自然语言处理对应于实体识别处理 或基于特征的观点分析。 8. 根据前述权利要求中的一项所述的方法, 其中所述多媒体内容是视听内容并且所述 文本文档是由网络用户所写的评论 (Pi) 。 9. 根据前述权利要求中的一项所述的方法, 其中, 所述多媒体内容被分段成其中时间 线的对应时间间隔与之相关联的多个场景, 所述

6、文本文档 (Pi) 被同步到它所涉及的场景的 时间间隔。 10. 一种用于丰富包括时间线和按时间顺序排列的文本描述的多媒体内容的系统, 其 特征在于它包括 : - 被配置为至少在从网络 (N) 取得的文本文档 (Pi) 的部分中识别至少一个特征 (F1、 F2) 的自然语言处理模块 (NLP) , - 用于自动将所述文本文档 (Pi) 的确定部分对齐到语义对应于所述文本文档的确定 部分的按时间顺序排列的文本描述的至少一部分的对齐模块 (A) , 使得至少将文本文档 (Pi) 的该部分自动地与所述多媒体内容的时间线同步。 权 利 要 求 书 CN 103984693 A 2 1/8 页 3 丰富

7、时间线和时间顺序文本描述定义的内容的方法和设备 技术领域 0001 本发明总地涉及将元数据关联到多媒体内容, 并且具体地涉及一种用于利用例如 网络用户在社交网络或诸如网络论坛的其它用户生成的内容库上张贴的评论来丰富由时 间线和由按时间顺序排列的文本描述定义的多媒体内容的方法和设备。 背景技术 0002 本节旨在向读者介绍本领域的各个方面, 这可能与下面所描述的和 / 或要求保护 的本发明的各个方面相关。 相信这种讨论在给读者提供背景信息以便于更好地理解本发明 的各个方中是有帮助的。因此, 应当理解, 要从这个角度阅读这些陈述, 而不是作为对现有 技术的承认。 0003 随着诸如 TWITTER

8、 和 YOUTUBE、 以及其它网络论坛的社交网络和平台的发展, 近些 年对于由非专业作家 (如电视用户) 写作的关于多媒体内容 (例如电影) 的评论的文本分析 已经取得了强烈的兴趣。 0004 特别是, 一些研究集中于用户评论与视频内容、 特别是与所述视频内容的时间线 的同步。 0005 因而已知通过使用在实时事件期间通过社交网络生成的文本微张贴 (如由于 TWITTER 平台的留言 (tweet) ) 来增强视听内容, 通过使用微张贴的时间戳来直接完成同 步。 0006 此外, 也已知允许用户观看视频内容, 并同时张贴自动和自然地与视频内的时间 相关联的评论的系统。 0007 在这两种情况

9、下,(如果已实现) 评论与视听内容的时间线的同步是简单的, 因为 由于时间戳, 评论已经具有时间码。 0008 换句话说, 这些现有技术允许将评论与多媒体内容的时间线同步, 仅仅因为每个 评论与时间信息 (例如, 文本微张贴在其对应的社交网络上被发送的时间) 相关联, 所述多 媒体内容被同时播放。 0009 然而, 这些现有技术的缺点依赖于它们要求在播放多媒体内容期间写入评论, 以 便使每个评论的发出时间与多媒体内容的特定时间点相匹配的事实。此外, 因为需要时间 来写评论, 其内容可能涉及多媒体内容的先前场景, 而不是涉及所述评论最终与之相关联 的场景。换句话说, 同步表现为不准确的。 001

10、0 本发明试图补救前面提到的缺点的至少一些, 并且特别是不使用任何时间码地将 文本元数据与在特定时间点的多媒体内容在其对应的时间线中对齐。 发明内容 0011 本发明涉及一种用于丰富由时间线和由按时间顺序排列的文本描述定义的多媒 体内容的方法。 0012 为此, 该方法包括以下步骤 : 说 明 书 CN 103984693 A 3 2/8 页 4 0013 - 使用自然语言处理来至少在文本文档的部分中识别至少一个特征, 0014 - 自动将所述文本文档的确定部分对齐到语义对应于所述文本文档的确定部分的 按时间顺序排列的文本描述的至少一部分, 0015 使得至少将文本文档的该部分自动地与所述多媒

11、体内容的时间线同步。 0016 在本说明书中, 应理解 : 0017 - 文本文档表示由专业或非专业用户尤其是, 但不排他地, 网络和 / 或电视用 户所写的任何类型的文本, 诸如测评、 评论、 博客或论坛帖子、 百科全书的文章、 新闻文 章等。显然, 文本文档可以由字母数字字符组成, 0018 - 作者是写出这样的文本文档的人 (例如网络用户、 电视用户等) , 0019 - 多媒体内容可能对应于视听文档 (例如电影、 体育赛事、 无线电节目等) , 0020 - 按时间顺序排列的文本描述对应于按时间顺序描述多媒体内容的任何类型的文 本文档。 作为非限制性示例, 这种按时间顺序排列的文本描述

12、可以是电影脚本、 足球比赛概 述、 电影字幕、 电影音频描述脚本等, 0021 - 特征是在文本文档中提到、 描述或评价的多媒体内容的特定元素, 诸如具体的场 景、 事件或动作, 电影的特定方面 (命名实体、 演员、 导演、 灯光等) , 或者具体场景中的特定 方面。 0022 此外, 在下面的说明书中, 假定多媒体内容和它的按时间顺序排列的文本描述已 经由于已知技术对齐在一起, 使得按时间顺序排列的文本描述直接和已经与所述多媒体内 容的时间线同步。在一个变型中, 这样的对齐可能在实施本发明之后进行。 0023 因此, 由于本发明, 可以在文本文档和多媒体内容的按时间顺序排列的文本描述 之间进

13、行文本到文本的对齐, 而无需使用时间码或时间信息。这种方法可能至少使文本文 档的一段与多媒体内容的按时间顺序排列的文本描述的一个或几个对应部分对齐, 以便在 按时间顺序排列的文本描述内关联其所涉及的时间线的一个或几个时间点或时间间隔。 0024 本发明的方法不打算将文本文档、 或其部分, 与所述多媒体内容直接匹配, 而只是 通过对应的按时间顺序排列的文本描述。 0025 此外, 应理解, 单一文本文档中提到的特征可以涉及按时间顺序排列的文本描述 中的几个不同的时间点或时间间隔。 0026 此外, 自然语言处理是计算机科学、 人工智能和与计算机和人类 (自然) 语言之间 的交互有关的语言学的领域

14、。因此, NLP 与人机交互的领域有关。 0027 在本发明的一个方面, 可以从一组文本文档识别所述文本文档, 作为涉及多媒体 内容。 0028 此外, 可以从因特网网络取得所述一组文本文档。 0029 在本发明的另一个方面, 在所述对齐步骤期间, 可以有利地实施首语重复分辨 (anaphora resolution) 技术以执行所述文本文档的确定部分和按时间顺序排列的文本描 述之间的语义对应。 0030 此外, 可以在多个文本文档上应用识别步骤和对齐步骤以自动地使所述文本文档 与多媒体内容的时间线同步。 0031 根据本发明的优选实施例, 属于下列特征分组的特征至少包括 : 0032 - 字

15、词的组合 ; 说 明 书 CN 103984693 A 4 3/8 页 5 0033 - 语义实体 ; 0034 - 字词列表 ; 0035 - 事件。 0036 优选地, 自然语言处理对应于实体识别处理或基于特征的观点分析。 0037 在本发明的实现示例中, 多媒体内容是视听内容并且文本文档是由网络用户写的 评论 (所谓的帖子) 。 0038 在本发明的另一个方面, 所述多媒体内容被分段成其中时间线的对应时间间隔与 之相关联的多个场景, 作为其与相关联的按时间顺序排列的文本描述同步的结果, 文本文 档可以被同步到它所涉及的场景的时间间隔。 0039 此外, 本发明还涉及一种用于丰富由时间线和

16、由按时间顺序排列的文本描述定义 的多媒体内容的系统。根据本发明, 该系统包括 : 0040 - 被配置为至少在文本文档的部分中识别至少一个特征的自然语言处理模块, 0041 - 用于自动将所述文本文档的确定部分对齐到语义对应于所述文本文档的确定部 分的按时间顺序排列的文本描述的至少一部分的对齐模块, 0042 使得至少将文本文档的该部分自动地与所述多媒体内容的时间线同步。 0043 与所公开的实施例在范围上相当的某些方面阐述如下。应理解, 提出这些方面仅 用于向读者提供本发明可以采取的某些形式的简要概述, 并且这些方面并不意在限制本发 明的范围。事实上, 本发明可包括下面没有阐明的各种方面。

17、附图说明 0044 借助于以下实施例和执行示例, 不以任何方式限制地参照附图将更好地理解和说 明本发明, 附图中 : 0045 - 图 1 是根据本发明的优选实施例的用于丰富多媒体内容的系统的框图 ; 0046 - 图 2 是根据该优选实施例的示出由用于丰富多媒体内容的方法实施的步骤的流 程图 ; 0047 - 图 3 是根据该优选实施例的描绘了用于丰富电影的步骤的全局图 ; 0048 - 图 4 表示来自电影专用网站的由第一用户答复先前的第二用户的帖子而写的帖 子的屏幕截图。 0049 在可能的地方, 相同的附图标记将被用于整个附图来指代相同或相似的部件。 具体实施方式 0050 根据优选实

18、施例的示例, 关于其中时间线和脚本相关联的电影来描绘本发明。应 注意, 脚本是电影的按时间顺序排列的文本描述的特定示例。 0051 显然, 本发明不限于这些示例, 并且可以被应用到由时间线和由至少一个按时间 顺序排列的文本描述 (诸如脚本) 定义的任何多媒体内容。 0052 根据该示例, 图 1 描绘了用于利用文本文档 (例如由专业和 / 或非专业网络 / 电视 用户所写的帖子) 来丰富电影的系统 S。该电影由一连串的按时间顺序排列的场景组成。 0053 具体地, 该系统 S 直接地或通过网关 (未在图 1 中表示) 连接到网络 N(例如因特 网网络) 。显然地, 在一个变型中, 所述系统 S

19、 可以不连接到任何网络。 说 明 书 CN 103984693 A 5 4/8 页 6 0054 涉及电影的一组帖子 Pi(i 1;N, N 是整数) 被存储在连接到网络 N 的远程服 务器 RS(例如类似 IMDb 的电影专用网站) 上。所述涉及电影的一组帖子 Pi 可以由系统 S 使用因特网网络 N 从服务器 RS 取得, 并且可以被存储在系统 S 的适配的存储器 M 中。 0055 此外, 在该示例中, 该电影和对应的脚本可以通过因特网网络 N 从视频服务器 VS 下载, 并且可以被存储在所述存储器 M 中。当然, 在一个变型中, 可以以任何其它适合的方 式 (例如, 从 USB 密钥或

20、 DVD) 取得该电影。显然, 在一个变型中, 远程服务器 RS 和视频服务 器 VS 可以是相同的服务器。 0056 系统 S 还包括人机界面 MMI(例如触摸屏) , 旨在由操作者使用以输入要从所述一 组帖子 Pi 中提取的一个或几个不同的特征。当然, 这些特征可以被自动定义和 / 或选择。 一旦在系统 S 中输入, 这些特征可以被存储在存储器 M 中。 0057 每个特征都是可能在帖子 Pi 中被提及、 描述或评价的电影的特定元素, 诸如具体 的场景、 事件或行动、 电影的特定方面 (命名实体、 演员、 导演、 灯光等) , 或者具体场景中的 特定方面。 0058 具体地, 特征可以是

21、: 0059 - 字词的组合 ; 0060 - 语义实体 ; 0061 - 字词列表 ; 0062 - 事件 ; 0063 - 等等。 0064 如图 1 所示, 系统 S 还包括自然语言处理模块 NLP (例如处理器) , 用于为存储在存 储器 M 中的每个帖子 Pi 自动地识别在系统 S 中输入的所述特征的至少一个。具体地, 模块 NLP 能够确定帖子 Pi 是否涉及预定义的特征, 并且帖子 Pi 包含对所述特征的引用的情况 下, 确定所述帖子的一个或多个特定部分是否对应于所述特征。 0065 具体地, 自然语言处理可以对应于实体识别处理和 / 或基于特征的观点分析, 例如, 如同在信息科

22、学杂志出版的文档 “Aspect-based sentiment analysis of movie reviews on discussion boards” (Thet&al., 2010) 第 36(6) 第 823-848 页所定义的。 0066 一旦已经识别了至少部分已定义的特征, 可以建立对应表以将每个预定义的特征 与已由模块 NLP 识别的帖子 Pi 的一个或多个对应部分相关联。此对应表可以被存储在存 储器 M 中。 0067 另外, 如图 1 所示, 系统 S 附加地包含一对准模块 A(例如处理器) , 用于自动地将 帖子 Pi 的一个或多个确定的部分对齐到语义地对应于帖子 P

23、i 的所述确定的 (多个) 部分的 电影脚本的一个或多个对应部分。 0068 具体地, 可以通过计算提取的 (多个)特征和按时间顺序排列的文本描述的 部分之间的文本相似性测量来获得语义对应 : 例如, 使用 Jaccard 系数 (如在 “ comparative de la distribution florale dans une portion des Alpes et des Jura” 中所定义的 (Jaccard 因 Paul(1901) 公布在 Bulletin de la Socit Vaudoise des Sciences Naturelles37 第 47-579 页)

24、或余弦测量 (如在以下网址 http:/en.wikipedia. org/wiki/Cosine_similarity中所定义) , 或者简单地通过计算共用的字词的数量。 然后根 据该文本相似性得分将包含该特征的帖子的部分对齐到按时间顺序排列的文本的最接近 说 明 书 CN 103984693 A 6 5/8 页 7 的部分。 0069 在一个替代方案中, 语义对应本身可以使用自然语言处理进行。 0070 此外, 对齐模块 A 可以实施首语重复分辨技术以执行帖子 Pi 的确定的 (多个) 部分 和所述电影的脚本之间的语义对应。 0071 以这种方式, 帖子 Pi 的每个识别的特征被对其到脚本

25、中的特定点, 其可以是场景 (每个场景由预定的时间间隔标识) 或是时间线的更精确的时间信息 (例如, 分钟) 。因此, 帖 子 Pi 可能在多个时间点与脚本对齐。 0072 由于本发明, 帖子 Pi 或它们的 (多个) 部分直接地和自动地与电影的脚本同步。从 而实现帖子与脚本的文本到文本的同步。然后, 通过参照电影的时间线定义的时间信息被 隐式地附接到每个帖子 Pi 或者它的 (多个) 部分。 0073 在脚本已经时间上与电影对齐的情况下, 帖子Pi或者它们的 (多个) 部分也通过脚 本成为隐式地时间上对齐到所述电影。 0074 然后, 本发明可以执行文本文档到多媒体内容的按时间顺序排列的描述

26、的对齐, 而无需使用按时间顺序排列的信息或者时间戳。 0075 图 2 的流程图描绘了根据本发明的优选实施例的用于丰富由时间线和由脚本定 义的电影的方法的各个步骤。 0076 在第一初始步骤 E0 中, 存储在远程服务器 RS 上的帖子 Pi 被初步识别为涉及所考 虑的电影。 0077 在进一步的步骤 E1 中, 识别的帖子 Pi 被从所述远程服务器 RS 中取回, 以便被存 储在系统 S 的存储器 M 中。 0078 在进一步的步骤E2中, 旨在被识别和从帖子Pi中提取的特征被经由人机界面MMI (或者, 在一个变型中, 通过软件编程) 定义和输入到系统 S 中。 0079 在进一步的步骤

27、E3 中, 模块 NLP 在每个帖子 Pi 中自动识别一个或几个定义的特 征, 并建立一个对应表, 其中, 对应的帖子Pi或者它们的 (多个) 部分与每个预定义的特征相 关联。 0080 在进一步的步骤 E4 中, 对齐模块 A 自动地将帖子 Pi 或者它们的 (多个) 部分与脚 本的 (多个) 语义地对应的部分相对齐。这样的对齐为帖子 Pi(或者它们的 (多个) 部分) 提 供了相对于电影的时间的时间信息。 0081 当然, 前面的步骤可以以不同的顺序来实现。 0082 然后, 一旦已经对预定的电影执行了对齐, 对齐的帖子 Pi 可以与脚本一起存储, 使得在电影的播放过程中, 对齐的帖子Pi

28、或者它们的 (多个) 部分在对应的时间点可以在主 显示设备 (例如电视机) 上和 / 或第二屏幕 (例如平板电脑) 上弹出。 0083 图 3 图示用于利用所写帖子 Pi 来丰富电影的方法的步骤 E1 至 E4。图示了两个定 义的特征 F1 和 F2。每个特征 F1、 F2 包括字词的组合, 即地点、 人物和时间。 0084 具体地, 在图 3 中, 表示了脚本到电影的对齐。这个附加的和众所周知的步骤可以 在步骤 E1 至 E4 的任一项之前或之后进行。 0085 此外, 作为第一说明性但非限制性的示例, 图 4 显示了由第一用户答复先前的第 二用户的帖子而写的帖子的屏幕截图。该帖子已经从电影

29、专用网站 IMDb 取得, 并具有下列 内容 : 说 明 书 CN 103984693 A 7 6/8 页 8 0086 “我明白你的意思, Rohmer 成功地传达了这一点。它不是像看起来那么浅显和肤 浅, 只是看起来像, 事实是, 真正的底线是更加令人郁闷的。我认为整体上对地点的选择恰 恰是对于这类故事惊人的准确。我们在这里, 在漂亮的 “新城区” (那些无中生有建造的人 造城市) , 在那里人们走来走去就像电影的临时演员。它是全白的、 干净的、 没有历史、 没有 个人风格, 但采取来自其他地方的架构模式的复制。整个事情的设计似乎只是为了满足生 活在那里的雅皮士的需求和休闲, 没有历史的角

30、度或视图的深度。 “老的” 景观都保持距离, 就像人物是在泡沫 (la Logan s Run, 也许! ) 内。甚至植被也才刚刚开始生长 : 小树, 待 生长的草坪。只有当 Blanche 和 Fabien 在旷野徘徊时她才哭泣, 看似被自然的力量压倒 (这是在 绿光 中也可以看到的模式) , 仿佛她完全失去了她的元素、 她的空荡的白色公寓。 人物似乎与彼此游戏, 以便使他们能够忘记就在此下面有一个巨大的虚无。非常具有存在 感!事实上, 有点令人郁闷。但伟大的电影都是一样的。只有 Rohmer 可以实现这样的模糊 水平, 这是导演的很大的特点。 ” 0087 该帖子的文本是非常丰富的, 并且

31、指出了名为 “男朋友、 女朋友” 的电影的许多方 面, 以及具体的地点和 / 或场景, 例如 : 0088 - 位置 :“她的空荡的白色公寓” ; 0089 - 场景 :“当 Blanche 和 Fabien 在旷野徘徊时 她才哭泣” 。 0090 在由系统 S 执行所述识别的步骤 E3 之后, 可以建议下列对应表 : 0091 特征帖子的部分 地点“她的空荡的白色公寓” 场景“当 Blanche 和 Fabien 在旷野徘徊时 她才哭泣” 0092 假定该电影脚本提供了场景的下列信息 : 0093 0094 该系统 S 的对齐模块 A 在步骤 E4 实现脚本时间线与提取的帖子或它们的 (多个

32、) 部分的映射。 0095 具体地, 第一特征指示地点。根据该脚本, 场景 3 和 13 都发生在公寓中。帖子的 这部分可能涉及这些场景。 如前所述, 这可以通过使用首语重复分辨技术来检查和改善, 所 述首语重复分辨技术将字词 “她的” (在 “她的空荡的白色公寓” 中) 链接到 Blanche。 0096 第二特征描述了具有 Blanche 和 Fabien 的发生 “在旷野” 的场景。这两个人物在 说 明 书 CN 103984693 A 8 7/8 页 9 场景 7 和 13 中匹配。然而,“旷野” 语义上更接近 “森林” , 而不是 “公寓” 。这可以通过使用 诸如 WordNet 的

33、外部字词本体来发现。场景 13 因此被丢弃。 0097 因此, 人们可能会知道这个帖子涉及场景 3、 7 和 13, 并且能够在文本中指出哪个 部分对应于哪个场景。 0098 在第二个说明性的非限制示例中, 多媒体是足球比赛视频 (切尔西对巴塞罗那) 。 帖子是可以在体育专用网站上进行抓取的涉及该足球比赛的论坛评论。 脚本是该足球比赛 的文本概述。例如, 它可以是 : 0099 - 由主持人做出的音频概述的记录 ; 0100 - 本场比赛的新闻报导 (以时间顺序撰写) ; 0101 - 给出比赛内关键时刻的足球分享 (soccer ticker) ; 0102 - 等等。 0103 以下表示示

34、出所选足球比赛期间的主要时刻的分享 : 0104 FT : ChelSea 1 BarCeIona 0 0105 LaSt updated 18th April2012 0106 A mistake from Messi of allpeople allows Ramires to break and he picks out Drogba with 0107 a pinpoint cross after a storming run, allowing the striker to drive home with a great finish. 0108 GOAL ! DROGBA OPEN

35、S THE SCORING TO MAKE IT 1-0TO CHELSEA ! 0109 45+2 it s Messi s turn to go down as he sllps awkwardly but he s back on his feet seconds 0110 later.Barca are in possession as the seconds trickle down. 0111 45+1 Drogba goes down in another heap as two minutes stoppage time are added this 0112 half, bu

36、t nothlng is given. 0113 45 Messi tries to pick out Sanchez in the Chelsea box but hoofs his pass ove r his team- 0114 mates head, prompting shouts ofwho a reya?from the home faithful. 0115 44 Heart-stopping moment there for Chelsea and vital last-gasp clearance from Cole. 0116 Messi tries another s

37、hot seconds later but mishits it. 0117 由于每种运动都有其特定的词汇表 ( 例如, 进球、 投篮得分、 犯规、 出线等 ), 可以 使用这个词汇表的一些术语来执行脚本和取得的帖子之间的对齐。 0118 然后, 可以抽出参与比赛的运动员的名字、 诸如进球的一些具体的术语、 按时间顺 序排列的信息等。 0119 图1中, 系统S的表示方框纯粹是功能实体, 其不必对应于物理上单独的实体。 即, 它们可以以软件、 硬件的形式被开发, 或者实现在一个或几个集成电路中。 0120 在本说明书、 权利要求和附图中公开的参考可以独立地或以任何适当的组合来提 供。在适当情况

38、下, 特征可以以硬件、 软件或两者的组合来实现。 说 明 书 CN 103984693 A 9 8/8 页 10 0121 本发明已经在其优选实施例中进行了描述, 显然, 它能容许在本领域技术人员的 能力内的众多修改和实施例, 而无需运用创造性劳动。 因此, 本发明的范围由下面的权利要 求的范围限定。 0122 这里陈述的所有示例和条件性语言旨在教导的目的, 以帮助读者理解本发明的原 理和发明人贡献的促进现有技术的构思, 并且应当被解释为不限于这些具体陈述的示例和 条件。 0123 此外, 这里陈述原理、 方面和本发明原理的实施例、 以及其具体示例的所有叙述, 旨在在包括其结构和功能的等效物。另外, 旨在这样的等效物包括当前已知的等效物以及 将来开发的等效物, 即执行相同功能的开发出的任何元件, 而与结构无关。 说 明 书 CN 103984693 A 10 1/3 页 11 图 1 图 2 说 明 书 附 图 CN 103984693 A 11 2/3 页 12 图 3 说 明 书 附 图 CN 103984693 A 12 3/3 页 13 图 4 说 明 书 附 图 CN 103984693 A 13


注意事项

本文(丰富时间线和时间顺序文本描述定义的内容的方法和设备.pdf)为本站会员(b***)主动上传,专利查询网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知专利查询网(点击联系客服),我们立即给予删除!




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1