书签分享收藏举报版权申诉 / 36

立即下载加入VIP,免费下载

当前位置：首页 > 物理 > 计算；推算；计数 > 信息处理装置、信息处理方法和程序.pdf

信息处理装置、信息处理方法和程序.pdf

上传人：00****42

文档编号：6147250

上传时间：2019-04-19

格式：PDF

页数：36

大小：10.23MB

《信息处理装置、信息处理方法和程序.pdf》由会员分享，可在线阅读，更多相关《信息处理装置、信息处理方法和程序.pdf（36页完整版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 103838808 A (43)申请公布日 2014.06.04 CN 103838808 A (21)申请号 201310579095.2 (22)申请日 2013.11.18 2012-257826 2012.11.26 JP G06F 17/30(2006.01) G06F 3/0484(2013.01) (71)申请人索尼公司地址日本东京 (72)发明人田中和政田中健司中村幸弘高桥义博深沢健太郎吉田恭助 (74)专利代理机构北京信慧永光知识产权代理有限责任公司 11290 代理人陈桂香褚海英 (54) 发明名称信息处理装置、信息处。

2、理方法和程序 (57) 摘要本发明公开了一种信息处理装置和信息处理方法。所述信息处理装置包括：多个特征量提取部，它们被构造用来从内容中提取多个特征量；显示控制部，其被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；以及选择部，其被构造用来选择显示或不显示与所述特征量相关的信息。所述显示控制部控制场景的重要性的显示，所述重要性是基于与所述选择部选择的与所述特征量相关的所述信息的显示或不显示而得到的。根据本发明，能够容易地掌握内容的实体。 (30)优先权数据 (51)Int.Cl. 权利要求书 2 页说明书 17 页附图 16 页。

3、(19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书2页说明书17页附图16页 (10)申请公布号 CN 103838808 A CN 103838808 A 1/2 页 2 1. 一种信息处理装置，其包括：多个特征量提取部，它们被构造用来从内容中提取多个特征量；显示控制部，所述显示控制部被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；以及选择部，所述选择部被构造用来选择显示或不显示与所述特征量相关的信息；其中，所述显示控制部控制场景的重要性的显示，所述重要性是基于与所述选择部选择的与所述特征量相关的所述信息的显示或。

4、不显示而得到的。 2. 如权利要求 1 所述的信息处理装置，其中，所述显示控制部根据所述重要性来改变与所述特征量相关的所述信息的显示。 3. 如权利要求 2 所述的信息处理装置，其中，所述显示控制部根据所述重要性控制作为与所述特征量相关的所述信息的场景头图像的显示。 4. 如权利要求 3 所述的信息处理装置，其中，所述显示控制部以具有高的所述重要性的场景头图像的尺寸大于具有低的所述重要性的场景头图像的尺寸的方式显示具有高的所述重要性的场景头图像。 5. 如权利要求 3 所述的信息处理装置，其中，所述显示控制部将具有高的所述重要性的场景头图像显示在具有低的所述重要性的场景头。

5、图像的前面。 6. 如权利要求 5 所述的信息处理装置，其中，所述显示控制部能够使用虚线显示被隐藏的具有低的所述重要性的场景头图像轮廓。 7. 如权利要求 2 所述的信息处理装置，其中，所述显示控制部根据所述重要性控制对象图像的显示，在所述对象图像中预定对象被检测作为与所述特征量相关的所述信息。 8. 如权利要求 7 所述的信息处理装置，其中，所述显示控制部以具有高的所述重要性的对象图像的尺寸大于具有低的所述重要性的对象图像的尺寸的方式显示具有高的所述重要性的对象图像。 9. 如权利要求 7 所述的信息处理装置，其中，所述显示控制部将具有高的所述重要性的对象图像显示在具。

6、有低的所述重要性的对象图像的前面。 10. 如权利要求 7 所述的信息处理装置，其中，在沿着时间线连续检测具有高的所述重要性的对象图像的情况下，所述显示控制部在连续检测具有高的所述重要性的对象图像的区间内显示一个以上具有高的所述重要性的对象图像。 11. 如权利要求 1 至 9 中任一项所述的信息处理装置，还包括：变更部，所述变更部被构造用来改变所述重要性的权重；其中，所述显示控制部根据被所述变更部改变了权重的所述重要性来改变与所述特征量相关的所述信息的显示。 12. 如权利要求 1 所述的信息处理装置，还包括：场景提取部，所述场景提取部被构造用来提取与所述。

7、重要性相对应的场景。权利要求书 CN 103838808 A 2 2/2 页 3 13. 如权利要求 12 所述的信息处理装置，还包括：摘要生成部，所述摘要生成部被构造用来收集由所述场景提取部提取的场景，并且生成摘要动态图像。 14. 如权利要求 12 所述的信息处理装置，还包括：元数据生成部，所述元数据生成部被构造用来生成摘要元数据，所述摘要元数据包括被所述场景提取部提取的场景的起点和终点。 15. 如权利要求 12 所述的信息处理装置，还包括：缩略图生成部，所述缩略图生成部根据被所述场景提取部提取的场景的图像生成代表所述内容的缩略图图像。 16.。

8、如权利要求 12 至 15 中任一项所述的信息处理装置，还包括：变更部，所述变更部被构造用来改变所述重要性的权重；其中，所述场景提取部提取根据被所述改变部改变了权重的所述重要性的场景。 17. 一种信息处理方法，所述方法包括以下步骤：信息处理装置从内容中提取多个特征量；由所述信息处理装置控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；由所述信息处理装置选择显示或不显示与所述特征量相关的信息；并且由所述信息处理装置控制场景的重要性的显示，所述重要性是基于与已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。 18. 一种程序，所述程。

9、序使得计算机能够起到如下部件的作用：多个特征量提取部，它们被构造用来从内容中提取多个特征量；显示控制部，所述显示控制部被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；以及选择部，所述选择部被构造用来选择显示或不显示与所述特征量相关的信息；其中，所述显示控制部控制场景的重要性的显示，所述重要性是基于与所述选择部已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。权利要求书 CN 103838808 A 3 1/17 页 4 信息处理装置、信息处理方法和程序技术领域 0001 本发明涉及信息处理装置、信息处理方法和程序。。

10、特别地，涉及能够使内容的实体易于被掌握的信息处理装置、信息处理方法和程序。背景技术 0002 用于确认动态图像内容的实体的预览屏幕一般包括：预览区域，其用于再现动态图像；和时间线区域，其具有用于指示时间线内的再现位置的滑块。 0003 为了掌握内容的实体，用户能够再现动态图像以确认预览，或者为了更快地掌握，用户能够使用滑块移动再现位置以确认内容的实体。然而，根据内容的长度可能需要长时间来掌握上述实体。 0004 另一方面，根据作为相关技术的日本专利特开平第 11-284948 号公报或日本专利特开第 2000-308003 号公报，由于能够沿着时间线显示。

11、与场景变化相对应的图像，所以客户能够确认在哪里有怎样的视频。发明内容 0005 然而，内容的长度或内容的场景变化的数量可能导致与场景变化对应的图像数量的增加，从而导致用户难以掌握内容的实体。 0006 鉴于以上状况提出了本发明，期望提高用于掌握内容的实体的可操作性。 0007 本发明的实施例提供了一种信息处理装置，该信息处理装置包括：多个特征量提取部，它们被构造用来从内容中提取多个特征量；显示控制部，其被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；以及选择部，其被构造用来选择显示或不显示与所述特征量相关的信息。所述显示控制部控制场。

12、景的重要性的显示，所述重要性是基于与所述选择部选择的与所述特征量相关的所述信息的显示或不显示而得到的。 0008 所述显示控制部可以根据所述重要性来改变与所述特征量相关的信息的显示。 0009 所述显示控制部可以根据所述重要性控制作为与所述特征量相关的所述信息的场景头图像的显示。 0010 所述显示控制部可以以具有高的所述重要性的场景头图像的尺寸大于具有低的所述重要性的场景头图像的尺寸的方式显示具有高的所述重要性的场景头图像。 0011 所述显示控制部可以将具有高的所述重要性的场景头图像显示在具有低的所述重要性的场景头图像的前面。 0012 所述显示控制部可以根据所述重要性控制对象图。

13、像的显示，在所述对象图像中预定对象被检测作为与所述特征量相关的所述信息。 0013 所述显示控制部可以以具有高的所述重要性的对象图像的尺寸大于具有低的所述重要性的对象图像的尺寸的方式显示具有高的所述重要性的对象图像。 0014 所述显示控制部可以将具有高的所述重要性的对象图像显示在具有低的所述重要性的对象图像的前面。说明书 CN 103838808 A 4 2/17 页 5 0015 在沿着时间线连续检测具有高的所述重要性的对象图像的情况下，所述显示控制部可以在连续检测具有高的所述重要性的对象图像的区间内显示一个以上具有高的所述重要性的对象图像。 0016 所述信息处理装置。

14、还可以包括被构造用来改变所述重要性的权重的变更部。所述显示控制部可以根据被所述变更部改变了权重的所述重要性来改变与所述特征量相关的所述信息的显示。 0017 所述信息处理装置还可以包括被构造用来提取与所述重要性相对应的场景的场景提取部。 0018 所述信息处理装置还可以包括摘要生成部，其被构造用来收集由所述场景提取部提取的场景，并且生成摘要动态图像。 0019 所述信息处理装置还可以包括元数据生成部，其被构造用来生成摘要元数据，所述摘要元数据包括被所述场景提取部提取的场景的起点和终点。 0020 所述信息处理装置还可以包括缩略图生成部，其根据被所述场景提取部提取的场景的。

15、图像生成代表所述内容的缩略图图像。 0021 所述信息处理装置还可以包括被构造用来改变所述重要性的权重的变更部。所述场景提取部可以提取根据被所述变更部改变了权重的所述重要性的场景。 0022 本公开的实施例提供了一种信息处理方法，所述方法包括步骤：信息处理装置从内容中提取多个特征量；由所述信息处理装置控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；由所述信息处理装置选择显示或不显示与所述特征量相关的信息；并且由所述信息处理装置控制场景的重要性的显示，所述重要性是基于与已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。 0023 本公开的实施。

16、例提供了一种程序，所述程序使得计算机能够起到如下部件的作用：多个特征量提取部，它们被构造用来从内容中提取多个特征量；显示控制部，其被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；以及选择部，其被构造用来选择显示或不显示与所述特征量相关的信息。所述显示控制部控制场景的重要性的显示，所述重要性是基于与所述选择部已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。 0024 根据本公开的一个实施例，从内容中提取多个特征量，并且控制所述内容的图像和与所述内容的特征量相关的信息的显示。然后，选择显示或不显示与所述特征量相关的信息，。

17、并且控制场景的重要性的显示，所述重要性是基于选择显示或不显示与特征量相关的信息而得到的。 0025 根据本公开的实施例，能够容易地掌握内容的实体。附图说明 0026 图 1 是示出了采用了本发明的信息处理装置的构造例； 0027 图 2 是图示了信息处理装置的内容输入处理的流程图； 0028 图 3 是图示了预览显示处理的流程图； 0029 图 4 是图示了预览屏幕的重新显示处理的流程图； 0030 图 5 示出了预览屏幕的示例；说明书 CN 103838808 A 5 3/17 页 6 0031 图 6 示出了预览屏幕的示例； 0032 图 7 示出了场景变化图像。

18、显示部的显示示例； 0033 图 8 示出了场景变化图像显示部的另一显示示例； 0034 图 9 示出了面部图像显示部的显示例； 0035 图 10 示出了面部图像显示部的显示例； 0036 图 11 示出了采用本发明的信息处理装置的构造例； 0037 图 12 是图示了预览显示处理的流程图； 0038 图 13 是图示了摘要生成处理的流程图； 0039 图 14 示出了摘要生成显示部的显示示例； 0040 图 15 示出了摘要生成显示部的另一显示示例； 0041 图 16 图示了另一摘要生成方法；以及 0042 图 17 是示出了计算机的配置示例的框图。具体实施方式。

19、0043 下面，参照附图详述本发明的优选实施例。注意，在本申请文件和附图中，以相同的附图标记来表示具有基本相同的功能和结构的结构元件，并且省略了对这些结构元件的重复说明。 0044 以下，将说明用于实施本发明的实施例（以下称作实施例）。按照如下顺序进行说明。 0045 1. 第一实施例（根据重要性的预览屏幕） 0046 2. 第二实施例（根据重要性的摘要生成） 0047 3. 第三实施例（计算机） 0048 1. 第一实施例（根据重要性的预览屏幕） 0049 本发明的信息处理装置的构造 0050 图 1 示出了应用本发明的信息处理装置的构造例。 0051 图 1 所。

20、示的信息处理装置 11 在用于预览内容的屏幕中沿着时间线显示通过诸如图像识别、语音识别和字符识别等识别技术从内容中提取的内容的特征量。信息处理装置 11 例如由个人计算机构成。 0052 在图 1 的示例中，信息处理装置 11 包括内容输入部 21、内容存档 22、特征量提取部23-1至23-3、内容特征量数据库24、显示控制部25、操作输入部26、显示部27、特征量提取部 28 以及检索部 29。 0053 内容输入部 21 从没有图示出的外部等接收内容，并将所接收的内容提供给特征量提取部 23-1 至 23-3。此外，内容输入部 21 将所接收的内容登记在内容。

21、存档 22 中。 0054 内容存档 22 中登记有来自内容输入部 21 的内容。 0055 特征量提取部 23-1 至 23-3 对内容进行图像识别、语音识别、字符识别等，以提取包括图像特征量、语音特征量等的多个特征量中的各特征量。特征量提取部23-1至23-3将提取的内容的特征量登记在内容特征量数据库 24 中。本文中，特征量提取部 23-1 至 23-3 包括三个特征量提取部，但是特征量提取部的数量不限于三个，而是根据所提取的特征量的类型（数量）而变化。以下，当不必相互区分时，将特征量提取部 23-1 至 23-3 称作特征量说明书 CN 103838。

22、808 A 6 4/17 页 7 提取部 23。 0056 内容特征量数据库 24 中登记有由特征量提取部 23 提取的内容的特征量。 0057 显示控制部 25 响应于来自操作输入部 26 的用户指令分别从内容存档 22 和内容特征量数据库 24 取出将被预览的内容以及该内容的特征量。显示控制部 25 基于被取出的内容的预览图像和关于该内容的特征量的信息来生成预览屏幕，并且控制显示部 27 显示生成的预览屏幕。在显示预览屏幕的过程中，当通过操作输入部 26（用户通过操作输入部 26 发出指令）将文本或图像信息输入提供给特征量提取部 28 时，显示控制部 25 接收响应于输入的。

23、信息而从检索部 29 提供的检索结果。显示控制部 25 基于检索结果来显示预览屏幕。 0058 此外，在显示预览屏幕的过程中，当因用户指令而通过操作输入部 26 将文本或图像信息输入提供给特征量提取部 28 时，显示控制部 25 接收响应于输入的信息而从检索部 29 提供的检索结果。显示控制部 25 基于检索结果来重新显示预览屏幕。在显示预览屏幕的过程中，显示控制部 25 基于检索结果和通过操作输入部 26 输入的且由用户选择显示或不显示的特征量来重新显示预览屏幕。此时，显示控制部 25 根据用户选择的特征量来判定各场景的重要性，并根据所述重要性来重新显示预览屏幕。 00。

24、59 此外，在显示预览屏幕的过程中，显示控制部25基于通过操作输入部26对特征量输入的校正等对内容特征量数据库 24 中登记的信息进行修正和更新等。 0060 操作输入部 26 例如包括鼠标、层叠在显示部 27 上的触摸面板等。操作输入部 26 将响应于用户操作的信号提供给显示控制部25。显示部27显示由显示控制部25生成的预览屏幕。 0061 特征量提取部28提取从显示控制部25提供的且用户为之发出指令的文本或图像信息的特征量，并将该特征量提供给检索部 29。检索部 29 针对与来自特征量提取部 28 的特征量类似的特征量对内容特征量数据库 24 进行检索，并将检索结果提。

25、供给显示控制部 25。 0062 信息处理装置的操作 0063 接下来，将参照图 2 的流程图说明信息处理装置 11 的内容输入处理。 0064 在步骤 S11 中，内容输入部 21 从没有图示出的外部等接收内容。内容输入部 21 将接收到的内容提供给特征量提取部 23-1 至 23-3。 0065 在步骤 S12 中，特征量提取部 23-1 至 23-3 对来自内容输入部 21 的内容进行图像识别、语音识别、字符识别等，以提取包括图像特征量、语音特征量等特征量中的各特征量。在步骤 S13 中，特征量提取部 23-1 至 23-3 将提取的内容特征量登记在内容特征量数据库。

26、24 中。 0066 在步骤 S14 中，内容输入部 21 将接收的内容登记在内容存档 22 中。 0067 参照图 3 的流程图，说明通过使用如上所述注册的内容和内容特征量进行的内容的预览显示处理。 0068 用户对操作输入部 26 进行操作来选择将被预览的内容。通过操作输入部 26 将用户选择的内容的信息提供至显示控制部 25。 0069 在步骤 S31 中，显示控制部 25 根据来自操作输入部 26 的信息来选择内容。在步骤 S32 中，显示控制部 25 从内容存档 22 获取在步骤 S31 中选择的内容。说明书 CN 103838808 A 7 5/17 页 8 0。

27、070 在步骤 S33 中，显示控制部 25 从内容特征量数据库 24 获取在步骤 S31 中选择的内容的特征量。 0071 在步骤 S34 中，显示控制部 25 显示预览屏幕。换言之，显示控制部 25 基于获取的内容和获取的内容的特征量生成预览屏幕并控制显示部 27 显示生成的预览屏幕（稍后将要说明的图 5 中所示的预览屏幕 51），在所述预览屏幕中，沿着时间线显示关于各种特征量的信息。这里，沿着时间线显示的不仅是特征量信息，还有与特征量有关的信息。与特征量有关的信息包括特征量信息、使用特征量获得的信息或使用特征量检索到的结果。 0072 在步骤 S35 中，。

28、显示控制部 25 进行预览屏幕的重新显示处理。在稍后将参照图 4 说明的所述预览屏幕的重新显示处理中，在步骤 S35 的处理中，在显示部 27 上显示预览屏幕（稍后将要说明的图6中所示的预览屏幕51），该预览屏幕响应于从操作输入部26提供的用户指令已被更新。 0073 在步骤 S36 中，显示控制部 25 判定预览屏幕的显示是否终止。在步骤 S36 中，如果用户凭借操作输入部 26 发出用于终止的指令，则判定预览屏幕的显示终止，并终止预览屏幕的显示。 0074 另一方面，在步骤 S36 中，如果判定预览屏幕的显示未终止，则处理返回至步骤 S35 并重复步骤 S3。

29、5 及接下来的步骤。 0075 接下来，将参照图 4 的流程图说明图 3 的步骤 S35 中的预览屏幕的重新显示处理。 0076 在步骤S51中，显示控制部25判定是否通过操作输入部26输入了待检索文本。如果在步骤S51中判定输入了待检索文本，则显示控制部25将输入的待检索文本的信息提供给特征量提取部 28，处理前进至步骤 S52。 0077 在步骤 S52 中，特征量提取部 28 和检索部 29 通过语音和 OCR 进行检索。即，在此情况下，特征量提取部 28 将来自显示控制部 25 的待检索文本原样提供给检索部 29。检索部 29 针对待检索文本对内容特征量数据库。

30、24 进行语音检索或字符识别结果检索，并将检索结果提供给显示控制部 25。然后，处理前进至步骤 S56。 0078 如果在步骤 S51 中判定未输入待检索文本，则处理前进至步骤 S53。在步骤 S53 中，显示控制部 25 判定是否凭借操作输入部 26 输入待检索图像。如果在步骤 S53 中判定输入了待检索图像，则显示控制部 25 将输入的待检索图像的信息提供给特征量提取部 28，处理前进至步骤 S54。 0079 在步骤 S54 中，特征量提取部 28 和检索部 29 检索类似的图像。换言之，在此情况下，特征量提取部28提取从显示控制部25提供的待检索图像的特征量，。

31、并将提取的待检索图像的特征量提供给检索部 29。检索部 29 使用待检索图像的特征量针对类似的图像检索内容特征量数据库 24，并将检索结果提供给显示控制部 25。然后，处理前进至步骤 S56。 0080 如果在步骤 S53 中判定未输入待检索图像，则处理前进至步骤 S55。在步骤 S55 中，显示控制部 25 判定是否凭借操作输入部 26 选择了显示特征量。 0081 可由用户选择显示还是不显示将在预览屏幕中沿着时间线显示的特征量（与特征量有关的信息）。如果用户选择显示各特征量中的至少一者，则在步骤 S55 中判定选择显示特征量，处理前进至步骤 S56。 0082 在步。

32、骤 S56 中，显示控制部 25 重新显示预览屏幕。换言之，在步骤 S52 之后，在步骤 S56 中，在将待检索文本的检索结果添加至将要沿时间线显示的特征量（与特征量有关说明书 CN 103838808 A 8 6/17 页 9 的信息）的状态下，重新显示预览屏幕。此外，在步骤 S54 之后，在步骤 S56 中，在将待检索图像的检索结果添加至将要沿时间线显示的特征量的状态下，重新显示预览屏幕。此外，在步骤S55之后，在步骤S56中，在根据用户的选择显示或不显示将要沿时间线显示的特征量的状态下，重新显示预览屏幕。此后，处理返回至图 3 的步骤 S3。

33、5。 0083 如果在步骤 S55 中判定未选择显示特征量，则预览屏幕的重新显示处理终止，并且处理返回至图 3 中的步骤 S35。 0084 预览屏幕的示例 0085 图 5 示出了预览屏幕的示例。 0086 图 5 的示例例如示出了在图 3 的步骤 S34 等中说明的预览屏幕 51。 0087 预览屏幕 51 包括：预览显示部 61，在其中能够对内容的动态图像进行预览；和时间线显示部 62，其位于预览显示部 61 的下方并且通过选择左上方标签而被显示。 0088 预览显示部61响应于对设置在预览显示部61正下方的操作按钮（再现按钮、快进按钮、速退按钮、停止按钮等。

34、）的用户操作，再现并预览内容的动态图像。预览显示部 61 显示用于在所显示的内容中选择面部的框 71，所述面部在后述的面部图像显示部 85 中经过面部识别。 0089 时间线显示部 62 沿着时间线显示与由图 1 中的特征量提取部 23-1 至 23-3 提取的多个特征量相关的信息。而且，在时间线上设置有线 63，线 63 表示当前在预览显示部 61 中显示的图像（帧）的位置，用户能够通过查看线 63 来掌握内容在时间线上的再现位置。 0090 此外，在时间线显示部62右侧显示的是特征量列表64，特征量列表64使得能够对时间线显示部 62 上的显示或不显示进行选择。。

35、用户能够在布置于该列表左侧的框中打勾或不打勾以选择显示或不显示与特征量有关的信息并且仅显示与期望的特征量有关的信息。 0091 注意，在图5的示例中，仅特征量列表64中的从上数第四个框 “相关性” 未被选中。即，图 5 的时间线显示部 62 不显示通过选中 “相关性” 而被显示的重要性显示部 91（后述的图 6）。 0092 此外，摘要生成显示部65实际上设置在与时间线显示部62相同的位置处，但在图 5 的示例中未图示。通过选择设置在摘要生成显示部 65 和时间线显示部 62 的左上方的标签，可显示摘要生成显示部 65 以替代时间线显示部 62。 0093 能够显示稍后。

36、将参照图14详细说明的摘要生成显示部65以使得生成摘要动态图像等。 0094 时间线显示部 62 从顶部开始依次包括场景变化图像显示部 81、语音波形显示部 82、文本检索结果显示部 83、图像检索结果显示部 84、面部图像显示部 85、对象图像显示部 86、人物语音区域显示部87以及相机动作信息显示部88。这些显示部均是用于显示与特征量有关的信息的显示部。 0095 通过勾选特征量列表 64 中的 “缩略图（Thumbnail） ” 以在时间线显示部 62 中显示场景变化图像显示部 81。在场景变化图像显示部 81 中，在时间线上显示通过场景变化得到的各场景的头帧图。

37、像的缩略图图像作为一个特征量。注意，下文中将场景头图像（scene head image）称作场景变化图像。 0096 通过勾选特征量列表 64 中的 “波形（Wave form） ” 以在时间线显示部 62 中显示语说明书 CN 103838808 A 9 7/17 页 10 音波形显示部82。在语音波形显示部82中，在时间线上显示内容的语音波形作为一个特征量。 0097 通过勾选特征量列表 64 中的 “关键词识别（Keyword Spotting） ” 以在时间线显示部 62 中显示文本检索结果显示部 83。在文本检索结果显示部 83 中，被显示的是基于根据语。

38、音识别或字符识别的特征量针对用户通过操作操作输入部26输入的文本（在图5的示例的情况下的 “总统（president） ” ）而检索内容特征量数据库 24 的结果。 0098 通过勾选特征量列表64中的 “图像识别（Image Spotting） ” 以在时间线显示部62 中显示图像检索结果显示部84。在图像检索结果显示部84中，被显示的是基于根据图像识别的特征量针对与用户通过操作操作输入部 26 所选择的图像类似的场景而检索内容特征量数据库 24 的结果（的缩略图图像）。 0099 通过勾选特征量列表 64 中的 “面部（Face） ” 以在时间线显示部 62 中显示。

39、面部图像显示部 85。在面部图像显示部 85 中，被显示的是来自内容特征量数据库 24 的与根据面部识别的特征量类似的特征量（的缩略图图像），该特征量是通过识别由预览显示部61中的框 71 选择的面部而获得的。 0100 通过勾选特征量列表 64 中的 “国会山（Capitol Hill） ” 以在时间线显示部 62 中显示对象图像显示部 86。本文中，在图 5 的示例中，“国会山” 是对象的示例，但对象不限于 “国会山” 且可由用户指定。在对象图像显示部 86 中，被显示的是基于根据对用户指定的对象（在图 5 的情况下的 “国会山” ）的识别的特征量检索内容特征。

40、量数据库 24 的结果（的缩略图图像）。 0101 注意，示出了分别显示面部图像和对象图像的示例，但面部也是对象之一。面部图像显示部85和对象图像显示部86中显示的图像可以是通过对来自原始图像的提取对象进行剪辑而获得的图像（缩略图图像）。 0102 通过勾选特征量列表 64 中的 “人物语音（Human Voice） ” 以在时间线显示部 62 中显示人物语音区域显示部 87。在人物语音区域显示部 87 中，被显示的是通过根据语音识别的特征量而得到的人物语音区域或音乐区域等。这里，如图 5 所示，人物语音区域显示部 87 不仅可显示人讲话的区域，还可显示根据讲。

41、话者的性别或年龄的标记。 0103 通过勾选特征量列表 64 中的 “相机动作（Camera Motion） ” 以在时间线显示部 62 中显示相机动作信息显示部88。在相机动作信息显示部88中，被显示的是具有诸如水平摇摄、俯仰拍摄或变焦等相机和相机镜头的动作信息（以下，称作相机动作信息）的区域，所述动作信息是根据相机动作识别的特征信息。作为相机动作信息，还可使用感测在拍摄内容时的相机动作等的传感器的信息。 0104 在预览屏幕 51 中，沿着时间线显示能够从内容中提取的诸如作为示例的上述特征量的各种特征量和使用这些特征量获得的信息。 0105 然而，在上述预览屏。

42、幕 51 中，在图 5 中的场景变化图像显示部 81、面部图像显示部 85 和对象图像显示部 86 中显示的缩略图图像根据内容的长度、场景变化的数量或检测的对象的数量而互不相同。这使得难以核查每个图像，从而导致难以掌握内容的实体。 0106 因此，在本发明中，在场景变化图像显示部 81、面部图像显示部 85 和对象图像显示部 86 中沿时间线显示的包括缩略图图像的图像是根据用户选择的特征量而有效地显示的。说明书 CN 103838808 A 10 8/17 页 11 0107 在本发明中，例如，根据用户选择的特征量，通过改变尺寸以及前后位置关系等来有效地显示。

43、沿着时间线显示的图像。 0108 用户在特征量列表 64 中选择的特征量是被判断为在掌握内容的实体中对于用户重要的特征量。例如，如果显示有人的图片是重要的，则通过面部检测获得的人出现的场景是重要的；如果说出特定词语的场景是重要的，则通过语音识别中的文本检索而提取的场景是重要的。 0109 因此，显示控制部 25 判定与用户选择的特征量相对应的场景是重要场景，并且与越多特征量相对应的场景是越重要的场景，以此来判定每个场景的重要性。 0110 这里，此时，可对每个特征量进行重要性加权，且可显示用于操作每个特征量的加权的滑块，以使得用户能够任意操作加权来判定重要性。

44、。 0111 在如图 6 中所示的时间线显示部 62 中显示了如上所述判定的重要性。 0112 图 6 示出了预览屏幕的另一示例。在图 6 的示例中，在时间线显示部 62 中，与图 5 的时间线显示部 62 的不同之处在于：在语音波形显示部 82 与文本检索结果显示部 83 之间新设置了重要性显示部 91。 0113 这里，图 6 中的时间线显示部 62 除上述部分以外的其它部分与图 5 中的时间线显示部 62 基本相同。 0114 通过勾选特征量列表 64 中的 “相关性” 以在时间线显示部 62 中显示重要性显示部 91。重要性显示部 91 显示通过以下处理所获得的重要性，。

45、所述处理即：判定与用户在特征量列表 64 中选择的特征量相对应的场景是重要场景，并且判定与越多特征量相对应的场景是越重要的场景，以确定每个场景的重要性。这里，将重要性分为三个级别，并且重要性 3 表示最高重要性。 0115 例如，重要性显示部 91 以如下方式显示对每个场景判定的重要性，所述方式即，实心黑色区域是最重要（重要性 3）场景，接下来，细阴影线区域是重要性 2 的场景，斜阴影线区域是重要性 1 的场景。 0116 然后，显示控制部 25 利用这种重要性来改变场景变化图像显示部 81、面部图像显示部 85 或对象图像显示部 86 中的与特征量。

46、有关的信息的显示。换言之，在场景变化图像显示部 81、面部图像显示部 85 或对象图像显示部 86 中，通过利用这种重要性，越重要的场景的图像被显示得更大和 / 或被显示在越前面。 0117 接下来，将参照图 7 说明在场景变化图像显示部 81 中对重要性的利用。在图 7 中的示例中，在场景变化图像显示部 81 中从左侧开始显示有缩略图图像 101 至缩略图图像 108。 0118 图 7 的 A 示出了在不考虑重要性的情况下的场景变化图像显示部 81。换言之，在图 7 的 A 的场景变化图像显示部 81 中，以相同的尺寸以及沿着时间线的前后关系显示任何场景变化的缩略。

47、图图像。即，作为按照时间顺序的第一个缩略图图像的缩略图图像 101 布置在最后面，作为按照时间顺序的最后一个缩略图图像的缩略图图像 108 布置在最前面。 0119 图7的B示出了在放大了重要场景的缩略图图像的情况下的场景变化图像显示部 81。换言之，在图 7 的 B 的场景变化图像显示部 81 中，最重要场景的缩略图图像 103 被显示得尺寸比其它缩略图图像大。重要场景的缩略图图像 101、 106 被显示得尺寸仅次于缩略图图像103。此外，次重要场景的缩略图图像102、 104、 107被显示得尺寸大于不重要场景的说明书 CN 103838808 A 11 9/17。

48、页 12 缩略图图像 105、 108。 0120 图 7 的 C 示出了从图 7 的 B 中的显示变化来的，在垂直居中地显示各个缩略图图像 101 至 108 的情况下的的场景变化图像显示部 81。 0121 图 8 的 D 示出了从图 7 的 C 中的显示变化来的，在将越重要的场景的缩略图图像显示在越前面的情况下的场景变化图像显示部 81。换言之，在图 8 的 D 的场景变化图像显示部 81 中，在最前面显示最重要场景的缩略图图像 103，在次前面显示重要场景的缩略图图像 101、 106。此外，在再次前面显示次重要场景的缩略图图像 102、 104、 107，在最。

49、后面显示不重要场景的缩略图图像 105、 108。然而，实际上隐藏了缩略图图像 102、 104、 105。 0122 图 8 的 E 示出了从图 8 的 D 的显示变化来的，在根据重要性错开图像的上端来显示从而不会完全隐藏任何缩略图图像的情况下的场景变化图像显示部 81。 0123 换言之，在图 8 的 E 的场景变化图像显示部 81 中，以这样的方式显示各个缩略图图像：在图 8 的 D 的情况下被隐藏的缩略图图像 102、 104、 105 存在于缩略图图像 101、 103、 106 的后面。 0124 这里，图 8 的 E 的示例示出了通过错开上端来显示的示例，而类似地，也可错开并显示下端。 0125 类似于图8的D中的显示，图8的。

摘要
申请专利号：	CN201310579095.2	申请日：	2013.11.18
公开号：	CN103838808A	公开日：	2014.06.04
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回IPC(主分类):G06F 17/30申请公布日:20140604\|\|\|公开
IPC分类号：	G06F17/30; G06F3/0484(2013.01)I	主分类号：	G06F17/30
申请人：	索尼公司
发明人：	田中和政; 田中健司; 中村幸弘; 高桥义博; 深沢健太郎; 吉田恭助
地址：	日本东京
优先权：	2012.11.26 JP 2012-257826
专利代理机构：	北京信慧永光知识产权代理有限责任公司 11290	代理人：	陈桂香;褚海英
PDF完整版下载：	PDF下载

内容摘要

本发明公开了一种信息处理装置和信息处理方法。所述信息处理装置包括：多个特征量提取部，它们被构造用来从内容中提取多个特征量；显示控制部，其被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；以及选择部，其被构造用来选择显示或不显示与所述特征量相关的信息。所述显示控制部控制场景的重要性的显示，所述重要性是基于与所述选择部选择的与所述特征量相关的所述信息的显示或不显示而得到的。根据本发明，能够容易地掌握内容的实体。

权利要求书

权利要求书
1.  一种信息处理装置，其包括：
多个特征量提取部，它们被构造用来从内容中提取多个特征量；
显示控制部，所述显示控制部被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；以及
选择部，所述选择部被构造用来选择显示或不显示与所述特征量相关的信息；
其中，所述显示控制部控制场景的重要性的显示，所述重要性是基于与所述选择部选择的与所述特征量相关的所述信息的显示或不显示而得到的。

2.  如权利要求1所述的信息处理装置，其中，
所述显示控制部根据所述重要性来改变与所述特征量相关的所述信息的显示。

3.  如权利要求2所述的信息处理装置，其中，
所述显示控制部根据所述重要性控制作为与所述特征量相关的所述信息的场景头图像的显示。

4.  如权利要求3所述的信息处理装置，其中，
所述显示控制部以具有高的所述重要性的场景头图像的尺寸大于具有低的所述重要性的场景头图像的尺寸的方式显示具有高的所述重要性的场景头图像。

5.  如权利要求3所述的信息处理装置，其中，
所述显示控制部将具有高的所述重要性的场景头图像显示在具有低的所述重要性的场景头图像的前面。

6.  如权利要求5所述的信息处理装置，其中，所述显示控制部能够使用虚线显示被隐藏的具有低的所述重要性的场景头图像轮廓。

7.  如权利要求2所述的信息处理装置，其中，
所述显示控制部根据所述重要性控制对象图像的显示，在所述对象图像中预定对象被检测作为与所述特征量相关的所述信息。

8.  如权利要求7所述的信息处理装置，其中，
所述显示控制部以具有高的所述重要性的对象图像的尺寸大于具有低的所述重要性的对象图像的尺寸的方式显示具有高的所述重要性的对象图像。

9.  如权利要求7所述的信息处理装置，其中，
所述显示控制部将具有高的所述重要性的对象图像显示在具有低的所述重要性的对象图像的前面。

10.  如权利要求7所述的信息处理装置，其中，
在沿着时间线连续检测具有高的所述重要性的对象图像的情况下，所述显示控制部在连续检测具有高的所述重要性的对象图像的区间内显示一个以上具有高的所述重要性的对象图像。

11.  如权利要求1至9中任一项所述的信息处理装置，还包括：
变更部，所述变更部被构造用来改变所述重要性的权重；
其中，所述显示控制部根据被所述变更部改变了权重的所述重要性来改变与所述特征量相关的所述信息的显示。

12.  如权利要求1所述的信息处理装置，还包括：
场景提取部，所述场景提取部被构造用来提取与所述重要性相对应的场景。

13.  如权利要求12所述的信息处理装置，还包括：
摘要生成部，所述摘要生成部被构造用来收集由所述场景提取部提取的场景，并且生成摘要动态图像。

14.  如权利要求12所述的信息处理装置，还包括：
元数据生成部，所述元数据生成部被构造用来生成摘要元数据，所述摘要元数据包括被所述场景提取部提取的场景的起点和终点。

15.  如权利要求12所述的信息处理装置，还包括：
缩略图生成部，所述缩略图生成部根据被所述场景提取部提取的场景的图像生成代表所述内容的缩略图图像。

16.  如权利要求12至15中任一项所述的信息处理装置，还包括：
变更部，所述变更部被构造用来改变所述重要性的权重；
其中，所述场景提取部提取根据被所述改变部改变了权重的所述重要性的场景。

17.  一种信息处理方法，所述方法包括以下步骤：
信息处理装置从内容中提取多个特征量；
由所述信息处理装置控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；
由所述信息处理装置选择显示或不显示与所述特征量相关的信息；并且
由所述信息处理装置控制场景的重要性的显示，所述重要性是基于与已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。

18.  一种程序，所述程序使得计算机能够起到如下部件的作用：
多个特征量提取部，它们被构造用来从内容中提取多个特征量；
显示控制部，所述显示控制部被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；以及
选择部，所述选择部被构造用来选择显示或不显示与所述特征量相关的信息；
其中，所述显示控制部控制场景的重要性的显示，所述重要性是基于与所述选择部已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。

说明书

说明书信息处理装置、信息处理方法和程序
技术领域
本发明涉及信息处理装置、信息处理方法和程序。特别地，涉及能够使内容的实体易于被掌握的信息处理装置、信息处理方法和程序。
背景技术
用于确认动态图像内容的实体的预览屏幕一般包括：预览区域，其用于再现动态图像；和时间线区域，其具有用于指示时间线内的再现位置的滑块。
为了掌握内容的实体，用户能够再现动态图像以确认预览，或者为了更快地掌握，用户能够使用滑块移动再现位置以确认内容的实体。然而，根据内容的长度可能需要长时间来掌握上述实体。
另一方面，根据作为相关技术的日本专利特开平第11-284948号公报或日本专利特开第2000-308003号公报，由于能够沿着时间线显示与场景变化相对应的图像，所以客户能够确认在哪里有怎样的视频。
发明内容
然而，内容的长度或内容的场景变化的数量可能导致与场景变化对应的图像数量的增加，从而导致用户难以掌握内容的实体。
鉴于以上状况提出了本发明，期望提高用于掌握内容的实体的可操作性。
本发明的实施例提供了一种信息处理装置，该信息处理装置包括：多个特征量提取部，它们被构造用来从内容中提取多个特征量；显示控制部，其被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；以及选择部，其被构造用来选择显示或不显示与所述特征量相关的信息。所述显示控制部控制场景的重要性的显示，所述重要性是基于与所述选择部选择的与所述特征量相关的所述信息的显示或不显示而得到的。
所述显示控制部可以根据所述重要性来改变与所述特征量相关的信息的显示。
所述显示控制部可以根据所述重要性控制作为与所述特征量相关的所述信息的场景头图像的显示。
所述显示控制部可以以具有高的所述重要性的场景头图像的尺寸大于具有低的所述重要性的场景头图像的尺寸的方式显示具有高的所述重要性的场景头图像。
所述显示控制部可以将具有高的所述重要性的场景头图像显示在具有低的所述重要性的场景头图像的前面。
所述显示控制部可以根据所述重要性控制对象图像的显示，在所述对象图像中预定对象被检测作为与所述特征量相关的所述信息。
所述显示控制部可以以具有高的所述重要性的对象图像的尺寸大于具有低的所述重要性的对象图像的尺寸的方式显示具有高的所述重要性的对象图像。
所述显示控制部可以将具有高的所述重要性的对象图像显示在具有低的所述重要性的对象图像的前面。
在沿着时间线连续检测具有高的所述重要性的对象图像的情况下，所述显示控制部可以在连续检测具有高的所述重要性的对象图像的区间内显示一个以上具有高的所述重要性的对象图像。
所述信息处理装置还可以包括被构造用来改变所述重要性的权重的变更部。所述显示控制部可以根据被所述变更部改变了权重的所述重要性来改变与所述特征量相关的所述信息的显示。
所述信息处理装置还可以包括被构造用来提取与所述重要性相对应的场景的场景提取部。
所述信息处理装置还可以包括摘要生成部，其被构造用来收集由所述场景提取部提取的场景，并且生成摘要动态图像。
所述信息处理装置还可以包括元数据生成部，其被构造用来生成摘要元数据，所述摘要元数据包括被所述场景提取部提取的场景的起点和终点。
所述信息处理装置还可以包括缩略图生成部，其根据被所述场景提取部提取的场景的图像生成代表所述内容的缩略图图像。
所述信息处理装置还可以包括被构造用来改变所述重要性的权重的变更部。所述场景提取部可以提取根据被所述变更部改变了权重的所述重要性的场景。
本公开的实施例提供了一种信息处理方法，所述方法包括步骤：信息处理装置从内容中提取多个特征量；由所述信息处理装置控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；由所述信息处理装置选择显示或不显示与所述特征量相关的信息；并且由所述信息处理装置控制场景的重要性的显示，所述重要性是基于与已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。
本公开的实施例提供了一种程序，所述程序使得计算机能够起到如下部件的作用：多个特征量提取部，它们被构造用来从内容中提取多个特征量；显示控制部，其被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；以及选择部，其被构造用来选择显示或不显示与所述特征量相关的信息。所述显示控制部控制场景的重要性的显示，所述重要性是基于与所述选择部已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。
根据本公开的一个实施例，从内容中提取多个特征量，并且控制所述内容的图像和与所述内容的特征量相关的信息的显示。然后，选择显示或不显示与所述特征量相关的信息，并且控制场景的重要性的显示，所述重要性是基于选择显示或不显示与特征量相关的信息而得到的。
根据本公开的实施例，能够容易地掌握内容的实体。
附图说明
图1是示出了采用了本发明的信息处理装置的构造例；
图2是图示了信息处理装置的内容输入处理的流程图；
图3是图示了预览显示处理的流程图；
图4是图示了预览屏幕的重新显示处理的流程图；
图5示出了预览屏幕的示例；
图6示出了预览屏幕的示例；
图7示出了场景变化图像显示部的显示示例；
图8示出了场景变化图像显示部的另一显示示例；
图9示出了面部图像显示部的显示例；
图10示出了面部图像显示部的显示例；
图11示出了采用本发明的信息处理装置的构造例；
图12是图示了预览显示处理的流程图；
图13是图示了摘要生成处理的流程图；
图14示出了摘要生成显示部的显示示例；
图15示出了摘要生成显示部的另一显示示例；
图16图示了另一摘要生成方法；以及
图17是示出了计算机的配置示例的框图。
具体实施方式
下面，参照附图详述本发明的优选实施例。注意，在本申请文件和附图中，以相同的附图标记来表示具有基本相同的功能和结构的结构元件，并且省略了对这些结构元件的重复说明。
以下，将说明用于实施本发明的实施例（以下称作实施例）。按照如下顺序进行说明。
1.第一实施例（根据重要性的预览屏幕）
2.第二实施例（根据重要性的摘要生成）
3.第三实施例（计算机）
1.第一实施例（根据重要性的预览屏幕）
[本发明的信息处理装置的构造]
图1示出了应用本发明的信息处理装置的构造例。
图1所示的信息处理装置11在用于预览内容的屏幕中沿着时间线显示通过诸如图像识别、语音识别和字符识别等识别技术从内容中提取的内容的特征量。信息处理装置11例如由个人计算机构成。
在图1的示例中，信息处理装置11包括内容输入部21、内容存档22、特征量提取部23-1至23-3、内容特征量数据库24、显示控制部25、操作输入部26、显示部27、特征量提取部28以及检索部29。
内容输入部21从没有图示出的外部等接收内容，并将所接收的内容提供给特征量提取部23-1至23-3。此外，内容输入部21将所接收的内容登记在内容存档22中。
内容存档22中登记有来自内容输入部21的内容。
特征量提取部23-1至23-3对内容进行图像识别、语音识别、字符识别等，以提取包括图像特征量、语音特征量等的多个特征量中的各特征量。特征量提取部23-1至23-3将提取的内容的特征量登记在内容特征量数据库24中。本文中，特征量提取部23-1至23-3包括三个特征量提取部，但是特征量提取部的数量不限于三个，而是根据所提取的特征量的类型（数量）而变化。以下，当不必相互区分时，将特征量提取部23-1至23-3称作特征量提取部23。
内容特征量数据库24中登记有由特征量提取部23提取的内容的特征量。
显示控制部25响应于来自操作输入部26的用户指令分别从内容存档22和内容特征量数据库24取出将被预览的内容以及该内容的特征量。显示控制部25基于被取出的内容的预览图像和关于该内容的特征量的信息来生成预览屏幕，并且控制显示部27显示生成的预览屏幕。在显示预览屏幕的过程中，当通过操作输入部26（用户通过操作输入部26发出指令）将文本或图像信息输入提供给特征量提取部28时，显示控制部25接收响应于输入的信息而从检索部29提供的检索结果。显示控制部25基于检索结果来显示预览屏幕。
此外，在显示预览屏幕的过程中，当因用户指令而通过操作输入部26将文本或图像信息输入提供给特征量提取部28时，显示控制部25接收响应于输入的信息而从检索部29提供的检索结果。显示控制部25基于检索结果来重新显示预览屏幕。在显示预览屏幕的过程中，显示控制部25基于检索结果和通过操作输入部26输入的且由用户选择显示或不显示的特征量来重新显示预览屏幕。此时，显示控制部25根据用户选择的特征量来判定各场景的重要性，并根据所述重要性来重新显示预览屏幕。
此外，在显示预览屏幕的过程中，显示控制部25基于通过操作输入部26对特征量输入的校正等对内容特征量数据库24中登记的信息进行修正和更新等。
操作输入部26例如包括鼠标、层叠在显示部27上的触摸面板等。操作输入部26将响应于用户操作的信号提供给显示控制部25。显示部27显示由显示控制部25生成的预览屏幕。
特征量提取部28提取从显示控制部25提供的且用户为之发出指令的文本或图像信息的特征量，并将该特征量提供给检索部29。检索部29针对与来自特征量提取部28的特征量类似的特征量对内容特征量数据库24进行检索，并将检索结果提供给显示控制部25。
[信息处理装置的操作]
接下来，将参照图2的流程图说明信息处理装置11的内容输入处理。
在步骤S11中，内容输入部21从没有图示出的外部等接收内容。内容输入部21将接收到的内容提供给特征量提取部23-1至23-3。
在步骤S12中，特征量提取部23-1至23-3对来自内容输入部21的内容进行图像识别、语音识别、字符识别等，以提取包括图像特征量、语音特征量等特征量中的各特征量。在步骤S13中，特征量提取部23-1至23-3将提取的内容特征量登记在内容特征量数据库24中。
在步骤S14中，内容输入部21将接收的内容登记在内容存档22中。
参照图3的流程图，说明通过使用如上所述注册的内容和内容特征量进行的内容的预览显示处理。
用户对操作输入部26进行操作来选择将被预览的内容。通过操作输入部26将用户选择的内容的信息提供至显示控制部25。
在步骤S31中，显示控制部25根据来自操作输入部26的信息来选择内容。在步骤S32中，显示控制部25从内容存档22获取在步骤S31中选择的内容。
在步骤S33中，显示控制部25从内容特征量数据库24获取在步骤S31中选择的内容的特征量。
在步骤S34中，显示控制部25显示预览屏幕。换言之，显示控制部25基于获取的内容和获取的内容的特征量生成预览屏幕并控制显示部27显示生成的预览屏幕（稍后将要说明的图5中所示的预览屏幕51），在所述预览屏幕中，沿着时间线显示关于各种特征量的信息。这里，沿着时间线显示的不仅是特征量信息，还有与特征量有关的信息。与特征量有关的信息包括特征量信息、使用特征量获得的信息或使用特征量检索到的结果。
在步骤S35中，显示控制部25进行预览屏幕的重新显示处理。在稍后将参照图4说明的所述预览屏幕的重新显示处理中，在步骤S35的处理中，在显示部27上显示预览屏幕（稍后将要说明的图6中所示的预览屏幕51），该预览屏幕响应于从操作输入部26提供的用户指令已被更新。
在步骤S36中，显示控制部25判定预览屏幕的显示是否终止。在步骤S36中，如果用户凭借操作输入部26发出用于终止的指令，则判定预览屏幕的显示终止，并终止预览屏幕的显示。
另一方面，在步骤S36中，如果判定预览屏幕的显示未终止，则处理返回至步骤S35并重复步骤S35及接下来的步骤。
接下来，将参照图4的流程图说明图3的步骤S35中的预览屏幕的重新显示处理。
在步骤S51中，显示控制部25判定是否通过操作输入部26输入了待检索文本。如果在步骤S51中判定输入了待检索文本，则显示控制部 25将输入的待检索文本的信息提供给特征量提取部28，处理前进至步骤S52。
在步骤S52中，特征量提取部28和检索部29通过语音和OCR进行检索。即，在此情况下，特征量提取部28将来自显示控制部25的待检索文本原样提供给检索部29。检索部29针对待检索文本对内容特征量数据库24进行语音检索或字符识别结果检索，并将检索结果提供给显示控制部25。然后，处理前进至步骤S56。
如果在步骤S51中判定未输入待检索文本，则处理前进至步骤S53。在步骤S53中，显示控制部25判定是否凭借操作输入部26输入待检索图像。如果在步骤S53中判定输入了待检索图像，则显示控制部25将输入的待检索图像的信息提供给特征量提取部28，处理前进至步骤S54。
在步骤S54中，特征量提取部28和检索部29检索类似的图像。换言之，在此情况下，特征量提取部28提取从显示控制部25提供的待检索图像的特征量，并将提取的待检索图像的特征量提供给检索部29。检索部29使用待检索图像的特征量针对类似的图像检索内容特征量数据库24，并将检索结果提供给显示控制部25。然后，处理前进至步骤S56。
如果在步骤S53中判定未输入待检索图像，则处理前进至步骤S55。在步骤S55中，显示控制部25判定是否凭借操作输入部26选择了显示特征量。
可由用户选择显示还是不显示将在预览屏幕中沿着时间线显示的特征量（与特征量有关的信息）。如果用户选择显示各特征量中的至少一者，则在步骤S55中判定选择显示特征量，处理前进至步骤S56。
在步骤S56中，显示控制部25重新显示预览屏幕。换言之，在步骤S52之后，在步骤S56中，在将待检索文本的检索结果添加至将要沿时间线显示的特征量（与特征量有关的信息）的状态下，重新显示预览屏幕。此外，在步骤S54之后，在步骤S56中，在将待检索图像的检索结果添加至将要沿时间线显示的特征量的状态下，重新显示预览屏幕。此外，在步骤S55之后，在步骤S56中，在根据用户的选择显示或不显示将要沿时间线显示的特征量的状态下，重新显示预览屏幕。此后，处理返回至图3的步骤S35。
如果在步骤S55中判定未选择显示特征量，则预览屏幕的重新显示处理终止，并且处理返回至图3中的步骤S35。
[预览屏幕的示例]
图5示出了预览屏幕的示例。
图5的示例例如示出了在图3的步骤S34等中说明的预览屏幕51。
预览屏幕51包括：预览显示部61，在其中能够对内容的动态图像进行预览；和时间线显示部62，其位于预览显示部61的下方并且通过选择左上方标签而被显示。
预览显示部61响应于对设置在预览显示部61正下方的操作按钮（再现按钮、快进按钮、速退按钮、停止按钮等）的用户操作，再现并预览内容的动态图像。预览显示部61显示用于在所显示的内容中选择面部的框71，所述面部在后述的面部图像显示部85中经过面部识别。
时间线显示部62沿着时间线显示与由图1中的特征量提取部23-1至23-3提取的多个特征量相关的信息。而且，在时间线上设置有线63，线63表示当前在预览显示部61中显示的图像（帧）的位置，用户能够通过查看线63来掌握内容在时间线上的再现位置。
此外，在时间线显示部62右侧显示的是特征量列表64，特征量列表64使得能够对时间线显示部62上的显示或不显示进行选择。用户能够在布置于该列表左侧的框中打勾或不打勾以选择显示或不显示与特征量有关的信息并且仅显示与期望的特征量有关的信息。
注意，在图5的示例中，仅特征量列表64中的从上数第四个框“相关性”未被选中。即，图5的时间线显示部62不显示通过选中“相关性”而被显示的重要性显示部91（后述的图6）。
此外，摘要生成显示部65实际上设置在与时间线显示部62相同的位置处，但在图5的示例中未图示。通过选择设置在摘要生成显示部65和时间线显示部62的左上方的标签，可显示摘要生成显示部65以替代时间线显示部62。
能够显示稍后将参照图14详细说明的摘要生成显示部65以使得生成摘要动态图像等。
时间线显示部62从顶部开始依次包括场景变化图像显示部81、语音波形显示部82、文本检索结果显示部83、图像检索结果显示部84、面部图像显示部85、对象图像显示部86、人物语音区域显示部87以及相机动作信息显示部88。这些显示部均是用于显示与特征量有关的信息的显示部。
通过勾选特征量列表64中的“缩略图（Thumbnail）”以在时间线显示部62中显示场景变化图像显示部81。在场景变化图像显示部81中，在时间线上显示通过场景变化得到的各场景的头帧图像的缩略图图像作为一个特征量。注意，下文中将场景头图像（scene head image）称作场景变化图像。
通过勾选特征量列表64中的“波形（Wave form）”以在时间线显示部62中显示语音波形显示部82。在语音波形显示部82中，在时间线上显示内容的语音波形作为一个特征量。
通过勾选特征量列表64中的“关键词识别（Keyword Spotting）”以在时间线显示部62中显示文本检索结果显示部83。在文本检索结果显示部83中，被显示的是基于根据语音识别或字符识别的特征量针对用户通过操作操作输入部26输入的文本（在图5的示例的情况下的“总统（president）”）而检索内容特征量数据库24的结果。
通过勾选特征量列表64中的“图像识别（Image Spotting）”以在时间线显示部62中显示图像检索结果显示部84。在图像检索结果显示部84中，被显示的是基于根据图像识别的特征量针对与用户通过操作操作输入部26所选择的图像类似的场景而检索内容特征量数据库24的结果（的缩略图图像）。
通过勾选特征量列表64中的“面部（Face）”以在时间线显示部62中显示面部图像显示部85。在面部图像显示部85中，被显示的是来自内容特征量数据库24的与根据面部识别的特征量类似的特征量（的缩略图图像），该特征量是通过识别由预览显示部61中的框71选择的面部而获得的。
通过勾选特征量列表64中的“国会山（Capitol Hill）”以在时间线显示部62中显示对象图像显示部86。本文中，在图5的示例中，“国会山”是对象的示例，但对象不限于“国会山”且可由用户指定。在对象图像显示部86中，被显示的是基于根据对用户指定的对象（在图5的情况下的“国会山”）的识别的特征量检索内容特征量数据库24的结果（的缩略图图像）。
注意，示出了分别显示面部图像和对象图像的示例，但面部也是对象之一。面部图像显示部85和对象图像显示部86中显示的图像可以是通过对来自原始图像的提取对象进行剪辑而获得的图像（缩略图图像）。
通过勾选特征量列表64中的“人物语音（Human Voice）”以在时间线显示部62中显示人物语音区域显示部87。在人物语音区域显示部87中，被显示的是通过根据语音识别的特征量而得到的人物语音区域或音乐区域等。这里，如图5所示，人物语音区域显示部87不仅可显示人讲话的区域，还可显示根据讲话者的性别或年龄的标记。
通过勾选特征量列表64中的“相机动作（Camera Motion）”以在时间线显示部62中显示相机动作信息显示部88。在相机动作信息显示部88中，被显示的是具有诸如水平摇摄、俯仰拍摄或变焦等相机和相机镜头的动作信息（以下，称作相机动作信息）的区域，所述动作信息是根据相机动作识别的特征信息。作为相机动作信息，还可使用感测在拍摄内容时的相机动作等的传感器的信息。
在预览屏幕51中，沿着时间线显示能够从内容中提取的诸如作为示例的上述特征量的各种特征量和使用这些特征量获得的信息。
然而，在上述预览屏幕51中，在图5中的场景变化图像显示部81、面部图像显示部85和对象图像显示部86中显示的缩略图图像根据内容的长度、场景变化的数量或检测的对象的数量而互不相同。这使得难以核查每个图像，从而导致难以掌握内容的实体。
因此，在本发明中，在场景变化图像显示部81、面部图像显示部85和对象图像显示部86中沿时间线显示的包括缩略图图像的图像是根据用户选择的特征量而有效地显示的。
在本发明中，例如，根据用户选择的特征量，通过改变尺寸以及前后位置关系等来有效地显示沿着时间线显示的图像。
用户在特征量列表64中选择的特征量是被判断为在掌握内容的实体中对于用户重要的特征量。例如，如果显示有人的图片是重要的，则通过面部检测获得的人出现的场景是重要的；如果说出特定词语的场景是重要的，则通过语音识别中的文本检索而提取的场景是重要的。
因此，显示控制部25判定与用户选择的特征量相对应的场景是重要场景，并且与越多特征量相对应的场景是越重要的场景，以此来判定每个场景的重要性。
这里，此时，可对每个特征量进行重要性加权，且可显示用于操作每个特征量的加权的滑块，以使得用户能够任意操作加权来判定重要性。
在如图6中所示的时间线显示部62中显示了如上所述判定的重要性。
图6示出了预览屏幕的另一示例。在图6的示例中，在时间线显示部62中，与图5的时间线显示部62的不同之处在于：在语音波形显示部82与文本检索结果显示部83之间新设置了重要性显示部91。
这里，图6中的时间线显示部62除上述部分以外的其它部分与图5中的时间线显示部62基本相同。
通过勾选特征量列表64中的“相关性”以在时间线显示部62中显示重要性显示部91。重要性显示部91显示通过以下处理所获得的重要性，所述处理即：判定与用户在特征量列表64中选择的特征量相对应的场景是重要场景，并且判定与越多特征量相对应的场景是越重要的场景，以确定每个场景的重要性。这里，将重要性分为三个级别，并且重要性3表示最高重要性。
例如，重要性显示部91以如下方式显示对每个场景判定的重要性，所述方式即，实心黑色区域是最重要（重要性3）场景，接下来，细阴影线区域是重要性2的场景，斜阴影线区域是重要性1的场景。
然后，显示控制部25利用这种重要性来改变场景变化图像显示部81、面部图像显示部85或对象图像显示部86中的与特征量有关的信息的显示。换言之，在场景变化图像显示部81、面部图像显示部85或对象图像显示部86中，通过利用这种重要性，越重要的场景的图像被显示得更大和/或被显示在越前面。
接下来，将参照图7说明在场景变化图像显示部81中对重要性的利用。在图7中的示例中，在场景变化图像显示部81中从左侧开始显示有缩略图图像101至缩略图图像108。
图7的A示出了在不考虑重要性的情况下的场景变化图像显示部81。换言之，在图7的A的场景变化图像显示部81中，以相同的尺寸以及沿着时间线的前后关系显示任何场景变化的缩略图图像。即，作为按照时间顺序的第一个缩略图图像的缩略图图像101布置在最后面，作为按照时间顺序的最后一个缩略图图像的缩略图图像108布置在最前面。
图7的B示出了在放大了重要场景的缩略图图像的情况下的场景变化图像显示部81。换言之，在图7的B的场景变化图像显示部81中，最重要场景的缩略图图像103被显示得尺寸比其它缩略图图像大。重要场景的缩略图图像101、106被显示得尺寸仅次于缩略图图像103。此外，次重要场景的缩略图图像102、104、107被显示得尺寸大于不重要场景的缩略图图像105、108。
图7的C示出了从图7的B中的显示变化来的，在垂直居中地显示各个缩略图图像101至108的情况下的的场景变化图像显示部81。
图8的D示出了从图7的C中的显示变化来的，在将越重要的场景的缩略图图像显示在越前面的情况下的场景变化图像显示部81。换言之，在图8的D的场景变化图像显示部81中，在最前面显示最重要场景的缩略图图像103，在次前面显示重要场景的缩略图图像101、106。此外，在再次前面显示次重要场景的缩略图图像102、104、107，在最后面显示不重要场景的缩略图图像105、108。然而，实际上隐藏了缩略图图像102、104、105。
图8的E示出了从图8的D的显示变化来的，在根据重要性错开图像的上端来显示从而不会完全隐藏任何缩略图图像的情况下的场景变化图像显示部81。
换言之，在图8的E的场景变化图像显示部81中，以这样的方式显示各个缩略图图像：在图8的D的情况下被隐藏的缩略图图像102、104、105存在于缩略图图像101、103、106的后面。
这里，图8的E的示例示出了通过错开上端来显示的示例，而类似地，也可错开并显示下端。
类似于图8的D中的显示，图8的F示出了在缩略图图像102、104、105被隐藏的情况下的场景变化图像显示部81。然而，在图8的F中的场景变化图像显示部81的情况下，以这样的方式表示被隐藏的缩略图图像的场景：在指示鼠标位置的箭头M响应于用户操作而悬停在被隐藏的缩略图图像的场景上时，使用虚线显示被隐藏的缩略图图像的轮廓。此外，在指示鼠标位置的箭头M响应于用户操作而悬停在被显示的轮廓上时，与之对应的缩略图图像被显示在最前面。
如上所述，由于根据基于用户选择的特征量的重要性来显示场景变化图像显示部81中的场景变化图像（缩略图图像），用户能够容易地掌握内容的实体。
注意，关于场景变化图像显示部81中的缩略图图像，以上说明了这样的示例：其中，根据用户在特征量列表64中选择的特征量来判定重要性。另一方面，关于面部图像显示部85和对象图像显示部86中的缩略图图像，各对象（也包括面部）的特性可由用户选择，将与所选择的特性相对应的对象图像（缩略图图像）判定为最重要图像。
例如，为根据面部识别的面部图像提取关于面部的更详细特性，包括性别、年龄、笑脸判定或人名。为根据对象识别的对象图像提取关于对象的更详细特性，包括对象的专有名称或对象的颜色。在人物语音信息的情况下，提取包括男声或女声、讲话者或音乐识别等特性。在相机动作信息的情况下，提取包括水平摇摄、俯仰拍摄、拉进变焦或拉远变焦等特性。
此外，关于面部图像显示部85和对象图像显示部86中的缩略图图像，如上所述提取的特性被配置为可选择的，以使得将与用户选择的特性对应的图像（缩略图图像）判定为重要图像。根据以此方式判定的重要性，能够以改变尺寸或改变显示的前后侧的方式来显示各个图像。
图9示出了在选择特定人物作为一个详细特性的情况下的面部图像显示部85的示例。
换言之，在图9的面部图像显示部85中，从各面部图像中提取特定人物的面部图像，并且被提取的面部图像被显示得尺寸大于其它的面部图像。
这使得用户对于对象图像也能够容易地识别重要场景。
此外，将参照图10说明面部图像显示部85和对象图像显示部86中的对象图像（缩略图图像）。
例如，在作为对象图像的示例的图5中的面部图像显示部85的情况下，对于提取出面部图像的所有帧图像，沿着时间线显示缩略图图像。即，如图10的A中所示，连续显示同一对象（特定人物的面部）从而以重叠的方式显示对象图像。
为解决这一问题，识别被检测的对象的同一性，且在同一对象连续出现的区域内，显示控制部25显示如图10的B中所示的多个连续的对象图像中的有代表性的一个。然后，显示控制部25显示用于所述区间的箭头、矩形等标记。
这里，被选择作为代表性对象图像的是连续对象图像中的最前图像或中间图像、在对象检测中具有对象识别的最高精度的图像、连续对象图像中的最平均的图像或者由于用户对对象特性的选择而被判定为重要的图像。
作为用于显示上述区间的矩形，例如，显示一系列对象图像的代表性颜色。例如，根据被检测对象中频繁出现的颜色或对象的背景部分中频繁出现的颜色等来确定代表性颜色。这里，在同一对象连续出现的区间中，如果由于检测精度而未在非常短的区间内检测出对象，则可对所述区间进行插值，以将所述区间判定为从中检测出对象的区间。
此外，如果其中有同一对象出现的区间长并且能够互不重叠地显示两个对象图像，则被显示的对象图像的数量不限于一个。在类似这样的情况下，如图10的C中所示，例如，可显示同一对象出现的区间中的最前图像和最后图像。
此外，如果其中有同一对象出现的区间长，或者还可通过放大（zoom in）时间线来延长其中有同一对象出现的区间，则被显示的对象图像不限于一个代表性图像。在类似这样的情况下，如图10的D中所示，根据区间的长度，与待填充的区间内的间隔相对应的时刻的对象图像可以被显示在该时刻处。这使得显示控制部25能够根据区间的长度以一定间隔来显示多个对象图像而不使这些图像重叠。
在如图10的B至图10的D中所示的互不重叠地显示同一对象的连续的图像的情况下，还能够按照根据用户选择的特性判定的对象图像的重要性以改变尺寸或者改变显示的前后侧的方式来显示。在类似这样的情况下，显示控制部25判定在其中有同一对象出现的区间内的同一对象的重要性，并以改变图像的尺寸或改变显示的前后侧的方式来显示。或者，显示控制部25可以判定其中有同一对象出现的区间内的每个图像的重要性，如果每个图像的重要性互不相同，则允许在所述区间内的重叠以将更重要的图像显示得更大且更靠前。或者，考虑到将以此方式显示的图像，显示控制部25在其它的对象图像不重叠的情况下在某时刻以如下方式显示其它的对象图像：即，区间内的与该时刻相对应的间隔被填充。
如上所述，在用户确认动态图像内容的实体的预览屏幕中，沿着时间线显示与所述内容的各种特征量有关的信息，从而使用户能够容易地掌握内容的实体。
而且，用户能够对各特征量进行选择或者对重要性进行加权并选择特征量，以选择用户认为重要的场景；根据该重要的场景，能够以改变尺寸或改变显示的前后侧的方式来显示场景变化图像。这使得能够容易地识别对于用户重要的场景，从而能够更有效地掌握内容的实体。
此外，关于从内容中提取的对象，能够以较少重叠的方式显示被检测对象，并且能够根据用户选择的特性来判定重要性从而以改变尺寸或改变显示的前后侧的方式显示重要图像。这样，能够更有效地掌握内容的实体。
2.第二实施例（根据重要性的摘要生成）
[本发明的信息处理装置配置]
图11示出了应用了本发明的信息处理装置的另一构造例。
在图11的示例中，类似于图1的信息处理装置11，信息处理装置111在用于预览内容的屏幕中沿着时间线显示与通过诸如图像识别、语音识别和字符识别等识别技术提取的方式从内容中提取的内容特征量相关的信息。
而且，类似于图1的信息处理装置11，信息处理装置111根据用户选择的特征量来判定各场景的重要性。然而，此时，与图1的信息处理装置11不同的是，信息处理装置111提取与上述重要性相对应的场景，并收集被提取的场景以生成摘要动态图像或者记录起点和终点作为元数据。
信息处理装置111包括内容输入部21、内容存档22、特征量提取部23-1至23-3、内容特征量数据库24、显示控制部25、操作输入部26、显示部27、特征量提取部28以及检索部29，这与图1的信息处理装置11是相同的。
信息处理装置111增加了重要场景判定部121和摘要生成部122，这与图1的信息处理装置11不同。
换言之，在显示预览屏幕时，显示控制部25基于检索结果和通过操作输入部26输入的且由用户选择显示或不显示的特征量（与特征量有关的信息）来重新显示预览屏幕。此时，显示控制部25根据用户选择的特征量来判定各场景的重要性，并重新显示显示有重要性的图6的预览屏幕51。
此外，当收到用户通过操作输入部26请求摘要生成的信号时，显示控制部25在预览屏幕51中显示摘要生成显示部65。然后，在通过用户通过操作输入部26收到用户期望的重要性的时候，显示控制部25控制重要场景判定部121以提取与上述重要性相对应的场景，并且在摘要生成显示部65中显示被提取的场景的缩略图图像。
重要场景判定部121根据显示控制部25提取与重要性相对应的场景，并将被提取的场景提供给显示控制部25和摘要生成部122。例如，重要场景判定部121存储被提取的重要场景的起点和终点的信息作为内容特征量数据库24中的元数据。或者，重要场景判定部121通过利用从这些场景中拍摄的静止图像来生成代表内容的一个以上缩略图图像。
或者，摘要生成部122使用从重要场景判定部121提供的场景来生成摘要动态图像。生成的摘要动态图像被记录在未图示的存储部中。
换言之，在将判定的重要性分为多个级别的情况下，显示控制部25选择用户所需的重要性。然后，重要场景判定部121提取与重要性相对应的场景以存储该场景的元数据，或生成缩略图图像，或者摘要生成部122生成摘要动态图像。
[信息处理装置的操作]
注意，与参照图2在上文中说明的信息处理装置11的内容输入处理基本类似地进行信息处理装置111的内容输入处理，且省略了对信息处理装置111的内容输入处理的说明以防止重复说明。
接着，参照图12的流程图说明信息处理装置111中的内容的预览显示处理。这里，图12中的步骤S111至S115以及S118进行与图3的步骤S31～S36基本相同的处理，于是，适当省略了对步骤S111～S115以及S118的说明以防止重复说明。
在步骤S111中，显示控制部25根据来自操作输入部26的信息选择内容。在步骤S112中，显示控制部25从内容存档22获取在步骤S111中选择的内容。
在步骤S113中，显示控制部25从内容特征量数据库24获取在步骤S111中所选择的内容的特征量。
在步骤S114中，显示控制部25显示预览屏幕。换言之，显示控制部25基于获取的内容和获取的内容特征量来生成其中沿着时间线显示关于各种特征量的信息的预览屏幕，并控制显示部27显示生成的预览屏幕（图5所示的预览屏幕51）。
在步骤S115中，显示控制部25进行上文中参照图4说明的预览屏幕的重新显示处理。在步骤S115的处理中，在显示部27显示预览屏幕，所述预览屏幕响应于从操作输入部26提供的用户指令而被更新。换言之，通过根据用户在特征量列表64中选择的特征量来判定以得到重要性，在显示部27中显示显示有重要性的图6中的预览屏幕51。
在步骤S116中，显示控制部25判定是否将要生成摘要。
例如，用户对操作输入部26进行操作以在预览屏幕51中的设置于时间线显示部62和摘要生成显示部65的左上方的标签中选择摘要生成显示部65的标签。
响应于此，显示控制部25在步骤S116中判定将要生成摘要，处理前进至步骤S117。在步骤S117中，重要场景判定部121和摘要生成部122进行摘要生成处理。稍后将参照图13说明该摘要生成处理。根据被选择的重要性，步骤S117中的处理生成摘要动态图像，存储元数据或生成缩略图图像。
如果未选择摘要生成显示部65的标签，则在步骤S116中判定不生成摘要并跳过步骤S117的处理，处理前进至步骤S118。
在步骤S118中，显示控制部25判断预览屏幕的显示是否终止。如果用户通过操作输入部26发出终止的指令，则在步骤S118中，判定预览屏幕的显示终止，且终止预览屏幕的显示。
另一方面，在步骤S118中，如果判定预览屏幕的显示未终止，则处理返回至步骤S115且重复步骤S115及接下来的步骤。
下面将参照图13的流程图说明图12中的步骤S117的摘要生成处理。
例如，在图12中的步骤S115中，重新显示预览屏幕51，且在图6中的重要性显示部91中显示重要性。当在该预览屏幕51中选择摘要生成显示部65的标签时，如图14中所示地显示摘要生成显示部65以替代时间线显示部62。
在图14中的摘要生成显示部65中，场景的重要性的带被显示并叠加在所有场景变化图像中的各者上。这里，将重要性分为三个级别，重要性3表示最高重要性。
图14的实心黑色带对应于图6中的重要性显示部91中的实心黑色区域，且表示最重要（重要性3）场景。图14的细阴影线带对应于图6中的重要性显示部91中的细阴影线区域，且表示重要性2的场景。此外，图14的斜阴影线带对应于图6中的重要性显示部91中的斜阴影线区域，且表示重要性1的场景。
这里，在图14的示例中，在重要性低于重要性1的场景上未叠加带。
然后，例如，用户选择重要性。例如，如图15的A所示，在摘要生成显示部65的右侧显示的是重要性选择部141，其用于从“most（最重要）”、“more（较重要）”和“relevant（适当）”中选择优先级（重要性）。
用户对操作输入部26进行操作以在重要性选择部141中选择重要性。响应于此操作，显示控制部25在步骤S132中控制重要场景判定部121以提取与重要性相对应的场景。关于提取的场景的信息被提供给显示控制部25，并且如图15的A至图15的C所示，显示控制部25显示重要性选择部141。
例如，如果选择“relevant”，则提取重要性1以上的场景的缩略图图像，如图15的A所示，摘要生成显示部65显示重要性1以上的场景的缩略图图像。例如，如果选择“more”，则提取重要性2以上的场景的缩略图图像，如图15的B所示，摘要生成显示部65显示重要性2以上的场景的缩略图图像。例如，如果选择“最重要”，则提取重要性3以上的场景的缩略图图像，如图15的C所示，摘要生成显示部65在其中显示重要性3以上的场景的缩略图图像。
然后，在步骤S133-1中，重要场景判定部121通过利用从这些场景拍摄的静止图像来生成代表内容的一个以上缩略图图像。
或者，在步骤S133-2中，重要场景判定部121存储关于所提取的重要场景的起点和终点的信息作为内容特征量数据库24中的元数据。
或者，在步骤S133-3中，摘要生成部122使用从重要场景判定部121提供的场景来生成摘要动态图像。将所生成的摘要动态图像记录在未图示的存储部中。
这里，并列示出了步骤S133-1至S133-3的处理，这是因为可以进行任何一个处理，且可以并行进行至少两个处理。
在步骤S134中，显示控制部25判断摘要生成处理是否终止。例如，用户对操作输入部26进行操作以在预览屏幕51中的设置于时间线显示部62和摘要生成显示部65的左上方的标签中选择时间线显示部62的标签。
响应于此操作，显示控制部25在步骤S134中判定摘要生成处理终止，且显示代替摘要生成显示部65的时间线显示部62以终止摘要生成处理。
另一方面，如果在步骤S134中判定摘要生成处理未终止，则处理返回至步骤S131并重复步骤S131及接下来的步骤。
如上所述，用户能够根据所需场景来选择重要性，并根据提取的场景生成摘要。或者，用户能够存储关于提取的场景的起点和终点的信息作为元数据以在其它应用等中使用。而且，例如场景变化图像等代表性图像能够被用于生成代表内容的一个以上缩略图图像。由于该缩略图图像是从重要场景中提取的，所以相比于相关技术中的场景的最前图像是缩略图图像的方法，能够获得如下效果：即，仅通过观看缩略图图像就能够容易地获知内容的实体。
这里，关于重要性的选择，能够显示从在切换重要性时提取的场景生成的摘要动态图像的长度，能够选择重要性以使得动态图像的长度接近用户期望的长度，并且能够生成摘要动态图像。
或者，用户能够在信息处理装置111中预先输入期望的长度，自动选择重要性以使得根据所述重要性生成长度与该长度接近的摘要动态图像，并且生成摘要。
[摘要生成的另一例]
接下来说明用于更容易地生成摘要的另一方法，其中，能够使用用户选择的一个以上图像来提取类似的场景并生成摘要。
例如，在图5中的预览屏幕51中的图像检索结果显示部84中，关于用户检索与输入图像类似的场景的特征量，不仅可输入一个图像还可输入多个图像以检索与各图像类似的场景。然后，能够从类似场景的检索结果中提取相关区域作为重要场景，从而生成摘要动态图像和缩略图图像。
图16中的示例图示了这样的示例，其中，输入四个特征图像151～154，且检索与各图像类似的场景以从检索到的类似场景中提取重要场景。
沿着时间线141显示的是与图像154类似的场景的区间154A、与图像151类似的场景的区间151A、与图像153类似的场景的区间153A以及与图像152类似的场景的区间152A。然后，在上述区间中，通过选择参数来提取实心黑色的区间161以作为摘要动态图像的素材区间，所述参数包括检测精度、误检测区间的噪声校正以及用户在特定时段内对区间的选择。
作为其它特征量，能够使用场景变化信息、关于声音中断的信息等以更灵活、适当地提取场景。根据这些提取的区间中的场景，能够生成摘要动态图像和缩略图图像，并且能够提取重要场景的起点和终点。
如上所述，由于利用诸如语音识别和图像识别等识别技术从动态图像内容中提取各种特征量以使得用户能够任意选择各特征量，因此，能够更详细地反映用户的意图以提取内容的重要场景。
此外，由于从用户任意选择的一个以上特征图像中检索类似的场景，因此能够灵活地选择用户想要的重要场景。
关于动态图像内容，对这种重要性的利用使得能够生成更加反映用户的意图的缩略图图像和摘要动态图像。
上述一系列处理可通过硬件来执行，也可通过软件来执行。当一系列处理由软件来执行时，将构成这种软件的程序安装在计算机中。这里，“计算机”的表述包括其中装有专用硬件的计算机以及当安装有各种程序时能够执行各种功能的通用个人计算机等。
3.第三实施例（计算机）
[计算机的配置示例]
图17图示了通过程序执行上述一系列处理的计算机的硬件的配置示例。
在计算机300中，中央处理单元（CPU）301、只读存储器（ROM）302和随机存取存储器（RAM）303通过总线304相互连接。
输入/输出接口305也连接至总线304。输入单元306、输出单元307、存储单元308、通信单元309以及驱动器310连接至输入/输出接口305。
输入单元306由键盘、鼠标、麦克风等构成。输出单元307由显示器、扬声器等构成。存储单元308由硬盘、非易失性存储器等构成。通信单元309由网络接口等构成。驱动器310驱动可移动记录介质311，诸如磁盘、光盘、磁光盘、半导体存储器等。
在如上所述配置的计算机中，CPU 301将例如存储在存储单元308中的程序经由输入/输出接口305和总线304加载至RAM 303，并执行所述程序。由此，进行上述一系列处理。
作为一个示例，可通过将由计算机（CPU 301）执行的程序记录在作为封装介质的可移动记录介质311等中来提供该程序。还可经由诸如局域网、互联网或数字卫星广播等有线或无线传输介质来提供程序。
在计算机中，通过将可移动记录介质311加载至驱动器310中，能够将程序经由输入/输出接口305安装至存储单元308中。还能够使用通信单元309从有线或无线传输介质接收程序，并将程序安装至存储单元308中。作为另一选择，可将程序预先安装至ROM 302或存储单元308中。
应当注意，由计算机执行的程序可以是根据本申请文件中说明的顺序按照时间顺序处理的程序，或者是并行处理或在诸如请求时等必要时刻被处理的程序。
在本发明中，用于说明上述系列处理的步骤可以包括根据记载的顺序依时间顺序进行的处理以及不依时间顺序而是并行或单独进行的处理。
本发明的实施例不限于上述实施例。本领域技术人员应当理解，依据设计要求和其它因素，可以在本发明随附的权利要求或其等同物的范围内进行各种修改、组合、次组合以及改变。
例如，本发明可采用云计算的构造，所述云计算由多个装置通过网络分配和连接一个功能来进行处理。
此外，可由一个装置或通过分配多个装置来执行上述流程图中说明的每个步骤。
此外，在一个步骤中包括多个处理的情况下，可由一个装置或通过分配多个装置来执行所述一个步骤中包括的多个处理。
此外，可将以上作为单个器件（或处理单元）说明的元件分成被构造为多个器件（或处理单元）。相反地，以上作为多个器件（或处理单元）说明的元件可共同被构造为一个器件（或处理单元）。此外，可将除上述元件以外的元件添加至各器件（或处理单元）。而且，给定器件（或处理单元）的元件的一部分可以被包含在另一器件（或另一处理单元）的元件中，只要系统的整体构造或操作基本相同即可。换言之，本发明的实施例不限于上述实施例，在不脱离本技术的范围内可进行各种改变和修改。
虽然参照附图详述了本发明的优选实施例，但本发明不限于此。本领域技术人员应当明白，在所附权利要求或等同物的技术范围内，可以存在各种变型例或修正例。应当理解的是，这些变型例或修正例也属于本发明的技术范围内。
此外，本发明还可如下构造。
（1）一种信息处理装置，其包括：
多个特征量提取部，它们被构造用来从内容中提取多个特征量；
显示控制部，所述显示控制部被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；以及
选择部，所述选择部被构造用来选择显示或不显示与所述特征量相关的信息；
其中，所述显示控制部控制场景的重要性的显示，所述重要性是基于与所述选择部选择的与所述特征量相关的所述信息的显示或不显示而得到的。
（2）根据（1）所述的信息处理装置，其中，
所述显示控制部根据所述重要性来改变与所述特征量相关的信息的显示。
（3）根据（2）所述的信息处理装置，其中，
所述显示控制部根据所述重要性控制作为与所述特征量相关的所述信息的场景头图像的显示。
（4）根据（3）所述的信息处理装置，其中，
所述显示控制部以具有高的所述重要性的场景头图像的尺寸大于具有低的所述重要性的场景头图像的尺寸的方式显示具有高的所述重要性的场景头图像。
（5）根据（3）所述的信息处理装置，其中，
所述显示控制部将具有高的所述重要性的场景头图像显示在具有低的所述重要性的场景头图像的前面。
（6）根据（2）所述的信息处理装置，其中，
所述显示控制部根据所述重要性控制对象图像的显示，在所述对象图像中预定对象被检测作为与所述特征量相关的所述信息。
（7）根据（6）所述的信息处理装置，其中，
所述显示控制部以具有高的所述重要性的对象图像的尺寸大于具有低的所述重要性的对象图像的尺寸的方式显示具有高的所述重要性的对象图像。
（8）根据（6）所述的信息处理装置，其中，
所述显示控制部将具有高的所述重要性的对象图像显示在具有低的所述重要性的对象图像的前面。
（9）根据（6）所述的信息处理装置，其中，
在沿着时间线连续检测具有高的所述重要性的对象图像的情况下，所述显示控制部在连续检测具有高的所述重要性的对象图像的区间内显示一个以上具有高的所述重要性的对象图像。
（10）根据（1）至（9）中任一项所述的信息处理装置，还包括：
变更部，所述变更部被构造用来改变所述重要性的权重；
其中，所述显示控制部根据被所述变更部改变了权重的所述重要性来改变与所述特征量相关的所述信息的显示。
（11）根据（1）所述的信息处理装置，还包括：
场景提取部，所述场景提取部被构造用来提取与所述重要性相对应的场景。
（12）根据（11）所述的信息处理装置，还包括：
摘要生成部，所述摘要生成部被构造用来收集由所述场景提取部提取的场景，并且生成摘要动态图像。
（13）根据（11）所述的信息处理装置，还包括：
元数据生成部，所述元数据生成部被构造用来生成摘要元数据，所述摘要元数据包括被所述场景提取部提取的场景的起点和终点。
（14）根据（11）所述的信息处理装置，还包括：
缩略图生成部，所述缩略图生成部根据被所述场景提取部提取的场景的图像生成代表所述内容的缩略图图像。
（15）根据（11）至（14）中任一项所述的信息处理装置，还包括：
变更部，所述变更部被构造用来改变所述重要性的权重；
其中，所述场景提取部提取根据被所述改变部改变了权重的所述重要性的场景。
（16）一种信息处理方法，所述方法包括以下步骤：
信息处理装置从内容中提取多个特征量；
由所述信息处理装置控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；
由所述信息处理装置选择显示或不显示与所述特征量相关的信息；并且
由所述信息处理装置控制场景的重要性的显示，所述重要性是基于与已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。
（17）一种程序，所述程序使得计算机能够起到如下部件的作用：
多个特征量提取部，它们被构造用来从内容中提取多个特征量；
显示控制部，所述显示控制部被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示；以及
选择部，所述选择部被构造用来选择显示或不显示与所述特征量相关的信息；
其中，所述显示控制部控制场景的重要性的显示，所述重要性是基于与所述选择部已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。
本申请包含与2012年11月26日向日本专利局提交的日本优先权专利申请JP 2012-257826所公开的内容相关的主题，因此将该日本优先权申请的全部内容以引用的方式并入本文。