书签分享收藏举报版权申诉 / 23

立即下载加入VIP,免费下载

当前位置：首页 > 电学 > 电通信技术 > 摄像装置以及信息处理装置.pdf

摄像装置以及信息处理装置.pdf

上传人：GAME****980

文档编号：4102738

上传时间：2018-08-29

格式：PDF

页数：23

大小：3.78MB

《摄像装置以及信息处理装置.pdf》由会员分享，可在线阅读，更多相关《摄像装置以及信息处理装置.pdf（23页完整版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 103959761 A (43)申请公布日 2014.07.30 C N 1 0 3 9 5 9 7 6 1 A (21)申请号 201280059195.6 (22)申请日 2012.12.21 2012-001023 2012.01.06 JP H04N 5/225(2006.01) G03B 15/00(2006.01) G03B 17/38(2006.01) G10L 15/14(2006.01) H04N 5/232(2006.01) H04N 9/806(2006.01) (71)申请人旭化成株式会社地址日本大阪府 (72)发明人冈本明浩 (74)专利代。

2、理机构北京林达刘知识产权代理事务所(普通合伙) 11277 代理人刘新宇 (54) 发明名称摄像装置以及信息处理装置 (57) 摘要构成摄像装置(10)，摄像装置(10)包括：暂时图像累积部(104)，其存储摄像部(101)除了用户的摄像指示以外自动连续拍摄得到的静止图像的图像数据；摄像时间点数据存储部(201)，其存储有使基于由声音获取部(102)输出的声音数据的声音信息与延迟时间信息相关联而得到的摄像时间点数据；摄像时间点数据指定部(202)，其基于上述声音数据，通过声音识别处理从上述多个摄像时间点数据中指定包含与上述声音数据对应的声音信息的摄像时间点数据；声音事件。

3、检测部 (203)，其根据上述声音数据来检测表示声音的开始、声音的结束等的声音事件；以及暂时图像选择部(204)，其基于上述声音事件和上述指定的上述摄像时间点数据的延迟时间，从上述暂时图像累积部中选择在上述声音事件之前的时刻拍摄得到的静止图像。 (30)优先权数据 (85)PCT国际申请进入国家阶段日 2014.05.30 (86)PCT国际申请的申请数据 PCT/JP2012/008206 2012.12.21 (87)PCT国际申请的公布数据 WO2013/102979 JA 2013.07.11 (51)Int.Cl. 权利要求书2页说明书12页附图8页 (19)中华人民共。

4、和国国家知识产权局 (12)发明专利申请权利要求书2页说明书12页附图8页 (10)申请公布号 CN 103959761 A CN 103959761 A 1/2页 2 1.一种摄像装置，具备：声音获取部，其将获取到的声音作为声音数据而输出；以及摄像部，其具有根据用户的摄像指示来拍摄静止图像的功能以及除了用户的摄像指示以外自动拍摄静止图像的功能，该摄像装置的特征在于，还具备：暂时图像累积部，其存储由上述摄像部自动连续拍摄得到的静止图像的图像数据；摄像时间点数据存储部，其存储有声音信息与延迟时间信息相关联的摄像时间点数据；摄像时间点数据指定部，其基于由上述声音获取部输出的上述声。

5、音数据，从上述摄像时间点数据存储部所存储的多个摄像时间点数据中，指定包含与由上述声音获取部输出的上述声音数据对应的声音信息的摄像时间点数据；声音事件检测部，其根据上述声音数据来检测表示声音的开始、声音的结束、声音识别处理的开始以及声音识别处理的结束中的任一个的声音事件；以及暂时图像选择部，其基于上述声音事件和由上述摄像时间点数据指定部指定的上述摄像时间点数据的延迟时间，从上述暂时图像累积部中选择在上述声音事件之前的时刻拍摄得到的静止图像。 2.根据权利要求1所述的摄像装置，其特征在于，上述声音事件检测部根据上述声音数据来检测表示声音的开始或者结束的声音事件。 3.根据权利要求1。

6、或者2所述的摄像装置，其特征在于，还具备：图像显示部，其显示由上述摄像部拍摄的静止图像；以及图像存储部，其存储由上述摄像部拍摄的静止图像。 4.根据权利要求3所述的摄像装置，其特征在于，上述图像显示部显示上述暂时图像累积部所存储的静止图像中的、由上述暂时图像选择部选择的静止图像和在拍摄由上述暂时图像选择部选择的静止图像的时刻前后的时刻拍摄得到的静止图像。 5.根据权利要求3或者4所述的摄像装置，其特征在于，上述图像存储部存储用户从由上述图像显示部显示的静止图像中指定的静止图像的图像数据。 6.根据权利要求15中的任一项所述的摄像装置，其特征在于，还具备：延迟时间计测部，其计测延。

7、迟时间，该延迟时间为拍摄用户从由上述图像显示部显示的静止图像中指定的静止图像的时刻与由上述声音事件检测部检测出的声音事件之间的发生时间差；以及摄像时间点数据生成部，其生成使由上述延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由上述声音获取部输出的上述声音数据的声音信息相关联的摄像时间点数据，其中，上述摄像时间点数据存储部存储由上述摄像时间点数据生成部生成的上述摄像时间点数据。 7.根据权利要求15中的任一项所述的摄像装置，其特征在于，还具备：摄像开始事件检测部，其对上述摄像部基于用户的摄像指示进行摄像的摄像开始事件进行检测；延迟时间计测部，其计测延迟时间，该延迟时。

8、间为由上述摄像开始事件检测部检测出权利要求书CN 103959761 A 2/2页 3 的摄像开始事件与由上述声音事件检测部检测出的声音事件之间的发生时间差；以及摄像时间点数据生成部，其生成使由上述延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由上述声音获取部输出的上述声音数据的声音信息相关联的摄像时间点数据，其中，上述摄像时间点数据存储部存储由上述摄像时间点数据生成部生成的上述摄像时间点数据。 8.根据权利要求17中的任一项所述的摄像装置，其特征在于，还具备摄像动作设定部，该摄像动作设定部基于由上述声音事件检测部检测的上述声音事件以及由上述摄像时间点数据指定。

9、部指定的上述摄像时间点数据的延迟时间，来设定上述摄像部的摄像时间点。 9.根据权利要求8所述的摄像装置，其特征在于，上述摄像动作设定部将上述摄像时间点设定为上述声音事件之后的时刻。 10.根据权利要求8或者9所述的摄像装置，其特征在于，还具备延迟时间修改部，该延迟时间修改部在上述摄像部按照由上述摄像动作设定部设定的上述摄像时间点进行拍摄所得到的数据没有被保存到上述图像存储部的情况下，对由上述摄像时间点数据指定部指定的上述摄像时间点数据所包含的延迟时间信息进行修改。 11.一种信息处理装置，被安装到摄像装置，该摄像装置具备：声音获取部，其将获取到的声音作为声音数据而输出；以及摄像部。

10、，其具有根据用户的摄像指示来拍摄静止图像的功能，该信息处理装置的特征在于，具备：声音事件检测部，其根据从上述声音获取部输出的声音数据来检测表示声音的开始或者结束的声音事件；摄像开始事件检测部，其检测基于用户的摄像指示的摄像部的摄像开始事件；延迟时间计测部，其计测延迟时间，该延迟时间为由摄像开始事件检测部检测出的摄像开始事件与由声音事件检测部检测出的声音事件之间的发生时间差；摄像时间点数据生成部，其生成使由延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由声音获取部输出的声音数据的声音信息相关联的摄像时间点数据；以及摄像时间点数据存储部，其存储由上述摄像时间点数据生成部。

11、生成的摄像时间点数据。权利要求书CN 103959761 A 1/12页 4 摄像装置以及信息处理装置技术领域 0001 本发明涉及一种摄像装置以及信息处理装置。背景技术 0002 当前，在照相机领域中，存在一种具备能够识别声音功能的照相机。这种照相机例如从识别得到的声音中提取出“、(hi cheese)”(日语)这种预先设定的语言。而且，在从发声提取出的语言的时间点起经过固定时间之后进行动作来自动地按下快门。 0003 上述照相机例如记载于专利文献1。根据专利文献1所记载的发明，照相机的操作人员能够拍摄与被摄体的动作一致的自然照片。另外，专利文献1记载了以下内容，即任意。

12、地设定从发声的时间点起至按下快门为止的时间(以下，称为延迟时间)。 0004 专利文献1：日本特开平1-191840号公报发明内容 0005 发明要解决的问题 0006 然而，上述公知的照相机在从发声起经过固定时间之后的时刻开始进行拍摄。因此，在错过了摄像时间点的情况下无法应对。 0007 作为不使摄像时间点错过的方法，可以考虑以下方法：在用户指示的时间点除了进行摄像以外还自动地拍摄静止图像，将自动拍摄得到的图像存储到存储器。但是，在该方法的情况下，用户需要从自动拍摄得到的大量图像中找出自己所期望的图像，迫使用户花费很多劳力和时间。 0008 本发明是鉴于这一点而完成的，目的在于提。

13、供一种不会错过摄像时间点并且不会迫使用户花费很多劳力和时间就能够呈现用户所期望的图像的摄像装置以及信息处理装置。 0009 用于解决问题的方案 0010 本发明的一个方式是一种摄像装置，具备：声音获取部(例如图1示出的声音获取部102)，其将获取到的声音作为声音数据而输出；以及摄像部(例如图1示出的摄像部 101)，其具有根据用户的摄像指示来拍摄静止图像的功能以及除了用户的摄像指示以外自动拍摄静止图像的功能，该摄像装置的特征在于，还具备：暂时图像存储部(例如图1示出的暂时图像累积部104)，其存储由上述摄像部自动连续拍摄得到的静止图像的图像数据；摄像时间点数据存储部(例如图1示出的。

14、摄像时间点数据存储部201)，其存储有声音信息与延迟时间信息相关联的摄像时间点数据；摄像时间点数据指定部(例如图1示出的摄像时间点数据指定部202)，其基于由上述声音获取部输出的上述声音数据，从上述摄像时间点数据存储部所存储的多个摄像时间点数据中，指定包含与由上述声音获取部输出的上述声音数据对应的声音信息的摄像时间点数据；声音事件检测部(例如图1示出的声音事件检测部203)，其根据上述声音数据来检测表示声音的开始、声音的结束、声音识别处理的开始以及声音识别处理的结束中的任一个的声音事件；以及暂时图像选择部(例如图1示出说明书CN 103959761 A 2/12页 5 的暂时。

15、图像选择部204)，其基于上述声音事件和由上述摄像时间点数据指定部指定的上述摄像时间点数据的延迟时间，从上述暂时图像累积部中选择在上述声音事件之前的时刻拍摄得到的静止图像。 0011 可以是，上述声音事件检测部根据上述声音数据来检测表示声音的开始或者结束的声音事件。 0012 可以是，还具备：图像显示部(例如图1示出的图像显示部205)，其显示由上述摄像部拍摄的静止图像；以及图像存储部(例如图1示出的图像存储部103)，其存储由上述摄像部拍摄的静止图像。 0013 可以是，上述图像显示部显示上述暂时图像累积部所存储的静止图像中的、由上述暂时图像选择部选择的静止图像和在拍摄由上述暂时。

16、图像选择部选择的静止图像的时刻前后的时刻拍摄得到的静止图像。 0014 可以是，上述图像存储部存储用户从由上述图像显示部显示的静止图像中指定的静止图像的图像数据。 0015 并且，也可以是，还具备：延迟时间计测部(例如图4示出的延迟时间计测部 211)，其计测延迟时间，该延迟时间为拍摄用户从由上述图像显示部显示的静止图像中指定的静止图像的时刻与由上述声音事件检测部检测出的声音事件之间的发生时间差；以及摄像时间点数据生成部(例如图4示出的摄像时间点数据生成部212)，其生成使由上述延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由上述声音获取部输出的上述声音数据的声音信息相关。

17、联的摄像时间点数据，其中，上述摄像时间点数据存储部存储由上述摄像时间点数据生成部生成的上述摄像时间点数据。 0016 可以是，还具备：摄像开始事件检测部(例如图5示出的摄像开始事件检测部 221)，其对上述摄像部基于用户的摄像指示进行摄像的摄像开始事件进行检测；延迟时间计测部(例如图5示出的延迟时间计测部222)，其计测延迟时间，该延迟时间为由上述摄像开始事件检测部检测出的摄像开始事件与由上述声音事件检测部检测出的声音事件之间的发生时间差；以及摄像时间点数据生成部(例如图5示出的摄像时间点数据生成部 223)，其生成使由上述延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由上。

18、述声音获取部输出的上述声音数据的声音信息相关联的摄像时间点数据，其中，上述摄像时间点数据存储部存储由上述摄像时间点数据生成部生成的上述摄像时间点数据。 0017 可以是，还具备摄像动作设定部(例如图6示出的摄像动作设定部231)，该摄像动作设定部基于由上述声音事件检测部检测的上述声音事件以及由上述摄像时间点数据指定部指定的上述摄像时间点数据的延迟时间，来设定上述摄像部的摄像时间点。 0018 可以是，上述摄像动作设定部将上述摄像时间点设定为上述声音事件之后的时刻。 0019 可以是，还具备延迟时间修改部(例如图7示出的延迟时间修改部241)，该延迟时间修改部在上述摄像部按照由上述摄像。

19、动作设定部设定的上述摄像时间点进行拍摄所得到的数据没有被保存到上述图像存储部的情况下，对由上述摄像时间点数据指定部指定的上述摄像时间点数据所包含的延迟时间信息进行修改。 0020 本发明的其它方式是一种信息处理装置(例如图9示出的信息处理装置100)，被安装到摄像装置，该摄像装置具备：声音获取部(例如图9示出的声音获取部102)，其将获说明书CN 103959761 A 3/12页 6 取到的声音作为声音数据而输出；以及摄像部(例如图9示出的摄像部101)，其具有根据用户的摄像指示来拍摄静止图像的功能，该信息处理装置的特征在于，具备：声音事件检测部(例如图9示出的声音事件检测部。

20、203)，其根据从上述声音获取部输出的声音数据来检测表示声音的开始或者结束的声音事件；摄像开始事件检测部(例如图9示出的摄像开始事件检测部221)，其检测基于用户的摄像指示的摄像部的摄像开始事件；延迟时间计测部 (例如图9示出的延迟时间计测部222)，其计测延迟时间，该延迟时间为由摄像开始事件检测部检测出的摄像开始事件与由声音事件检测部检测出的声音事件之间的发生时间差；摄像时间点数据生成部(例如图9示出的摄像时间点数据生成部223)，其生成使由延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由声音获取部输出的声音数据的声音信息相关联的摄像时间点数据；以及摄像时间点数据存储部。

21、(例如图9示出的摄像时间点数据存储部201)，其存储由上述摄像时间点数据生成部生成的摄像时间点数据。 0021 发明的效果 0022 根据本发明的一个方式，能够提供一种不会错过摄像时间点并且不会迫使用户花费很多劳力和时间就能够呈现用户所期望的图像的摄像装置以及信息处理装置。附图说明 0023 图1是用于说明本发明的第一实施方式的摄像装置的结构的功能框图的一例。 0024 图2是例示本发明的第一实施方式的摄像时间点数据的图。 0025 图3是用于说明本发明的第一实施方式的摄像装置的动作的流程图的一例。 0026 图4是用于说明本发明的第二实施方式的摄像装置的结构的功能框图的一例。 0027。

22、图5是用于说明本发明的第三实施方式的摄像装置的结构的功能框图的一例。 0028 图6是用于说明本发明的第四实施方式的摄像装置的结构的功能框图的一例。 0029 图7是用于说明本发明的第五实施方式的摄像装置的结构的功能框图的一例。 0030 图8是用于说明本发明的第六实施方式的摄像装置的结构的功能框图的一例。 0031 图9是用于说明本发明的第七实施方式的信息处理装置的结构的功能框图的一例。具体实施方式 0032 下面，说明本发明的第一第七实施方式。 0033 (第一实施方式) 0034 图1是用于说明第一实施方式的摄像装置10的结构的功能框图的一例。此外，设为第一实施方式的摄像装置10。

23、为拍摄静止图像的照相机。 0035 (摄像装置的结构) 0036 图1示出的结构示出安装到摄像装置10的照相机部1以及摄像系统2。照相机部 1主要为硬件结构。另外，摄像系统2由未图示的摄像装置10的存储器所保存的数据以及具有摄像装置10的未图示的CPU(Central Processing Unit：中央处理器)、存储器的公知的微型计算机构成。 0037 (照相机部1) 0038 如图1所示，照相机部1具备摄像部101、获取通过发声等产生的声音的数据(声说明书CN 103959761 A 4/12页 7 音数据)的声音获取部102、用于存储拍摄得到的图像的数据的图像存储部103以及暂。

24、时图像累积部104。此外，“发声等”除了发声以外，还包括从哨子等发出声音的器具发出的声音。 0039 (摄像部101) 0040 摄像部101由透镜、其控制部构成。摄像部101具备根据用户的摄像指示来拍摄静止图像的功能以及除了用户的摄像指示以外自动连续地拍摄静止图像的功能这两种功能。自动连续地拍摄静止图像的功能可以始终进行动作，并且也可以根据用户的指示来开始进行动作。 0041 (声音获取部102) 0042 声音获取部102对模拟输入的声音进行数字变换并进行分析，将得到的结果作为声音数据而输出。具体地说，声音获取部102具备以下结构，即，输入声音，对所输入的声音进行模拟数字变换。

25、之后，使用傅里叶变换等进行分析并设为声音数据。利用隐马尔科夫模型(以下称为“HMM”)对该声音数据进行声音识别处理，由此能够提取出预定的音素列中最近似的音素列。在第一实施方式中，作为一例，将提取出的该音素列(或者还能够假设发音符号列的情况)设为声音信息。此外，利用HMM的声音识别处理为公知的技术，因此省略更多的详细说明。第一实施方式所指的声音数据是指对声音进行模拟数字变换之后使用傅里叶变换等进行分析而得到的数据群。 0043 (图像存储部103) 0044 图像存储部103由将图像作为数据而存储的存储器以及对该存储器的动作进行控制的程序构成。 0045 图像存储部103非临时地保存。

26、由摄像部101拍摄得到的图像。具体地说，用户从摄像部101根据用户的摄像指进行拍摄所得到的静止图像、后述的暂时图像累积部104所存储的静止图像中选择出的图像等作为非临时的数据存储到图像存储部103。在图像存储部103中也可以将由摄像部101拍摄得到的静止图像的图像数据和拍摄该静止图像的时刻相对应地存储。 0046 (暂时图像累积部104) 0047 暂时图像累积部104由将图像作为数据而累积的存储器以及对该存储器的动作进行控制的程序构成。 0048 暂时图像累积部104存储有摄像部101自动进行拍摄所得到的静止图像的图像数据与进行拍摄的时刻相对应的数据。从存储器容量的观点出发，优选。

27、在固定时间之后丢弃暂时图像累积部104所存储的数据。优选考虑后述的摄像时间点数据存储部201所存储的延迟时间来设定该固定时间。 0049 例如利用照相机所内置的时钟来计测上述“进行拍摄的时刻”。 0050 此外，该“进行拍摄的时刻”可以是利用照相机所内置的时钟进行计测得到的时刻本身(绝对时刻)，也可以是以照相机启动时、摄像开始时间点作为起点的经过时间(相对时间)。 0051 另外，同样地，从存储器容量、处理量的观点出发，优选摄像部101自动进行拍摄所得到的静止图像与根据用户的摄像指示进行拍摄所得到的静止图像相比降低图像质量 (分辨率、聚焦)而存储到暂时图像累积部104。说明书C。

28、N 103959761 A 5/12页 8 0052 另外，从存储器容量、处理量的观点出发，优选摄像部101自动进行拍摄所得到的静止图像向暂时图像累积部104的存储仅在由后述的声音事件检测部203检测出声音事件之前的时刻进行存储，在检测出声音事件之后不进行存储。 0053 摄像系统2由摄像时间点数据存储部201、摄像时间点数据指定部202、声音事件检测部203、暂时图像选择部204以及图像显示部205构成。 0054 (摄像时间点数据存储部201) 0055 摄像时间点数据存储部201存储有声音信息与延迟时间信息相关联的摄像时间点数据。图2是例示摄像时间点数据的图。图2示出的摄像时间点。

29、数据由作为与延迟时间有关的信息的延迟时间信息、与声音有关的声音信息(例如音素列、发音符号列)以及其ID 编号构成。此外，在第一实施方式中，将与声音有关的声音信息和其ID编号的组设为声音识别词典数据。 0056 在图2示出的摄像时间点数据中，作为ID编号1的声音识别词典数据，存储有发出“戻”(modoote)(日语)而得到的声音信息(例如发音符号列“”(日语)，摄像时间点数据构成为使“-2秒钟”的延迟时间信息与该ID编号1对应。 0057 另外，作为ID编号2的声音识别词典数据，存储有发出“戻”(choudo modoote)(日语)而得到的声音信息(例如发音符号列“”(日语)，摄像时。

30、间点数据构成为使“-1秒钟”的延迟时间信息与该ID编号2对应。 0058 在摄像时间点数据中不仅包含延迟时间信息为负的数据还可以包含延迟时间信息为正的数据。例如，作为ID编号3的声音识别词典数据，存储有发出“”(cheese) (日语)而得到的声音信息(例如发音符号列“”(日语)，摄像时间点数据也可以构成为使“+2秒钟”的延迟时间信息与该ID编号3对应。 0059 (摄像时间点数据指定部202) 0060 根据由声音获取部102输出的声音数据以及摄像时间点数据所包含的(以ID编号关联的)声音信息，从由摄像时间点数据存储部201存储的多个摄像时间点数据中，指定包含与对由声音获取部102输。

31、出的声音数据进行声音识别处理所得的结果最近似的声音信息的一个摄像时间点数据。 0061 通过利用HMM的声音识别处理中的似然性比较等公知的方法来进行根据声音获取部102进行输出而得到的声音数据选出最近似的声音信息的声音识别处理即可，因此省略说明。 0062 (声音事件检测部203) 0063 声音事件检测部203根据声音数据来检测表示声音的开始、声音的结束、声音识别处理的开始、声音识别处理的结束中的任一个的声音事件。具体地说，声音事件检测部 203接收由声音获取部102输出的声音数据，检测声音事件以及发生声音事件的时刻。在本说明书中，将发声等的开始设为发声开始事件，将发声等的结束设为。

32、发声结束事件，将声音识别处理的开始设为声音识别处理开始事件，将声音识别处理的结束设为声音识别处理结束事件。而且，将这些发声开始事件、发声结束事件、声音识别处理开始事件以及声音识别处理结束事件一起设为声音事件。 0064 在第一实施方式中，声音事件检测部203将由声音获取部102输出的声音数据 (声音信号)的能量或者能量变化的程度首次超过第一阈值检测为发声等的开始。另外，将说明书CN 103959761 A 6/12页 9 声音信号的能量或者能量变化的程度低于第二阈值检测为发声等的结束，输出其时刻。 0065 以发声开始事件的同时或者连续固定次数检测出超过上述第一阈值为声音识别处理。

33、开始事件，并且以发声结束事件的同时或者从发声结束事件起经过固定时间之后确定了处理结果的时间点为声音识别处理结束事件，输出这些时刻。 0066 此外，作为由声音事件检测部203检测的声音事件，可举出发声开始事件、发声结束事件、声音识别处理开始事件以及声音识别处理结束事件，但是作为声音事件，优选使用发声开始事件和发声结束事件中的任一个。这是由于，在使用发声开始事件和发声结束事件中的任一个的情况下呈现用户所期望的图像的可能性更高。 0067 (暂时图像选择部204) 0068 暂时图像选择部204根据由声音事件检测部203检测的声音事件以及由摄像时间点数据指定部202指定的摄像时间点数据的。

34、延迟时间，从暂时图像累积部104中选择在声音事件之前的时刻拍摄得到的静止图像。 0069 具体地说，暂时图像选择部204选择暂时图像累积部104所包含的静止图像中的、在相对于从由声音事件检测部203检测的声音事件的时刻起仅追溯由摄像时间点数据指定部202指定的摄像时间点数据的延迟时间的时刻最近的时刻拍摄得到的静止图像。但是，并不必须仅选择在最近时刻拍摄得到的静止图像，还可以将在前后少许时刻的时刻拍摄得到的静止图像包括在内来选择静止图像。 0070 (图像显示部205) 0071 图像显示部205显示由摄像部101拍摄得到的静止图像。在图像显示部205中显示暂时图像累积部104所存储。

35、的静止图像中的、由暂时图像选择部204选择的一个或者多个静止图像。 0072 除了由暂时图像选择部204选择的图像以外，也可以一起显示暂时图像累积部 104所保存的静止图像的一部分或者全部。在进行显示时，优选按照拍摄时刻的升序或者降序来显示。 0073 图像显示部205例如具备触摸面板功能等用户用于选择所显示的静止图像的选择单元，构成为用户能够选择所显示的静止图像。而且，图像显示部205所显示的静止图像中的用户所选择的图像的数据被发送到图像存储部103，作为非临时的数据存储到图像存储部103。 0074 接着，说明上述说明的摄像装置10的动作。 0075 图3是用于说明第一实施方式的。

36、摄像装置10的动作的流程图。 0076 在摄像装置10中，首先，基于用户的系统启动指示，开始进行摄像部101的自动连续摄像(步骤S501)。 0077 通过自动连续摄像而拍摄得到的图像被存储到暂时图像累积部104(步骤S502)。 0078 当在该状态下用户发音时，由声音获取部102获取声音(步骤S503)。 0079 声音获取部102对获取到的声音进行分析，变换为声音数据，将声音数据输出到声音事件检测部203和摄像时间点数据指定部202(步骤S504)。 0080 声音事件检测部203对由声音获取部102输出的声音数据进行分析而检测声音事件及其发生时刻。将检测出的声音事件及其发生时刻发。

37、送到暂时图像选择部204(步骤 S505)。说明书CN 103959761 A 7/12页 10 0081 摄像时间点数据指定部202对由摄像时间点数据存储部201存储的摄像时间点数据所包含的声音信息以及由声音获取部102输出的声音数据进行声音识别处理(利用HMM 的对照处理)(步骤S506)。 0082 而且，在存储了包含与声音数据对应的声音信息的摄像时间点数据的情况下(步骤S506：“是”)，指定该摄像时间点数据，将所指定的摄像时间点数据的延迟时间信息发送到暂时图像选择部204(步骤S507)。 0083 此外，在没有存储包含对应的声音信息的摄像时间点数据的情况下(步骤S506。

38、： “否”)，返回到声音获取处理(步骤S503)。 0084 暂时图像选择部204基于由声音事件检测部203检测的声音事件以及由摄像时间点数据指定部202指定的摄像时间点数据的延迟时间，从暂时图像累积部104中选择在声音事件之前的时刻进行拍摄所得到的静止图像(步骤S508)。详细地说，从由暂时图像选择部204存储的静止图像中选择在与从声音事件检测部203检测的声音事件的发生时刻起仅追溯由摄像时间点数据指定部202指定的摄像时间点数据的延迟时间的时刻最近的时刻进行拍摄所得到的静止图像(以及在其前后时刻拍摄得到的数个静止图像)。 0085 图像显示部205显示由暂时图像选择部204选择的。

39、静止图像(步骤S509)。 0086 根据上述说明的第一实施方式的摄像装置10，连续地自动拍摄静止图像并存储该静止图像。而且，在比用户发出的声音事件仅提前规定的延迟时间的时刻进行拍摄所得到的静止图像被显示于图像显示部205。因此，用户通过参照图像显示部205所显示的静止图像，能够得到以发声的时间点为起点的期望时刻的静止图像。也就是说，通过采用这种结构，能够得到接近期望的摄像时间点的时刻的静止图像，因此不会错过摄像时间点并且不会迫使用户花费很多劳力和时间就能够呈现用户所期望的图像。 0087 (第二实施方式) 0088 接着，说明本发明的第二实施方式。 0089 图4是用于说明第二实施。

40、方式中的摄像装置10的结构的功能框图的一例。 0090 第二实施方式中的摄像装置10为能够适当地设定由摄像时间点数据存储部201 存储的摄像时间点数据的摄像装置。第二实施方式中的摄像装置10除了第一实施方式中的摄像装置10的结构以外，还具备延迟时间计测部211和摄像时间点数据生成部212。随着追加延迟时间计测部211和摄像时间点数据生成部212，除了摄像时间点数据存储部201 的处理的一部分有所不同以外，具有与第一实施方式中的摄像装置10相同的功能结构，因此省略相同部分的详细说明。 0091 (延迟时间计测部211) 0092 延迟时间计测部211计测延迟时间，该延迟时间为拍摄由图像显示。

41、部205显示的多个静止图像中用户所指定的静止图像的时刻与由声音事件检测部203检测出的声音事件之间的发生时间差。 0093 具体地说，在图像是拍摄由图像显示部205显示的静止图像中用户所指定的静止图像的时刻为以发生声音事件的时刻为基准而追溯3.5秒钟的时刻的图像的情况下，延迟时间计测部211对其“-3.5秒钟”这种时刻进行计测。延迟时间计测部211将计测得到的延迟时间输出到摄像时间点数据生成部212。 0094 (摄像时间点数据生成部212) 说明书CN 103959761 A 10 8/12页 11 0095 摄像时间点数据生成部212生成使由延迟时间计测部211计测得到的延迟。

42、时间与基于由声音获取部102输出的声音数据的声音信息相关联的摄像时间点数据。 0096 具体地说，在用户对声音获取部102发出“戻” (modoote)的情况下，与“戻 ”(modoote)这种发声对应的声音信息(例如发音符号列“”)从声音获取部 102被输出到摄像时间点数据生成部212，并且，由延迟时间计测部211计测得到的延迟时间(例如，“-3.5秒钟”)从延迟时间计测部211被输出到摄像时间点数据生成部212。 0097 摄像时间点数据生成部212生成使发音符号列“”与“-3.5秒钟”相关联的摄像时间点数据。所生成的摄像时间点数据被输出到摄像时间点数据存储部201，被存储到摄像时。

43、间点数据存储部201。 0098 (摄像时间点数据存储部201) 0099 该第二实施方式中的摄像时间点数据存储部201用于存储由摄像时间点数据生成部212生成的摄像时间点数据。在摄像时间点数据存储部201内已经存储有保持有与由摄像时间点数据生成部212生成的摄像时间点数据所保持的声音信息相同的声音信息的摄像时间点数据的情况下，摄像时间点数据存储部201也可以将保持有该相同的声音信息的摄像时间点数据的延迟时间信息修改为由摄像时间点数据生成部212生成的摄像时间点数据的延迟时间信息。 0100 具体地说，例如，设为在摄像时间点数据存储部201内已经存储有使作为声音信息的发音符号列“”。

44、与作为延迟时间信息的“-2.0秒钟”相关联的摄像时间点数据。并且，设为由摄像时间点数据生成部212生成的摄像时间点数据为使作为声音信息的发音符号列“”与作为延迟时间信息的“-3.5秒钟”相关联的摄像时间点数据。 0101 在该情况下，摄像时间点数据存储部201将作为声音信息的发音符号列“ ”的延迟时间信息从“-2.0秒钟”修改至“-3.5秒钟”，修改其内容。 0102 通过采用第二实施方式的结构，能够将摄像时间点数据存储部201所存储的摄像时间点数据设定为适合于各用户的适当的条件。 0103 (第三实施方式) 0104 接着，说明本发明的第三实施方式。 0105 图5是用于说明第三实施方。

45、式中的摄像装置10的结构的功能框图的一例。 0106 第三实施方式中的摄像装置10为能够适当地设定由摄像时间点数据存储部201 存储的摄像时间点数据的摄像装置。第三实施方式中的摄像装置10除了第一实施方式中的摄像装置10的结构以外，还具备摄像开始事件检测部221、延迟时间计测部222以及摄像时间点数据生成部223。随着追加摄像开始事件检测部221、延迟时间计测部222以及摄像时间点数据生成部223，除了摄像时间点数据存储部201的处理的一部分不同以外，具有与第一实施方式中的摄像装置10相同的功能结构，因此省略相同部分的详细说明。 0107 (摄像开始事件检测部221) 0108 摄像开。

46、始事件检测部221对摄像部101根据用户的摄像指示进行的摄像开始事件及其时刻进行检测。作为摄像开始事件的具体例，用户以手动方式按下摄像部101的快门等符合。 0109 (延迟时间计测部222) 0110 延迟时间计测部222计测延迟时间，该延迟时间为由摄像开始事件检测部221检说明书CN 103959761 A 11 9/12页 12 测出的摄像开始事件与由声音事件检测部203检测出的声音事件之间的发生时间差。 0111 作为具体例，在用户发出“”(cheese)起经过2秒钟之后用户以手动方式按下摄像部101的快门的情况下，由延迟时间计测部222计测作为声音事件与摄像开始事件之间。

47、的发生时间差的“2秒钟”。 0112 (摄像时间点数据生成部223) 0113 摄像时间点数据生成部223生成使由延迟时间计测部222计测得到的延迟时间与由声音获取部102输出的声音数据相关联的摄像时间点数据。 0114 具体地说，在用户对声音获取部102发出“” (cheese)的情况下，与“ ”(cheese)这种发声对应的声音信息(例如发音符号列“”)从声音获取部102被输出到摄像时间点数据生成部223。并且，由延迟时间计测部222计测得到的延迟时间(例如，“2秒钟”)从延迟时间计测部222被输出到摄像时间点数据生成部223。 0115 摄像时间点数据生成部223生成使发音符号列“。

48、”与“+2秒钟”相关联的摄像时间点数据。将所生成的摄像时间点数据存储到摄像时间点数据存储部201。 0116 (摄像时间点数据存储部201) 0117 摄像时间点数据存储部201用于存储由摄像时间点数据生成部223生成的摄像时间点数据。在摄像时间点数据存储部201内已经存储保持有与由摄像时间点数据生成部 223生成的摄像时间点数据所保持的声音信息相同的声音信息的摄像时间点数据的情况下，摄像时间点数据存储部201也可以将保持有该相同的声音信息的摄像时间点数据的延迟时间信息修改为由摄像时间点数据生成部223生成的摄像时间点数据的延迟时间信息。 0118 通过采用第三实施方式中的摄像装置10的结构，能够将由摄像时间点数据存储部201存储的摄像时间点数据设定为适合于各用户的适当的条件。 0119 (第四实施方式) 0120 接着，说明本发明的第四实施方式。 0121 第四实施方式中的摄像装置10除了第一第三实施方式中的任一个实施方式中的摄像装置10的结构以外，还具备摄像动作设定部231。 0122 在此，说明第一实施方式中的摄像装置10还具备摄像动作设定部231的情况。此外，对与第一实施方式中的摄像装置10相同的部分附加相同的附图标记而省略其详细说明。 0123 图6是用于说明第四实施方式中的摄像装置10的结构的功能框图的一例。

摘要
申请专利号：	CN201280059195.6	申请日：	2012.12.21
公开号：	CN103959761A	公开日：	2014.07.30
当前法律状态：	授权	有效性：	有权
法律详情：	授权\|\|\|实质审查的生效IPC(主分类):H04N 5/225申请日:20121221\|\|\|公开
IPC分类号：	H04N5/225; G03B15/00; G03B17/38; G10L15/14; H04N5/232; H04N9/806	主分类号：	H04N5/225
申请人：	旭化成株式会社
发明人：	冈本明浩
地址：	日本大阪府
优先权：	2012.01.06 JP 2012-001023
专利代理机构：	北京林达刘知识产权代理事务所(普通合伙) 11277	代理人：	刘新宇
PDF完整版下载：	PDF下载

内容摘要

构成摄像装置(10)，摄像装置(10)包括：暂时图像累积部(104)，其存储摄像部(101)除了用户的摄像指示以外自动连续拍摄得到的静止图像的图像数据；摄像时间点数据存储部(201)，其存储有使基于由声音获取部(102)输出的声音数据的声音信息与延迟时间信息相关联而得到的摄像时间点数据；摄像时间点数据指定部(202)，其基于上述声音数据，通过声音识别处理从上述多个摄像时间点数据中指定包含与上述声音数据对应的声音信息的摄像时间点数据；声音事件检测部(203)，其根据上述声音数据来检测表示声音的开始、声音的结束等的声音事件；以及暂时图像选择部(204)，其基于上述声音事件和上述指定的上述摄像时间点数据的延迟时间，从上述暂时图像累积部中选择在上述声音事件之前的时刻拍摄得到的静止图像。

权利要求书

权利要求书
1.  一种摄像装置，具备：声音获取部，其将获取到的声音作为声音数据而输出；以及摄像部，其具有根据用户的摄像指示来拍摄静止图像的功能以及除了用户的摄像指示以外自动拍摄静止图像的功能，该摄像装置的特征在于，还具备：
暂时图像累积部，其存储由上述摄像部自动连续拍摄得到的静止图像的图像数据；
摄像时间点数据存储部，其存储有声音信息与延迟时间信息相关联的摄像时间点数据；
摄像时间点数据指定部，其基于由上述声音获取部输出的上述声音数据，从上述摄像时间点数据存储部所存储的多个摄像时间点数据中，指定包含与由上述声音获取部输出的上述声音数据对应的声音信息的摄像时间点数据；
声音事件检测部，其根据上述声音数据来检测表示声音的开始、声音的结束、声音识别处理的开始以及声音识别处理的结束中的任一个的声音事件；以及
暂时图像选择部，其基于上述声音事件和由上述摄像时间点数据指定部指定的上述摄像时间点数据的延迟时间，从上述暂时图像累积部中选择在上述声音事件之前的时刻拍摄得到的静止图像。

2.  根据权利要求1所述的摄像装置，其特征在于，
上述声音事件检测部根据上述声音数据来检测表示声音的开始或者结束的声音事件。

3.  根据权利要求1或者2所述的摄像装置，其特征在于，还具备：
图像显示部，其显示由上述摄像部拍摄的静止图像；以及
图像存储部，其存储由上述摄像部拍摄的静止图像。

4.  根据权利要求3所述的摄像装置，其特征在于，
上述图像显示部显示上述暂时图像累积部所存储的静止图像中的、由上述暂时图像选择部选择的静止图像和在拍摄由上述暂时图像选择部选择的静止图像的时刻前后的时刻拍摄得到的静止图像。

5.  根据权利要求3或者4所述的摄像装置，其特征在于，
上述图像存储部存储用户从由上述图像显示部显示的静止图像中指定的静止图像的图像数据。

6.  根据权利要求1～5中的任一项所述的摄像装置，其特征在于，还具备：
延迟时间计测部，其计测延迟时间，该延迟时间为拍摄用户从由上述图像显示部显示的静止图像中指定的静止图像的时刻与由上述声音事件检测部检测出的声音事件之间的发生时间差；以及
摄像时间点数据生成部，其生成使由上述延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由上述声音获取部输出的上述声音数据的声音信息相关联的摄像时间点数据，
其中，上述摄像时间点数据存储部存储由上述摄像时间点数据生成部生成的上述摄像时间点数据。

7.  根据权利要求1～5中的任一项所述的摄像装置，其特征在于，还具备：
摄像开始事件检测部，其对上述摄像部基于用户的摄像指示进行摄像的摄像开始事件进行检测；
延迟时间计测部，其计测延迟时间，该延迟时间为由上述摄像开始事件检测部检测出的摄像开始事件与由上述声音事件检测部检测出的声音事件之间的发生时间差；以及
摄像时间点数据生成部，其生成使由上述延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由上述声音获取部输出的上述声音数据的声音信息相关联的摄像时间点数据，
其中，上述摄像时间点数据存储部存储由上述摄像时间点数据生成部生成的上述摄像时间点数据。

8.  根据权利要求1～7中的任一项所述的摄像装置，其特征在于，
还具备摄像动作设定部，该摄像动作设定部基于由上述声音事件检测部检测的上述声音事件以及由上述摄像时间点数据指定部指定的上述摄像时间点数据的延迟时间，来设定上述摄像部的摄像时间点。

9.  根据权利要求8所述的摄像装置，其特征在于，
上述摄像动作设定部将上述摄像时间点设定为上述声音事件之后的时刻。

10.  根据权利要求8或者9所述的摄像装置，其特征在于，
还具备延迟时间修改部，该延迟时间修改部在上述摄像部按照由上述摄像动作设定部设定的上述摄像时间点进行拍摄所得到的数据没有被保存到上述图像存储部的情况下，对由上述摄像时间点数据指定部指定的上述摄像时间点数据所包含的延迟时间信息进行修改。

11.  一种信息处理装置，被安装到摄像装置，该摄像装置具备：声音获取部，其将获取到的声音作为声音数据而输出；以及摄像部，其具有根据用户的摄像指示来拍摄静止图像的功能，该信息处理装置的特征在于，具备：
声音事件检测部，其根据从上述声音获取部输出的声音数据来检测表示声音的开始或者结束的声音事件；
摄像开始事件检测部，其检测基于用户的摄像指示的摄像部的摄像开始事件；
延迟时间计测部，其计测延迟时间，该延迟时间为由摄像开始事件检测部检测出的摄像开始事件与由声音事件检测部检测出的声音事件之间的发生时间差；
摄像时间点数据生成部，其生成使由延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由声音获取部输出的声音数据的声音信息相关联的摄像时间点数据；以及
摄像时间点数据存储部，其存储由上述摄像时间点数据生成部生成的摄像时间点数据。

说明书

说明书摄像装置以及信息处理装置
技术领域
本发明涉及一种摄像装置以及信息处理装置。
背景技术
当前，在照相机领域中，存在一种具备能够识别声音功能的照相机。这种照相机例如从识别得到的声音中提取出“はい、チーズ(hi cheese)”(日语)这种预先设定的语言。而且，在从发声提取出的语言的时间点起经过固定时间之后进行动作来自动地按下快门。
上述照相机例如记载于专利文献1。根据专利文献1所记载的发明，照相机的操作人员能够拍摄与被摄体的动作一致的自然照片。另外，专利文献1记载了以下内容，即任意地设定从发声的时间点起至按下快门为止的时间(以下，称为延迟时间)。
专利文献1：日本特开平1-191840号公报
发明内容
发明要解决的问题
然而，上述公知的照相机在从发声起经过固定时间之后的时刻开始进行拍摄。因此，在错过了摄像时间点的情况下无法应对。
作为不使摄像时间点错过的方法，可以考虑以下方法：在用户指示的时间点除了进行摄像以外还自动地拍摄静止图像，将自动拍摄得到的图像存储到存储器。但是，在该方法的情况下，用户需要从自动拍摄得到的大量图像中找出自己所期望的图像，迫使用户花费很多劳力和时间。
本发明是鉴于这一点而完成的，目的在于提供一种不会错过摄像时间点并且不会迫使用户花费很多劳力和时间就能够呈现用户所期望的图像的摄像装置以及信息处理装置。
用于解决问题的方案
本发明的一个方式是一种摄像装置，具备：声音获取部(例如图1示出的声音获取部102)，其将获取到的声音作为声音数据而输出；以及摄像部(例如图1示出的摄像部101)，其具有根据用户的摄像指示来拍摄静止图像的功能以及除了用户的摄像指示以外自动拍摄静止图像的功能，该摄像装置的特征在于，还具备：暂时图像存储部(例如图1示出的暂时图像累积部104)，其存储由上述摄像部自动连续拍摄得到的静止图像的图像数据；摄像时间点数据存储部(例如图1示出的摄像时间点数据存储部201)，其存储有声音信息与延迟时间信息相关联的摄像时间点数据；摄像时间点数据指定部(例如图1示出的摄像时间点数据指定部202)，其基于由上述声音获取部输出的上述声音数据，从上述摄像时间点数据存储部所存储的多个摄像时间点数据中，指定包含与由上述声音获取部输出的上述声音数据对应的声音信息的摄像时间点数据；声音事件检测部(例如图1示出的声音事件检测部203)，其根据上述声音数据来检测表示声音的开始、声音的结束、声音识别处理的开始以及声音识别处理的结束中的任一个的声音事件；以及暂时图像选择部(例如图1示出的暂时图像选择部204)，其基于上述声音事件和由上述摄像时间点数据指定部指定的上述摄像时间点数据的延迟时间，从上述暂时图像累积部中选择在上述声音事件之前的时刻拍摄得到的静止图像。
可以是，上述声音事件检测部根据上述声音数据来检测表示声音的开始或者结束的声音事件。
可以是，还具备：图像显示部(例如图1示出的图像显示部205)，其显示由上述摄像部拍摄的静止图像；以及图像存储部(例如图1示出的图像存储部103)，其存储由上述摄像部拍摄的静止图像。
可以是，上述图像显示部显示上述暂时图像累积部所存储的静止图像中的、由上述暂时图像选择部选择的静止图像和在拍摄由上述暂时图像选择部选择的静止图像的时刻前后的时刻拍摄得到的静止图像。
可以是，上述图像存储部存储用户从由上述图像显示部显示的静止图像中指定的静止图像的图像数据。
并且，也可以是，还具备：延迟时间计测部(例如图4示出的延迟时间计测部211)，其计测延迟时间，该延迟时间为拍摄用户从由上述图像显示部显示的静止图像中指定的静止图像的时刻与由上述声音事件检测部检测出的声音事件之间的发生时间差；以及摄像时间点数据生成部(例如图4示出的摄像时间点数据生成部212)，其生成使由上述延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由上述声音获取部输出的上述声音数据的声音信息相关联的摄像时间点数据，其中，上述摄像时间点数据存储部存储由上述摄像时间点数据生成部生成的上述摄像时间点数据。
可以是，还具备：摄像开始事件检测部(例如图5示出的摄像开始事件检测部221)，其对上述摄像部基于用户的摄像指示进行摄像的摄像开始事件进行检测；延迟时间计测部(例如图5示出的延迟时间计测部222)，其计测延迟时间，该延迟时间为由上述摄像开始事件检测部检测出的摄像开始事件与由上述声音事件检测部检测出的声音事件之间的发生时间差；以及摄像时间点数据生成部(例如图5示出的摄像时间点数据生成部223)，其生成使由上述延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由上述声音获取部输出的上述声音数据的声音信息相关联的摄像时间点数据，其中，上述摄像时间点数据存储部存储由上述摄像时间点数据生成部生成的上述摄像时间点数据。
可以是，还具备摄像动作设定部(例如图6示出的摄像动作设定部231)，该摄像动作设定部基于由上述声音事件检测部检测的上述声音事件以及由上述摄像时间点数据指定部指定的上述摄像时间点数据的延迟时间，来设定上述摄像部的摄像时间点。
可以是，上述摄像动作设定部将上述摄像时间点设定为上述声音事件之后的时刻。
可以是，还具备延迟时间修改部(例如图7示出的延迟时间修改部241)，该延迟时间修改部在上述摄像部按照由上述摄像动作设定部设定的上述摄像时间点进行拍摄所得到的数据没有被保存到上述图像存储部的情况下，对由上述摄像时间点数据指定部指定的上述摄像时间点数据所包含的延迟时间信息进行修改。
本发明的其它方式是一种信息处理装置(例如图9示出的信息处理装置100)，被安装到摄像装置，该摄像装置具备：声音获取部(例如图9示出的声音获取部102)，其将获取到的声音作为声音数据而输出；以及摄像部(例如图9示出的摄像部101)，其具有根据用户的摄像指示来拍摄静止图像的功能，该信息处理装置的特征在于，具备：声音事件检测部(例如图9示出的声音事件检测部203)，其根据从上述声音获取部输出的声音数据来检测表示声音的开始或者结束的声音事件；摄像开始事件检测部(例如图9示出的摄像开始事件检测部221)，其检测基于用户的摄像指示的摄像部的摄像开始事件；延迟时间计测部(例如图9示出的延迟时间计测部222)，其计测延迟时间，该延迟时间为由摄像开始事件检测部检测出的摄像开始事件与由声音事件检测部检测出的声音事件之间的发生时间差；摄像时间点数据生成部(例如图9示出的摄像时间点数据生成部223)，其生成使由延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由声音获取部输出的声音数据的声音信息相关联的摄像时间点数据；以及摄像时间点数据存储部(例如图9示出的摄像时间点数据存储部201)，其存储由上述摄像时间点数据生成部生成的摄像时间点数据。
发明的效果
根据本发明的一个方式，能够提供一种不会错过摄像时间点并且不会迫使用户花费很多劳力和时间就能够呈现用户所期望的图像的摄像装置以及信息处理装置。
附图说明
图1是用于说明本发明的第一实施方式的摄像装置的结构的功能框图的一例。
图2是例示本发明的第一实施方式的摄像时间点数据的图。
图3是用于说明本发明的第一实施方式的摄像装置的动作的流程图的一例。
图4是用于说明本发明的第二实施方式的摄像装置的结构的功能框图的一例。
图5是用于说明本发明的第三实施方式的摄像装置的结构的功能框图的一例。
图6是用于说明本发明的第四实施方式的摄像装置的结构的功能框图的一例。
图7是用于说明本发明的第五实施方式的摄像装置的结构的功能框图的一例。
图8是用于说明本发明的第六实施方式的摄像装置的结构的功能框图的一例。
图9是用于说明本发明的第七实施方式的信息处理装置的结构的功能框图的一例。
具体实施方式
下面，说明本发明的第一～第七实施方式。
(第一实施方式)
图1是用于说明第一实施方式的摄像装置10的结构的功能框图的一例。此外，设为第一实施方式的摄像装置10为拍摄静止图像的照相机。
(摄像装置的结构)
图1示出的结构示出安装到摄像装置10的照相机部1以及摄像系统2。照相机部1主要为硬件结构。另外，摄像系统2由未图示的摄像装置10的存储器所保存的数据以及具有摄像装置10的未图示的CPU(Central Processing Unit：中央处理器)、存储器的公知的微型计算机构成。
(照相机部1)
如图1所示，照相机部1具备摄像部101、获取通过发声等产生的声音的数据(声音数据)的声音获取部102、用于存储拍摄得到的图像的数据的图像存储部103以及暂时图像累积部104。此外，“发声等”除了发声以外，还包括从哨子等发出声音的器具发出的声音。
(摄像部101)
摄像部101由透镜、其控制部构成。摄像部101具备根据用户的摄像指示来拍摄静止图像的功能以及除了用户的摄像指示以外自动连续地拍摄静止图像的功能这两种功能。自动连续地拍摄静止图像的功能可以始终进行动作，并且也可以根据用户的指示来开始进行动作。
(声音获取部102)
声音获取部102对模拟输入的声音进行数字变换并进行分析，将得到的结果作为声音数据而输出。具体地说，声音获取部102具备以下结构，即，输入声音，对所输入的声音进行模拟数字变换之后，使用傅里叶变换等进行分析并设为声音数据。利用隐马尔科夫模型(以下称为“HMM”)对该声音数据进行声音识别处理，由此能够提取出预定的音素列中最近似的音素列。在第一实施方式中，作为一例，将提取出的该音素列(或者还能够假设发音符号列的情况)设为声音信息。此外，利用HMM的声音识别处理为公知的技术，因此省略更多的详细说明。第一实施方式所指的声音数据是指对声音进行模拟数字变换之后使用傅里叶变换等进行分析而得到的数据群。
(图像存储部103)
图像存储部103由将图像作为数据而存储的存储器以及对该存储器的动作进行控制的程序构成。
图像存储部103非临时地保存由摄像部101拍摄得到的图像。具体地说，用户从摄像部101根据用户的摄像指进行拍摄所得到的静止图像、后述的暂时图像累积部104所存储的静止图像中选择出的图像等作为非临时的数据存储到图像存储部103。在图像存储部103中也可以将由摄像部101拍摄得到的静止图像的图像数据和拍摄该静止图像的时刻相对应地存储。
(暂时图像累积部104)
暂时图像累积部104由将图像作为数据而累积的存储器以及对该存储器的动作进行控制的程序构成。
暂时图像累积部104存储有摄像部101自动进行拍摄所得到的静止图像的图像数据与进行拍摄的时刻相对应的数据。从存储器容量的观点出发，优选在固定时间之后丢弃暂时图像累积部104所存储的数据。优选考虑后述的摄像时间点数据存储部201所存储的延迟时间来设定该固定时间。
例如利用照相机所内置的时钟来计测上述“进行拍摄的时刻”。
此外，该“进行拍摄的时刻”可以是利用照相机所内置的时钟进行计测得到的时刻本身(绝对时刻)，也可以是以照相机启动时、摄像开始时间点作为起点的经过时间(相对时间)。
另外，同样地，从存储器容量、处理量的观点出发，优选摄像部101自动进行拍摄所得到的静止图像与根据用户的摄像指示进行拍摄所得到的静止图像相比降低图像质量(分辨率、聚焦)而存储到暂时图像累积部104。
另外，从存储器容量、处理量的观点出发，优选摄像部101自动进行拍摄所得到的静止图像向暂时图像累积部104的存储仅在由后述的声音事件检测部203检测出声音事件之前的时刻进行存储，在检测出声音事件之后不进行存储。
摄像系统2由摄像时间点数据存储部201、摄像时间点数据指定部202、声音事件检测部203、暂时图像选择部204以及图像显示部205构成。
(摄像时间点数据存储部201)
摄像时间点数据存储部201存储有声音信息与延迟时间信息相关联的摄像时间点数据。图2是例示摄像时间点数据的图。图2示出的摄像时间点数据由作为与延迟时间有关的信息的延迟时间信息、与声音有关的声音信息(例如音素列、发音符号列)以及其ID编号构成。此外，在第一实施方式中，将与声音有关的声音信息和其ID编号的组设为声音识别词典数据。
在图2示出的摄像时间点数据中，作为ID编号1的声音识别词典数据，存储有发出“戻って”(modoote)(日语)而得到的声音信息(例如发音符号列“もどって”(日语))，摄像时间点数据构成为使“-2秒钟”的延迟时间信息与该ID编号1对应。
另外，作为ID编号2的声音识别词典数据，存储有发出“ちょっと戻って”(choudo modoote)(日语)而得到的声音信息(例如发音符号列“ちょっともどって”(日语))，摄像时间点数据构成为使“-1秒钟”的延迟时间信息与该ID编号2对应。
在摄像时间点数据中不仅包含延迟时间信息为负的数据还可以包含延迟时间信息为正的数据。例如，作为ID编号3的声音识别词典数据，存储有发出“チーズ”(cheese)(日语)而得到的声音信息(例如发音符号列“ちいず”(日语))，摄像时间点数据也可以构成为使“+2秒钟”的延迟时间信息与该ID编号3对应。
(摄像时间点数据指定部202)
根据由声音获取部102输出的声音数据以及摄像时间点数据所包含的(以ID编号关联的)声音信息，从由摄像时间点数据存储部201存储的多个摄像时间点数据中，指定包含与对由声音获取部102输出的声音数据进行声音识别处理所得的结果最近似的声音信息的一个摄像时间点数据。
通过利用HMM的声音识别处理中的似然性比较等公知的方法来进行根据声音获取部102进行输出而得到的声音数据选出最近似的声音信息的声音识别处理即可，因此省略说明。
(声音事件检测部203)
声音事件检测部203根据声音数据来检测表示声音的开始、声音的结束、声音识别处理的开始、声音识别处理的结束中的任一个的声音事件。具体地说，声音事件检测部203接收由声音获取部102输出的声音数据，检测声音事件以及发生声音事件的时刻。在本说明书中，将发声等的开始设为发声开始事件，将发声等的结束设为发声结束事件，将声音识别处理的开始设为声音识别处理开始事件，将声音识别处理的结束设为声音识别处理结束事件。而且，将这些发声开始事件、发声结束事件、声音识别处理开始事件以及声音识别处理结束事件一起设为声音事件。
在第一实施方式中，声音事件检测部203将由声音获取部102输出的声音数据(声音信号)的能量或者能量变化的程度首次超过第一阈值检测为发声等的开始。另外，将声音信号的能量或者能量变化的程度低于第二阈值检测为发声等的结束，输出其时刻。
以发声开始事件的同时或者连续固定次数检测出超过上述第一阈值为声音识别处理开始事件，并且以发声结束事件的同时或者从发声结束事件起经过固定时间之后确定了处理结果的时间点为声音识别处理结束事件，输出这些时刻。
此外，作为由声音事件检测部203检测的声音事件，可举出发声开始事件、发声结束事件、声音识别处理开始事件以及声音识别处理结束事件，但是作为声音事件，优选使用发声开始事件和发声结束事件中的任一个。这是由于，在使用发声开始事件和发声结束事件中的任一个的情况下呈现用户所期望的图像的可能性更高。
(暂时图像选择部204)
暂时图像选择部204根据由声音事件检测部203检测的声音事件以及由摄像时间点数据指定部202指定的摄像时间点数据的延迟时间，从暂时图像累积部104中选择在声音事件之前的时刻拍摄得到的静止图像。
具体地说，暂时图像选择部204选择暂时图像累积部104所包含的静止图像中的、在相对于从由声音事件检测部203检测的声音事件的时刻起仅追溯由摄像时间点数据指定部202指定的摄像时间点数据的延迟时间的时刻最近的时刻拍摄得到的静止图像。但是，并不必须仅选择在最近时刻拍摄得到的静止图像，还可以将在前后少许时刻的时刻拍摄得到的静止图像包括在内来选择静止图像。
(图像显示部205)
图像显示部205显示由摄像部101拍摄得到的静止图像。在图像显示部 205中显示暂时图像累积部104所存储的静止图像中的、由暂时图像选择部204选择的一个或者多个静止图像。
除了由暂时图像选择部204选择的图像以外，也可以一起显示暂时图像累积部104所保存的静止图像的一部分或者全部。在进行显示时，优选按照拍摄时刻的升序或者降序来显示。
图像显示部205例如具备触摸面板功能等用户用于选择所显示的静止图像的选择单元，构成为用户能够选择所显示的静止图像。而且，图像显示部205所显示的静止图像中的用户所选择的图像的数据被发送到图像存储部103，作为非临时的数据存储到图像存储部103。
接着，说明上述说明的摄像装置10的动作。
图3是用于说明第一实施方式的摄像装置10的动作的流程图。
在摄像装置10中，首先，基于用户的系统启动指示，开始进行摄像部101的自动连续摄像(步骤S501)。
通过自动连续摄像而拍摄得到的图像被存储到暂时图像累积部104(步骤S502)。
当在该状态下用户发音时，由声音获取部102获取声音(步骤S503)。
声音获取部102对获取到的声音进行分析，变换为声音数据，将声音数据输出到声音事件检测部203和摄像时间点数据指定部202(步骤S504)。
声音事件检测部203对由声音获取部102输出的声音数据进行分析而检测声音事件及其发生时刻。将检测出的声音事件及其发生时刻发送到暂时图像选择部204(步骤S505)。
摄像时间点数据指定部202对由摄像时间点数据存储部201存储的摄像时间点数据所包含的声音信息以及由声音获取部102输出的声音数据进行声音识别处理(利用HMM的对照处理)(步骤S506)。
而且，在存储了包含与声音数据对应的声音信息的摄像时间点数据的情况下(步骤S506：“是”)，指定该摄像时间点数据，将所指定的摄像时间点数据的延迟时间信息发送到暂时图像选择部204(步骤S507)。
此外，在没有存储包含对应的声音信息的摄像时间点数据的情况下(步骤S506：“否”)，返回到声音获取处理(步骤S503)。
暂时图像选择部204基于由声音事件检测部203检测的声音事件以及由摄像时间点数据指定部202指定的摄像时间点数据的延迟时间，从暂时图像累积部104中选择在声音事件之前的时刻进行拍摄所得到的静止图像(步骤S508)。详细地说，从由暂时图像选择部204存储的静止图像中选择在与从声音事件检测部203检测的声音事件的发生时刻起仅追溯由摄像时间点数据指定部202指定的摄像时间点数据的延迟时间的时刻最近的时刻进行拍摄所得到的静止图像(以及在其前后时刻拍摄得到的数个静止图像)。
图像显示部205显示由暂时图像选择部204选择的静止图像(步骤S509)。
根据上述说明的第一实施方式的摄像装置10，连续地自动拍摄静止图像并存储该静止图像。而且，在比用户发出的声音事件仅提前规定的延迟时间的时刻进行拍摄所得到的静止图像被显示于图像显示部205。因此，用户通过参照图像显示部205所显示的静止图像，能够得到以发声的时间点为起点的期望时刻的静止图像。也就是说，通过采用这种结构，能够得到接近期望的摄像时间点的时刻的静止图像，因此不会错过摄像时间点并且不会迫使用户花费很多劳力和时间就能够呈现用户所期望的图像。
(第二实施方式)
接着，说明本发明的第二实施方式。
图4是用于说明第二实施方式中的摄像装置10的结构的功能框图的一例。
第二实施方式中的摄像装置10为能够适当地设定由摄像时间点数据存储部201存储的摄像时间点数据的摄像装置。第二实施方式中的摄像装置10除了第一实施方式中的摄像装置10的结构以外，还具备延迟时间计测部211和摄像时间点数据生成部212。随着追加延迟时间计测部211和摄像时间点数据生成部212，除了摄像时间点数据存储部201的处理的一部分有所不同以外，具有与第一实施方式中的摄像装置10相同的功能结构，因此省略相同部分的详细说明。
(延迟时间计测部211)
延迟时间计测部211计测延迟时间，该延迟时间为拍摄由图像显示部205显示的多个静止图像中用户所指定的静止图像的时刻与由声音事件检测部203检测出的声音事件之间的发生时间差。
具体地说，在图像是拍摄由图像显示部205显示的静止图像中用户所指定的静止图像的时刻为以发生声音事件的时刻为基准而追溯3.5秒钟的时刻的图像的情况下，延迟时间计测部211对其“-3.5秒钟”这种时刻进行计测。延迟时间计测部211将计测得到的延迟时间输出到摄像时间点数据生成部212。
(摄像时间点数据生成部212)
摄像时间点数据生成部212生成使由延迟时间计测部211计测得到的延迟时间与基于由声音获取部102输出的声音数据的声音信息相关联的摄像时间点数据。
具体地说，在用户对声音获取部102发出“戻って”(modoote)的情况下，与“戻って”(modoote)这种发声对应的声音信息(例如发音符号列“もどって”)从声音获取部102被输出到摄像时间点数据生成部212，并且，由延迟时间计测部211计测得到的延迟时间(例如，“-3.5秒钟”)从延迟时间计测部211被输出到摄像时间点数据生成部212。
摄像时间点数据生成部212生成使发音符号列“もどって”与“-3.5秒钟”相关联的摄像时间点数据。所生成的摄像时间点数据被输出到摄像时间点数据存储部201，被存储到摄像时间点数据存储部201。
(摄像时间点数据存储部201)
该第二实施方式中的摄像时间点数据存储部201用于存储由摄像时间点数据生成部212生成的摄像时间点数据。在摄像时间点数据存储部201内已经存储有保持有与由摄像时间点数据生成部212生成的摄像时间点数据所保持的声音信息相同的声音信息的摄像时间点数据的情况下，摄像时间点数据存储部201也可以将保持有该相同的声音信息的摄像时间点数据的延迟时间信息修改为由摄像时间点数据生成部212生成的摄像时间点数据的延迟时间信息。
具体地说，例如，设为在摄像时间点数据存储部201内已经存储有使作为声音信息的发音符号列“もどって”与作为延迟时间信息的“-2.0秒钟”相关联的摄像时间点数据。并且，设为由摄像时间点数据生成部212生成的摄像时间点数据为使作为声音信息的发音符号列“もどって”与作为延迟时间信息的“-3.5秒钟”相关联的摄像时间点数据。
在该情况下，摄像时间点数据存储部201将作为声音信息的发音符号列“もどって”的延迟时间信息从“-2.0秒钟”修改至“-3.5秒钟”，修改其内容。
通过采用第二实施方式的结构，能够将摄像时间点数据存储部201所存储的摄像时间点数据设定为适合于各用户的适当的条件。
(第三实施方式)
接着，说明本发明的第三实施方式。
图5是用于说明第三实施方式中的摄像装置10的结构的功能框图的一例。
第三实施方式中的摄像装置10为能够适当地设定由摄像时间点数据存储部201存储的摄像时间点数据的摄像装置。第三实施方式中的摄像装置10除了第一实施方式中的摄像装置10的结构以外，还具备摄像开始事件检测部221、延迟时间计测部222以及摄像时间点数据生成部223。随着追加摄像开始事件检测部221、延迟时间计测部222以及摄像时间点数据生成部223，除了摄像时间点数据存储部201的处理的一部分不同以外，具有与第一实施方式中的摄像装置10相同的功能结构，因此省略相同部分的详细说明。
(摄像开始事件检测部221)
摄像开始事件检测部221对摄像部101根据用户的摄像指示进行的摄像开始事件及其时刻进行检测。作为摄像开始事件的具体例，用户以手动方式按下摄像部101的快门等符合。
(延迟时间计测部222)
延迟时间计测部222计测延迟时间，该延迟时间为由摄像开始事件检测部221检测出的摄像开始事件与由声音事件检测部203检测出的声音事件之间的发生时间差。
作为具体例，在用户发出“チーズ”(cheese)起经过2秒钟之后用户以手动方式按下摄像部101的快门的情况下，由延迟时间计测部222计测作为声音事件与摄像开始事件之间的发生时间差的“2秒钟”。
(摄像时间点数据生成部223)
摄像时间点数据生成部223生成使由延迟时间计测部222计测得到的延迟时间与由声音获取部102输出的声音数据相关联的摄像时间点数据。
具体地说，在用户对声音获取部102发出“チーズ”(cheese)的情况下，与“チーズ”(cheese)这种发声对应的声音信息(例如发音符号列“ちいず”)从声音获取部102被输出到摄像时间点数据生成部223。并且，由延迟时间计测部222计测得到的延迟时间(例如，“2秒钟”)从延迟时间计测部222被输出到摄像时间点数据生成部223。
摄像时间点数据生成部223生成使发音符号列“ちいず”与“+2秒钟”相关联的摄像时间点数据。将所生成的摄像时间点数据存储到摄像时间点数据存储部201。
(摄像时间点数据存储部201)
摄像时间点数据存储部201用于存储由摄像时间点数据生成部223生成的摄像时间点数据。在摄像时间点数据存储部201内已经存储保持有与由摄像时间点数据生成部223生成的摄像时间点数据所保持的声音信息相同的声音信息的摄像时间点数据的情况下，摄像时间点数据存储部201也可以将保持有该相同的声音信息的摄像时间点数据的延迟时间信息修改为由摄像时间点数据生成部223生成的摄像时间点数据的延迟时间信息。
通过采用第三实施方式中的摄像装置10的结构，能够将由摄像时间点数据存储部201存储的摄像时间点数据设定为适合于各用户的适当的条件。
(第四实施方式)
接着，说明本发明的第四实施方式。
第四实施方式中的摄像装置10除了第一～第三实施方式中的任一个实施方式中的摄像装置10的结构以外，还具备摄像动作设定部231。
在此，说明第一实施方式中的摄像装置10还具备摄像动作设定部231的情况。此外，对与第一实施方式中的摄像装置10相同的部分附加相同的附图标记而省略其详细说明。
图6是用于说明第四实施方式中的摄像装置10的结构的功能框图的一例。
(摄像动作设定部231)
摄像动作设定部231基于由声音事件检测部203检测的声音事件以及由摄像时间点数据指定部202指定的摄像时间点数据的延迟时间，来设定摄像部101的摄像时间点。
以下，具体地进行说明。
在此，设为在摄像时间点数据存储部201中存储有使用户发出“チーズ”(cheese)而得到的声音信息(例如发音符号列“ちいず”)以及与该声音信息对应的延迟时间信息(例如“+2秒钟”)相对应的摄像时间点数据。
而且，当用户对声音获取部102发出“チーズ”(cheese)时，声音获取部102将与“チーズ”(cheese)对应的声音数据输出到声音事件检测部203和摄像时间点数据指定部202。
声音事件检测部203使用从声音获取部102输出的声音数据来检测声音事件及其时刻。将检测出的声音事件的时刻输出到摄像动作设定部231。
摄像时间点数据指定部202基于由声音获取部102输出的声音数据和摄像时间点数据所包含的声音信息来进行声音识别处理，从由摄像时间点数据存储部201存储的多个摄像时间点数据中指定具有最近似的声音信息的摄像时间点数据，将该摄像时间点数据所包含的延迟时间输出到摄像动作设定部231。在本具体例中，将“+2秒钟”这种延迟时间输出到摄像动作设定部231。
摄像动作设定部231对摄像部101发出指令以在从声音事件的发生时刻起经过2秒钟的时刻进行拍摄。此时，也可以对摄像部101发出指令以在从声音事件的发生时刻起经过延迟时间之后的时刻前后也进行拍摄。
在摄像动作设定部231设定摄像时间点的情况下，在由摄像时间点数据指定部202指定的摄像时间点数据的延迟时间为正的情况下，即在声音事件之后的时刻设定摄像时间点。摄像部101基于摄像动作设定部231的指令进行拍摄所得到的图像数据被存储到图像存储部103。摄像部101基于摄像动作设定部231的指令进行拍摄所得到的图像数据为用户所期望的图像的可能性高，因此优选将摄像部101基于摄像动作设定部231的指令进行拍摄所得到的图像数据设为图像质量(分辨率、聚焦)比摄像部101进行自动连续拍摄所得到的图像数据更高的数据。
通过采用第四实施方式的结构，根据声音事件，能够在适当的时间点自动地进行摄像部101的拍摄。
(第五实施方式)
接着，说明本发明的第五实施方式。
图7是用于说明第五实施方式中的摄像装置10的结构的功能框图的一例。
第五实施方式中的摄像装置10除了第四实施方式中的摄像装置10的结构以外，还具备延迟时间修改部241。随着追加延迟时间修改部241，除了图像存储部103的处理的一部分不同以外，具有与第四实施方式中的摄像装置10相同的功能结构，因此省略相同部分的详细说明。
(图像存储部103)
该第五实施方式中的图像存储部103将摄像动作设定部231设定摄像时间点并由摄像部101拍摄得到的图像作为图像数据进行累积。而且，能够检测是累积了拍摄得到的图像还是丢弃了拍摄得到的图像。
图像存储部103在并未累积图像数据而丢弃图像数据的情况下，将图像丢弃通知通知给延迟时间修改部241。
(延迟时间修改部241)
延迟时间修改部241在摄像部101根据由摄像动作设定部231设定的摄像时间点进行拍摄所得到的数据没有被累积的情况下，对由摄像时间点数据指定部202指定的摄像时间点数据所包含的延迟时间信息进行修改。详细地说，当接收到从图像存储部103输出的图像丢弃通知时，延迟时间修改部241对摄像时间点数据存储部201所存储的摄像时间点数据中的由摄像时间点数据指定部202指定的摄像时间点数据的延迟时间进行修改。
在这种结构中，拍摄得到的图像被丢弃，由此估计为延迟时间不合适。而且，基于所设定的延迟时间期间摄像部101的快门没有被用户以手动方式按下，由此估计为当前所设定的延迟时间比适当的延迟时间短，以延长摄像时间点数据的延迟时间的方式进行修改。
因此，能够将由摄像动作设定部231设定的摄像时间点设定为适合于各用户的适当的时间点。
另外，在第五实施方式中，也可以按每个摄像时间点数据来记录图像数据被丢弃或者累积的次数、频率。而且，对于所设定的延迟时间，能够设为在图像数据被丢弃的次数、频率低于阈值的情况下不对延迟时间进行修改。如果设为这种结构，则能够防止在由于与延迟时间不同的其它原因而有时图像数据被丢弃的情况下，适当设定的延迟时间被变更。
并且，例如，对于上述第五实施方式的延迟时间的延长，能够通过以固定的比率增加修改前的延迟时间、对修改前的延迟时间加上固定的时间来实现。另外，还能够根据图像数据过去被丢弃或者保存的次数、频率来变更上述固定的比率、固定的时间。也可以以图像数据被丢弃的次数越多则将固定的比率、固定的时间设定得越大的方式进行变更。
(第六实施方式)
接着，说明本发明的第六实施方式。
图8是用于说明第六实施方式中的摄像装置10的结构的功能框图的一例。
第六实施方式中的摄像装置10除了第四实施方式或者第五实施方式中的摄像装置10的结构以外，还具备图像分析部251。在此，说明在第四实施方式中的摄像装置10中追加了图像分析部251的情况。
此外，随着追加图像分析部251，除了摄像动作设定部231的处理的一部分不同以外，具有与第四实施方式中的摄像装置10相同的功能结构，因此省略相同部分的详细说明。
(图像分析部251)
图像分析部251从由摄像部101拍摄得到的图像中提取出与摄像对象的形态变化有关的形态变化信息。形态变化是指摄像对象的外观发生变化，人物的表情变化、动物的姿势变化符合形态变化。形态变化的检测在摄像装置等领域中是公知的技术，因此省略更多的说明。
图像分析部251例如在检测到人物变成笑脸时，将检测结果通知给摄像动作设定部231。
(摄像动作设定部231)
当从图像分析部251通知了人物变成笑脸时，摄像动作设定部231将摄像指示通知给摄像部101。该摄像指示相当于摄像开始指示，摄像部101开始进行拍摄。
根据这种结构，摄像动作设定部231在经过所设定的延迟时间期间，也能够检测人物变成笑脸、动物看照相机或者做动作。因此，即使在自动地设定延迟时间的情况下，摄像装置10也能够不错过经过延迟时间以前的快门良机而在适当的时间点开始进行拍摄。
(第七实施方式)
接着，说明本发明的第七实施方式。
图9是用于说明第七实施方式中的信息处理装置100的结构的功能框图的一例。
第七实施方式是与安装到摄像装置等的信息处理装置100有关的实施方式，该实施方式着眼于在第三实施方式所记载的摄像装置10中进行用于生成摄像时间点数据的处理的信息处理装置100。在图9中，对与第三实施方式中的图5示出的摄像装置10相同的部分附加相同的附图标记，省略其详细说明。
即，第七实施方式是安装到摄像装置10的信息处理装置100，该摄像装置10具备声音获取部102，其将对模拟输入的声音进行数字变换并分析所得到的结果作为声音数据而输出；以及摄像部101，其具有根据用户的摄像指示来拍摄静止图像的功能。在图9中，信息处理装置100具备：声音事件检测部203，其根据从声音获取部102输出的声音数据来检测表示声音的开始或者结束的声音事件；摄像开始事件检测部221，其检测基于用户的摄像指示进行的摄像部101的摄像开始事件；延迟时间计测部222，其计测延迟时间，该延迟时间为由摄像开始事件检测部221检测出的摄像开始事件与由声音事件检测部203检测出的声音事件之间的发生时间差；摄像时间点数据生成部223，其生成使由延迟时间计测部222计测得到的延迟时间相关的延迟时间信息与基于由声音获取部102输出的声音数据的声音信息相关联的摄像时间点数据；以及摄像时间点数据存储部201，其存储由上述摄像时间点数据生成部223生成的摄像时间点数据。
声音获取部102和摄像部101的相关说明与第一实施方式所记载的说明相同，因此省略说明。
声音事件检测部203、延迟时间计测部222、摄像时间点数据生成部223以及摄像时间点数据存储部201的相关说明与第三实施方式所记载的说明相同，因此省略说明。
通过采用第七实施方式的结构，能够将由摄像时间点数据存储部201存储的摄像时间点数据设定为适合于各用户的适当的条件。
附图标记说明
10：摄像装置；101：摄像部；102：声音获取部；103：图像存储部；104：暂时图像累积部；201：摄像时间点数据存储部；202：摄像时间点数据指定部；203：声音事件检测部；204：暂时图像选择部；205：图像显示部；211：延迟时间计测部；212：摄像时间点数据生成部；221：摄像开始事件检测部；222：延迟时间计测部；223：摄像时间点数据生成部；231：摄像动作设定部；241：延迟时间修改部；251：图像分析部。