《摄像装置以及信息处理装置.pdf》由会员分享,可在线阅读,更多相关《摄像装置以及信息处理装置.pdf(23页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103959761 A (43)申请公布日 2014.07.30 C N 1 0 3 9 5 9 7 6 1 A (21)申请号 201280059195.6 (22)申请日 2012.12.21 2012-001023 2012.01.06 JP H04N 5/225(2006.01) G03B 15/00(2006.01) G03B 17/38(2006.01) G10L 15/14(2006.01) H04N 5/232(2006.01) H04N 9/806(2006.01) (71)申请人旭化成株式会社 地址日本大阪府 (72)发明人冈本明浩 (74)专利代。
2、理机构北京林达刘知识产权代理事 务所(普通合伙) 11277 代理人刘新宇 (54) 发明名称 摄像装置以及信息处理装置 (57) 摘要 构成摄像装置(10),摄像装置(10)包括:暂 时图像累积部(104),其存储摄像部(101)除了用 户的摄像指示以外自动连续拍摄得到的静止图像 的图像数据;摄像时间点数据存储部(201),其存 储有使基于由声音获取部(102)输出的声音数据 的声音信息与延迟时间信息相关联而得到的摄像 时间点数据;摄像时间点数据指定部(202),其基 于上述声音数据,通过声音识别处理从上述多个 摄像时间点数据中指定包含与上述声音数据对应 的声音信息的摄像时间点数据;声音事件。
3、检测部 (203),其根据上述声音数据来检测表示声音的开 始、声音的结束等的声音事件;以及暂时图像选 择部(204),其基于上述声音事件和上述指定的 上述摄像时间点数据的延迟时间,从上述暂时图 像累积部中选择在上述声音事件之前的时刻拍摄 得到的静止图像。 (30)优先权数据 (85)PCT国际申请进入国家阶段日 2014.05.30 (86)PCT国际申请的申请数据 PCT/JP2012/008206 2012.12.21 (87)PCT国际申请的公布数据 WO2013/102979 JA 2013.07.11 (51)Int.Cl. 权利要求书2页 说明书12页 附图8页 (19)中华人民共。
4、和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书12页 附图8页 (10)申请公布号 CN 103959761 A CN 103959761 A 1/2页 2 1.一种摄像装置,具备:声音获取部,其将获取到的声音作为声音数据而输出;以及摄 像部,其具有根据用户的摄像指示来拍摄静止图像的功能以及除了用户的摄像指示以外自 动拍摄静止图像的功能,该摄像装置的特征在于,还具备: 暂时图像累积部,其存储由上述摄像部自动连续拍摄得到的静止图像的图像数据; 摄像时间点数据存储部,其存储有声音信息与延迟时间信息相关联的摄像时间点数 据; 摄像时间点数据指定部,其基于由上述声音获取部输出的上述声。
5、音数据,从上述摄像 时间点数据存储部所存储的多个摄像时间点数据中,指定包含与由上述声音获取部输出的 上述声音数据对应的声音信息的摄像时间点数据; 声音事件检测部,其根据上述声音数据来检测表示声音的开始、声音的结束、声音识别 处理的开始以及声音识别处理的结束中的任一个的声音事件;以及 暂时图像选择部,其基于上述声音事件和由上述摄像时间点数据指定部指定的上述摄 像时间点数据的延迟时间,从上述暂时图像累积部中选择在上述声音事件之前的时刻拍摄 得到的静止图像。 2.根据权利要求1所述的摄像装置,其特征在于, 上述声音事件检测部根据上述声音数据来检测表示声音的开始或者结束的声音事件。 3.根据权利要求1。
6、或者2所述的摄像装置,其特征在于,还具备: 图像显示部,其显示由上述摄像部拍摄的静止图像;以及 图像存储部,其存储由上述摄像部拍摄的静止图像。 4.根据权利要求3所述的摄像装置,其特征在于, 上述图像显示部显示上述暂时图像累积部所存储的静止图像中的、由上述暂时图像选 择部选择的静止图像和在拍摄由上述暂时图像选择部选择的静止图像的时刻前后的时刻 拍摄得到的静止图像。 5.根据权利要求3或者4所述的摄像装置,其特征在于, 上述图像存储部存储用户从由上述图像显示部显示的静止图像中指定的静止图像的 图像数据。 6.根据权利要求15中的任一项所述的摄像装置,其特征在于,还具备: 延迟时间计测部,其计测延。
7、迟时间,该延迟时间为拍摄用户从由上述图像显示部显示 的静止图像中指定的静止图像的时刻与由上述声音事件检测部检测出的声音事件之间的 发生时间差;以及 摄像时间点数据生成部,其生成使由上述延迟时间计测部计测得到的延迟时间相关的 延迟时间信息与基于由上述声音获取部输出的上述声音数据的声音信息相关联的摄像时 间点数据, 其中,上述摄像时间点数据存储部存储由上述摄像时间点数据生成部生成的上述摄像 时间点数据。 7.根据权利要求15中的任一项所述的摄像装置,其特征在于,还具备: 摄像开始事件检测部,其对上述摄像部基于用户的摄像指示进行摄像的摄像开始事件 进行检测; 延迟时间计测部,其计测延迟时间,该延迟时。
8、间为由上述摄像开始事件检测部检测出 权 利 要 求 书CN 103959761 A 2/2页 3 的摄像开始事件与由上述声音事件检测部检测出的声音事件之间的发生时间差;以及 摄像时间点数据生成部,其生成使由上述延迟时间计测部计测得到的延迟时间相关的 延迟时间信息与基于由上述声音获取部输出的上述声音数据的声音信息相关联的摄像时 间点数据, 其中,上述摄像时间点数据存储部存储由上述摄像时间点数据生成部生成的上述摄像 时间点数据。 8.根据权利要求17中的任一项所述的摄像装置,其特征在于, 还具备摄像动作设定部,该摄像动作设定部基于由上述声音事件检测部检测的上述声 音事件以及由上述摄像时间点数据指定。
9、部指定的上述摄像时间点数据的延迟时间,来设定 上述摄像部的摄像时间点。 9.根据权利要求8所述的摄像装置,其特征在于, 上述摄像动作设定部将上述摄像时间点设定为上述声音事件之后的时刻。 10.根据权利要求8或者9所述的摄像装置,其特征在于, 还具备延迟时间修改部,该延迟时间修改部在上述摄像部按照由上述摄像动作设定部 设定的上述摄像时间点进行拍摄所得到的数据没有被保存到上述图像存储部的情况下,对 由上述摄像时间点数据指定部指定的上述摄像时间点数据所包含的延迟时间信息进行修 改。 11.一种信息处理装置,被安装到摄像装置,该摄像装置具备:声音获取部,其将获取 到的声音作为声音数据而输出;以及摄像部。
10、,其具有根据用户的摄像指示来拍摄静止图像 的功能,该信息处理装置的特征在于,具备: 声音事件检测部,其根据从上述声音获取部输出的声音数据来检测表示声音的开始或 者结束的声音事件; 摄像开始事件检测部,其检测基于用户的摄像指示的摄像部的摄像开始事件; 延迟时间计测部,其计测延迟时间,该延迟时间为由摄像开始事件检测部检测出的摄 像开始事件与由声音事件检测部检测出的声音事件之间的发生时间差; 摄像时间点数据生成部,其生成使由延迟时间计测部计测得到的延迟时间相关的延迟 时间信息与基于由声音获取部输出的声音数据的声音信息相关联的摄像时间点数据;以及 摄像时间点数据存储部,其存储由上述摄像时间点数据生成部。
11、生成的摄像时间点数 据。 权 利 要 求 书CN 103959761 A 1/12页 4 摄像装置以及信息处理装置 技术领域 0001 本发明涉及一种摄像装置以及信息处理装置。 背景技术 0002 当前,在照相机领域中,存在一种具备能够识别声音功能的照相机。这种照相机例 如从识别得到的声音中提取出“、(hi cheese)”(日语)这种预先设定的语言。 而且,在从发声提取出的语言的时间点起经过固定时间之后进行动作来自动地按下快门。 0003 上述照相机例如记载于专利文献1。根据专利文献1所记载的发明,照相机的操作 人员能够拍摄与被摄体的动作一致的自然照片。另外,专利文献1记载了以下内容,即任意。
12、 地设定从发声的时间点起至按下快门为止的时间(以下,称为延迟时间)。 0004 专利文献1:日本特开平1-191840号公报 发明内容 0005 发明要解决的问题 0006 然而,上述公知的照相机在从发声起经过固定时间之后的时刻开始进行拍摄。因 此,在错过了摄像时间点的情况下无法应对。 0007 作为不使摄像时间点错过的方法,可以考虑以下方法:在用户指示的时间点除了 进行摄像以外还自动地拍摄静止图像,将自动拍摄得到的图像存储到存储器。但是,在该方 法的情况下,用户需要从自动拍摄得到的大量图像中找出自己所期望的图像,迫使用户花 费很多劳力和时间。 0008 本发明是鉴于这一点而完成的,目的在于提。
13、供一种不会错过摄像时间点并且不会 迫使用户花费很多劳力和时间就能够呈现用户所期望的图像的摄像装置以及信息处理装 置。 0009 用于解决问题的方案 0010 本发明的一个方式是一种摄像装置,具备:声音获取部(例如图1示出的声音获 取部102),其将获取到的声音作为声音数据而输出;以及摄像部(例如图1示出的摄像部 101),其具有根据用户的摄像指示来拍摄静止图像的功能以及除了用户的摄像指示以外自 动拍摄静止图像的功能,该摄像装置的特征在于,还具备:暂时图像存储部(例如图1示出 的暂时图像累积部104),其存储由上述摄像部自动连续拍摄得到的静止图像的图像数据; 摄像时间点数据存储部(例如图1示出的。
14、摄像时间点数据存储部201),其存储有声音信息 与延迟时间信息相关联的摄像时间点数据;摄像时间点数据指定部(例如图1示出的摄像 时间点数据指定部202),其基于由上述声音获取部输出的上述声音数据,从上述摄像时间 点数据存储部所存储的多个摄像时间点数据中,指定包含与由上述声音获取部输出的上述 声音数据对应的声音信息的摄像时间点数据;声音事件检测部(例如图1示出的声音事件 检测部203),其根据上述声音数据来检测表示声音的开始、声音的结束、声音识别处理的开 始以及声音识别处理的结束中的任一个的声音事件;以及暂时图像选择部(例如图1示出 说 明 书CN 103959761 A 2/12页 5 的暂时。
15、图像选择部204),其基于上述声音事件和由上述摄像时间点数据指定部指定的上述 摄像时间点数据的延迟时间,从上述暂时图像累积部中选择在上述声音事件之前的时刻拍 摄得到的静止图像。 0011 可以是,上述声音事件检测部根据上述声音数据来检测表示声音的开始或者结束 的声音事件。 0012 可以是,还具备:图像显示部(例如图1示出的图像显示部205),其显示由上述摄 像部拍摄的静止图像;以及图像存储部(例如图1示出的图像存储部103),其存储由上述 摄像部拍摄的静止图像。 0013 可以是,上述图像显示部显示上述暂时图像累积部所存储的静止图像中的、由上 述暂时图像选择部选择的静止图像和在拍摄由上述暂时。
16、图像选择部选择的静止图像的时 刻前后的时刻拍摄得到的静止图像。 0014 可以是,上述图像存储部存储用户从由上述图像显示部显示的静止图像中指定的 静止图像的图像数据。 0015 并且,也可以是,还具备:延迟时间计测部(例如图4示出的延迟时间计测部 211),其计测延迟时间,该延迟时间为拍摄用户从由上述图像显示部显示的静止图像中指 定的静止图像的时刻与由上述声音事件检测部检测出的声音事件之间的发生时间差;以及 摄像时间点数据生成部(例如图4示出的摄像时间点数据生成部212),其生成使由上述延 迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由上述声音获取部输出的 上述声音数据的声音信息相关。
17、联的摄像时间点数据,其中,上述摄像时间点数据存储部存 储由上述摄像时间点数据生成部生成的上述摄像时间点数据。 0016 可以是,还具备:摄像开始事件检测部(例如图5示出的摄像开始事件检测部 221),其对上述摄像部基于用户的摄像指示进行摄像的摄像开始事件进行检测;延迟时间 计测部(例如图5示出的延迟时间计测部222),其计测延迟时间,该延迟时间为由上述摄 像开始事件检测部检测出的摄像开始事件与由上述声音事件检测部检测出的声音事件之 间的发生时间差;以及摄像时间点数据生成部(例如图5示出的摄像时间点数据生成部 223),其生成使由上述延迟时间计测部计测得到的延迟时间相关的延迟时间信息与基于由 上。
18、述声音获取部输出的上述声音数据的声音信息相关联的摄像时间点数据,其中,上述摄 像时间点数据存储部存储由上述摄像时间点数据生成部生成的上述摄像时间点数据。 0017 可以是,还具备摄像动作设定部(例如图6示出的摄像动作设定部231),该摄像动 作设定部基于由上述声音事件检测部检测的上述声音事件以及由上述摄像时间点数据指 定部指定的上述摄像时间点数据的延迟时间,来设定上述摄像部的摄像时间点。 0018 可以是,上述摄像动作设定部将上述摄像时间点设定为上述声音事件之后的时 刻。 0019 可以是,还具备延迟时间修改部(例如图7示出的延迟时间修改部241),该延迟时 间修改部在上述摄像部按照由上述摄像。
19、动作设定部设定的上述摄像时间点进行拍摄所得 到的数据没有被保存到上述图像存储部的情况下,对由上述摄像时间点数据指定部指定的 上述摄像时间点数据所包含的延迟时间信息进行修改。 0020 本发明的其它方式是一种信息处理装置(例如图9示出的信息处理装置100),被 安装到摄像装置,该摄像装置具备:声音获取部(例如图9示出的声音获取部102),其将获 说 明 书CN 103959761 A 3/12页 6 取到的声音作为声音数据而输出;以及摄像部(例如图9示出的摄像部101),其具有根据 用户的摄像指示来拍摄静止图像的功能,该信息处理装置的特征在于,具备:声音事件检测 部(例如图9示出的声音事件检测部。
20、203),其根据从上述声音获取部输出的声音数据来检 测表示声音的开始或者结束的声音事件;摄像开始事件检测部(例如图9示出的摄像开始 事件检测部221),其检测基于用户的摄像指示的摄像部的摄像开始事件;延迟时间计测部 (例如图9示出的延迟时间计测部222),其计测延迟时间,该延迟时间为由摄像开始事件检 测部检测出的摄像开始事件与由声音事件检测部检测出的声音事件之间的发生时间差;摄 像时间点数据生成部(例如图9示出的摄像时间点数据生成部223),其生成使由延迟时间 计测部计测得到的延迟时间相关的延迟时间信息与基于由声音获取部输出的声音数据的 声音信息相关联的摄像时间点数据;以及摄像时间点数据存储部。
21、(例如图9示出的摄像时 间点数据存储部201),其存储由上述摄像时间点数据生成部生成的摄像时间点数据。 0021 发明的效果 0022 根据本发明的一个方式,能够提供一种不会错过摄像时间点并且不会迫使用户花 费很多劳力和时间就能够呈现用户所期望的图像的摄像装置以及信息处理装置。 附图说明 0023 图1是用于说明本发明的第一实施方式的摄像装置的结构的功能框图的一例。 0024 图2是例示本发明的第一实施方式的摄像时间点数据的图。 0025 图3是用于说明本发明的第一实施方式的摄像装置的动作的流程图的一例。 0026 图4是用于说明本发明的第二实施方式的摄像装置的结构的功能框图的一例。 0027。
22、 图5是用于说明本发明的第三实施方式的摄像装置的结构的功能框图的一例。 0028 图6是用于说明本发明的第四实施方式的摄像装置的结构的功能框图的一例。 0029 图7是用于说明本发明的第五实施方式的摄像装置的结构的功能框图的一例。 0030 图8是用于说明本发明的第六实施方式的摄像装置的结构的功能框图的一例。 0031 图9是用于说明本发明的第七实施方式的信息处理装置的结构的功能框图的一 例。 具体实施方式 0032 下面,说明本发明的第一第七实施方式。 0033 (第一实施方式) 0034 图1是用于说明第一实施方式的摄像装置10的结构的功能框图的一例。此外,设 为第一实施方式的摄像装置10。
23、为拍摄静止图像的照相机。 0035 (摄像装置的结构) 0036 图1示出的结构示出安装到摄像装置10的照相机部1以及摄像系统2。照相机部 1主要为硬件结构。另外,摄像系统2由未图示的摄像装置10的存储器所保存的数据以及 具有摄像装置10的未图示的CPU(Central Processing Unit:中央处理器)、存储器的公知 的微型计算机构成。 0037 (照相机部1) 0038 如图1所示,照相机部1具备摄像部101、获取通过发声等产生的声音的数据(声 说 明 书CN 103959761 A 4/12页 7 音数据)的声音获取部102、用于存储拍摄得到的图像的数据的图像存储部103以及暂。
24、时 图像累积部104。此外,“发声等”除了发声以外,还包括从哨子等发出声音的器具发出的声 音。 0039 (摄像部101) 0040 摄像部101由透镜、其控制部构成。摄像部101具备根据用户的摄像指示来拍摄静 止图像的功能以及除了用户的摄像指示以外自动连续地拍摄静止图像的功能这两种功能。 自动连续地拍摄静止图像的功能可以始终进行动作,并且也可以根据用户的指示来开始进 行动作。 0041 (声音获取部102) 0042 声音获取部102对模拟输入的声音进行数字变换并进行分析,将得到的结果作为 声音数据而输出。具体地说,声音获取部102具备以下结构,即,输入声音,对所输入的声音 进行模拟数字变换。
25、之后,使用傅里叶变换等进行分析并设为声音数据。利用隐马尔科夫模 型(以下称为“HMM”)对该声音数据进行声音识别处理,由此能够提取出预定的音素列中最 近似的音素列。在第一实施方式中,作为一例,将提取出的该音素列(或者还能够假设发音 符号列的情况)设为声音信息。此外,利用HMM的声音识别处理为公知的技术,因此省略更 多的详细说明。第一实施方式所指的声音数据是指对声音进行模拟数字变换之后使用傅里 叶变换等进行分析而得到的数据群。 0043 (图像存储部103) 0044 图像存储部103由将图像作为数据而存储的存储器以及对该存储器的动作进行 控制的程序构成。 0045 图像存储部103非临时地保存。
26、由摄像部101拍摄得到的图像。具体地说,用户从 摄像部101根据用户的摄像指进行拍摄所得到的静止图像、后述的暂时图像累积部104所 存储的静止图像中选择出的图像等作为非临时的数据存储到图像存储部103。在图像存储 部103中也可以将由摄像部101拍摄得到的静止图像的图像数据和拍摄该静止图像的时刻 相对应地存储。 0046 (暂时图像累积部104) 0047 暂时图像累积部104由将图像作为数据而累积的存储器以及对该存储器的动作 进行控制的程序构成。 0048 暂时图像累积部104存储有摄像部101自动进行拍摄所得到的静止图像的图像数 据与进行拍摄的时刻相对应的数据。从存储器容量的观点出发,优选。
27、在固定时间之后丢弃 暂时图像累积部104所存储的数据。优选考虑后述的摄像时间点数据存储部201所存储的 延迟时间来设定该固定时间。 0049 例如利用照相机所内置的时钟来计测上述“进行拍摄的时刻”。 0050 此外,该“进行拍摄的时刻”可以是利用照相机所内置的时钟进行计测得到的时刻 本身(绝对时刻),也可以是以照相机启动时、摄像开始时间点作为起点的经过时间(相对 时间)。 0051 另外,同样地,从存储器容量、处理量的观点出发,优选摄像部101自动进行拍摄 所得到的静止图像与根据用户的摄像指示进行拍摄所得到的静止图像相比降低图像质量 (分辨率、聚焦)而存储到暂时图像累积部104。 说 明 书C。
28、N 103959761 A 5/12页 8 0052 另外,从存储器容量、处理量的观点出发,优选摄像部101自动进行拍摄所得到的 静止图像向暂时图像累积部104的存储仅在由后述的声音事件检测部203检测出声音事件 之前的时刻进行存储,在检测出声音事件之后不进行存储。 0053 摄像系统2由摄像时间点数据存储部201、摄像时间点数据指定部202、声音事件 检测部203、暂时图像选择部204以及图像显示部205构成。 0054 (摄像时间点数据存储部201) 0055 摄像时间点数据存储部201存储有声音信息与延迟时间信息相关联的摄像时间 点数据。图2是例示摄像时间点数据的图。图2示出的摄像时间点。
29、数据由作为与延迟时间 有关的信息的延迟时间信息、与声音有关的声音信息(例如音素列、发音符号列)以及其ID 编号构成。此外,在第一实施方式中,将与声音有关的声音信息和其ID编号的组设为声音 识别词典数据。 0056 在图2示出的摄像时间点数据中,作为ID编号1的声音识别词典数据,存储有发 出“戻”(modoote)(日语)而得到的声音信息(例如发音符号列“”(日语), 摄像时间点数据构成为使“-2秒钟”的延迟时间信息与该ID编号1对应。 0057 另外,作为ID编号2的声音识别词典数据,存储有发出“戻”(choudo modoote)(日语)而得到的声音信息(例如发音符号列“”(日语),摄 像时。
30、间点数据构成为使“-1秒钟”的延迟时间信息与该ID编号2对应。 0058 在摄像时间点数据中不仅包含延迟时间信息为负的数据还可以包含延迟时间信 息为正的数据。例如,作为ID编号3的声音识别词典数据,存储有发出“”(cheese) (日语)而得到的声音信息(例如发音符号列“”(日语),摄像时间点数据也可以 构成为使“+2秒钟”的延迟时间信息与该ID编号3对应。 0059 (摄像时间点数据指定部202) 0060 根据由声音获取部102输出的声音数据以及摄像时间点数据所包含的(以ID编 号关联的)声音信息,从由摄像时间点数据存储部201存储的多个摄像时间点数据中,指定 包含与对由声音获取部102输。
31、出的声音数据进行声音识别处理所得的结果最近似的声音 信息的一个摄像时间点数据。 0061 通过利用HMM的声音识别处理中的似然性比较等公知的方法来进行根据声音获 取部102进行输出而得到的声音数据选出最近似的声音信息的声音识别处理即可,因此省 略说明。 0062 (声音事件检测部203) 0063 声音事件检测部203根据声音数据来检测表示声音的开始、声音的结束、声音识 别处理的开始、声音识别处理的结束中的任一个的声音事件。具体地说,声音事件检测部 203接收由声音获取部102输出的声音数据,检测声音事件以及发生声音事件的时刻。在本 说明书中,将发声等的开始设为发声开始事件,将发声等的结束设为。
32、发声结束事件,将声音 识别处理的开始设为声音识别处理开始事件,将声音识别处理的结束设为声音识别处理结 束事件。而且,将这些发声开始事件、发声结束事件、声音识别处理开始事件以及声音识别 处理结束事件一起设为声音事件。 0064 在第一实施方式中,声音事件检测部203将由声音获取部102输出的声音数据 (声音信号)的能量或者能量变化的程度首次超过第一阈值检测为发声等的开始。另外,将 说 明 书CN 103959761 A 6/12页 9 声音信号的能量或者能量变化的程度低于第二阈值检测为发声等的结束,输出其时刻。 0065 以发声开始事件的同时或者连续固定次数检测出超过上述第一阈值为声音识别 处理。
33、开始事件,并且以发声结束事件的同时或者从发声结束事件起经过固定时间之后确定 了处理结果的时间点为声音识别处理结束事件,输出这些时刻。 0066 此外,作为由声音事件检测部203检测的声音事件,可举出发声开始事件、发声结 束事件、声音识别处理开始事件以及声音识别处理结束事件,但是作为声音事件,优选使用 发声开始事件和发声结束事件中的任一个。这是由于,在使用发声开始事件和发声结束事 件中的任一个的情况下呈现用户所期望的图像的可能性更高。 0067 (暂时图像选择部204) 0068 暂时图像选择部204根据由声音事件检测部203检测的声音事件以及由摄像时间 点数据指定部202指定的摄像时间点数据的。
34、延迟时间,从暂时图像累积部104中选择在声 音事件之前的时刻拍摄得到的静止图像。 0069 具体地说,暂时图像选择部204选择暂时图像累积部104所包含的静止图像中的、 在相对于从由声音事件检测部203检测的声音事件的时刻起仅追溯由摄像时间点数据指 定部202指定的摄像时间点数据的延迟时间的时刻最近的时刻拍摄得到的静止图像。但 是,并不必须仅选择在最近时刻拍摄得到的静止图像,还可以将在前后少许时刻的时刻拍 摄得到的静止图像包括在内来选择静止图像。 0070 (图像显示部205) 0071 图像显示部205显示由摄像部101拍摄得到的静止图像。在图像显示部205中显 示暂时图像累积部104所存储。
35、的静止图像中的、由暂时图像选择部204选择的一个或者多 个静止图像。 0072 除了由暂时图像选择部204选择的图像以外,也可以一起显示暂时图像累积部 104所保存的静止图像的一部分或者全部。在进行显示时,优选按照拍摄时刻的升序或者降 序来显示。 0073 图像显示部205例如具备触摸面板功能等用户用于选择所显示的静止图像的选 择单元,构成为用户能够选择所显示的静止图像。而且,图像显示部205所显示的静止图像 中的用户所选择的图像的数据被发送到图像存储部103,作为非临时的数据存储到图像存 储部103。 0074 接着,说明上述说明的摄像装置10的动作。 0075 图3是用于说明第一实施方式的。
36、摄像装置10的动作的流程图。 0076 在摄像装置10中,首先,基于用户的系统启动指示,开始进行摄像部101的自动连 续摄像(步骤S501)。 0077 通过自动连续摄像而拍摄得到的图像被存储到暂时图像累积部104(步骤S502)。 0078 当在该状态下用户发音时,由声音获取部102获取声音(步骤S503)。 0079 声音获取部102对获取到的声音进行分析,变换为声音数据,将声音数据输出到 声音事件检测部203和摄像时间点数据指定部202(步骤S504)。 0080 声音事件检测部203对由声音获取部102输出的声音数据进行分析而检测声音 事件及其发生时刻。将检测出的声音事件及其发生时刻发。
37、送到暂时图像选择部204(步骤 S505)。 说 明 书CN 103959761 A 7/12页 10 0081 摄像时间点数据指定部202对由摄像时间点数据存储部201存储的摄像时间点数 据所包含的声音信息以及由声音获取部102输出的声音数据进行声音识别处理(利用HMM 的对照处理)(步骤S506)。 0082 而且,在存储了包含与声音数据对应的声音信息的摄像时间点数据的情况下(步 骤S506:“是”),指定该摄像时间点数据,将所指定的摄像时间点数据的延迟时间信息发送 到暂时图像选择部204(步骤S507)。 0083 此外,在没有存储包含对应的声音信息的摄像时间点数据的情况下(步骤S506。
38、: “否”),返回到声音获取处理(步骤S503)。 0084 暂时图像选择部204基于由声音事件检测部203检测的声音事件以及由摄像时间 点数据指定部202指定的摄像时间点数据的延迟时间,从暂时图像累积部104中选择在声 音事件之前的时刻进行拍摄所得到的静止图像(步骤S508)。详细地说,从由暂时图像选择 部204存储的静止图像中选择在与从声音事件检测部203检测的声音事件的发生时刻起仅 追溯由摄像时间点数据指定部202指定的摄像时间点数据的延迟时间的时刻最近的时刻 进行拍摄所得到的静止图像(以及在其前后时刻拍摄得到的数个静止图像)。 0085 图像显示部205显示由暂时图像选择部204选择的。
39、静止图像(步骤S509)。 0086 根据上述说明的第一实施方式的摄像装置10,连续地自动拍摄静止图像并存储该 静止图像。而且,在比用户发出的声音事件仅提前规定的延迟时间的时刻进行拍摄所得到 的静止图像被显示于图像显示部205。因此,用户通过参照图像显示部205所显示的静止 图像,能够得到以发声的时间点为起点的期望时刻的静止图像。也就是说,通过采用这种结 构,能够得到接近期望的摄像时间点的时刻的静止图像,因此不会错过摄像时间点并且不 会迫使用户花费很多劳力和时间就能够呈现用户所期望的图像。 0087 (第二实施方式) 0088 接着,说明本发明的第二实施方式。 0089 图4是用于说明第二实施。
40、方式中的摄像装置10的结构的功能框图的一例。 0090 第二实施方式中的摄像装置10为能够适当地设定由摄像时间点数据存储部201 存储的摄像时间点数据的摄像装置。第二实施方式中的摄像装置10除了第一实施方式中 的摄像装置10的结构以外,还具备延迟时间计测部211和摄像时间点数据生成部212。随 着追加延迟时间计测部211和摄像时间点数据生成部212,除了摄像时间点数据存储部201 的处理的一部分有所不同以外,具有与第一实施方式中的摄像装置10相同的功能结构,因 此省略相同部分的详细说明。 0091 (延迟时间计测部211) 0092 延迟时间计测部211计测延迟时间,该延迟时间为拍摄由图像显示。
41、部205显示的 多个静止图像中用户所指定的静止图像的时刻与由声音事件检测部203检测出的声音事 件之间的发生时间差。 0093 具体地说,在图像是拍摄由图像显示部205显示的静止图像中用户所指定的静止 图像的时刻为以发生声音事件的时刻为基准而追溯3.5秒钟的时刻的图像的情况下,延迟 时间计测部211对其“-3.5秒钟”这种时刻进行计测。延迟时间计测部211将计测得到的 延迟时间输出到摄像时间点数据生成部212。 0094 (摄像时间点数据生成部212) 说 明 书CN 103959761 A 10 8/12页 11 0095 摄像时间点数据生成部212生成使由延迟时间计测部211计测得到的延迟。
42、时间与 基于由声音获取部102输出的声音数据的声音信息相关联的摄像时间点数据。 0096 具体地说,在用户对声音获取部102发出“戻” (modoote)的情况下,与“戻 ”(modoote)这种发声对应的声音信息(例如发音符号列“”)从声音获取部 102被输出到摄像时间点数据生成部212,并且,由延迟时间计测部211计测得到的延迟时 间(例如,“-3.5秒钟”)从延迟时间计测部211被输出到摄像时间点数据生成部212。 0097 摄像时间点数据生成部212生成使发音符号列“”与“-3.5秒钟”相关联 的摄像时间点数据。所生成的摄像时间点数据被输出到摄像时间点数据存储部201,被存储 到摄像时。
43、间点数据存储部201。 0098 (摄像时间点数据存储部201) 0099 该第二实施方式中的摄像时间点数据存储部201用于存储由摄像时间点数据生 成部212生成的摄像时间点数据。在摄像时间点数据存储部201内已经存储有保持有与由 摄像时间点数据生成部212生成的摄像时间点数据所保持的声音信息相同的声音信息的 摄像时间点数据的情况下,摄像时间点数据存储部201也可以将保持有该相同的声音信息 的摄像时间点数据的延迟时间信息修改为由摄像时间点数据生成部212生成的摄像时间 点数据的延迟时间信息。 0100 具体地说,例如,设为在摄像时间点数据存储部201内已经存储有使作为声音信 息的发音符号列“”。
44、与作为延迟时间信息的“-2.0秒钟”相关联的摄像时间点数 据。并且,设为由摄像时间点数据生成部212生成的摄像时间点数据为使作为声音信息的 发音符号列“”与作为延迟时间信息的“-3.5秒钟”相关联的摄像时间点数据。 0101 在该情况下,摄像时间点数据存储部201将作为声音信息的发音符号列“ ”的延迟时间信息从“-2.0秒钟”修改至“-3.5秒钟”,修改其内容。 0102 通过采用第二实施方式的结构,能够将摄像时间点数据存储部201所存储的摄像 时间点数据设定为适合于各用户的适当的条件。 0103 (第三实施方式) 0104 接着,说明本发明的第三实施方式。 0105 图5是用于说明第三实施方。
45、式中的摄像装置10的结构的功能框图的一例。 0106 第三实施方式中的摄像装置10为能够适当地设定由摄像时间点数据存储部201 存储的摄像时间点数据的摄像装置。第三实施方式中的摄像装置10除了第一实施方式中 的摄像装置10的结构以外,还具备摄像开始事件检测部221、延迟时间计测部222以及摄像 时间点数据生成部223。随着追加摄像开始事件检测部221、延迟时间计测部222以及摄像 时间点数据生成部223,除了摄像时间点数据存储部201的处理的一部分不同以外,具有与 第一实施方式中的摄像装置10相同的功能结构,因此省略相同部分的详细说明。 0107 (摄像开始事件检测部221) 0108 摄像开。
46、始事件检测部221对摄像部101根据用户的摄像指示进行的摄像开始事件 及其时刻进行检测。作为摄像开始事件的具体例,用户以手动方式按下摄像部101的快门 等符合。 0109 (延迟时间计测部222) 0110 延迟时间计测部222计测延迟时间,该延迟时间为由摄像开始事件检测部221检 说 明 书CN 103959761 A 11 9/12页 12 测出的摄像开始事件与由声音事件检测部203检测出的声音事件之间的发生时间差。 0111 作为具体例,在用户发出“”(cheese)起经过2秒钟之后用户以手动方式按 下摄像部101的快门的情况下,由延迟时间计测部222计测作为声音事件与摄像开始事件 之间。
47、的发生时间差的“2秒钟”。 0112 (摄像时间点数据生成部223) 0113 摄像时间点数据生成部223生成使由延迟时间计测部222计测得到的延迟时间与 由声音获取部102输出的声音数据相关联的摄像时间点数据。 0114 具体地说,在用户对声音获取部102发出“” (cheese)的情况下,与“ ”(cheese)这种发声对应的声音信息(例如发音符号列“”)从声音获取部102被 输出到摄像时间点数据生成部223。并且,由延迟时间计测部222计测得到的延迟时间(例 如,“2秒钟”)从延迟时间计测部222被输出到摄像时间点数据生成部223。 0115 摄像时间点数据生成部223生成使发音符号列“。
48、”与“+2秒钟”相关联的摄 像时间点数据。将所生成的摄像时间点数据存储到摄像时间点数据存储部201。 0116 (摄像时间点数据存储部201) 0117 摄像时间点数据存储部201用于存储由摄像时间点数据生成部223生成的摄像时 间点数据。在摄像时间点数据存储部201内已经存储保持有与由摄像时间点数据生成部 223生成的摄像时间点数据所保持的声音信息相同的声音信息的摄像时间点数据的情况 下,摄像时间点数据存储部201也可以将保持有该相同的声音信息的摄像时间点数据的延 迟时间信息修改为由摄像时间点数据生成部223生成的摄像时间点数据的延迟时间信息。 0118 通过采用第三实施方式中的摄像装置10的结构,能够将由摄像时间点数据存储 部201存储的摄像时间点数据设定为适合于各用户的适当的条件。 0119 (第四实施方式) 0120 接着,说明本发明的第四实施方式。 0121 第四实施方式中的摄像装置10除了第一第三实施方式中的任一个实施方式中 的摄像装置10的结构以外,还具备摄像动作设定部231。 0122 在此,说明第一实施方式中的摄像装置10还具备摄像动作设定部231的情况。此 外,对与第一实施方式中的摄像装置10相同的部分附加相同的附图标记而省略其详细说 明。 0123 图6是用于说明第四实施方式中的摄像装置10的结构的功能框图的一例。