《一种拾音方法.pdf》由会员分享,可在线阅读,更多相关《一种拾音方法.pdf(18页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 104320729 A (43)申请公布日 2015.01.28 CN 104320729 A (21)申请号 201410528682.3 (22)申请日 2014.10.09 H04R 1/08(2006.01) G06F 3/01(2006.01) (71)申请人 深圳市金立通信设备有限公司 地址 518040 广东省深圳市福田区深南大道 7028 号时代科技大厦东座 21 楼 (72)发明人 尚岸奇 (74)专利代理机构 广州三环专利代理有限公司 44202 代理人 郝传鑫 熊永强 (54) 发明名称 一种拾音方法 (57) 摘要 本发明实施例公开了一种拾音方。
2、法, 包括 : 获 取终端捕捉到的图像信息 ; 在图像信息中获取目 标人物头像 ; 根据目标人物头像在图像信息中的 位置, 对拾音装置进行拾音控制 ; 获取通过拾音 控制后的拾音装置拾音得到的音频信号。采用本 发明实施例, 可根据目标人物头像在图像信息中 的位置, 对拾音装置进行拾音控制, 可提高拾音的 效果, 并提升用户体验。 (51)Int.Cl. 权利要求书 2 页 说明书 10 页 附图 5 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书10页 附图5页 (10)申请公布号 CN 104320729 A CN 104320729 A 1/2 页 。
3、2 1. 一种拾音方法, 其特征在于, 所述方法包括 : 获取终端捕捉到的图像信息 ; 在所述图像信息中获取目标人物头像 ; 根据所述目标人物头像在所述图像信息中的位置, 对拾音装置进行拾音控制 ; 获取通过拾音控制后的拾音装置拾音得到的音频信号。 2. 如权利要求 1 所述的方法, 其特征在于, 所述获取终端捕捉到的图像信息之后, 还包 括 : 获取用户设置的配置信息, 所述配置信息用于指示是否对所述拾音装置进行拾音控 制 ; 若检测到所述配置信息用于指示对所述拾音装置进行拾音控制, 则触发在所述图像信 息中获取目标人物头像。 3. 如权利要求 1 所述的方法, 其特征在于, 所述图像信息包。
4、括一个人物头像 ; 所述在所述图像信息中获取目标人物头像包括 : 识别所述图像信息中的人物头像 ; 将所述识别到的人物头像设定为目标人物头像。 4. 如权利要求 1 所述的方法, 其特征在于, 所述图像信息包括至少两个人物头像 ; 所述在所述图像信息中获取目标人物头像包括 : 接收用户对所述图像信息提交的目标人物头像确认指令 ; 根据所述目标人物头像确认指令, 识别所述图像信息中的目标人物头像。 5. 如权利要求 1 所述的方法, 其特征在于, 所述根据所述目标人物头像在所述图像信 息中的位置, 对拾音装置进行拾音控制包括 : 根据所述目标人物头像在所述图像信息中的位置, 确定目标拾音装置 ;。
5、 对所述确定的目标拾音装置进行拾音控制。 6. 如权利要求 5 所述的方法, 其特征在于, 所述对所述确定的目标拾音装置进行拾音 控制包括 : 控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音 ; 控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源以外 的其它音源进行噪声抑制。 7. 如权利要求 1 所述的方法, 其特征在于, 所述根据所述目标人物头像在所述图像信 息中的位置, 对拾音装置进行拾音控制包括 : 根据所述目标人物头像在所述图像信息中的位置, 调整所述拾音装置的音频参数。 8. 如权利要求 7 所述的方法, 其特征在于, 所述音频参数包括所述拾音。
6、装置的幅度, 所 述拾音装置包括第一拾音装置和第二拾音装置 ; 所述根据所述目标人物头像在所述图像信息中的位置, 调整所述拾音装置的音频参数 包括 : 根据所述目标人物头像在所述图像信息中的位置, 确定与所述目标人物头像匹配的第 一拾音装置 ; 增大所述第一拾音装置的幅度, 并减小所述第二拾音装置的幅度。 9. 如权利要求 1 所述的方法, 其特征在于, 所述获取通过拾音控制后的拾音装置拾音 权 利 要 求 书 CN 104320729 A 2 2/2 页 3 得到的音频信号包括 : 通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频 信号, 并滤除所述目标音源以外的其他。
7、音源发送的音频信号。 权 利 要 求 书 CN 104320729 A 3 1/10 页 4 一种拾音方法 技术领域 0001 本发明涉及电子技术领域, 尤其涉及一种拾音方法。 背景技术 0002 拾音就是收集声音的过程, 而在拾音过程中麦克风通常收集到不必要的声音, 以 摄影拾音为例, 终端捕捉图像信息过程中通常会出现目标音源对应的用户以外的陌生人说 话的声音, 或者所处环境中噪声源发出的干扰声等等, 将弱化目标音源发送的声音, 导致摄 影效果较差, 现有技术无法在拾音的过程中避开噪声源, 则拾取的音频信号的音质较低。 发明内容 0003 本发明实施例提供一种拾音方法, 可提高拾音的效果, 。
8、并提升用户体验。 0004 本发明实施例提供了一种拾音方法, 包括 : 0005 获取终端捕捉的图像信息 ; 0006 在所述图像信息中获取目标人物头像 ; 0007 根据所述目标人物头像在所述图像信息中的位置, 对拾音装置进行拾音控制 ; 0008 获取通过拾音控制后的拾音装置拾音得到的音频信号。 0009 实施本发明实施例, 终端可获取图像信息, 在图像信息中获取目标人物头像, 根据 目标人物头像在图像信息中的位置, 对拾音装置进行拾音控制, 获取通过拾音控制后的拾 音装置拾音得到的音频信号, 现有技术中终端不能对拾音装置进行拾音控制, 则终端在拾 音过程中会接收到目标音源以外的其他音源发。
9、送的音频信号, 音频信号的音质较差, 本发 明实施例可根据目标人物头像在图像信息中的位置, 对拾音装置进行拾音控制, 可提高拾 音的效果, 并提升用户体验。 附图说明 0010 为了更清楚地说明本发明实施例的技术方案, 下面将对实施例描述中所需要使用 的附图作简单地介绍, 显而易见地, 下面描述中的附图是本发明的一些实施例, 对于本领域 普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。 0011 图 1 是本发明第一实施例中提供的一种拾音方法的流程示意图 ; 0012 图 2 是本发明第二实施例中提供的一种拾音方法的流程示意图 ; 0013 图 3 是本发明。
10、第三实施例中提供的一种拾音方法的流程示意图 ; 0014 图 4 是本发明第一实施例中提供的一种终端的结构示意图 ; 0015 图 5 是本发明实施例中图 4 的一种人物头像获取单元的结构示意图 ; 0016 图 6 是本发明实施例中图 4 的另一种人物头像获取单元的结构示意图 ; 0017 图 7 是本发明实施例中图 4 的一种拾音控制单元的结构示意图 ; 0018 图 8 是本发明实施例中图 4 的另一种拾音控制单元的结构示意图 ; 0019 图 9 是本发明第二实施例中提供的一种终端的结构示意图 ; 说 明 书 CN 104320729 A 4 2/10 页 5 0020 图 10 是本。
11、发明实施例中提供的一种控制拾音装置进行拾音的效果示意图。 具体实施方式 0021 下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行清楚、 完 整地描述, 显然, 所描述的实施例是本发明一部分实施例, 而不是全部的实施例。基于本发 明中的实施例, 本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施 例, 都属于本发明保护的范围。 0022 本发明实施例提供了一种拾音方法, 拾音即采集声音的过程, 终端可以获取捕捉 到的图像信息, 在图像信息中获取目标人物头像, 根据目标人物头像在图像信息中的位置, 对拾音装置进行拾音控制, 获取通过拾音控制后的拾音装置拾音得到的音频。
12、信号, 本发明 实施例可提高拾音的效果, 并提升用户体验。 0023 本发明实施例提及到的终端可以包括手机、 平板电脑、 PC(personal computer, 个 人计算机 ) 或者佩戴式智能设备等具有拾音功能的终端。拾音装置可以包括麦克风或者话 筒等, 其中麦克风可以内置放大器。 0024 请参见图 1, 图 1 是本发明实施例中提供的一种拾音方法的流程示意图, 如图所示 本发明实施例中的拾音方法可以包括 : 0025 S101, 获取终端捕捉到的图像信息。 0026 终端可以获取捕捉到的图像信息, 以图 10 所示的控制拾音装置进行拾音的效果 示意图为例, 终端可以通过摄像头获取捕捉。
13、到的图像信息, 其中图像信息可以包括至少一 个人物头像。 0027 在可选实施例中, 终端获取到图像信息之后, 可以获取用户设置的配置信息, 检测 该配置信息是否用于指示对拾音装置进行拾音控制, 若该配置信息用于指示对拾音装置进 行拾音控制, 则进一步执行 S102 ; 若该配置信息用于指示不对拾音装置进行拾音控制, 则 对获取到的图像信息不进行处理。 例如, 用户需要对拾音装置进行拾音控制, 则可以预先设 置用于指示对拾音装置进行拾音控制的配置信息, 终端获取到图像信息后, 若检测到用户 设置的配置信息用于指示对拾音装置进行拾音控制, 则可以在图像信息中获取目标人物头 像。其中配置信息用于指。
14、示是否对拾音装置进行拾音控制。 0028 S102, 在图像信息中获取目标人物头像。 0029 终端获取到图像信息之后, 可以在图像信息中获取目标人物头像。 0030 在可选实施例中, 若图像信息包括一个人物头像, 则终端可以识别图像信息中的 人物头像, 并将识别到的人物头像设定为目标人物头像。 0031 在可选实施例中, 若图像信息包括至少两个人物头像, 则终端可以接收用户对图 像信息提交的目标人物头像确认指令, 根据目标人物头像确认指令识别图像信息中的目标 人物头像, 其中目标人物头像可以包括图像信息中的部分或全部人物头像。 例如, 终端检测 到图像信息包括至少两个人物头像时, 可以生成人。
15、物头像提示信息, 并在终端的显示界面 中显示该人物头像提示信息, 用户可以根据该人物头像提示信息向终端提交目标人物头像 确认指令, 终端根据目标人物头像确认指令识别图像信息中的目标人物头像。 0032 S103, 根据目标人物头像在图像信息中的位置, 对拾音装置进行拾音控制。 0033 终端可以根据目标人物头像在图像信息中的位置, 对拾音装置进行拾音控制。以 说 明 书 CN 104320729 A 5 3/10 页 6 图 10 所示的控制拾音装置进行拾音的效果示意图为例, 若检测到目标人物头像在图像信 息中的位置位于右方, 则终端可以对至少一个拾音装置进行拾音控制, 示例性的, 终端可以 。
16、根据目标人物头像在图像信息中的位置, 对拾音装置 C 进行拾音控制。 0034 在可选实施例中, 终端可以根据目标人物头像在图像信息中的位置, 确定目标拾 音装置, 并对确定的目标拾音装置进行拾音控制。确定目标拾音装置可以是在终端已有的 拾音装置中选择其中一个拾音装置进行拾音操作, 也可以是选择其中几个 ( 至少两个 ) 的 组合。另一种可选的方案, 确定目标拾音装置, 可以是调整终端已有的拾音装置的功能。进 一步可选的, 终端可以控制目标拾音装置中的至少一个拾音装置对目标人物头像进行拾 音, 并控制目标拾音装置中的其它拾音装置对目标人物头像对应的目标音源以外的其它音 源进行噪声抑制。以图 1。
17、0 为例, 终端可以根据目标人物头像在图像信息中的位置, 确定目 标拾音装置, 以调整终端已有的拾音装置的功能为例 : 其中目标拾音装置可以包括拾音装 置 A、 拾音装置 B 以及拾音装置 C, 控制拾音装置 C 对目标人物头像进行拾音, 并控制拾音装 置 A 和拾音装置 B 对目标人物头像对应的目标音源以外的其它音源进行噪声抑制 ( 拾音装 置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声 抑制 )。 0035 在可选实施例中, 终端可以根据目标人物头像在图像信息中的位置, 调整拾音装 置的音频参数, 进一步可选的, 拾音装置的音频参数可以包括拾音装置的幅度, 。
18、拾音装置 可以包括第一拾音装置和第二拾音装置, 则终端可以根据目标人物头像在图像信息中的位 置, 确定与目标人物头像匹配的第一拾音装置, 并增大第一拾音装置的幅度, 减小第二拾音 装置的幅度。以图 10 为例, 终端中的拾音装置包括拾音装置 A、 拾音装置 B 和拾音装置 C, 目标人物头像在图像信息中的位置位于右方, 则终端可以确定与目标人物头像匹配的第一 拾音装置为拾音装置C, 进而增大拾音装置C的幅度, 减小拾音装置A和拾音装置B的幅度, 本发明实施例可增强目标人物头像对应的目标音源发送的音频信号, 并抑制目标音源以外 的其他音源发送的音频信号。 0036 需要指出的是, 本发明实施例中。
19、的拾音装置包含但不局限于第一拾音装置和第二 拾音装置, 还可以包括其他拾音装置, 其中第一拾音装置可以包括至少一个拾音装置, 第二 拾音装置可以包括至少一个拾音装置, 本发明实施例中的音频参数包含但不局限于幅度, 还可以包括频率或者相位等, 具体不受本发明实施例限制。 0037 S104, 获取通过拾音控制后的拾音装置拾音得到的音频信号。 0038 终端对拾音装置进行拾音控制后, 可以获取通过拾音控制后的拾音装置拾音得到 的音频信号, 具体的, 若终端对目标拾音装置进行拾音控制, 则可以获取通过拾音控制后的 目标拾音装置拾音得到的音频信号 ; 若终端对拾音装置的音频参数进行调整, 则可以获取 。
20、通过音频参数调整后的拾音装置拾音得到的音频信号。 0039 在可选实施例中, 终端可以通过所述拾音控制后的拾音装置拾取所述目标人物头 像对应的目标音源发送的音频信号, 并滤除所述目标音源以外的其他音源发送的音频信 号, 以图 10 所示的控制拾音装置进行拾音的效果示意图为例, 目标人物头像在图像信息中 的位置位于右方, 目标人物头像与拾音装置 C 之间的距离较短, 则终端可以对拾音装置 A、 拾音装置 B 以及拾音装置 C 进行拾音控制, 获取分别通过拾音装置 A、 拾音装置 B 以及拾音 装置 C 拾音得到的音频信号, 将拾音装置 C 拾音得到的音频信号减去拾音装置 A 拾音得到 说 明 书。
21、 CN 104320729 A 6 4/10 页 7 的音频信号, 进而减去拾音装置 B 拾音得到的音频信号, 以获取目标人物头像对应的目标 音源发送的音频信号, 并滤除目标音源以外的其他音源发送的音频信号。 0040 在图 1 所示的拾音方法中, 终端获取捕捉到的图像信息, 在图像信息中获取目标 人物头像, 根据目标人物头像在图像信息中的位置, 对拾音装置进行拾音控制, 获取通过拾 音控制后的拾音装置拾音得到的音频信号, 本发明实施例可提高拾音的效果, 并提升用户 体验。 0041 请参见图 2, 图 2 是本发明第二实施例中提供的一种拾音方法的流程示意图, 如图 所示本发明实施例中的拾音方。
22、法可以包括 : 0042 S201, 获取终端捕捉到的图像信息, 其中图像信息包括一个人物头像。 0043 终端可以获取捕捉到的图像信息, 例如终端可以通过摄像头获取捕捉到的图像信 息, 其中图像信息可以包括一个人物头像。 0044 在可选实施例中, 终端获取到图像信息之后, 可以获取用户设置的配置信息, 检测 该配置信息是否用于指示对拾音装置进行拾音控制, 若该配置信息用于指示对拾音装置进 行拾音控制, 则进一步执行 S202 ; 若该配置信息用于指示不对拾音装置进行拾音控制, 则 对获取到的图像信息不进行处理。 例如, 用户需要对拾音装置进行拾音控制, 则可以预先设 置用于指示对拾音装置进。
23、行拾音控制的配置信息, 终端获取到图像信息后, 若检测到用户 设置的配置信息用于指示对拾音装置进行拾音控制, 则可以识别图像信息中的人物头像。 其中配置信息用于指示是否对拾音装置进行拾音控制。 0045 S202, 识别图像信息中的人物头像。 0046 终端获取到图像信息后, 可以识别图像信息中的人物头像。以图 10 所示的控制拾 音装置进行拾音的效果示意图为例, 终端可以通过图像处理技术对图像信息进行分析, 进 而识别图像信息中的人物头像。 0047 S203, 将识别到的人物头像设定为目标人物头像。 0048 终端识别到图像信息中的人物头像后, 可以将识别到的人物头像设定为目标人物 头像。。
24、 0049 S204, 根据目标人物头像在图像信息中的位置, 确定目标拾音装置。 0050 终端识别到目标人物头像后, 可以根据目标人物头像在图像信息中的位置, 确定 目标拾音装置。 确定目标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置 进行拾音操作, 也可以是选择其中几个 ( 至少两个 ) 的组合。以图 10 为例, 若终端检测到 目标人物头像在图像信息中的位置位于右方, 则可以根据目标人物头像在图像信息中的位 置, 确定目标拾音装置, 其中目标拾音装置可以包括拾音装置 C。 0051 S205, 对目标拾音装置进行拾音控制。 0052 终端可以对确定的目标拾音装置进行拾音控制,。
25、 具体的, 终端可以控制目标拾音 装置中的至少一个拾音装置对目标人物头像进行拾音, 例如终端确定的目标拾音装置包括 拾音装置 C 时, 可以控制拾音装置 C 对目标人物头像进行拾音。 0053 S206, 获取通过拾音控制后的目标拾音装置拾音得到的音频信号。 0054 终端对目标拾音装置进行拾音控制后, 可以获取通过拾音控制后的目标拾音装置 拾音得到的音频信号, 具体的, 终端可以获取通过拾音控制后的拾音装置 C 拾音得到的音 频信号。 说 明 书 CN 104320729 A 7 5/10 页 8 0055 在图 2 所示的拾音方法中, 终端将识别到的图像信息中的人物头像设定为目标人 物头像。
26、, 根据目标人物头像在图像信息中的位置确定目标拾音装置, 对确定的目标拾音装 置进行拾音控制, 并获取通过拾音控制后的目标拾音装置拾音得到的音频信号, 可提高拾 音的效果, 并提升用户体验。 0056 请参见图 3, 图 3 是本发明第三实施例中提供的一种拾音方法的流程示意图, 如图 所示本发明实施例中的拾音方法可以包括 : 0057 S301, 获取终端捕捉到的图像信息, 其中图像信息包括至少两个人物头像。 0058 终端可以获取捕捉到的图像信息, 例如终端可以通过摄像头获取捕捉到的图像信 息, 其中图像信息可以包括至少两个人物头像。 0059 在可选实施例中, 终端获取到图像信息之后, 可。
27、以获取用户设置的配置信息, 检测 该配置信息是否用于指示对拾音装置进行拾音控制, 若该配置信息用于指示对拾音装置进 行拾音控制, 则进一步执行 S302 ; 若该配置信息用于指示不对拾音装置进行拾音控制, 则 对获取到的图像信息不进行处理。 例如, 用户需要对拾音装置进行拾音控制, 则可以预先设 置用于指示对拾音装置进行拾音控制的配置信息, 终端获取到图像信息后, 若检测到用户 设置的配置信息用于指示对拾音装置进行拾音控制, 则可以接收用户对图像信息提交的目 标人物头像确认指令。其中配置信息用于指示是否对拾音装置进行拾音控制。 0060 S302, 接收用户对图像信息提交的目标人物头像确认指令。
28、。 0061 终端获取到的图像信息包括至少两个人物头像时, 可以接收用户对图像信息提交 的目标人物头像确认指令, 其中目标人物头像可以包括图像信息中的部分或全部人物头 像。例如, 终端检测到图像信息包括至少两个人物头像时, 可以生成人物头像提示信息, 并 在终端的显示界面中显示该人物头像提示信息, 用户可以根据该人物头像提示信息向终端 提交目标人物头像确认指令。 0062 S303, 根据目标人物头像确认指令, 识别图像信息中的目标人物头像。 0063 S304, 根据目标人物头像在图像信息中的位置, 调整拾音装置的音频参数。 0064 终端识别到目标人物头像后, 可以根据目标人物头像在图像信。
29、息中的位置, 调整 拾音装置的音频参数。可选的, 拾音装置的音频参数可以包括拾音装置的幅度, 拾音装置 可以包括第一拾音装置和第二拾音装置, 则终端可以根据目标人物头像在图像信息中的位 置, 确定与目标人物头像匹配的第一拾音装置, 并增大第一拾音装置的幅度, 减小第二拾音 装置的幅度。 以图10为例, 终端中的拾音装置包括拾音装置A和拾音装置C, 目标人物头像 在图像信息中的位置位于右方, 则终端可以确定与目标人物头像匹配的第一拾音装置为拾 音装置 C, 进而增大拾音装置 C 的幅度, 减小拾音装置 A 的幅度, 本发明实施例可增强目标 人物头像对应的目标音源发送的音频信号, 并抑制目标音源以。
30、外的其他音源发送的音频信 号。 0065 需要指出的是, 本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二 拾音装置, 还可以包括其他拾音装置, 例如拾音装置 B, 本发明实施例中的音频参数包含但 不局限于幅度, 还可以包括频率或者相位等, 具体不受本发明实施例限制。 0066 S305, 获取通过音频参数调整后的拾音装置拾音得到的音频信号。 0067 终端对拾音装置进行音频参数调整后, 可以获取通过音频参数调整后的拾音装置 拾音得到的音频信号, 具体的, 终端可以获取通过音频参数调整后的第一拾音装置拾音得 说 明 书 CN 104320729 A 8 6/10 页 9 到的音频信号,。
31、 并获取通过音频参数调整后的第二拾音装置拾音得到的音频信号。 0068 在可选实施例中, 终端可以通过所述拾音控制后的拾音装置拾取所述目标人物头 像对应的目标音源发送的音频信号, 并滤除所述目标音源以外的其他音源发送的音频信 号, 以图 10 所示的控制拾音装置进行拾音的效果示意图为例, 目标人物头像在图像信息中 的位置位于右方, 目标人物头像与拾音装置 C 之间的距离较短, 则终端可以对拾音装置 A、 拾音装置 B 以及拾音装置 C 进行拾音控制, 获取分别通过拾音装置 A、 拾音装置 B 以及拾音 装置 C 拾音得到的音频信号, 将拾音装置 C 拾音得到的音频信号减去拾音装置 A 拾音得到。
32、 的音频信号, 进而减去拾音装置 B 拾音得到的音频信号, 以获取目标人物头像对应的目标 音源发送的音频信号, 并滤除目标音源以外的其他音源发送的音频信号。 0069 在图 3 所示的拾音方法中, 终端根据用户对图像信息提交的目标人物头像确认指 令, 识别图像信息中的目标人物头像, 根据目标人物头像在图像信息中的位置, 调整拾音装 置的音频参数, 获取通过音频参数调整后的拾音装置拾音得到的音频信号, 可提高拾音的 效果, 并提升用户体验。 0070 请参见图 4, 图 4 是本发明第一实施例中提供的一种终端的结构示意图, 如图所示 本发明实施例中的终端 400 至少可以包括信息获取单元 410。
33、、 人物头像获取单元 420、 拾音 控制单元 430 以及音频信号获取单元 440, 其中 : 0071 信息获取单元 410, 用于获取捕捉到的图像信息, 以图 10 所示的控制拾音装置进 行拾音的效果示意图为例, 信息获取单元 410 可以通过摄像头获取捕捉到的图像信息, 其 中图像信息可以包括至少一个人物头像。 0072 人物头像获取单元 420, 用于在所述图像信息中获取目标人物头像。 0073 拾音控制单元 430, 用于根据所述目标人物头像在所述图像信息中的位置, 对拾音 装置进行拾音控制。以图 10 所示的控制拾音装置进行拾音的效果示意图为例, 若检测到目 标人物头像在图像信息。
34、中的位置位于右方, 则拾音控制单元 430 可以对至少一个拾音装置 进行拾音控制, 示例性的, 终端可以根据目标人物头像在图像信息中的位置, 对拾音装置 C 进行拾音控制。 0074 音频信号获取单元 440, 用于获取拾音控制后的拾音装置拾音得到的音频信号。 0075 作为一种可选的实施方式, 信息获取单元 410, 还用于获取到所述图像信息之后, 获取用户设置的配置信息, 所述配置信息用于指示是否对所述拾音装置进行拾音控制, 若 检测到所述配置信息用于指示对所述拾音装置进行拾音控制, 则触发所述人物头像获取单 元 420 在所述图像信息中获取目标人物头像。例如, 用户需要对拾音装置进行拾音。
35、控制, 则 可以预先设置用于指示对拾音装置进行拾音控制的配置信息, 信息获取单元 410 获取到图 像信息后, 若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制, 则人物头像 获取单元 420 可以在图像信息中获取目标人物头像。其中配置信息用于指示是否对拾音装 置进行拾音控制。 0076 作为一种可选的实施方式, 图像信息可以包括一个人物头像, 则本发明实施例中 的人物头像获取单元 420 可以如图 5 所示, 进一步包括 : 0077 第一识别单元 510, 用于识别所述图像信息中的人物头像。 0078 设定单元 520, 用于将所述识别到的人物头像设定为目标人物头像。 0079 作。
36、为一种可选的实施方式, 图像信息可以包括至少两个人物头像, 则本发明实施 说 明 书 CN 104320729 A 9 7/10 页 10 例中的人物头像获取单元 420 可以如图 6 所示, 进一步包括 : 0080 指令接收单元 610, 用于接收用户对所述图像信息提交的目标人物头像确认指令。 0081 第二识别单元 620, 用于根据所述目标人物头像确认指令, 识别所述图像信息中的 目标人物头像, 其中目标人物头像可以包括图像信息中的部分或全部人物头像。 0082 作为一种可选的实施方式, 本发明实施例中的拾音控制单元430可以如图7所示, 进一步包括 : 0083 第一确定单元 710。
37、, 用于根据所述目标人物头像在所述图像信息中的位置, 确定目 标拾音装置。第一确定单元 710 可以在终端已有的拾音装置中选择其中一个拾音装置进行 拾音操作, 也可以是选择其中几个 ( 至少两个 ) 的组合。另一种可选的方案, 第一确定单元 710 可以调整终端已有的拾音装置的功能。 0084 第一控制单元 720, 用于对所述第一确定单元 710 确定的目标拾音装置进行拾音 控制。 0085 进一步可选的, 第一控制单元 720, 用于控制所述目标拾音装置中的至少一个拾音 装置对所述目标人物头像进行拾音。 0086 第一控制单元 720, 还用于控制所述目标拾音装置中的其它拾音装置对所述目标。
38、 人物头像对应的目标音源以外的其它音源进行噪声抑制。 0087 以图 10 为例, 第一确定单元 710 可以根据目标人物头像在图像信息中的位置, 确 定目标拾音装置, 以调整终端已有的拾音装置的功能为例 : 其中目标拾音装置可以包括拾 音装置 A、 拾音装置 B 以及拾音装置 C, 第一控制单元 720 可以控制拾音装置 C 对目标人物 头像进行拾音, 并控制拾音装置 A 和拾音装置 B 对目标人物头像对应的目标音源以外的其 它音源进行噪声抑制 ( 拾音装置 A 和拾音装置 B 的功能调整为对目标人物头像对应的目标 音源以外的其它音源进行噪声抑制 )。 0088 作为一种可选的实施方式, 拾。
39、音控制单元 430, 用于根据所述目标人物头像在所述 图像信息中的位置, 调整所述拾音装置的音频参数。 0089 进一步可选的, 音频参数可以包括拾音装置的幅度, 拾音装置可以包括第一拾音 装置和第二拾音装置, 则本发明实施例中的拾音控制单元 430 可以如图 8 所示, 进一步包 括 : 0090 第二确定单元 810, 用于根据所述目标人物头像在所述图像信息中的位置, 确定与 所述目标人物头像匹配的第一拾音装置。 0091 第二控制单元 820, 用于增大所述第一拾音装置的幅度, 并减小所述第二拾音装置 的幅度。 0092 以图10为例, 拾音装置包括拾音装置A和拾音装置C, 目标人物头像。
40、在图像信息中 的位置位于右方, 则第二确定单元 810 可以确定与目标人物头像匹配的第一拾音装置为拾 音装置 C, 第二控制单元 820 增大拾音装置 C 的幅度, 减小拾音装置 A 的幅度。 0093 需要指出的是, 本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二 拾音装置, 还可以包括其他拾音装置, 例如拾音装置 B, 本发明实施例中的音频参数包含但 不局限于幅度, 还可以包括频率或者相位等, 具体不受本发明实施例限制。 0094 作为一种可选的实施方式, 音频信号获取单元 440, 用于通过所述拾音控制后的拾 音装置拾取所述目标人物头像对应的目标音源发送的音频信号, 并滤除所述。
41、目标音源以外 说 明 书 CN 104320729 A 10 8/10 页 11 的其他音源发送的音频信号。 0095 以图 10 所示的控制拾音装置进行拾音的效果示意图为例, 目标人物头像在图像 信息中的位置位于右方, 目标人物头像与拾音装置 C 之间的距离较短, 则拾音控制单元 430 可以对拾音装置 A、 拾音装置 B 以及拾音装置 C 进行拾音控制, 音频信号获取单元 440 获取 分别通过拾音装置 A、 拾音装置 B 以及拾音装置 C 拾音得到的音频信号, 并将拾音装置 C 拾 音得到的音频信号减去拾音装置 A 拾音得到的音频信号, 进而减去拾音装置 B 拾音得到的 音频信号, 以获。
42、取目标人物头像对应的目标音源发送的音频信号, 并滤除目标音源以外的 其他音源发送的音频信号。 0096 在图 4 所示的终端中, 人物头像获取单元 420 在信息获取单元 410 获取到的图像 信息中获取目标人物头像, 拾音控制单元 430 根据目标人物头像在图像信息中的位置, 对 拾音装置进行拾音控制, 音频信号获取单元 440 获取通过拾音控制后的拾音装置拾音得到 的音频信号, 可提高拾音的效果, 并提升用户体验。 0097 请参见图 9, 图 9 是本发明第二实施例中提供的一种终端的结构示意图, 如图 9 所 示, 该终端 900 包括 : 至少一个处理器 910, 例如 CPU, 至少。
43、一个输入装置 930, 至少一个输出 装置 940, 存储器 950, 至少一个总线 920。其中, 通信总线 920 用于实现这些组件之间的连 接通信。 例如, 输入装置930可以包括触控板或者摄像头等, 输出装置940可以包括显示屏。 存储器 950 可以是高速 RAM 存储器, 也可以是非不稳定的存储器 (non-volatile memory), 例如至少一个磁盘存储器。存储器 950 可选的还可以是至少一个位于远离前述处理器 910 的存储终端。其中处理器 910 可以结合图 4 图 8 所示的终端, 其中 : 0098 输入装置 930, 用于获取捕捉到的图像信息, 以图 10 所。
44、示的控制拾音装置进行拾 音的效果示意图为例, 输入装置 930 可以通过摄像头获取捕捉到的图像信息, 其中图像信 息可以包括至少一个人物头像。 0099 存储器 950 中存储一组程序代码, 且处理器 910 调用存储器 950 中存储的程序代 码, 用于执行以下操作 : 0100 在所述图像信息中获取目标人物头像。 0101 根据所述目标人物头像在所述图像信息中的位置, 对拾音装置进行拾音控制。以 图 10 所示的控制拾音装置进行拾音的效果示意图为例, 若检测到目标人物头像在图像信 息中的位置位于右方, 则处理器 910 可以对至少一个拾音装置进行拾音控制, 示例性的, 终 端可以根据目标人。
45、物头像在图像信息中的位置, 对拾音装置 C 进行拾音控制。 0102 获取通过拾音控制后的拾音装置拾音得到的音频信号。 0103 作为一种可选的实施方式, 输入装置930获取到所述图像信息之后, 处理器910可 以获取用户设置的配置信息, 所述配置信息用于指示是否对所述拾音装置进行拾音控制, 若检测到所述配置信息用于指示对所述拾音装置进行拾音控制, 则触发处理器 910 在所述 图像信息中获取目标人物头像。 例如, 用户需要对拾音装置进行拾音控制, 则可以预先设置 用于指示对拾音装置进行拾音控制的配置信息, 获取到图像信息后, 若检测到用户设置的 配置信息用于指示对拾音装置进行拾音控制, 则处。
46、理器 910 可以在图像信息中获取目标人 物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。 0104 作为一种可选的实施方式, 图像信息可以包括一个人物头像, 则处理器 910 获取 图像信息中的目标人物头像具体可以为 : 说 明 书 CN 104320729 A 11 9/10 页 12 0105 识别所述图像信息中的人物头像。 0106 将所述识别到的人物头像设定为目标人物头像。 0107 作为一种可选的实施方式, 图像信息可以包括至少两个人物头像, 则处理器 910 获取图像信息中的目标人物头像具体可以为 : 0108 接收用户对所述图像信息提交的目标人物头像确认指令。 0109。
47、 根据所述目标人物头像确认指令, 识别所述图像信息中的目标人物头像, 其中目 标人物头像可以包括图像信息中的部分或全部人物头像。 0110 作为一种可选的实施方式, 处理器 910 根据目标人物头像在所述图像信息中的位 置, 对拾音装置进行拾音控制具体可以为 : 0111 根据所述目标人物头像在所述图像信息中的位置, 确定目标拾音装置。确定的目 标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作, 也可以 是选择其中几个 ( 至少两个 ) 的组合。另一种可选的方案, 确定目标拾音装置, 可以是调整 终端已有的拾音装置的功能。 0112 对所述确定的目标拾音装置进行拾音控制。。
48、 0113 进一步可选的, 处理器 910 对所述确定的目标拾音装置进行拾音控制具体可以 为 : 0114 控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音。 0115 控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源 以外的其它音源进行噪声抑制。 0116 以图 10 为例, 可以根据目标人物头像在图像信息中的位置, 确定目标拾音装置, 以调整终端已有的拾音装置的功能为例 : 其中目标拾音装置可以包括拾音装置 A、 拾音装 置 B 以及拾音装置 C, 处理器 910 可以控制拾音装置 C 对目标人物头像进行拾音, 并控制拾 音装置 A 和拾音装置 B 对。
49、目标人物头像对应的目标音源以外的其它音源进行噪声抑制 ( 拾 音装置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行 噪声抑制 )。 0117 作为一种可选的实施方式, 处理器 910 根据目标人物头像在所述图像信息中的位 置, 对拾音装置进行拾音控制具体可以为 : 0118 根据所述目标人物头像在所述图像信息中的位置, 调整所述拾音装置的音频参 数。 0119 进一步可选的, 音频参数可以包括拾音装置的幅度, 拾音装置可以包括第一拾音 装置和第二拾音装置, 则处理器 910 根据所述目标人物头像在所述图像信息中的位置, 调 整所述拾音装置的音频参数具体可以为 : 0120 根据所述目标人物头像在所述图像信息中的位置, 确定与所述目标人物头像匹配 的第一拾音装置。 0121 增大所。