书签分享收藏举报版权申诉 / 18

立即下载加入VIP,免费下载

当前位置：首页 > 电学 > 电通信技术 > 一种拾音方法.pdf

一种拾音方法.pdf

上传人：a****

文档编号：4745947

上传时间：2018-11-05

格式：PDF

页数：18

大小：1.67MB

《一种拾音方法.pdf》由会员分享，可在线阅读，更多相关《一种拾音方法.pdf（18页完整版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 104320729 A (43)申请公布日 2015.01.28 CN 104320729 A (21)申请号 201410528682.3 (22)申请日 2014.10.09 H04R 1/08(2006.01) G06F 3/01(2006.01) (71)申请人深圳市金立通信设备有限公司地址 518040 广东省深圳市福田区深南大道 7028 号时代科技大厦东座 21 楼 (72)发明人尚岸奇 (74)专利代理机构广州三环专利代理有限公司 44202 代理人郝传鑫熊永强 (54) 发明名称一种拾音方法 (57) 摘要本发明实施例公开了一种拾音方。

2、法，包括：获取终端捕捉到的图像信息；在图像信息中获取目标人物头像；根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制；获取通过拾音控制后的拾音装置拾音得到的音频信号。采用本发明实施例，可根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制，可提高拾音的效果，并提升用户体验。 (51)Int.Cl. 权利要求书 2 页说明书 10 页附图 5 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书2页说明书10页附图5页 (10)申请公布号 CN 104320729 A CN 104320729 A 1/2 页。

3、2 1. 一种拾音方法，其特征在于，所述方法包括：获取终端捕捉到的图像信息；在所述图像信息中获取目标人物头像；根据所述目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制；获取通过拾音控制后的拾音装置拾音得到的音频信号。 2. 如权利要求 1 所述的方法，其特征在于，所述获取终端捕捉到的图像信息之后，还包括：获取用户设置的配置信息，所述配置信息用于指示是否对所述拾音装置进行拾音控制；若检测到所述配置信息用于指示对所述拾音装置进行拾音控制，则触发在所述图像信息中获取目标人物头像。 3. 如权利要求 1 所述的方法，其特征在于，所述图像信息包。

4、括一个人物头像；所述在所述图像信息中获取目标人物头像包括：识别所述图像信息中的人物头像；将所述识别到的人物头像设定为目标人物头像。 4. 如权利要求 1 所述的方法，其特征在于，所述图像信息包括至少两个人物头像；所述在所述图像信息中获取目标人物头像包括：接收用户对所述图像信息提交的目标人物头像确认指令；根据所述目标人物头像确认指令，识别所述图像信息中的目标人物头像。 5. 如权利要求 1 所述的方法，其特征在于，所述根据所述目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制包括：根据所述目标人物头像在所述图像信息中的位置，确定目标拾音装置；。

5、对所述确定的目标拾音装置进行拾音控制。 6. 如权利要求 5 所述的方法，其特征在于，所述对所述确定的目标拾音装置进行拾音控制包括：控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音；控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源以外的其它音源进行噪声抑制。 7. 如权利要求 1 所述的方法，其特征在于，所述根据所述目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制包括：根据所述目标人物头像在所述图像信息中的位置，调整所述拾音装置的音频参数。 8. 如权利要求 7 所述的方法，其特征在于，所述音频参数包括所述拾音。

6、装置的幅度，所述拾音装置包括第一拾音装置和第二拾音装置；所述根据所述目标人物头像在所述图像信息中的位置，调整所述拾音装置的音频参数包括：根据所述目标人物头像在所述图像信息中的位置，确定与所述目标人物头像匹配的第一拾音装置；增大所述第一拾音装置的幅度，并减小所述第二拾音装置的幅度。 9. 如权利要求 1 所述的方法，其特征在于，所述获取通过拾音控制后的拾音装置拾音权利要求书 CN 104320729 A 2 2/2 页 3 得到的音频信号包括：通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号，并滤除所述目标音源以外的其他。

7、音源发送的音频信号。权利要求书 CN 104320729 A 3 1/10 页 4 一种拾音方法技术领域 0001 本发明涉及电子技术领域，尤其涉及一种拾音方法。背景技术 0002 拾音就是收集声音的过程，而在拾音过程中麦克风通常收集到不必要的声音，以摄影拾音为例，终端捕捉图像信息过程中通常会出现目标音源对应的用户以外的陌生人说话的声音，或者所处环境中噪声源发出的干扰声等等，将弱化目标音源发送的声音，导致摄影效果较差，现有技术无法在拾音的过程中避开噪声源，则拾取的音频信号的音质较低。发明内容 0003 本发明实施例提供一种拾音方法，可提高拾音的效果，。

8、并提升用户体验。 0004 本发明实施例提供了一种拾音方法，包括： 0005 获取终端捕捉的图像信息； 0006 在所述图像信息中获取目标人物头像； 0007 根据所述目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制； 0008 获取通过拾音控制后的拾音装置拾音得到的音频信号。 0009 实施本发明实施例，终端可获取图像信息，在图像信息中获取目标人物头像，根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制，获取通过拾音控制后的拾音装置拾音得到的音频信号，现有技术中终端不能对拾音装置进行拾音控制，则终端在拾音过程中会接收到目标音源以外的其他音源发。

9、送的音频信号，音频信号的音质较差，本发明实施例可根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制，可提高拾音的效果，并提升用户体验。附图说明 0010 为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。 0011 图 1 是本发明第一实施例中提供的一种拾音方法的流程示意图； 0012 图 2 是本发明第二实施例中提供的一种拾音方法的流程示意图； 0013 图 3 是本发明。

10、第三实施例中提供的一种拾音方法的流程示意图； 0014 图 4 是本发明第一实施例中提供的一种终端的结构示意图； 0015 图 5 是本发明实施例中图 4 的一种人物头像获取单元的结构示意图； 0016 图 6 是本发明实施例中图 4 的另一种人物头像获取单元的结构示意图； 0017 图 7 是本发明实施例中图 4 的一种拾音控制单元的结构示意图； 0018 图 8 是本发明实施例中图 4 的另一种拾音控制单元的结构示意图； 0019 图 9 是本发明第二实施例中提供的一种终端的结构示意图；说明书 CN 104320729 A 4 2/10 页 5 0020 图 10 是本。

11、发明实施例中提供的一种控制拾音装置进行拾音的效果示意图。具体实施方式 0021 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。 0022 本发明实施例提供了一种拾音方法，拾音即采集声音的过程，终端可以获取捕捉到的图像信息，在图像信息中获取目标人物头像，根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制，获取通过拾音控制后的拾音装置拾音得到的音频。

12、信号，本发明实施例可提高拾音的效果，并提升用户体验。 0023 本发明实施例提及到的终端可以包括手机、平板电脑、 PC(personal computer，个人计算机 ) 或者佩戴式智能设备等具有拾音功能的终端。拾音装置可以包括麦克风或者话筒等，其中麦克风可以内置放大器。 0024 请参见图 1，图 1 是本发明实施例中提供的一种拾音方法的流程示意图，如图所示本发明实施例中的拾音方法可以包括： 0025 S101，获取终端捕捉到的图像信息。 0026 终端可以获取捕捉到的图像信息，以图 10 所示的控制拾音装置进行拾音的效果示意图为例，终端可以通过摄像头获取捕捉。

13、到的图像信息，其中图像信息可以包括至少一个人物头像。 0027 在可选实施例中，终端获取到图像信息之后，可以获取用户设置的配置信息，检测该配置信息是否用于指示对拾音装置进行拾音控制，若该配置信息用于指示对拾音装置进行拾音控制，则进一步执行 S102 ；若该配置信息用于指示不对拾音装置进行拾音控制，则对获取到的图像信息不进行处理。例如，用户需要对拾音装置进行拾音控制，则可以预先设置用于指示对拾音装置进行拾音控制的配置信息，终端获取到图像信息后，若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制，则可以在图像信息中获取目标人物头像。其中配置信息用于指。

14、示是否对拾音装置进行拾音控制。 0028 S102，在图像信息中获取目标人物头像。 0029 终端获取到图像信息之后，可以在图像信息中获取目标人物头像。 0030 在可选实施例中，若图像信息包括一个人物头像，则终端可以识别图像信息中的人物头像，并将识别到的人物头像设定为目标人物头像。 0031 在可选实施例中，若图像信息包括至少两个人物头像，则终端可以接收用户对图像信息提交的目标人物头像确认指令，根据目标人物头像确认指令识别图像信息中的目标人物头像，其中目标人物头像可以包括图像信息中的部分或全部人物头像。例如，终端检测到图像信息包括至少两个人物头像时，可以生成人。

15、物头像提示信息，并在终端的显示界面中显示该人物头像提示信息，用户可以根据该人物头像提示信息向终端提交目标人物头像确认指令，终端根据目标人物头像确认指令识别图像信息中的目标人物头像。 0032 S103，根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制。 0033 终端可以根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制。以说明书 CN 104320729 A 5 3/10 页 6 图 10 所示的控制拾音装置进行拾音的效果示意图为例，若检测到目标人物头像在图像信息中的位置位于右方，则终端可以对至少一个拾音装置进行拾音控制，示例性的，终端可以。

16、根据目标人物头像在图像信息中的位置，对拾音装置 C 进行拾音控制。 0034 在可选实施例中，终端可以根据目标人物头像在图像信息中的位置，确定目标拾音装置，并对确定的目标拾音装置进行拾音控制。确定目标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作，也可以是选择其中几个 ( 至少两个 ) 的组合。另一种可选的方案，确定目标拾音装置，可以是调整终端已有的拾音装置的功能。进一步可选的，终端可以控制目标拾音装置中的至少一个拾音装置对目标人物头像进行拾音，并控制目标拾音装置中的其它拾音装置对目标人物头像对应的目标音源以外的其它音源进行噪声抑制。以图 1。

17、0 为例，终端可以根据目标人物头像在图像信息中的位置，确定目标拾音装置，以调整终端已有的拾音装置的功能为例：其中目标拾音装置可以包括拾音装置 A、拾音装置 B 以及拾音装置 C，控制拾音装置 C 对目标人物头像进行拾音，并控制拾音装置 A 和拾音装置 B 对目标人物头像对应的目标音源以外的其它音源进行噪声抑制 ( 拾音装置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声抑制 )。 0035 在可选实施例中，终端可以根据目标人物头像在图像信息中的位置，调整拾音装置的音频参数，进一步可选的，拾音装置的音频参数可以包括拾音装置的幅度，。

18、拾音装置可以包括第一拾音装置和第二拾音装置，则终端可以根据目标人物头像在图像信息中的位置，确定与目标人物头像匹配的第一拾音装置，并增大第一拾音装置的幅度，减小第二拾音装置的幅度。以图 10 为例，终端中的拾音装置包括拾音装置 A、拾音装置 B 和拾音装置 C，目标人物头像在图像信息中的位置位于右方，则终端可以确定与目标人物头像匹配的第一拾音装置为拾音装置C，进而增大拾音装置C的幅度，减小拾音装置A和拾音装置B的幅度，本发明实施例可增强目标人物头像对应的目标音源发送的音频信号，并抑制目标音源以外的其他音源发送的音频信号。 0036 需要指出的是，本发明实施例中。

19、的拾音装置包含但不局限于第一拾音装置和第二拾音装置，还可以包括其他拾音装置，其中第一拾音装置可以包括至少一个拾音装置，第二拾音装置可以包括至少一个拾音装置，本发明实施例中的音频参数包含但不局限于幅度，还可以包括频率或者相位等，具体不受本发明实施例限制。 0037 S104，获取通过拾音控制后的拾音装置拾音得到的音频信号。 0038 终端对拾音装置进行拾音控制后，可以获取通过拾音控制后的拾音装置拾音得到的音频信号，具体的，若终端对目标拾音装置进行拾音控制，则可以获取通过拾音控制后的目标拾音装置拾音得到的音频信号；若终端对拾音装置的音频参数进行调整，则可以获取。

20、通过音频参数调整后的拾音装置拾音得到的音频信号。 0039 在可选实施例中，终端可以通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号，并滤除所述目标音源以外的其他音源发送的音频信号，以图 10 所示的控制拾音装置进行拾音的效果示意图为例，目标人物头像在图像信息中的位置位于右方，目标人物头像与拾音装置 C 之间的距离较短，则终端可以对拾音装置 A、拾音装置 B 以及拾音装置 C 进行拾音控制，获取分别通过拾音装置 A、拾音装置 B 以及拾音装置 C 拾音得到的音频信号，将拾音装置 C 拾音得到的音频信号减去拾音装置 A 拾音得到说明书。

21、 CN 104320729 A 6 4/10 页 7 的音频信号，进而减去拾音装置 B 拾音得到的音频信号，以获取目标人物头像对应的目标音源发送的音频信号，并滤除目标音源以外的其他音源发送的音频信号。 0040 在图 1 所示的拾音方法中，终端获取捕捉到的图像信息，在图像信息中获取目标人物头像，根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制，获取通过拾音控制后的拾音装置拾音得到的音频信号，本发明实施例可提高拾音的效果，并提升用户体验。 0041 请参见图 2，图 2 是本发明第二实施例中提供的一种拾音方法的流程示意图，如图所示本发明实施例中的拾音方。

22、法可以包括： 0042 S201，获取终端捕捉到的图像信息，其中图像信息包括一个人物头像。 0043 终端可以获取捕捉到的图像信息，例如终端可以通过摄像头获取捕捉到的图像信息，其中图像信息可以包括一个人物头像。 0044 在可选实施例中，终端获取到图像信息之后，可以获取用户设置的配置信息，检测该配置信息是否用于指示对拾音装置进行拾音控制，若该配置信息用于指示对拾音装置进行拾音控制，则进一步执行 S202 ；若该配置信息用于指示不对拾音装置进行拾音控制，则对获取到的图像信息不进行处理。例如，用户需要对拾音装置进行拾音控制，则可以预先设置用于指示对拾音装置进。

23、行拾音控制的配置信息，终端获取到图像信息后，若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制，则可以识别图像信息中的人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。 0045 S202，识别图像信息中的人物头像。 0046 终端获取到图像信息后，可以识别图像信息中的人物头像。以图 10 所示的控制拾音装置进行拾音的效果示意图为例，终端可以通过图像处理技术对图像信息进行分析，进而识别图像信息中的人物头像。 0047 S203，将识别到的人物头像设定为目标人物头像。 0048 终端识别到图像信息中的人物头像后，可以将识别到的人物头像设定为目标人物头像。。

24、 0049 S204，根据目标人物头像在图像信息中的位置，确定目标拾音装置。 0050 终端识别到目标人物头像后，可以根据目标人物头像在图像信息中的位置，确定目标拾音装置。确定目标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作，也可以是选择其中几个 ( 至少两个 ) 的组合。以图 10 为例，若终端检测到目标人物头像在图像信息中的位置位于右方，则可以根据目标人物头像在图像信息中的位置，确定目标拾音装置，其中目标拾音装置可以包括拾音装置 C。 0051 S205，对目标拾音装置进行拾音控制。 0052 终端可以对确定的目标拾音装置进行拾音控制，。

25、具体的，终端可以控制目标拾音装置中的至少一个拾音装置对目标人物头像进行拾音，例如终端确定的目标拾音装置包括拾音装置 C 时，可以控制拾音装置 C 对目标人物头像进行拾音。 0053 S206，获取通过拾音控制后的目标拾音装置拾音得到的音频信号。 0054 终端对目标拾音装置进行拾音控制后，可以获取通过拾音控制后的目标拾音装置拾音得到的音频信号，具体的，终端可以获取通过拾音控制后的拾音装置 C 拾音得到的音频信号。说明书 CN 104320729 A 7 5/10 页 8 0055 在图 2 所示的拾音方法中，终端将识别到的图像信息中的人物头像设定为目标人物头像。

26、，根据目标人物头像在图像信息中的位置确定目标拾音装置，对确定的目标拾音装置进行拾音控制，并获取通过拾音控制后的目标拾音装置拾音得到的音频信号，可提高拾音的效果，并提升用户体验。 0056 请参见图 3，图 3 是本发明第三实施例中提供的一种拾音方法的流程示意图，如图所示本发明实施例中的拾音方法可以包括： 0057 S301，获取终端捕捉到的图像信息，其中图像信息包括至少两个人物头像。 0058 终端可以获取捕捉到的图像信息，例如终端可以通过摄像头获取捕捉到的图像信息，其中图像信息可以包括至少两个人物头像。 0059 在可选实施例中，终端获取到图像信息之后，可。

27、以获取用户设置的配置信息，检测该配置信息是否用于指示对拾音装置进行拾音控制，若该配置信息用于指示对拾音装置进行拾音控制，则进一步执行 S302 ；若该配置信息用于指示不对拾音装置进行拾音控制，则对获取到的图像信息不进行处理。例如，用户需要对拾音装置进行拾音控制，则可以预先设置用于指示对拾音装置进行拾音控制的配置信息，终端获取到图像信息后，若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制，则可以接收用户对图像信息提交的目标人物头像确认指令。其中配置信息用于指示是否对拾音装置进行拾音控制。 0060 S302，接收用户对图像信息提交的目标人物头像确认指令。

28、。 0061 终端获取到的图像信息包括至少两个人物头像时，可以接收用户对图像信息提交的目标人物头像确认指令，其中目标人物头像可以包括图像信息中的部分或全部人物头像。例如，终端检测到图像信息包括至少两个人物头像时，可以生成人物头像提示信息，并在终端的显示界面中显示该人物头像提示信息，用户可以根据该人物头像提示信息向终端提交目标人物头像确认指令。 0062 S303，根据目标人物头像确认指令，识别图像信息中的目标人物头像。 0063 S304，根据目标人物头像在图像信息中的位置，调整拾音装置的音频参数。 0064 终端识别到目标人物头像后，可以根据目标人物头像在图像信。

29、息中的位置，调整拾音装置的音频参数。可选的，拾音装置的音频参数可以包括拾音装置的幅度，拾音装置可以包括第一拾音装置和第二拾音装置，则终端可以根据目标人物头像在图像信息中的位置，确定与目标人物头像匹配的第一拾音装置，并增大第一拾音装置的幅度，减小第二拾音装置的幅度。以图10为例，终端中的拾音装置包括拾音装置A和拾音装置C，目标人物头像在图像信息中的位置位于右方，则终端可以确定与目标人物头像匹配的第一拾音装置为拾音装置 C，进而增大拾音装置 C 的幅度，减小拾音装置 A 的幅度，本发明实施例可增强目标人物头像对应的目标音源发送的音频信号，并抑制目标音源以。

30、外的其他音源发送的音频信号。 0065 需要指出的是，本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置，还可以包括其他拾音装置，例如拾音装置 B，本发明实施例中的音频参数包含但不局限于幅度，还可以包括频率或者相位等，具体不受本发明实施例限制。 0066 S305，获取通过音频参数调整后的拾音装置拾音得到的音频信号。 0067 终端对拾音装置进行音频参数调整后，可以获取通过音频参数调整后的拾音装置拾音得到的音频信号，具体的，终端可以获取通过音频参数调整后的第一拾音装置拾音得说明书 CN 104320729 A 8 6/10 页 9 到的音频信号，。

31、并获取通过音频参数调整后的第二拾音装置拾音得到的音频信号。 0068 在可选实施例中，终端可以通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号，并滤除所述目标音源以外的其他音源发送的音频信号，以图 10 所示的控制拾音装置进行拾音的效果示意图为例，目标人物头像在图像信息中的位置位于右方，目标人物头像与拾音装置 C 之间的距离较短，则终端可以对拾音装置 A、拾音装置 B 以及拾音装置 C 进行拾音控制，获取分别通过拾音装置 A、拾音装置 B 以及拾音装置 C 拾音得到的音频信号，将拾音装置 C 拾音得到的音频信号减去拾音装置 A 拾音得到。

32、的音频信号，进而减去拾音装置 B 拾音得到的音频信号，以获取目标人物头像对应的目标音源发送的音频信号，并滤除目标音源以外的其他音源发送的音频信号。 0069 在图 3 所示的拾音方法中，终端根据用户对图像信息提交的目标人物头像确认指令，识别图像信息中的目标人物头像，根据目标人物头像在图像信息中的位置，调整拾音装置的音频参数，获取通过音频参数调整后的拾音装置拾音得到的音频信号，可提高拾音的效果，并提升用户体验。 0070 请参见图 4，图 4 是本发明第一实施例中提供的一种终端的结构示意图，如图所示本发明实施例中的终端 400 至少可以包括信息获取单元 410。

33、、人物头像获取单元 420、拾音控制单元 430 以及音频信号获取单元 440，其中： 0071 信息获取单元 410，用于获取捕捉到的图像信息，以图 10 所示的控制拾音装置进行拾音的效果示意图为例，信息获取单元 410 可以通过摄像头获取捕捉到的图像信息，其中图像信息可以包括至少一个人物头像。 0072 人物头像获取单元 420，用于在所述图像信息中获取目标人物头像。 0073 拾音控制单元 430，用于根据所述目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制。以图 10 所示的控制拾音装置进行拾音的效果示意图为例，若检测到目标人物头像在图像信息。

34、中的位置位于右方，则拾音控制单元 430 可以对至少一个拾音装置进行拾音控制，示例性的，终端可以根据目标人物头像在图像信息中的位置，对拾音装置 C 进行拾音控制。 0074 音频信号获取单元 440，用于获取拾音控制后的拾音装置拾音得到的音频信号。 0075 作为一种可选的实施方式，信息获取单元 410，还用于获取到所述图像信息之后，获取用户设置的配置信息，所述配置信息用于指示是否对所述拾音装置进行拾音控制，若检测到所述配置信息用于指示对所述拾音装置进行拾音控制，则触发所述人物头像获取单元 420 在所述图像信息中获取目标人物头像。例如，用户需要对拾音装置进行拾音。

35、控制，则可以预先设置用于指示对拾音装置进行拾音控制的配置信息，信息获取单元 410 获取到图像信息后，若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制，则人物头像获取单元 420 可以在图像信息中获取目标人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。 0076 作为一种可选的实施方式，图像信息可以包括一个人物头像，则本发明实施例中的人物头像获取单元 420 可以如图 5 所示，进一步包括： 0077 第一识别单元 510，用于识别所述图像信息中的人物头像。 0078 设定单元 520，用于将所述识别到的人物头像设定为目标人物头像。 0079 作。

36、为一种可选的实施方式，图像信息可以包括至少两个人物头像，则本发明实施说明书 CN 104320729 A 9 7/10 页 10 例中的人物头像获取单元 420 可以如图 6 所示，进一步包括： 0080 指令接收单元 610，用于接收用户对所述图像信息提交的目标人物头像确认指令。 0081 第二识别单元 620，用于根据所述目标人物头像确认指令，识别所述图像信息中的目标人物头像，其中目标人物头像可以包括图像信息中的部分或全部人物头像。 0082 作为一种可选的实施方式，本发明实施例中的拾音控制单元430可以如图7所示，进一步包括： 0083 第一确定单元 710。

37、，用于根据所述目标人物头像在所述图像信息中的位置，确定目标拾音装置。第一确定单元 710 可以在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作，也可以是选择其中几个 ( 至少两个 ) 的组合。另一种可选的方案，第一确定单元 710 可以调整终端已有的拾音装置的功能。 0084 第一控制单元 720，用于对所述第一确定单元 710 确定的目标拾音装置进行拾音控制。 0085 进一步可选的，第一控制单元 720，用于控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音。 0086 第一控制单元 720，还用于控制所述目标拾音装置中的其它拾音装置对所述目标。

38、人物头像对应的目标音源以外的其它音源进行噪声抑制。 0087 以图 10 为例，第一确定单元 710 可以根据目标人物头像在图像信息中的位置，确定目标拾音装置，以调整终端已有的拾音装置的功能为例：其中目标拾音装置可以包括拾音装置 A、拾音装置 B 以及拾音装置 C，第一控制单元 720 可以控制拾音装置 C 对目标人物头像进行拾音，并控制拾音装置 A 和拾音装置 B 对目标人物头像对应的目标音源以外的其它音源进行噪声抑制 ( 拾音装置 A 和拾音装置 B 的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声抑制 )。 0088 作为一种可选的实施方式，拾。

39、音控制单元 430，用于根据所述目标人物头像在所述图像信息中的位置，调整所述拾音装置的音频参数。 0089 进一步可选的，音频参数可以包括拾音装置的幅度，拾音装置可以包括第一拾音装置和第二拾音装置，则本发明实施例中的拾音控制单元 430 可以如图 8 所示，进一步包括： 0090 第二确定单元 810，用于根据所述目标人物头像在所述图像信息中的位置，确定与所述目标人物头像匹配的第一拾音装置。 0091 第二控制单元 820，用于增大所述第一拾音装置的幅度，并减小所述第二拾音装置的幅度。 0092 以图10为例，拾音装置包括拾音装置A和拾音装置C，目标人物头像。

40、在图像信息中的位置位于右方，则第二确定单元 810 可以确定与目标人物头像匹配的第一拾音装置为拾音装置 C，第二控制单元 820 增大拾音装置 C 的幅度，减小拾音装置 A 的幅度。 0093 需要指出的是，本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置，还可以包括其他拾音装置，例如拾音装置 B，本发明实施例中的音频参数包含但不局限于幅度，还可以包括频率或者相位等，具体不受本发明实施例限制。 0094 作为一种可选的实施方式，音频信号获取单元 440，用于通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号，并滤除所述。

41、目标音源以外说明书 CN 104320729 A 10 8/10 页 11 的其他音源发送的音频信号。 0095 以图 10 所示的控制拾音装置进行拾音的效果示意图为例，目标人物头像在图像信息中的位置位于右方，目标人物头像与拾音装置 C 之间的距离较短，则拾音控制单元 430 可以对拾音装置 A、拾音装置 B 以及拾音装置 C 进行拾音控制，音频信号获取单元 440 获取分别通过拾音装置 A、拾音装置 B 以及拾音装置 C 拾音得到的音频信号，并将拾音装置 C 拾音得到的音频信号减去拾音装置 A 拾音得到的音频信号，进而减去拾音装置 B 拾音得到的音频信号，以获。

42、取目标人物头像对应的目标音源发送的音频信号，并滤除目标音源以外的其他音源发送的音频信号。 0096 在图 4 所示的终端中，人物头像获取单元 420 在信息获取单元 410 获取到的图像信息中获取目标人物头像，拾音控制单元 430 根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制，音频信号获取单元 440 获取通过拾音控制后的拾音装置拾音得到的音频信号，可提高拾音的效果，并提升用户体验。 0097 请参见图 9，图 9 是本发明第二实施例中提供的一种终端的结构示意图，如图 9 所示，该终端 900 包括：至少一个处理器 910，例如 CPU，至少。

43、一个输入装置 930，至少一个输出装置 940，存储器 950，至少一个总线 920。其中，通信总线 920 用于实现这些组件之间的连接通信。例如，输入装置930可以包括触控板或者摄像头等，输出装置940可以包括显示屏。存储器 950 可以是高速 RAM 存储器，也可以是非不稳定的存储器 (non-volatile memory)，例如至少一个磁盘存储器。存储器 950 可选的还可以是至少一个位于远离前述处理器 910 的存储终端。其中处理器 910 可以结合图 4 图 8 所示的终端，其中： 0098 输入装置 930，用于获取捕捉到的图像信息，以图 10 所。

44、示的控制拾音装置进行拾音的效果示意图为例，输入装置 930 可以通过摄像头获取捕捉到的图像信息，其中图像信息可以包括至少一个人物头像。 0099 存储器 950 中存储一组程序代码，且处理器 910 调用存储器 950 中存储的程序代码，用于执行以下操作： 0100 在所述图像信息中获取目标人物头像。 0101 根据所述目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制。以图 10 所示的控制拾音装置进行拾音的效果示意图为例，若检测到目标人物头像在图像信息中的位置位于右方，则处理器 910 可以对至少一个拾音装置进行拾音控制，示例性的，终端可以根据目标人。

45、物头像在图像信息中的位置，对拾音装置 C 进行拾音控制。 0102 获取通过拾音控制后的拾音装置拾音得到的音频信号。 0103 作为一种可选的实施方式，输入装置930获取到所述图像信息之后，处理器910可以获取用户设置的配置信息，所述配置信息用于指示是否对所述拾音装置进行拾音控制，若检测到所述配置信息用于指示对所述拾音装置进行拾音控制，则触发处理器 910 在所述图像信息中获取目标人物头像。例如，用户需要对拾音装置进行拾音控制，则可以预先设置用于指示对拾音装置进行拾音控制的配置信息，获取到图像信息后，若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制，则处。

46、理器 910 可以在图像信息中获取目标人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。 0104 作为一种可选的实施方式，图像信息可以包括一个人物头像，则处理器 910 获取图像信息中的目标人物头像具体可以为：说明书 CN 104320729 A 11 9/10 页 12 0105 识别所述图像信息中的人物头像。 0106 将所述识别到的人物头像设定为目标人物头像。 0107 作为一种可选的实施方式，图像信息可以包括至少两个人物头像，则处理器 910 获取图像信息中的目标人物头像具体可以为： 0108 接收用户对所述图像信息提交的目标人物头像确认指令。 0109。

47、根据所述目标人物头像确认指令，识别所述图像信息中的目标人物头像，其中目标人物头像可以包括图像信息中的部分或全部人物头像。 0110 作为一种可选的实施方式，处理器 910 根据目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制具体可以为： 0111 根据所述目标人物头像在所述图像信息中的位置，确定目标拾音装置。确定的目标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作，也可以是选择其中几个 ( 至少两个 ) 的组合。另一种可选的方案，确定目标拾音装置，可以是调整终端已有的拾音装置的功能。 0112 对所述确定的目标拾音装置进行拾音控制。。

48、 0113 进一步可选的，处理器 910 对所述确定的目标拾音装置进行拾音控制具体可以为： 0114 控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音。 0115 控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源以外的其它音源进行噪声抑制。 0116 以图 10 为例，可以根据目标人物头像在图像信息中的位置，确定目标拾音装置，以调整终端已有的拾音装置的功能为例：其中目标拾音装置可以包括拾音装置 A、拾音装置 B 以及拾音装置 C，处理器 910 可以控制拾音装置 C 对目标人物头像进行拾音，并控制拾音装置 A 和拾音装置 B 对。

49、目标人物头像对应的目标音源以外的其它音源进行噪声抑制 ( 拾音装置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声抑制 )。 0117 作为一种可选的实施方式，处理器 910 根据目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制具体可以为： 0118 根据所述目标人物头像在所述图像信息中的位置，调整所述拾音装置的音频参数。 0119 进一步可选的，音频参数可以包括拾音装置的幅度，拾音装置可以包括第一拾音装置和第二拾音装置，则处理器 910 根据所述目标人物头像在所述图像信息中的位置，调整所述拾音装置的音频参数具体可以为： 0120 根据所述目标人物头像在所述图像信息中的位置，确定与所述目标人物头像匹配的第一拾音装置。 0121 增大所。

摘要
申请专利号：	CN201410528682.3	申请日：	2014.10.09
公开号：	CN104320729A	公开日：	2015.01.28
当前法律状态：	实审	有效性：	审中
法律详情：	实质审查的生效IPC(主分类):H04R 1/08申请日:20141009\|\|\|公开
IPC分类号：	H04R1/08; G06F3/01	主分类号：	H04R1/08
申请人：	深圳市金立通信设备有限公司
发明人：	尚岸奇
地址：	518040 广东省深圳市福田区深南大道7028号时代科技大厦东座21楼
优先权：
专利代理机构：	广州三环专利代理有限公司 44202	代理人：	郝传鑫;熊永强
PDF完整版下载：	PDF下载

内容摘要

本发明实施例公开了一种拾音方法，包括：获取终端捕捉到的图像信息；在图像信息中获取目标人物头像；根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制；获取通过拾音控制后的拾音装置拾音得到的音频信号。采用本发明实施例，可根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制，可提高拾音的效果，并提升用户体验。

权利要求书

权利要求书
1.  一种拾音方法，其特征在于，所述方法包括：
获取终端捕捉到的图像信息；
在所述图像信息中获取目标人物头像；
根据所述目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制；
获取通过拾音控制后的拾音装置拾音得到的音频信号。

2.  如权利要求1所述的方法，其特征在于，所述获取终端捕捉到的图像信息之后，还包括：
获取用户设置的配置信息，所述配置信息用于指示是否对所述拾音装置进行拾音控制；
若检测到所述配置信息用于指示对所述拾音装置进行拾音控制，则触发在所述图像信息中获取目标人物头像。

3.  如权利要求1所述的方法，其特征在于，所述图像信息包括一个人物头像；
所述在所述图像信息中获取目标人物头像包括：
识别所述图像信息中的人物头像；
将所述识别到的人物头像设定为目标人物头像。

4.  如权利要求1所述的方法，其特征在于，所述图像信息包括至少两个人物头像；
所述在所述图像信息中获取目标人物头像包括：
接收用户对所述图像信息提交的目标人物头像确认指令；
根据所述目标人物头像确认指令，识别所述图像信息中的目标人物头像。

5.  如权利要求1所述的方法，其特征在于，所述根据所述目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制包括：
根据所述目标人物头像在所述图像信息中的位置，确定目标拾音装置；
对所述确定的目标拾音装置进行拾音控制。

6.  如权利要求5所述的方法，其特征在于，所述对所述确定的目标拾音装置进行拾音控制包括：
控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音；
控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源以外的其它音源进行噪声抑制。

7.  如权利要求1所述的方法，其特征在于，所述根据所述目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制包括：
根据所述目标人物头像在所述图像信息中的位置，调整所述拾音装置的音频参数。

8.  如权利要求7所述的方法，其特征在于，所述音频参数包括所述拾音装置的幅度，所述拾音装置包括第一拾音装置和第二拾音装置；
所述根据所述目标人物头像在所述图像信息中的位置，调整所述拾音装置的音频参数包括：
根据所述目标人物头像在所述图像信息中的位置，确定与所述目标人物头像匹配的第一拾音装置；
增大所述第一拾音装置的幅度，并减小所述第二拾音装置的幅度。

9.  如权利要求1所述的方法，其特征在于，所述获取通过拾音控制后的拾音装置拾音得到的音频信号包括：
通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号，并滤除所述目标音源以外的其他音源发送的音频信号。

说明书

说明书一种拾音方法
技术领域
本发明涉及电子技术领域，尤其涉及一种拾音方法。
背景技术
拾音就是收集声音的过程，而在拾音过程中麦克风通常收集到不必要的声音，以摄影拾音为例，终端捕捉图像信息过程中通常会出现目标音源对应的用户以外的陌生人说话的声音，或者所处环境中噪声源发出的干扰声等等，将弱化目标音源发送的声音，导致摄影效果较差，现有技术无法在拾音的过程中避开噪声源，则拾取的音频信号的音质较低。
发明内容
本发明实施例提供一种拾音方法，可提高拾音的效果，并提升用户体验。
本发明实施例提供了一种拾音方法，包括：
获取终端捕捉的图像信息；
在所述图像信息中获取目标人物头像；
根据所述目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制；
获取通过拾音控制后的拾音装置拾音得到的音频信号。
实施本发明实施例，终端可获取图像信息，在图像信息中获取目标人物头像，根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制，获取通过拾音控制后的拾音装置拾音得到的音频信号，现有技术中终端不能对拾音装置进行拾音控制，则终端在拾音过程中会接收到目标音源以外的其他音源发送的音频信号，音频信号的音质较差，本发明实施例可根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制，可提高拾音的效果，并提升用户体验。
附图说明
为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
图1是本发明第一实施例中提供的一种拾音方法的流程示意图；
图2是本发明第二实施例中提供的一种拾音方法的流程示意图；
图3是本发明第三实施例中提供的一种拾音方法的流程示意图；
图4是本发明第一实施例中提供的一种终端的结构示意图；
图5是本发明实施例中图4的一种人物头像获取单元的结构示意图；
图6是本发明实施例中图4的另一种人物头像获取单元的结构示意图；
图7是本发明实施例中图4的一种拾音控制单元的结构示意图；
图8是本发明实施例中图4的另一种拾音控制单元的结构示意图；
图9是本发明第二实施例中提供的一种终端的结构示意图；
图10是本发明实施例中提供的一种控制拾音装置进行拾音的效果示意图。
具体实施方式
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
本发明实施例提供了一种拾音方法，拾音即采集声音的过程，终端可以获取捕捉到的图像信息，在图像信息中获取目标人物头像，根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制，获取通过拾音控制后的拾音装置拾音得到的音频信号，本发明实施例可提高拾音的效果，并提升用户体验。
本发明实施例提及到的终端可以包括手机、平板电脑、PC(personal computer，个人计算机)或者佩戴式智能设备等具有拾音功能的终端。拾音装置可以包括麦克风或者话筒等，其中麦克风可以内置放大器。
请参见图1，图1是本发明实施例中提供的一种拾音方法的流程示意图，如图所示本发明实施例中的拾音方法可以包括：
S101，获取终端捕捉到的图像信息。
终端可以获取捕捉到的图像信息，以图10所示的控制拾音装置进行拾音的效果示意图为例，终端可以通过摄像头获取捕捉到的图像信息，其中图像信息可以包括至少一个人物头像。
在可选实施例中，终端获取到图像信息之后，可以获取用户设置的配置信息，检测该配置信息是否用于指示对拾音装置进行拾音控制，若该配置信息用于指示对拾音装置进行拾音控制，则进一步执行S102；若该配置信息用于指示不对拾音装置进行拾音控制，则对获取到的图像信息不进行处理。例如，用户需要对拾音装置进行拾音控制，则可以预先设置用于指示对拾音装置进行拾音控制的配置信息，终端获取到图像信息后，若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制，则可以在图像信息中获取目标人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。
S102，在图像信息中获取目标人物头像。
终端获取到图像信息之后，可以在图像信息中获取目标人物头像。
在可选实施例中，若图像信息包括一个人物头像，则终端可以识别图像信息中的人物头像，并将识别到的人物头像设定为目标人物头像。
在可选实施例中，若图像信息包括至少两个人物头像，则终端可以接收用户对图像信息提交的目标人物头像确认指令，根据目标人物头像确认指令识别图像信息中的目标人物头像，其中目标人物头像可以包括图像信息中的部分或全部人物头像。例如，终端检测到图像信息包括至少两个人物头像时，可以生成人物头像提示信息，并在终端的显示界面中显示该人物头像提示信息，用户可以根据该人物头像提示信息向终端提交目标人物头像确认指令，终端根据目标人物头像确认指令识别图像信息中的目标人物头像。
S103，根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制。
终端可以根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制。以图10所示的控制拾音装置进行拾音的效果示意图为例，若检测到目标人物头像在图像信息中的位置位于右方，则终端可以对至少一个拾音装置进行拾音控制，示例性的，终端可以根据目标人物头像在图像信息中的位置，对拾音装置C进行拾音控制。
在可选实施例中，终端可以根据目标人物头像在图像信息中的位置，确定目标拾音装置，并对确定的目标拾音装置进行拾音控制。确定目标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作，也可以是选择其中几个(至少两个)的组合。另一种可选的方案，确定目标拾音装置，可以是调整终端已有的拾音装置的功能。进一步可选的，终端可以控制目标拾音装置中的至少一个拾音装置对目标人物头像进行拾音，并控制目标拾音装置中的其它拾音装置对目标人物头像对应的目标音源以外的其它音源进行噪声抑制。以图10为例，终端可以根据目标人物头像在图像信息中的位置，确定目标拾音装置，以调整终端已有的拾音装置的功能为例：其中目标拾音装置可以包括拾音装置A、拾音装置B以及拾音装置C，控制拾音装置C对目标人物头像进行拾音，并控制拾音装置A和拾音装置B对目标人物头像对应的目标音源以外的其它音源进行噪声抑制(拾音装置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声抑制)。
在可选实施例中，终端可以根据目标人物头像在图像信息中的位置，调整拾音装置的音频参数，进一步可选的，拾音装置的音频参数可以包括拾音装置的幅度，拾音装置可以包括第一拾音装置和第二拾音装置，则终端可以根据目标人物头像在图像信息中的位置，确定与目标人物头像匹配的第一拾音装置，并增大第一拾音装置的幅度，减小第二拾音装置的幅度。以图10为例，终端中的拾音装置包括拾音装置A、拾音装置B和拾音装置C，目标人物头像在图像信息中的位置位于右方，则终端可以确定与目标人物头像匹配的第一拾音装置为拾音装置C，进而增大拾音装置C的幅度，减小拾音装置A和拾音装置B的幅度，本发明实施例可增强目标人物头像对应的目标音源发送的音频信号，并抑制目标音源以外的其他音源发送的音频信号。
需要指出的是，本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置，还可以包括其他拾音装置，其中第一拾音装置可以包括至少一个拾音装置，第二拾音装置可以包括至少一个拾音装置，本发明实施例中的音频参数包含但不局限于幅度，还可以包括频率或者相位等，具体不受本发明实施例限制。
S104，获取通过拾音控制后的拾音装置拾音得到的音频信号。
终端对拾音装置进行拾音控制后，可以获取通过拾音控制后的拾音装置拾音得到的音频信号，具体的，若终端对目标拾音装置进行拾音控制，则可以获取通过拾音控制后的目标拾音装置拾音得到的音频信号；若终端对拾音装置的音频参数进行调整，则可以获取通过音频参数调整后的拾音装置拾音得到的音频信号。
在可选实施例中，终端可以通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号，并滤除所述目标音源以外的其他音源发送的音频信号，以图10所示的控制拾音装置进行拾音的效果示意图为例，目标人物头像在图像信息中的位置位于右方，目标人物头像与拾音装置C之间的距离较短，则终端可以对拾音装置A、拾音装置B以及拾音装置C进行拾音控制，获取分别通过拾音装置A、拾音装置B以及拾音装置C拾音得到的音频信号，将拾音装置C拾音得到的音频信号减去拾音装置A拾音得到的音频信号，进而减去拾音装置B拾音得到的音频信号，以获取目标人物头像对应的目标音源发送的音频信号，并滤除目标音源以外的其他音源发送的音频信号。
在图1所示的拾音方法中，终端获取捕捉到的图像信息，在图像信息中获取目标人物头像，根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制，获取通过拾音控制后的拾音装置拾音得到的音频信号，本发明实施例可提高拾音的效果，并提升用户体验。
请参见图2，图2是本发明第二实施例中提供的一种拾音方法的流程示意图，如图所示本发明实施例中的拾音方法可以包括：
S201，获取终端捕捉到的图像信息，其中图像信息包括一个人物头像。
终端可以获取捕捉到的图像信息，例如终端可以通过摄像头获取捕捉到的图像信息，其中图像信息可以包括一个人物头像。
在可选实施例中，终端获取到图像信息之后，可以获取用户设置的配置信息，检测该配置信息是否用于指示对拾音装置进行拾音控制，若该配置信息用于指示对拾音装置进行拾音控制，则进一步执行S202；若该配置信息用于指示不对拾音装置进行拾音控制，则对获取到的图像信息不进行处理。例如，用户需要对拾音装置进行拾音控制，则可以预先设置用于指示对拾音装置进行拾音控制的配置信息，终端获取到图像信息后，若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制，则可以识别图像信息中的人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。
S202，识别图像信息中的人物头像。
终端获取到图像信息后，可以识别图像信息中的人物头像。以图10所示的控制拾音装置进行拾音的效果示意图为例，终端可以通过图像处理技术对图像信息进行分析，进而识别图像信息中的人物头像。
S203，将识别到的人物头像设定为目标人物头像。
终端识别到图像信息中的人物头像后，可以将识别到的人物头像设定为目标人物头像。
S204，根据目标人物头像在图像信息中的位置，确定目标拾音装置。
终端识别到目标人物头像后，可以根据目标人物头像在图像信息中的位置，确定目标拾音装置。确定目标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作，也可以是选择其中几个(至少两个)的组合。以图10为例，若终端检测到目标人物头像在图像信息中的位置位于右方，则可以根据目标人物头像在图像信息中的位置，确定目标拾音装置，其中目标拾音装置可以包括拾音装置C。
S205，对目标拾音装置进行拾音控制。
终端可以对确定的目标拾音装置进行拾音控制，具体的，终端可以控制目标拾音装置中的至少一个拾音装置对目标人物头像进行拾音，例如终端确定的目标拾音装置包括拾音装置C时，可以控制拾音装置C对目标人物头像进行拾音。
S206，获取通过拾音控制后的目标拾音装置拾音得到的音频信号。
终端对目标拾音装置进行拾音控制后，可以获取通过拾音控制后的目标拾音装置拾音得到的音频信号，具体的，终端可以获取通过拾音控制后的拾音装置C拾音得到的音频信号。
在图2所示的拾音方法中，终端将识别到的图像信息中的人物头像设定为目标人物头像，根据目标人物头像在图像信息中的位置确定目标拾音装置，对确定的目标拾音装置进行拾音控制，并获取通过拾音控制后的目标拾音装置拾音得到的音频信号，可提高拾音的效果，并提升用户体验。
请参见图3，图3是本发明第三实施例中提供的一种拾音方法的流程示意图，如图所示本发明实施例中的拾音方法可以包括：
S301，获取终端捕捉到的图像信息，其中图像信息包括至少两个人物头像。
终端可以获取捕捉到的图像信息，例如终端可以通过摄像头获取捕捉到的图像信息，其中图像信息可以包括至少两个人物头像。
在可选实施例中，终端获取到图像信息之后，可以获取用户设置的配置信息，检测该配置信息是否用于指示对拾音装置进行拾音控制，若该配置信息用于指示对拾音装置进行拾音控制，则进一步执行S302；若该配置信息用于指示不对拾音装置进行拾音控制，则对获取到的图像信息不进行处理。例如，用户需要对拾音装置进行拾音控制，则可以预先设置用于指示对拾音装置进行拾音控制的配置信息，终端获取到图像信息后，若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制，则可以接收用户对图像信息提交的目标人物头像确认指令。其中配置信息用于指示是否对拾音装置进行拾音控制。
S302，接收用户对图像信息提交的目标人物头像确认指令。
终端获取到的图像信息包括至少两个人物头像时，可以接收用户对图像信息提交的目标人物头像确认指令，其中目标人物头像可以包括图像信息中的部分或全部人物头像。例如，终端检测到图像信息包括至少两个人物头像时，可以生成人物头像提示信息，并在终端的显示界面中显示该人物头像提示信息，用户可以根据该人物头像提示信息向终端提交目标人物头像确认指令。
S303，根据目标人物头像确认指令，识别图像信息中的目标人物头像。
S304，根据目标人物头像在图像信息中的位置，调整拾音装置的音频参数。
终端识别到目标人物头像后，可以根据目标人物头像在图像信息中的位置，调整拾音装置的音频参数。可选的，拾音装置的音频参数可以包括拾音装置的幅度，拾音装置可以包括第一拾音装置和第二拾音装置，则终端可以根据目标人物头像在图像信息中的位置，确定与目标人物头像匹配的第一拾音装置，并增大第一拾音装置的幅度，减小第二拾音装置的幅度。以图10为例，终端中的拾音装置包括拾音装置A和拾音装置C，目标人物头像在图像信息中的位置位于右方，则终端可以确定与目标人物头像匹配的第一拾音装置为拾音装置C，进而增大拾音装置C的幅度，减小拾音装置A的幅度，本发明实施例可增强目标人物头像对应的目标音源发送的音频信号，并抑制目标音源以外的其他音源发送的音频信号。
需要指出的是，本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置，还可以包括其他拾音装置，例如拾音装置B，本发明实施例中的音频参数包含但不局限于幅度，还可以包括频率或者相位等，具体不受本发明实施例限制。
S305，获取通过音频参数调整后的拾音装置拾音得到的音频信号。
终端对拾音装置进行音频参数调整后，可以获取通过音频参数调整后的拾音装置拾音得到的音频信号，具体的，终端可以获取通过音频参数调整后的第一拾音装置拾音得到的音频信号，并获取通过音频参数调整后的第二拾音装置拾音得到的音频信号。
在可选实施例中，终端可以通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号，并滤除所述目标音源以外的其他音源发送的音频信号，以图10所示的控制拾音装置进行拾音的效果示意图为例，目标人物头像在图像信息中的位置位于右方，目标人物头像与拾音装置C之间的距离较短，则终端可以对拾音装置A、拾音装置B以及拾音装置C进行拾音控制，获取分别通过拾音装置A、拾音装置B以及拾音装置C拾音得到的音频信号，将拾音装置C拾音得到的音频信号减去拾音装置A拾音得到的音频信号，进而减去拾音装置B拾音得到的音频信号，以获取目标人物头像对应的目标音源发送的音频信号，并滤除目标音源以外的其他音源发送的音频信号。
在图3所示的拾音方法中，终端根据用户对图像信息提交的目标人物头像确认指令，识别图像信息中的目标人物头像，根据目标人物头像在图像信息中的位置，调整拾音装置的音频参数，获取通过音频参数调整后的拾音装置拾音得到的音频信号，可提高拾音的效果，并提升用户体验。
请参见图4，图4是本发明第一实施例中提供的一种终端的结构示意图，如图所示本发明实施例中的终端400至少可以包括信息获取单元410、人物头像获取单元420、拾音控制单元430以及音频信号获取单元440，其中：
信息获取单元410，用于获取捕捉到的图像信息，以图10所示的控制拾音装置进行拾音的效果示意图为例，信息获取单元410可以通过摄像头获取捕捉到的图像信息，其中图像信息可以包括至少一个人物头像。
人物头像获取单元420，用于在所述图像信息中获取目标人物头像。
拾音控制单元430，用于根据所述目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制。以图10所示的控制拾音装置进行拾音的效果示意图为例，若检测到目标人物头像在图像信息中的位置位于右方，则拾音控制单元430可以对至少一个拾音装置进行拾音控制，示例性的，终端可以根据目标人物头像在图像信息中的位置，对拾音装置C进行拾音控制。
音频信号获取单元440，用于获取拾音控制后的拾音装置拾音得到的音频信号。
作为一种可选的实施方式，信息获取单元410，还用于获取到所述图像信息之后，获取用户设置的配置信息，所述配置信息用于指示是否对所述拾音装置进行拾音控制，若检测到所述配置信息用于指示对所述拾音装置进行拾音控制，则触发所述人物头像获取单元420在所述图像信息中获取目标人物头像。例如，用户需要对拾音装置进行拾音控制，则可以预先设置用于指示对拾音装置进行拾音控制的配置信息，信息获取单元410获取到图像信息后，若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制，则人物头像获取单元420可以在图像信息中获取目标人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。
作为一种可选的实施方式，图像信息可以包括一个人物头像，则本发明实施例中的人物头像获取单元420可以如图5所示，进一步包括：
第一识别单元510，用于识别所述图像信息中的人物头像。
设定单元520，用于将所述识别到的人物头像设定为目标人物头像。
作为一种可选的实施方式，图像信息可以包括至少两个人物头像，则本发明实施例中的人物头像获取单元420可以如图6所示，进一步包括：
指令接收单元610，用于接收用户对所述图像信息提交的目标人物头像确认指令。
第二识别单元620，用于根据所述目标人物头像确认指令，识别所述图像信息中的目标人物头像，其中目标人物头像可以包括图像信息中的部分或全部人物头像。
作为一种可选的实施方式，本发明实施例中的拾音控制单元430可以如图7所示，进一步包括：
第一确定单元710，用于根据所述目标人物头像在所述图像信息中的位置，确定目标拾音装置。第一确定单元710可以在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作，也可以是选择其中几个(至少两个)的组合。另一种可选的方案，第一确定单元710可以调整终端已有的拾音装置的功能。
第一控制单元720，用于对所述第一确定单元710确定的目标拾音装置进行拾音控制。
进一步可选的，第一控制单元720，用于控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音。
第一控制单元720，还用于控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源以外的其它音源进行噪声抑制。
以图10为例，第一确定单元710可以根据目标人物头像在图像信息中的位置，确定目标拾音装置，以调整终端已有的拾音装置的功能为例：其中目标拾音装置可以包括拾音装置A、拾音装置B以及拾音装置C，第一控制单元720可以控制拾音装置C对目标人物头像进行拾音，并控制拾音装置A和拾音装置B对目标人物头像对应的目标音源以外的其它音源进行噪声抑制(拾音装置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声抑制)。
作为一种可选的实施方式，拾音控制单元430，用于根据所述目标人物头像在所述图像信息中的位置，调整所述拾音装置的音频参数。
进一步可选的，音频参数可以包括拾音装置的幅度，拾音装置可以包括第一拾音装置和第二拾音装置，则本发明实施例中的拾音控制单元430可以如图8所示，进一步包括：
第二确定单元810，用于根据所述目标人物头像在所述图像信息中的位置，确定与所述目标人物头像匹配的第一拾音装置。
第二控制单元820，用于增大所述第一拾音装置的幅度，并减小所述第二拾音装置的幅度。
以图10为例，拾音装置包括拾音装置A和拾音装置C，目标人物头像在图像信息中的位置位于右方，则第二确定单元810可以确定与目标人物头像匹配的第一拾音装置为拾音装置C，第二控制单元820增大拾音装置C的幅度，减小拾音装置A的幅度。
需要指出的是，本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置，还可以包括其他拾音装置，例如拾音装置B，本发明实施例中的音频参数包含但不局限于幅度，还可以包括频率或者相位等，具体不受本发明实施例限制。
作为一种可选的实施方式，音频信号获取单元440，用于通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号，并滤除所述目标音源以外的其他音源发送的音频信号。
以图10所示的控制拾音装置进行拾音的效果示意图为例，目标人物头像在图像信息中的位置位于右方，目标人物头像与拾音装置C之间的距离较短，则拾音控制单元430可以对拾音装置A、拾音装置B以及拾音装置C进行拾音控制，音频信号获取单元440获取分别通过拾音装置A、拾音装置B以及拾音装置C拾音得到的音频信号，并将拾音装置C拾音得到的音频信号减去拾音装置A拾音得到的音频信号，进而减去拾音装置B拾音得到的音频信号，以获取目标人物头像对应的目标音源发送的音频信号，并滤除目标音源以外的其他音源发送的音频信号。
在图4所示的终端中，人物头像获取单元420在信息获取单元410获取到的图像信息中获取目标人物头像，拾音控制单元430根据目标人物头像在图像信息中的位置，对拾音装置进行拾音控制，音频信号获取单元440获取通过拾音控制后的拾音装置拾音得到的音频信号，可提高拾音的效果，并提升用户体验。
请参见图9，图9是本发明第二实施例中提供的一种终端的结构示意图，如图9所示，该终端900包括：至少一个处理器910，例如CPU，至少一个输入装置930，至少一个输出装置940，存储器950，至少一个总线920。其中，通信总线920用于实现这些组件之间的连接通信。例如，输入装置930可以包括触控板或者摄像头等，输出装置940可以包括显示屏。存储器950可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器950可选的还可以是至少一个位于远离前述处理器910的存储终端。其中处理器910可以结合图4～图8所示的终端，其中：
输入装置930，用于获取捕捉到的图像信息，以图10所示的控制拾音装置进行拾音的效果示意图为例，输入装置930可以通过摄像头获取捕捉到的图像信息，其中图像信息可以包括至少一个人物头像。
存储器950中存储一组程序代码，且处理器910调用存储器950中存储的程序代码，用于执行以下操作：
在所述图像信息中获取目标人物头像。
根据所述目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制。以图10所示的控制拾音装置进行拾音的效果示意图为例，若检测到目标人物头像在图像信息中的位置位于右方，则处理器910可以对至少一个拾音装置进行拾音控制，示例性的，终端可以根据目标人物头像在图像信息中的位置，对拾音装置C进行拾音控制。
获取通过拾音控制后的拾音装置拾音得到的音频信号。
作为一种可选的实施方式，输入装置930获取到所述图像信息之后，处理器910可以获取用户设置的配置信息，所述配置信息用于指示是否对所述拾音装置进行拾音控制，若检测到所述配置信息用于指示对所述拾音装置进行拾音控制，则触发处理器910在所述图像信息中获取目标人物头像。例如，用户需要对拾音装置进行拾音控制，则可以预先设置用于指示对拾音装置进行拾音控制的配置信息，获取到图像信息后，若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制，则处理器910可以在图像信息中获取目标人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。
作为一种可选的实施方式，图像信息可以包括一个人物头像，则处理器910获取图像信息中的目标人物头像具体可以为：
识别所述图像信息中的人物头像。
将所述识别到的人物头像设定为目标人物头像。
作为一种可选的实施方式，图像信息可以包括至少两个人物头像，则处理器910获取图像信息中的目标人物头像具体可以为：
接收用户对所述图像信息提交的目标人物头像确认指令。
根据所述目标人物头像确认指令，识别所述图像信息中的目标人物头像，其中目标人物头像可以包括图像信息中的部分或全部人物头像。
作为一种可选的实施方式，处理器910根据目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制具体可以为：
根据所述目标人物头像在所述图像信息中的位置，确定目标拾音装置。确定的目标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作，也可以是选择其中几个(至少两个)的组合。另一种可选的方案，确定目标拾音装置，可以是调整终端已有的拾音装置的功能。
对所述确定的目标拾音装置进行拾音控制。
进一步可选的，处理器910对所述确定的目标拾音装置进行拾音控制具体可以为：
控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音。
控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源以外的其它音源进行噪声抑制。
以图10为例，可以根据目标人物头像在图像信息中的位置，确定目标拾音装置，以调整终端已有的拾音装置的功能为例：其中目标拾音装置可以包括拾音装置A、拾音装置B以及拾音装置C，处理器910可以控制拾音装置C对目标人物头像进行拾音，并控制拾音装置A和拾音装置B对目标人物头像对应的目标音源以外的其它音源进行噪声抑制(拾音装置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声抑制)。
作为一种可选的实施方式，处理器910根据目标人物头像在所述图像信息中的位置，对拾音装置进行拾音控制具体可以为：
根据所述目标人物头像在所述图像信息中的位置，调整所述拾音装置的音频参数。
进一步可选的，音频参数可以包括拾音装置的幅度，拾音装置可以包括第一拾音装置和第二拾音装置，则处理器910根据所述目标人物头像在所述图像信息中的位置，调整所述拾音装置的音频参数具体可以为：
根据所述目标人物头像在所述图像信息中的位置，确定与所述目标人物头像匹配的第一拾音装置。
增大所述第一拾音装置的幅度，并减小所述第二拾音装置的幅度。
以图10为例，拾音装置包括拾音装置A和拾音装置C，目标人物头像在图像信息中的位置位于右方，则处理器910可以确定与目标人物头像匹配的第一拾音装置为拾音装置C，增大拾音装置C的幅度，减小拾音装置A的幅度，本发明实施例可增强目标人物头像对应的目标音源发送的音频信号，并抑制目标音源以外的其他音源发送的音频信号。
需要指出的是，本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置，还可以包括其他拾音装置，例如拾音装置B，本发明实施例中的音频参数包含但不局限于幅度，还可以包括频率或者相位等，具体不受本发明实施例限制。
作为一种可选的实施方式，处理器910获取通过拾音控制后的拾音装置拾音得到的音频信号具体可以为：
通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号，并滤除所述目标音源以外的其他音源发送的音频信号。以图10所示的控制拾音装置进行拾音的效果示意图为例，目标人物头像在图像信息中的位置位于右方，目标人物头像与拾音装置C之间的距离较短，则处理器910可以对拾音装置A、拾音装置B以及拾音装置C进行拾音控制，获取分别通过拾音装置A、拾音装置B以及拾音装置C拾音得到的音频信号，将拾音装置C拾音得到的音频信号减去拾音装置A拾音得到的音频信号，进而减去拾音装置B拾音得到的音频信号，以获取目标人物头像对应的目标音源发送的音频信号，并滤除目标音源以外的其他音源发送的音频信号。
具体的，本发明实施例中介绍的终端900可以用以实施本发明结合图1、图2或者图3介绍的拾音方法实施例中的部分或全部流程。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。
需要说明的是，在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详细描述的部分，可以参见其他实施例的相关描述。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明实施例所必须的。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例终端中的单元可以根据实际需要进行合并、划分和删减。
本发明实施例中所述单元，可以通过通用集成电路，例如CPU(Central Processing Unit，中央处理器)，或通过ASIC(Application Specific Integrated Circuit，专用集成电路)来实现。
以上对本发明实施例所提供的拾音方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。