一种分布式麦克系统 【技术领域】
本发明涉及多媒体通讯和数字信号处理器应用领域,尤其涉及一种使用以太网和音频压缩技术的分布式麦克系统。
背景技术
麦克风的基础应用一般在视频会议和视频监控行业中。目前,市面上用于视频会议和视频监控终端的麦克有两种:模拟麦克和高频载波的数字麦克,其中又以模拟麦克输入为绝对主流。前者利用咪头把声音信号转换成模拟电信号然后通过电缆输出;后者在前者的基础上先把模拟电信号数字化后,再通过某种通讯协议如蓝牙发送给接收设备。两种麦克的音频输出信号最终都送至终端设备进行编码压缩处理。
对于目前的两种麦克,存在如下不足之处:
1、连接方式单一,麦克和终端设备的连接方式是点对点的,临时改变连接需要重新布线或对码。在麦克数量比较多时,这种改变往往很复杂,甚至难以实现;
2、麦克与终端之间的连线距离不能太远,特别是对于数字麦克,由于接收器内置于终端中,通信距离尤其受到限制,否则会造成话音质量的急剧下降;
3、功能单一,无法实现诸如回声抵消等终端所需的基本功能;
4、无法支持压缩数据的输出,模拟麦克无法支持,即使是数字麦克风输出也只输出格式单一的PCM(Pulse Code Modulation,脉冲编码调制)音频数据,同样不支持压缩数据的输出;
5、没有智能控制功能,终端设备无法控制麦克的操作如音量调节等,需要人工参与。
【发明内容】
本发明要解决的技术问题是提供一种分布式麦克系统,改变目前麦克单一的输出和连接方式,可集中多个麦克的音频输入,还可实现多种格式的音频数据的输出。
为了解决上述问题,本发明提供了一种分布式麦克系统,其包括具有数字信号处理器DSP的分布式麦克,所述分布式麦克设有多个内置咪头,所述DSP通过音频口采集所述多个内置咪头输入的音频数据,并将所述音频数据通过以太网口输出至终端。
进一步地,所述分布式麦克还连接有模拟麦克,所述DSP通过控制模拟开关选择音频输入的方式:内置咪头输入或者模拟麦克输入。
进一步地,其特征在于,所述DSP对所述音频数据进行处理后采用脉冲编码调制格式或者压缩码流格式进行封装后输出。
进一步地,所述DSP对所述输入数据进行以下处理中的一种或多种:混音、回音抵消。
进一步地,所述分布式麦克通过网络与多个终端相连,所述DSP根据所述终端的指令将指定内置咪头或者模拟麦克的音频数据输出至相应终端。
进一步地,所述终端将所需要的音频能力通过网络配置给所述DSP,所述DSP根据每个终端的需求输出相应格式的音频数据。
进一步地,当多个终端对某一音频输入的输出格式需求有冲突时,由所述终端通过自协商、并由所述分布式麦克最终决定以同一格式或者以不同格式输出。
进一步地,所述DSP采用单播或者组播方式将音频数据输出至所述终端。
进一步地,所述DSP将自身工作能力通过用户数据报协议UDP广播包向网络进行通告,其中,所述DSP的自身工作能力包括以下内容中的一种或多种:所述DSP的IP地址、支持的麦克数、每一个麦克所支持的音频格式、最大允许连接数;且在达到最大允许连接数前,所述DSP将定时进行自身工作能力的通告。
进一步地,所述系统具有一个或多个所述分布式麦克,当具有多个所述分布式麦克时,所述多个分布式麦克之间通过网络级联。
【附图说明】
图1是传统模拟麦克与终端的连接示意图;
图2是传统数字麦克与终端的连接示意图;
图3是本发明实施例的分布式麦克系统的组成示意图;
图4是本发明分布式麦克系统的分布式输出示意图;
图5是本发明分布式麦克系统的分布式输入示意图;
图6是本发明实施例的分布式输出的流程图。
【具体实施方式】
鉴于现有麦克的多种缺陷,本发明现提出一种分布式麦克的设计,包括:采用麦克阵列作为DSP(Digital Signal Process,数字信号处理)音频口McAsp(多通道音频接入接口,是美国TI公司的DSP一种通用的音频接入接口,采用时分复用的数据流形式)的输入,然后DSP(Digital Signal Processor,数字信号处理器)将处理后的音频数据通过以太网接口输出,通过以太网可以改变麦克音频的输出行为如输出格式等。
本发明的核心在于用DSP集中多个麦克(以最常用的TI公司的DM642为例,可以接入多达16个麦克)的音频输入,然后根据应用的需求决定每路输入最终以何种格式输出,默认为原音即PCM输出,再封装成一定的帧格式通过单一网口发送出去,这样就可以打破传统麦克由于抗干扰特性差受使用距离的限制等诸多局限。
目前音频的编码压缩、混音、回声抵消等处理都在终端侧进行,这也消耗了终端宝贵的处理能力,增加了软件的复杂度。本发明将上述音频处理前移至分布式麦克系统本身地DSP中进行,提升了与之相连终端的性能。同时,本发明的分布式麦克的中间处理过程采用数字信号,后端输出则采用网线,极大提高了信号输出的信噪比。
其中,DSP对每路输入的最终输出方式可以选择PCM也可以选择压缩码流,这决定了输出的带宽,以最常用的16kHz采样率为例,每个采样点的分辨率为16bit,都以PCM形式输出需要4Mbps多一点的网络带宽,如果采用64Kbps的压缩数据格式,则仅需要1Mbps的带宽。
此外,每个终端可以根据自己的需求命令每路音频以特定的格式输出,碰到不同终端对同一音频源需求冲突的时候,各终端通过自协商并由麦克决定最终的输出格式。
对于长时间没有输入的麦克,DSP在实施混音处理时可以对其实施关闭。具体地,DSP可以通过控制AD(Analog-Digital,模数转换)器件的mute(静音)管脚,实现对音频输入的开启和闭合操作。
本发明还保留了对传统模拟麦克的支持,也就是说针对某一路音频输入提供了模拟麦克和内置咪头两种选择,加之本发明支持异地级联使用,这样能够拓展输入源的适用范围,使其不再局限于在同一会场使用。
下面结合附图和具体实施例对本发明的技术方案作进一步详细描述。
图1和图2分别示出了两种传统麦克与终端的连线方式。
其中,图1为传统模拟麦克与终端的连线示意图,模拟麦克101将声音信号转化为电信号,通过连接电缆102输入到模拟麦克接入的终端103。显而易见,麦克101和终端103的连接关系是点对点的,如果要改变连接关系,将101接入至另一台终端的话,则需要人工参与。
图2为传统数字麦克与终端的连接示意图,数字麦克201通过高频载波202将数字信号输入到数字模拟麦克接入的终端203,此终端203带有高频接收设备,可以分离出PCM数据。数字麦克201与终端203进行连接前需要对码以建立通信通道,如果要改变连接关系将201接入至另一台终端,则需要重新对码建立新的通信通道。
图3示出了本发明实施例的分布式数字麦克系统的构成示意图。其中分布式麦克302是本发明的核心部件,它是一个圆盘形设备,内嵌16个内置咪头301,分布式麦克302中的DSP通过音频口采集16个内置咪头的数据,根据终端的需求对每路输入进行处理,然后封装成帧,通过网线305发送到网络306供终端使用。
为了保证每一路音频的均衡输入,优选地,本实施例的16个内置咪头以相同的夹角对称的分布在一个圆圈上。
该系统中还保留了对传统模拟麦克303的接口,每路音频输入前端有内置咪头和模拟麦克两种选择输入,DSP通过控制模拟开关可以选择输入方式,以及后续的音频接入AD器件。由于有传统麦克输入的选择,本发明不再局限在同一个会场中的同一房间内使用,从而拓展了本发明的适用范围。
目前麦克所采集的音源的输出目标是确定的,即输出至与之相连的终端设备上。而本实施例所采集的16路音源输出目标是由终端设备选择的,可以是单独1路,也可以是多路。
图4为采用本发明的分布式输出示意图,多个终端401、402及403通过网络404与分布式麦克405相连,分布式麦克405会根据每个终端的具体需要输出不同格式的音频数据。其中,输出到每个终端的方式灵活多变,可以是单播也可以是组播。
相较于传统模拟麦克连线方式,本发明的分布式输出只需要1根网线,大大减少了连线的数目,特别是在终端设备数目比较多时这个优势尤为突出。
如果碰到多个终端对某一路音频输入有不同格式输出要求时,例如终端401和终端402对第一路输入要求以不同的格式输出,则终端401、终端402和分布式麦克405可以通过自协商的方式解决,协商后以同一格式或者以不同格式输出,可以由分布式麦克405最终决定。
图5为采用本发明的分布式输入示意图,传统麦克501、502和分布式麦克503不在同一房间中,分别以墙壁506、507与分布式麦克503阻隔开,通过分布式麦克503实现了不在同一房间内的传统麦克501与502的分布式输入。此外,分布式麦克503还可以通过网络505级联异地的分布式麦克504,这样就实现了异地分布式输入,通过网络505即可以实现异地的音频输入,不再受音频输入距离和地域的限制。
图6示出了本发明的一个实施例的分布式输出的流程图:
步骤601,分布式麦克上电,DSP完成自启动;
步骤602,完成各种外设的初始化以及网络初始化等,包括初始化音频口、网口,底层驱动开始运行,启动TCP/IP协议栈,此时已开始采集音频数据;
步骤603,DSP将自身的工作能力,包括:DSP的IP地址、支持的麦克数、每一个麦克所支持的音频格式、最大允许连接数等,通过UDP(UserDatagram Protocol,用户数据报协议)广播包(即目标IP地址形式为255.255.255.255的UDP包)向网络进行通告;
该步骤中,为了让更多的终端利用麦克的输出,在达到最大允许连接数前,DSP会定时进行自身工作能力的通告;
步骤604,DSP在一个特定的UDP端口(如24680)查询有无终端发送过来的查询命令,如果有,则转至步骤605执行,否则转至步骤609执行;
终端将所需要的音频能力通过网络配置给分布式麦克,分布式麦克在一个特定端口定时查询命令以适应终端的需求,根据终端命令将指定麦克的音频数据发送给相应终端;终端在工作完毕后,可以通过网络通知分布式麦克停止向本终端发送音频数据。
步骤605,判断是否有多个终端发出查询命令,如果是,则转至步骤606执行,否则转至步骤607执行;
步骤606,判断多个终端的格式命令是否对某一路有冲突,如果是,则转至步骤608执行,否则转至步骤607执行;
步骤607,根据终端的要求配置输出音频的格式;
步骤608,麦克和终端通过自协商决定音频输出的格式,由麦克最终决定;
步骤609,根据音频输出格式,对各路音频进行相应处理如压缩、格式封装等,然后采用不同IP通过网络发送至各个终端,结束后转至步骤604循环执行。
综上所述,本发明具有如下特点:
1.分布式输出,本发明所采集的多路音源输出目标是由终端设备选择的,可以是单独一路,也可以是多路;
2.分布式输入,由于有传统麦克输入的选择,本发明不再局限在同一个会场中的同一房间内使用,通过网络还可以接入异地的音频输入,不再受音频输入距离和地域的限制;
3.减少连线,本发明只需要一根网线输出,较之传统模拟麦克连线的减少显而易见,特别是终端设备数目比较多时该优势尤为突出;
4.智能管理,本发明分布式麦克的输出格式是由终端设备决定的,如有多台终端对同一输入麦克的输出格式需求有冲突,即不同终端对同一音频源要求不同格式输出的情况,麦克和终端通过自协商以最大能力输出,无需人为干预;
5.音频处理前移,本发明将编码压缩、混音、回声抵消等音频处理前移至DSP中进行,间接提升了与之相连终端的性能;
6.高抗干扰特性,传统的麦克由于抗干扰特性差,都有使用距离的限制,本发明中间处理过程采用数字信号,后端输出则采用网线,这些措施都极大提高了信号输出的信噪比。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。