书签 分享 收藏 举报 版权申诉 / 41

多屏视频会议中对与会者图像显示进行调整的方法及装置.pdf

  • 上传人:b***
  • 文档编号:4305789
  • 上传时间:2018-09-13
  • 格式:PDF
  • 页数:41
  • 大小:733.55KB
  • 摘要
    申请专利号:

    CN201010279924.1

    申请日:

    2010.09.09

    公开号:

    CN102404542A

    公开日:

    2012.04.04

    当前法律状态:

    授权

    有效性:

    有权

    法律详情:

    授权|||实质审查的生效IPC(主分类):H04N 7/15申请日:20100909|||公开

    IPC分类号:

    H04N7/15

    主分类号:

    H04N7/15

    申请人:

    华为终端有限公司

    发明人:

    吴姣黎; 陈显义; 宋文

    地址:

    518129 广东省深圳市龙岗区坂田华为基地B区2号楼

    优先权:

    专利代理机构:

    深圳市深佳知识产权代理事务所(普通合伙) 44285

    代理人:

    彭愿洁;李文红

    PDF完整版下载: PDF下载
    内容摘要

    本发明实施例提供一种多屏视频会议中对与会者图像显示进行调整的方法及装置,其中对与会者图像显示进行调整的方法包括按照当前会议中与会者音量从大到小的顺序,从音量最大的与会者开始,依次确定预定个数的待显示的与会者;确定第一会场中预定个数的当前显示的与会者对应的屏幕作为需要切换图像的屏幕;控制所述需要切换图像的屏幕所显示的图像切换为所述预定个数的待显示与会者的图像。采用本发明提供的技术方案,能够使第一会场中的与会者看到参与讨论的与会者图像。

    权利要求书

    1: 一种多屏视频会议中对与会者图像显示进行调整的方法, 其特征在于, 包括 : 按照当前会议中与会者音量从大到小的顺序, 从音量最大的与会者开始, 依次确定预 定个数的待显示的与会者 ; 确定第一会场中预定个数的当前显示的与会者对应的屏幕作为需要切换图像的屏 幕; 控制所述需要切换图像的屏幕所显示的图像切换为所述预定个数的待显示与会者的 图像。2: 根据权利要求 1 所述的方法, 其特征在于, 所述确定第一会场中预定个数的当前显 示的与会者对应的屏幕作为需要切换图像的屏幕, 具体为 : 根据第一会场的屏幕当前显示的与会者的排序结果, 确定第一会场中预定个数的当前 显示的与会者对应的屏幕作为需要切换图像的屏幕。3: 根据权利要求 2 所述的方法, 其特征在于, 所述第一会场的屏幕当前显示的与会者 的排序结果是按照如下排序条件进行的, 所述排序条件包括如下条件之一 : 当前显示的与 会者的声音大小、 当前显示的与会者的发言时间点远近、 当前显示的与会者的发言时长、 第 一会场的屏幕当前显示的与会者的发言次数和第一会场的屏幕当前显示的与会者所对应 的屏幕是否为主屏。4: 根据权利要求 3 所述方法, 其特征在于, 其中, 所述排序结果是按照如下方式之一进 行排序 : 当前显示的与会者按照声音从大到小的顺序 ; 当前显示的与会者的发言时间点按照从近到远的顺序 ; 当前显示的与会者的发言时长按照从长到短的顺序 ; 第一会场的屏幕当前显示的与会者的发言次数按照从多到少的顺序。5: 根据权利要求 4 所述的方法, 其特征在于, 所述预定个数为 1 个 ; 根据第一会场的屏幕当前显示的与会者的排序结果, 确定所述第一会场中预定个数的 当前显示的与会者对应的屏幕作为需要切换图像的屏幕包括 : 根据所述第一会场的屏幕当前显示的与会者的排序结果, 判断排在最后的当前显示的 与会者所在的屏幕是否是第一特定屏幕, 如果否, 确定需要切 换图像的屏幕为所述排在最 后的当前显示的与会者所在的屏幕 ; 如果是, 确定需要切换图像的屏幕为所述排在最后的 当前显示的与会者的前一个当前显示的与会者所在的屏幕 ; 其中, 所述第一特定屏幕与第 二特定屏幕关于屏幕中心线对称, 所述第二特定屏幕是能和声音最大的发言者图像达到眼 对眼效果的第一会场的屏幕, 屏幕中心线为所述第一会场中各屏幕依次连接所形成的屏幕 组的几何中心线。6: 根据权利要求 4 所述的方法, 其特征在于, 控制所述需要切换图像的屏幕所显示的图像切换为所述预定个数的待显示的与会者 的图像包括 : 当所述预定个数的待显示的与会者的图像中存在至少两个待显示的与会者的图像来 自于第二会场时, 控制所述需要切换图像的屏幕中至少两个屏幕所显示的图像切换为所述 至少两个待显示的与会者的图像, 使得在所述第一会场中显示的所述至少两个待显示的与 2 会者的图像的方向顺序与所述至少两个待显示的与会者在所述第二会场中的物理位置的 顺序相同。7: 根据权利要求 4 所述的方法, 其特征在于, 该方法还包括 : 控制当前声音最大的待显示的与会者所在会场的全景图像经过图像处理后, 叠加到当 前声音最大的待显示的与会者的图像的部分区域上显示。8: 根据权利要求 4 所述的方法, 其特征在于, 在按照当前会议中与会者音量从大到小 的顺序, 从音量最大的与会者开始, 依次确定预定个数的待显示的与会者之前, 该方法还包 括: 控制具有相同屏幕个数的各会场同一编号的屏幕具有相同的视频源。9: 根据权利要求 8 所述的方法, 其特征在于, 所述控制具有相同屏幕个数的各会场同一编号的屏幕具有相同的视频源包括 : 获取当前声音最大的待显示的与会者的图像, 判断所述第一会场中第二特定屏幕是否 能显示所述声音最大的待显示的与会者的图像, 如果是, 控制所述第二特定屏幕显示所述 声音最大的待显示的与会者的图像 ; 如果否, 则确定所述第一会场中离所述第二特定屏幕 的物理距离最近, 且能显示所述声音最大的待显示的与会者的图像的屏幕, 控制所述确定 的屏幕显示所述当前 声音最大的待显示的与会者的图像, 其中, 所述第二特定屏幕是能和 声音最大的发言者图像达到眼对眼效果的第一会场的屏幕。10: 根据权利要求 4 或 8 所述的方法, 其特征在于, 在控制所述需要切换图像的屏幕所显示的图像切换为所述预定个数的待显示与会者 的图像之后, 该方法还包括 : 控制除所述第一会场以外的其他会场的相应屏幕显示的图像切换为预定个数的待显 示的与会者的图像 ; 其中, 所述其他会场的相应屏幕与所选择的第一会场中需要切换图像 的屏幕具有相同的编号。11: 一种网络侧媒体处理设备, 其特征在于, 包括 : 与会者选择单元, 用于按照当前会议中与会者音量从大到小的顺序, 从音量最大的与 会者开始, 依次确定预定个数的待显示的与会者 ; 屏幕选择单元, 用于确定第一会场中预定个数的当前显示的与会者对应的屏幕作为需 要切换图像的屏幕 ; 第一控制切换单元, 用于控制所述需要切换图像的屏幕所显示的图像切换为所述预定 个数的待显示与会者的图像。12: 根据权利要求 11 所述的设备, 其特征在于, 所述屏幕选择单元具体用于 : 根据第一 会场的屏幕当前显示的与会者的排序结果, 确定第一会场中预定个数的当前显示的与会者 对应的屏幕作为需要切换图像的屏幕。13: 根据权利要求 12 所述的设备, 其特征在于, 所述设备还包括 : 排序单元, 用于按照排序条件对第一会场的屏幕当前显示的与会者进行排序, 得到所 述第一会场的屏幕当前显示的与会者的排序结果, 所述排序条件为如下条件之一 : 当前显 示的与会者的声音大小、 发言时间点远近、 发言时长、 第一会场的屏幕当前显示的与会者的 发言次数和第一会场的屏幕当前显示的与会者所对应的屏幕是否为主屏。14: 根据权利要求 13 所述的设备, 其特征在于, 所述排序结果是按照如下方式之一进 3 行排序 : 当前显示的与会者按照声音从大到小的顺序 ; 当前显示的与会者的发言时间点按照从近到远的顺序 ; 当前显示的与会者的发言时长按照从长到短的顺序 ; 第一会场的屏幕当前显示的与 会者的发言次数按照从多到少的顺序。15: 根据权利要求 14 所述的设备, 其特征在于, 所述预定个数为 1 个 ; 所述屏幕选择单元包括 : 第一选择子单元, 用于根据第一会场的屏幕当前显示的与会者的排序结果, 选择排在 最后的当前显示的与会者所在的屏幕 ; 特定屏幕判断子单元, 用于判断所述排在最后的当前显示的与会者所在的屏幕是否是 第一特定屏幕, 其中, 所述第一特定屏幕与第二特定屏幕关于屏幕中心线对称, 所述第二特 定屏幕是能和声音最大的发言者图像达到眼对眼效果的第一会场的屏幕, 屏幕中心线为所 述第一会场中各屏幕依次连接所形成的屏幕组的几何中心线 ; 第二选择子单元, 用于当所述特定屏幕判断子单元的判断结果为是时, 选择所述排在 最后的当前显示的与会者的前一个当前显示的与会者所在的屏幕 ; 确定子单元, 用于当特定屏幕判断子单元的判断结果为否时, 确定需要切换图像的屏 幕为所述第一选择子单元所选择的屏幕 ; 当特定屏幕判断子单元的判断结果为是时, 确定 需要切换图像的屏幕为所述第二选择子单元所选择的屏幕。16: 根据权利要求 14 所述的设备, 其特征在于, 所述第一控制切换单元具体用于当所述预定个数的待显示的与会者的图像中存在至 少两个待显示的与会者的图像来自于第二会场时, 控制所述需要切换图像的屏幕中至少两 个屏幕所显示的图像切换为所述至少两个待显示与会者的图像, 使得在所述第一会场中显 示的所述至少两个待显示的与会者的图像的方向顺序与所述至少两个待显示的与会者在 所述第二会场中的物理位置的顺序相同。17: 根据权利要求 14 所述的设备, 其特征在于, 还包括 : 控制叠加单元, 用于控制当前声音最大的待显示的与会者所在会场的全景图像经过图 像处理后, 叠加到当前声音最大的待显示的与会者的图像的部分区域上显示。18: 根据权利要求 14 所述的设备, 其特征在于, 还包括 : 视频源控制单元, 用于控制具有相同屏幕个数的各会场同一编号的屏幕具有相同的视 频源。19: 根据权利要求 18 所述的设备, 其特征在于, 视频源控制单元包括 : 第一确定子单元, 用于判断第一会场中第二特定屏幕是否能显示当前声音最大的待显 示的与会者的图像, 所述第二特定屏幕是能和声音最大的待显示的发言者图像达到眼对眼 效果的第一会场的屏幕 ; 第二确定子单元, 用于在所述第一确定子单元的判断结果为否时, 则确定所述第一会 场中离所述第二特定屏幕的物理距离最近, 且能显示所述声音最大的待显示的与会者的图 像的屏幕 ; 4 控制显示子单元, 用于在所述第一确定子单元的判断结果为是时, 控制所述第二特定 屏幕显示所述声音最大的待显示的与会者的图像 ; 在所述第一确定子单元的判断结果为否 时, 控制所述第二确定子单元所确定的屏幕显示所述声音最大的待显示的与会者的图像。20: 根据权利要求 14 或 18 所述的设备, 其特征在于, 还包括 : 第二控制切换单元, 用于控制除所述第一会场以外的其他会场的相应屏幕显示的图像 切换为预定个数的待显示的与会者的图像 ; 其中, 所述其他会场的相应屏幕与所选择的第 一会场中需要切换图像的屏幕具有相同的编号。21: 根据权利要求 11-19 任一权利要求所述的设备, 其特征在于, 所述网络侧媒体处理 设备为 : 多点控制单元。

    说明书


    多屏视频会议中对与会者图像显示进行调整的方法及装置

        技术领域 本发明涉及通信技术领域, 特别涉及一种多屏视频会议中对与会者图像显示进行 调整的方法及装置。
         背景技术 视讯会议业务是一种多媒体通信业务, 其利用视讯终端和通信网络召开会议, 可 以同时实现两地或多个地点之间的图像、 语音、 数据的交互。 会场中的终端将本地摄像机拍 摄的图像信号、 与会者区域中的麦克风拾取的与会者的声音信号进行压缩编码, 经过传输 网络传至远方会场。 同时, 通过传输网络接收远方会场传来的数字信号, 对数字信号进行解 码得到远方会场与会者的图像和信号。随着视频会议的发展, 会场已经由以前的一个摄像 机、 一个显示器、 一个与会者区域发展到多个摄像机、 多个显示器、 多个与会者区域, 这些在 同一会场的多个摄像机、 多个显示器、 多个与会者区域通过物理的或者逻辑的关系进行关 联。
         现有技术提供一种按会场的声控切换方法, 通信网络中的多点控制服务器 ( 以 MCU, Multipoint Control Unit, 即多点控制单元为例 ) 识别当前声音最大的发言者, 将当 前声音最大的发言者所在会场的各与会者的图像都切换到目标会场中, 其中目标会场是会 议中除最大发言者所在会场以外的各会场。
         现有技术具有如下缺点 :
         现有技术中目标会场只能显示同一会场的各与会者图像, 即只能显示声音最大的 与会者所在会场的各与会者图像, 这样, 如果当前参与讨论的与会者是不同会场的与会者 时, 目标会场中的与会者就不能看到当前参与讨论的与会者图像。
         发明内容
         本发明实施例提供一种多屏视频会议中对与会者图像显示进行调整的方法及装 置, 能够灵活的进行按屏幕声控切换, 提高与会者的体验。
         有鉴于此, 本发明实施例提供 :
         一种多屏视频会议中对与会者图像显示进行调整的方法, 包括 :
         按照当前会议中与会者音量从大到小的顺序, 从音量最大的与会者开始, 依次确 定预定个数的待显示的与会者 ;
         确定第一会场中预定个数的当前显示的与会者对应的屏幕作为需要切换图像的 屏幕 ;
         控制所述需要切换图像的屏幕所显示的图像切换为所述预定个数的待显示与会 者的图像。
         一种网络侧媒体处理设备, 包括 :
         与会者选择单元, 用于按照当前会议中与会者音量从大到小的顺序, 从音量最大 的与会者开始, 依次确定预定个数的待显示的与会者 ;屏幕选择单元, 用于确定第一会场中预定个数的当前显示的与会者对应的屏幕作 为需要切换图像的屏幕 ;
         第一控制切换单元, 用于控制所述需要切换图像的屏幕所显示的图像切换为所述 预定个数的待显示与会者的图像。
         本发明实施例确定第一会场中预定个数的当前显示的与会者对应的屏幕作为需 要切换图像的屏幕, 然后将需要切换图像的屏幕中的图像切换为根据会议中各与会者音量 从大到小的顺序而确定的待显示与会者的图像。 由于所选择的待显示的与会者是按照当前 会议中与会者音量从大到小的顺序而确定的, 所以可以显示当前参与讨论、 且位于不同会 场的与会者, 能够使第一会场中的与会者看到参与讨论的与会者图像, 提高与会者的体验。 附图说明 为了更清楚地说明本发明实施例的技术方案, 下面将对实施例中所需要使用的附 图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本发明的一些实施例, 对于本领域 普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。
         图 1 是多屏会场的结构示意图 ;
         图 2A 是本发明一实施例提供的多屏视频会议中对与会者图像显示进行调整的方 法流程图 ;
         图 2B 是本发明另一实施例提供的多屏视频会议中对与会者图像显示进行调整的 方法流程图 ;
         图 2C 是本发明又一实施例提供的多屏视频会议中对与会者图像显示进行调整的 方法流程图 ;
         图 2D 是本发明又一实施例提供的多屏视频会议中对与会者图像显示进行调整的 方法流程图 ;
         图 3 是本发明实施例提供的一种基于最近发言者列表对与会者图像显示进行调 整的方法流程图 ;
         图 4 是本发明实施例提供的另一种基于最近发言者列表对与会者图像显示进行 调整的方法流程图 ;
         图 5 是本发明实施例提供的又一种基于最近发言者列表对与会者图像显示进行 调整的方法流程图 ;
         图 6A 是本发明实施例提供的采用图 3、 4 或者 5 的方法切换三屏会场屏幕的图像 的示意图 ;
         图 6B 是本发明实施例提供的采用图 3、 4 或者 5 的方法切换两屏会场屏幕的图像 的示意图 ;
         图 6C 是本发明实施例提供的采用指定显示最大发言者图像的屏幕的方法切换三 屏会场屏幕的图像的示意图 ;
         图 6D 是本发明实施例提供的采用指定显示最大发言者图像的屏幕的方法切换两 屏会场屏幕的图像的示意图 ;
         图 7 是本发明实施例提供的一种考虑会场中屏幕的位置对与会者图像显示进行 调整的方法流程图 ;
         图 8 是本发明实施例提供的会场将多画面图像叠加显示在声音最大的发言者图 像上的示意图 ;
         图 9 是本发明实施例提供的会场中的放音设备播放混音 ( 远端会场的多个与会者 声音 ) 的示意图 ;
         图 10 是本发明实施例提供的显示声音最大的与会者图像的同时显示多画面的示 意图 ;
         图 11 是本发明实施例提供的一种网络侧媒体处理设备结构图 ;
         图 12、 图 13 分别为屏幕选择单元结构图 ;
         图 14 为视频源控制单元结构图。 具体实施方式
         为使本发明实施例的目的、 技术方案和优点更加清楚, 下面将结合本发明实施例 中的附图, 对本发明实施例中的技术方案进行清楚、 完整地描述, 显然, 所描述的实施例是 本发明一部分实施例, 而不是全部的实施例。 基于本发明中的实施例, 本领域普通技术人员 在没有作出创造性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。 参阅图 2A, 本发明实施例提供一种多屏视频会议中对与会者图像显示进行调整的 方法, 该方法具体包括 :
         201A、 按照当前会议中与会者音量从大到小的顺序, 从音量最大的与会者开始, 依 次确定预定个数的待显示的与会者。
         其中, 与会者的音量从大到小的顺序, 在需要对与会者的图像显示进行调整时, 对 与会者的一段时间讲话的音量能量值进行统计, 所述的一段时间可以为需要对与会者的图 像进行调整的时刻之前的一段时间, 该一段时间的时长可以由用户设定 ; 其中, 预定个数可 以是一个, 此时所确定的与会者为声音最大的与会者 ; 或者, 预定个数为多个, 具体可以由 网络侧媒体处理设备设置的, 也可以是网络侧业务管理平台或者网络侧设备管理平台设置 的, 还可以是由终端设置并发送给网络侧媒体处理设备, 比如, 主席会场的终端设置后发送 给网络侧媒体处理设备。
         202A、 确定第一会场中预定个数的当前显示的与会者对应的屏幕作为需要切换图 像的屏幕。
         具体的, 可以根据用户的自定义选择, 也可以根据会议过程中管理员的指定, 还可 以根据第一会场的屏幕当前显示的与会者的排序结果, 来确定第一会场中预定个数的当前 显示的与会者对应的屏幕作为需要切换图像的屏幕。其中, 第一会场的屏幕当前显示的与 会者的排序结果是按照如下排序条件进行的, 所述排序条件包括如下条件之一 : 当前显示 的与会者的声音大小、 当前显示的与会者的发言时间点远近、 当前显示的与会者的发言时 长、 第一会场的屏幕当前显示的与会者的发言次数和第一会场的屏幕当前显示的与会者所 对应的屏幕是否为主屏。 其中, 排序结果可以是按照如下方式之一进行排序 : 当前显示的与 会者按照声音从大到小的顺序 ; 当前显示的与会者的发言时间点按照从近到远的顺序 ; 当 前显示的与会者的发言时长按照从长到短的顺序 ; 第一会场的屏幕当前显示的与会者的发 言次数按照从多到少的顺序 ; 此外, 第一会场的屏幕当前显示的与会者所对应的屏幕是否 为主屏可以作为附加的排序条件, 屏幕为主屏的第一会场的当前显示的与会者的排序顺序
         位于屏幕为非主屏的第一会场的当前显示的与会者的排序顺序之前。
         在视讯会议中, 一般声音最小的与会者是没有参与讨论的与会者, 声音较大的与 会者是参与讨论的与会者, 所以为了能选择到没有参与讨论的与会者所在屏幕作为待切换 的屏幕, 所以将当前显示的与会者的声音大小作为排序条件之一 ; 在视讯会议中, 一般发言 时间点较近的与会者再次发言的概率比较大, 发言时间点较远的与会者再次发言的概率比 较小, 所以将当前显示的与会者的发言时间点远近作为排序条件之一 ; 在视讯会议中, 一 般发言时间长的与会者再次发言的概率比较大, 发言时长短的与会者再次发言的概率比较 小, 所以将当前显示的与会者的发言时长作为排序条件之一 ; 在视讯会议中, 一般经常发言 的人其再次发言的概率就会更高, 为了更好的统计与会者发言的概率, 所以可以将与会者 的发言次数作为排序条件之一 ; 另外, 在视讯会议中, 对于奇数个显示屏幕的会场, 中间的 屏幕对应的主屏 ; 对于偶数个显示屏幕的会场, 中轴线相邻的两个屏幕对应的是主屏, 而主 屏一般呈现会议主席等会议主要参与者的图像, 因此, 为了更好的统计主屏呈现的与会者, 所以可以将第一会场的屏幕当前显示的与会者所对应的屏幕是否为主屏主屏作为排序条 件。
         对于不同的排序条件可以按照相应的重要性设定对应的权重 ( 作为举例 : 所有的 排序条件分配的权重之和归一化为 1, 当然, 也可以设计权重之和不为 1 的情况 ), 并对各个 排序条件的因素按照其特征定义取值范围, 然后通过计算这些因素的加权和作为排序参考 值;
         如下举例说明 : 假定与会者声音大小的权重为 0.1、 发言时间点远近的权重为 0.4、 发言时长的权重为 0.2、 发言次数多少的权重为 0.2、 与会者所在屏幕是否为主屏的权 重为 0.1, 所有这些因素的权重之和为 1。而且, 所有这些因素都有自己的值, 比如, 与会者 声音大小的取值范围为 1 ~ 10, 其中, 声音越大, 取值越大, 声音越小, 取值越小, 其中, 各与 会者声音的大小为最近发言时间点的各与会者声音的大小 ; 发言时间点的取值范围为 1 ~ 1000, 各与会者发言时间点为各与会者最近一次发言的时间点, 其中, 可以假定会议开始时 记为 1, 然后过 1 分钟, 就加 1 ; 发言时长取值范围 1 ~ 500, 以分钟为单位, 其可以是与会 者最近一次发言的时长, 也可以是与会者特定时间段内发言时长的累加值, 比如与会者在 1 小时之内发言的总时长 ; 发言次数取值范围为 1 ~ 100, 其可以为特定时间段内的发言次 数, 比如 1 小时之内的发言次数, 也可以是从会议开始算起得到的总发言次数 ; 与会者所在 屏幕取值为 0 或者 1, 即与会者所在屏幕为主屏时, 则取值为 1, 否则取值为 0, 对于三屏或者 五屏会场, 中间的屏幕为主屏, 对于四屏会场, 可以认为中间的两个为主屏。然后按照以下 公式计算各与会者的排序参考值 :
         与会者的排序参考值=与会者的声音 × 与会者声音大小权重 + 与会者的发言时 间点 × 发言时间点权重 + 与会者的发言时长 × 发言时长权重 + 与会者的发言次数 × 发 言次数权重 + 与会者的与会者所在屏幕 × 与会者所在屏幕权重。
         然后, 按照排序参考值从大到小的顺序对各与会者进行排序, 选择排序结果靠后 的预定个数的与会者所对应的屏幕作为需要切换图像的屏幕。
         其中, 需要说明的是, 在对第一会场的屏幕当前显示的与会者进行排序时, 可以仅 考虑各与会者声音的大小, 此时按照与会者的声音从大到小的顺序进行排序 ; 也可以仅考 虑各与会者发言时间点的远近, 此时按照与会者的发言时间点从近到远的顺序进行排序 ;也可以仅考虑各与会者的发言时长, 此时按照与会者的发言时长从长到短的顺序进行排 序; 也可以仅考虑各与会者声音的大小和各与会者发言时间点的远近, 而不考虑其他条件, 假定与会者声音的权重为 0.4、 发言时间点的权重为 0.6, 可以假定与会者声音大小的取值 范围为 1 ~ 10, 其中, 声音越大, 取值越大, 声音越小, 取值越小, 其中, 各与会者声音的大小 为最近发言时间点的各与会者声音的大小, 发言时间点的取值范围为 1 ~ 1000, 各与会者 发言时间点为各与会者最近一次发言的时间点, 此时, 按照以下公式计算各与会者的排序 参考值 : 与会者的排序参考值=与会者的声音 × 与会者声音大小权重 + 与会者的发言时间 点 × 发言时间点权重, 然后, 按照排序参考值从大到小的顺序对各与会者进行排序 ; 或者, 也可以仅考虑各与会者的发言时长和各与会者发言时间点的远近, 而不考虑其他条件, 不 影响本发明的实现。
         203A、 控制所述需要切换图像的屏幕所显示的图像切换为所述预定个数的待显示 与会者的图像。
         假定预定个数为两个, 而排序条件为按照声音从大到小的方式进行排序, 则该步 骤是选择声音最大的与会者和声音次大的与会者, 确定声音最大的与会者和声音次大的与 会者对应的屏幕作为需要切换图像的屏幕。 需要说明的, 上述步骤 201A、 与步骤 202A 没有执行上的先后顺序, 可以先执行步 骤 201A 再执行步骤 202A, 也可以先执行步骤 202A 再执行步骤 201A, 也可以同时执行。其 中, 所述预定个数可以为第一会场的与会者提前指定, 可以为会议管理台的管理员提前指 定, 还可以为会议的主席终端的与会者提前指定, 还可以由多媒体控制服务器预先设定。
         需要说明的是, 上述预定个数可以为一个, 也可以为多个, 当预定个数为一个时, 步骤 201A 中就选择了当前声音最大的与会者, 此时, 步骤 203A 可以采用如下方式实现 : 根 据第一会场的屏幕当前显示的与会者的排序结果, 选择排在最后的当前显示的与会者, 判 断所述排在最后的当前显示的与会者所在的屏幕是否是第一特定屏幕, 如果否, 确定需要 切换图像的屏幕为所述排在最后的当前显示的与会者所在的屏幕 ; 如果是, 选择所述排在 最后的当前显示的与会者的前一个当前显示的与会者, 确定需要切换图像的屏幕为所述排 在最后的当前显示的与会者的前一个当前显示的与会者所在的屏幕 ; 其中, 所述第一特定 屏幕与第二特定屏幕关于屏幕中心线对称, 所述第二特定屏幕是能和声音最大的发言者图 像达到眼对眼效果的第一会场的屏幕, 屏幕中心线为所述第一会场中各屏幕依次连接所形 成的屏幕组的几何中心线。
         其中, 由于第二特定屏幕是能和声音最大的发言者图像达到眼对眼效果的第一会 场的屏幕, 而第一特定屏幕与第二特定屏幕关于屏幕中心线对称的屏幕, 这样, 如果声音最 大的发言者图像在第一特定屏幕上显示, 则该声音最大的发言者与第一会场中的与会者达 不到较好的眼对眼效果, 因此, 当排在最后的与会者所在的屏幕是第一特定屏幕时, 就选择 所述排在最后的与会者的前一个与会者所在的屏幕作为需要切换图像的屏幕。
         为了使上述描述更加清楚, 如下以三屏会场为例进行详细说明, 假定有两个三屏 会场, 一个会场中摄像机 1 拍摄的区域 1 的与会者图像缺省在另一会场中的屏幕 1 或者 3 呈现 ( 如果对图像未采用镜像处理技术, 则一会场区域 1 的与会者图像缺省在另一会场的 屏幕 3 呈现 ; 如果对拍摄图像采用镜像处理技术, 则区域 1 的与会者图像缺省在另一会场的 屏幕 1 呈现 ) ; 一个会场中的摄像机 2 拍摄的区域 2 的与会者图像缺省在另一会场的屏幕
         2 呈现, 一个会场中的摄像机 3 拍摄的区域 3 的与会者图像缺省在另一会场的屏幕 1 或者 3 呈现 ( 同一会场的区域 1 的与会者图像在另一会场的呈现方式类似 )。上述一个会场的与 会者图像缺省在另一会场的屏幕上呈现时, 能够使该与会者图像在另一会场中显示时, 该 与会者与另一会场中的与会者达到眼对眼的效果。图 1 示出了未采用镜像处理技术时, 会 场 1 中的与会者在会场 2 中的缺省呈现的方式, 假定两个会场中区域 1 中的与会者为与会 者 1, 区域 2 中的与会者为与会者 2, 区域 3 中的与会者为与会者 3。利用本发明实施例提供 的技术方案, 假定会场 1 中的与会者 1 是当前声音最大的与会者, 则第二特定屏幕为会场 2 中的屏幕 3, 会场 2 中的屏幕 3 关于屏幕中心线对称的屏幕为会场 2 中的屏幕 1, 此时会场 2 中的屏幕 1 为第一特定屏幕, 即会场 1 中的与会者 1 的图像不能在会场 2 中的屏幕 1 显示。 当采用镜像处理技术时, 假定会场 1 中的与会者 1 是当前声音最大的与会者, 则第二特定屏 幕为会场 2 中的屏幕 1, 会场 2 中的屏幕 1 关于屏幕中心线对称的屏幕为会场 2 中的屏幕 3, 此时会场 2 中的屏幕 3 为第一特定屏幕, 即会场 1 中的与会者 1 的图像不能在会场 2 中 的屏幕 3 显示。其中, 需要说明的是, 屏幕数目为奇数的会场, 如果声音最大的发言者图像 所对应的屏幕为中间屏幕时, 则不会存在第一特定屏幕了, 可以直接确定需要切换图像的 屏幕为排在最后的与会者所在的屏幕。 需要说明的是, 当预定个数为 1 个时, 则步骤 201A 确定的与会者为声音最大的与 会者, 当该声音最大的与会者已经在第一会场的屏幕上显示时, 则不再执行步骤 202A 和步 骤 203A。
         其中, 上述方法实施例中的第一会场的屏幕为第一会场中能进行图像切换的屏 幕, 第一会场中能切换图像的屏幕为第一会场中所有的屏幕或者除预定屏幕以外的屏幕。 所述预定屏幕为预定的不能切换图像的屏幕, 比如显示会议数据资料的屏幕 ( 即 : 辅流屏 幕 ), 或者指定显示会议主席的屏幕, 或者指定显示多画面的屏幕。
         需要说明的, 上述各步骤可以由网络侧媒体处理设备执行, 网络侧媒体处理设备 可以是多点控制服务器 ( 以 MCU 为例 ), 也可以是具有上述媒体控制功能的终端设备 ( 譬 如: 集成媒体控制功能的视讯会议终端 ), 还可以是其他网络设备 ; 或者, 步骤 201A 由网络 侧媒体处理设备执行, 而步骤 202A 由第一会场的终端执行, 具体的 : 第一会场的终端根据 第一会场的屏幕当前显示的与会者的排序结果, 选择预定个数的与会者, 确定所选择的与 会者所对应的屏幕作为需要切换图像的屏幕, 然后将所选择的预定个数的屏幕的编号通知 网络侧媒体处理设备, 此时, 预定个数可以为第一会场的与会者提前指定。
         需要说明的是, 该实施例是以假定预定个数小于或者等于第一会场能切换图像的 屏幕个数, 如果预定个数大于第一会场能切换图像的屏幕个数, 则按照当前会议中与会者 音量从大到小的顺序, 从音量最大的与会者开始, 选择与第一会场能切换图像的屏幕数目 相同的待显示的与会者, 控制第一会场能切换图像的屏幕所显示的图像切换为所选择的待 显示与会者的图像。
         另外, 如果会议中规定某一会场的一个特定与会者在第一会场的某一特定屏幕上 显示时, 则步骤 201A 需要对除所述特定与会者以外的与会者按照音量从大到小的顺序, 从 音量最大的与会者开始, 依次确定预定个数的待显示的与会者, 且在步骤 202A 中需要在除 上述特定屏幕以外的第一会场能切换图像的的屏幕中确定需要切换图像的屏幕。
         本发明实施例确定第一会场中预定个数的当前显示的与会者对应的屏幕作为需
         要切换图像的屏幕, 然后将需要切换图像的屏幕切换为根据会议中各与会者音量从大到小 的顺序而确定的待显示与会者的图像, 由于所选择的待显示的与会者是按照当前会议中与 会者音量从大到小的顺序而确定的, 所以可以显示当前参与讨论、 且位于不同会场的与会 者, 能够使第一会场中的与会者看到参与讨论的与会者图像, 提高与会者的体验。
         参阅图 2B, 本发明实施例提供一种多屏视频会议中对与会者图像显示进行调整 的方法, 该方法中网络侧媒体处理设备具体为 MCU, MCU 先选择当前会议中声音较大的与会 者, 再选择第一会场中需要切换图像的屏幕, 然后控制需要切换图像的屏幕所显示的图像 切换为声音较大的待显示的与会者的图像, 该方法具体包括 :
         201B、 各个会场将采集到的与会者的声音和拍摄得到的与会者的图像都发给 MCU。
         202B、 MCU 启动声控切换。
         其中, 该步骤中 MCU 启动声控切换是指 MCU 可以进行声控切换了。
         203B、 MCU 按照当前会议中与会者音量从大到小的顺序, 从音量最大的与会者开 始, 依次选择预定个数的待显示的与会者。
         该步骤中 MCU 选择预定个数的待显示的与会者表示 MCU 要开始声控切换了。
         其中, 预定个数可以为 1 个或者为多个, 当预定个数为多个, 具体可以是由 MCU 设 置的, 也可以是网络侧业务管理平台或者网络侧设备管理平台设置的, 还可以是由终端设 置并发送给 MCU 的, 比如, 主席会场的终端设置后发送给网络侧媒体处理设备。 204B、 MCU 按照排序条件对第一会场的屏幕当前显示的与会者进行排序, 得到第一 会场的屏幕当前显示的与会者的排序结果。
         具体的, 可以是在周期时间到达时进行排序, 或者随机进行排序, 或者按需进行排 序, 其中, 按需进行排序可以是在 MCU 要开始进行声控切换的时候进行排序。
         其中, 具体的排序方式与步骤 202A 中的相应描述相同, 在此不再赘述。
         205B、 MCU 根据第一会场的屏幕当前显示的与会者的排序结果, 选择预定个数的 当前显示的与会者, 确定所选择的当前显示的与会者所对应的屏幕作为需要切换图像的屏 幕。
         206B、 MCU 控制所述需要切换图像的屏幕所显示的图像切换为所述预定个数的待 显示与会者的图像。
         其中, 当所述预定个数的待显示的与会者的图像中存在至少两个待显示的与会者 的图像来自于同一会场 ( 假定为第二会场 ) 时, 控制所述需要切换图像的屏幕中至少两个 屏幕所显示的图像切换为所述至少两个待显示的与会者的图像, 使得在所述第一会场中显 示的所述至少两个待显示的与会者的图像的方向顺序与所述至少两个待显示的与会者在 所述第二会场中的物理位置的顺序相同。其中, 第一会场中显示第二会场的区域 1 对应的 与会者的图像、 区域 2 对应的与会者的图像的方向顺序为该会场中显示第二会场的区域 1 与会者图像的屏幕、 区域 2 与会者图像的屏幕的方向顺序。
         采用这种图像切换方式, 使得切换后的至少两个待显示的与会者的图像, 能够保 持该至少两个待显示的与会者在原会场的物理位置的顺序相同, 使得在第一会场显示的至 少两个待显示的与会者能够更好的保持在原会场的物理位置不变。
         如下举实例说明 : 假定 2 个五屏会场 ( 会场 A、 会场 B), 会场 A 中区域 1 的与会者 缺省对应的屏幕为屏幕 1, 区域 2/3/4/5 的与会者缺省对应的屏幕分别为屏幕 2/3/4/5, 如
         果 A 会场的区域 1、 区域 2 的与会者图像都在 B 会场中显示, 则 MCU 可以调整第一会场中屏 幕显示的图像, 使第一会场中的屏幕的显示包括但不限于如下几种方式 :
         1)、 显示 A 会场的区域 1 的与会者图像、 区域 2 的与会者图像的屏幕分别为 B 会场 的屏幕 1、 屏幕 2。
         2)、 显示 A 会场的区域 1 的与会者图像、 区域 2 的与会者图像的屏幕分别为 B 会场 的屏幕 2、 屏幕 3。
         3)、 显示 A 会场的区域 1 的与会者图像、 区域 2 的与会者图像的屏幕分别为 B 会场 的屏幕 1、 屏幕 3。
         也就是说显示 A 会场区域 1、 2 的与会者图像的屏幕的方向顺序是按照 1/2/3/4/5 这个方向排序的 ( 即如果以上面描述的缺省对应的方式, 那么显示区域 1 与会者图像的屏 幕编号一定比显示区域 2 与会者图像的屏幕编号小 )。
         本发明实施例中 MCU 根据第一会场中屏幕显示的与会者的排序结果, 选择需要切 换图像的屏幕, 然后将需要切换图像的屏幕切换为根据会议中各与会者音量从大到小的顺 序而选择的与会者的图像, 由于排序结果是根据第一会场中屏幕显示的与会者声音大小、 发言时间点远近、 发言时长中至少一个条件进行排序的排序结果, 所以能够保证当前不断 讲话的与会者的图像都可能在第一会场的屏幕中显示, 能够使第一会场中的与会者看到当 前参与讨论的与会者图像, 提高与会者的体验。
         参阅图 2C, 本发明实施例提供一种多屏视频会议中对与会者图像显示进行调整的 方法, 该方法中网络侧媒体处理设备为 MCU, MCU 先选择第一会场中需要切换图像的屏幕, 再选择当前会议中声音较大的待显示的与会者, 然后控制需要切换图像的屏幕所显示的图 像切换为声音较大的待显示的与会者的图像, 该方法具体包括 :
         201C、 各个会场将采集到的与会者的声音和拍摄得到的与会者的图像都发给 MCU。
         202C、 MCU 启动声控切换。
         其中, 该步骤中 MCU 启动声控切换是指 MCU 可以进行声控切换了。
         203C、 MCU 按照排序条件对第一会场的屏幕当前显示的与会者进行排序, 得到第一 会场的屏幕当前显示的与会者的排序结果。
         其中, 具体的排序方式和排序时间可以参考步骤 204B 的相应描述, 在此不再赘 述。
         204C、 MCU 根据第一会场的屏幕当前显示的与会者的排序结果, 选择预定个数的当 前显示的与会者, 确定所选择的预定个数的当前显示的与会者所对应的屏幕作为需要切换 图像的屏幕。
         205C、 MCU 按照当前会议中与会者音量从大到小的顺序, 从音量最大的与会者开 始, 依次选择预定个数的待显示的与会者。
         该步骤中 MCU 选择预定个数的待显示的与会者表示 MCU 要开始进行声控切换了。 其中, 预定个数可以为 1 个或者为多个, 当预定个数为多个, 具体可以是有由 MCU 设置的, 也 可以是网络侧业务管理平台或者网络侧设备管理平台设置的, 还可以是由终端设置并发送 给 MCU 的, 比如, 主席会场的终端设置后发送给网络侧媒体处理设备。
         206C、 MCU 控制所述需要切换图像的屏幕所显示的图像切换为所述预定个数的待 显示的与会者的图像。本发明实施例中 MCU 根据第一会场中屏幕当前显示的与会者的排序结果, 选择需 要切换图像的屏幕, 然后将需要切换图像的屏幕切换为根据会议中各与会者音量从大到小 的顺序而选择的当前显示的与会者的图像, 由于排序结果是根据第一会场中屏幕显示的与 会者声音大小、 发言时间点远近、 发言时长中至少一个条件进行排序的排序结果, 所以能够 保证当前不断讲话的与会者的图像都可能在第一会场的屏幕中显示, 能够使第一会场中的 与会者看到当前参与讨论的与会者图像, 提高与会者的体验。
         参阅图 2D, 本发明实施例提供一种多屏视频会议中对与会者图像显示进行调整的 方法, 该方法与上述两个实施例的区别在于 : 第一会场的终端根据第一会场的屏幕当前显 示的与会者的排序结果, 选择需要切换图像的屏幕然后通知 MCU, 由 MCU 控制第一会场中屏 幕显示图像的切换, 该方法具体包括 :
         201D、 各个会场将采集到的与会者的声音和拍摄得到的与会者的图像都发给 MCU。
         202D、 MCU 启动声控切换。
         203D、 第一会场的终端按照排序条件对第一会场的屏幕当前显示的与会者进行排 序, 得到第一会场的屏幕当前显示的与会者的排序结果。
         其中, 具体的排序方式和排序时间可以参考步骤 204B 的相应描述, 在此不再赘 述。
         204D、 第一会场的终端根据第一会场的屏幕当前显示的与会者的排序结果, 选择 预定个数的当前显示的与会者, 确定所选择的与会者所对应的屏幕作为需要切换图像的屏 幕。
         205D、 第一会场的终端向 MCU 发送第一会场中需要切换图像的屏幕的编号。
         206D、 MCU 按照当前会议中与会者音量从大到小的顺序, 从音量最大的与会者开 始, 依次确定预定个数的待显示的与会者。
         其中, 预定个数可以为 1 个或者为多个, 当预定个数为多个, 具体可以是由终端设 置并发送给 MCU。
         207D、 MCU 控制所述需要切换图像的屏幕所显示的图像切换为预定个数的待显示 的与会者的图像。
         本发明实施例中第一会场的终端根据第一会场中屏幕显示的与会者的排序结果, 选择需要切换图像的屏幕, 然后由 MCU 控制需要切换图像的屏幕切换为根据会议中各与会 者音量从大到小的顺序而选择出的与会者图像, 由于排序结果是根据第一会场中屏幕显示 的与会者声音大小、 发言时间点远近、 发言时长中至少一个条件进行排序的排序结果, 所以 能够保证当前不断讲话的与会者的图像都可能在第一会场的屏幕中显示, 能够使第一会场 中的与会者看到参与讨论的与会者图像, 提高与会者的体验。
         参阅图 3, 本发明实施例提供一种多屏视频会议中对与会者图像显示进行调整的 方法, 该方法中网络侧媒体处理设备为 MCU, MCU 先选择当前声音最大的与会者对应的图像 作为待显示的图像, 然后根据第一会场中屏幕显示的与会者的声音大小, 选择需要切换图 像的屏幕, 该方法具体包括 :
         301、 各个会场将采集到的与会者的声音和拍摄得到的与会者的图像都发给 MCU。
         302、 MCU 启动声控切换。
         303、 MCU 确定当前声音最大的与会者, 该声音最大的与会者为待显示的与会者。304、 MCU 判断是否满足切换条件, 如果是, 执行 305, 如果否, 结束本流程。
         具体的, 可以是判断当前声音最大的与会者的声音是否持续一个预设时间段, 如 果是, 则满足切换条件, 否则不具备切换条件。
         305、 MCU 判断第一会场中能切换图像的屏幕当前显示的与会者是否有最近发言者 列表中的与会者, 如果否, 则执行 306, 如果是, 则执行 307。
         306、 MCU 根据第一会场的能切换图像的屏幕当前显示的与会者的声音大小, 确定 声音最小的与会者的图像所在的屏幕为需要切换图像的屏幕, 控制该屏幕显示的图像从声 音最小的与会者图像切换为当前声音最大的与会者的图像, 结束本流程。
         其中, 第一会场中能切换图像的屏幕为第一会场中所有的屏幕或者除预定屏幕以 外的屏幕, 所述预定屏幕为预置的不能进行图像切换的屏幕。所述预定屏幕为预定的不能 切换图像的屏幕, 比如显示会议数据资料的屏幕, 或者指定显示会议主席的屏幕, 或者指定 显示多画面的屏幕。
         需要说明的是, 本实施例及后续各实施例中, 可以将多画面图像作为声音最小的 与会者图像, 这样在声控切换启动后, 第一次进行图像切换时就可以将该多画面图像切换 为当前声音最大的与会者图像。 307、 MCU 判断第一会场能切换图像的屏幕当前显示的与会者是否都属于最近发言 者列表, 如果是, 执行 308, 如果否, 则执行 309。
         308、 MCU 按照最近发言者列表中与会者的排序结果, 选择排序结果靠后的与会者 所在的屏幕为需要切换图像的屏幕, 则控制该屏幕显示的图像切换为声音最大的与会者的 图像, 结束本流程。
         其中, 最近发言者列表中与会者的排序方式和排序时间与上述实施例中所描述的 第一会场的屏幕当前显示的与会者的排序方式相同, 在此不再赘述。 其中, 最近发言者列表 也可以是图像列表, 即近期发言的与会者的图像的列表。
         309、 MCU 从不属于最近发言者列表的当前显示的与会者中选择声音最小的与会 者, 将所选择的与会者所在的屏幕作为需要切换图像的屏幕, MCU 控制将该屏幕显示的图像 切换为声音最大的与会者的图像。
         具体的, 可以从不属于最近发言者列表的当前显示的与会者中选择声音最小的与 会者, 则该声音最小的与会者所在的屏幕为需要切换图像的屏幕, 控制该屏幕显示的图像 切换为声音最大的与会者的图像。
         本发明实施例在考虑最近发言列表时, 从不属于最近发言者列表的与会者中选择 待切换的与会者, 或者, 根据最近发言者列表中与会者的排序结果, 选择排序结果靠后的与 会者作为待切换图像, 这种声控切换方法, 能够避免最近经常发言的与会者被切换掉, 使会 场中的用户能够看到参与讨论的与会者图像, 提高与会者的体验 ; 进一步, 只要声音最大的 发言者的声音满足切换条件, 则可以将声音最大的发言者的图像切换到会场中, 使会场中 的用户即时看到声音最大的与会者的图像, 提高与会者的体验。
         参阅图 4, 本发明实施例提供一种多屏视频会议中对与会者图像显示进行调整的 方法, 该方法中与图 3 所示实施例的区别在于 : MCU 先根据第一会场中屏幕显示的与会者 的声音大小, 选择需要切换图像的屏幕, 然后再选择当前声音最大的与会者, 该方法具体包 括:
         401、 各个会场将采集得到的与会者的声音和获取得到的与会者的图像都发给MCU。 402、 MCU 启动声控切换。
         403、 周期时间到达时, MCU 判断第一会场中能切换图像的屏幕当前显示的与会者 是否有最近发言者列表中的与会者, 如果否, 则执行 404, 如果是, 则执行 405。
         具体的, 可以预先设定周期时间, 比如一个周期为 2s, 这样每隔两秒就会执行步骤 403。
         404、 MCU 根据第一会场的能切换图像的屏幕当前显示的与会者的声音大小, 选择 声音最小的与会者的图像所在的屏幕作为需要切换图像的屏幕。
         其中, 第一会场中能切换图像的屏幕的定义与图 3 所示实施例相应部分的描述相 同, 在此不再赘述。
         405、 MCU 判断第一会场能切换图像的屏幕当前显示的与会者是否都属于最近发言 者列表, 如果是, 执行 406, 如果否, 则执行 407。
         406、 MCU 按照最近发言者列表中与会者的排序结果, 选择排序结果靠后的与会者 所在的屏幕为需要切换图像的屏幕。
         其中, 最近发言者列表中与会者的排序方式和排序时间与上述实施例中所描述的 第一会场的屏幕当前显示的与会者的排序方式相同, 在此不再赘述。 其中, 最近发言者列表 也可以是图像列表, 即近期发言的与会者的图像的列表。
         407、 MCU 从不属于最近发言者列表的当前显示的与会者中选择声音最小的与会 者, 将所选择的与会者所在的屏幕作为需要切换图像的屏幕。
         408、 MCU 确定当前声音最大的发言者, 该声音最大的与会者为待显示的与会者。
         409、 MCU 判断是否具备切换条件, 如果是, 执行 410, 如果否, 不进行处理, 返回执 行步骤 403。
         410、 MCU 控制需要切换图像的屏幕显示的图像切换为声音最大的与会者的图像。
         本发明实施例在考虑最近发言列表时, 在不属于最近发言者列表的当前显示的与 会者中选择待切换的与会者, 或者, 根据最近发言者列表中与会者的排序结果, 选择排序结 果靠后的与会者作为待切换的与会者, 这种声控切换方法, 能够避免最近经常发言的与会 者图像被切换掉, 使会场中的用户能够看到参与讨论的与会者图像, 提高与会者的体验。
         参阅图 5, 本发明实施例提供一种多屏视频会议中对与会者图像显示进行调整的 方法, 该方法中与图 3、 图 4 所示实施例的区别在于 : 第一会场的终端根据第一会场中屏幕 显示的与会者的声音大小, 选择需要切换图像的屏幕然后通知 MCU, 该方法具体包括 :
         501、 各个会场将与会者的声音和与会者的图像都发给 MCU。
         502、 MCU 启动声控切换。
         503、 周期时间到达时, 第一会场的终端判断第一会场中能切换图像的屏幕当前显 示的与会者是否有最近发言者列表中的与会者, 如果否, 则执行 504, 如果是, 则执行 505。
         具体的, 可以预先设定周期时间, 比如一个周期为 2s, 这样每隔两秒就会执行步骤 503。
         504、 第一会场的终端根据第一会场能切换图像的屏幕当前显示的与会者的声音 大小, 选择声音最小的与会者的图像所在的屏幕作为需要切换图像的屏幕。
         其中, 第一会场中能切换图像的屏幕的定义与图 3 所示实施例相应部分的描述相 同, 在此不再赘述。
         505、 第一会场的终端判断第一会场能切换图像的屏幕当前显示的与会者是否都 属于最近发言者列表, 如果是, 执行 506, 如果否, 则执行 507。
         506、 第一会场的终端按照最近发言者列表中与会者的排序结果, 选择排序结果靠 后的与会者所在的屏幕为需要切换图像的屏幕。
         其中, 最近发言者列表中与会者的排序方式和排序时间与上述实施例中所描述的 第一会场的屏幕当前显示的与会者的排序方式相同, 在此不再赘述。 其中, 最近发言者列表 也可以是图像列表, 即近期发言的与会者的图像的列表。
         507、 第一会场的终端从不属于最近发言者列表的当前显示的与会者中选择声音 最小的与会者, 将所选择的与会者所在的屏幕作为需要切换图像的屏幕。
         508、 第一会场的终端向 MCU 发送需要切换图像的屏幕的编号。
         509、 MCU 确定当前声音最大的发言者, 该声音最大的发言者为待显示的与会者。
         510、 MCU 判断是否具备切换条件, 如果是, 执行 511, 如果否, 不进行处理, 结束本 流程。
         511、 MCU 控制需要切换图像的屏幕显示的图像切换为声音最大的与会者的图像。
         本发明实施例在考虑最近发言列表时, 在不属于最近发言者列表的与会者中选择 待切换的与会者, 或者, 根据最近发言者列表中与会者的排序结果, 选择排序结果靠后的与 会者作为待切换的与会者, 这种声控切换方法, 能够避免最近经常发言的与会者图像被切 换掉, 使会场中的用户能够看到参与讨论的与会者图像, 提高与会者的体验。进一步, 由第 一会场的终端选择需要切换图像的屏幕, 减少了 MCU 的工作, 降低了对 MCU 的要求。
         如下对最近发言者列表进行详细介绍 :
         1、 关于与会者的排序方式参见步骤 202A 的详细描述, 在此不再赘述。
         2、 当最近发言者列表为图像列表时, 可以控制会议主席图像一直位于发言者图像 列表中, 多画面图像一直位于发言者图像列表中。 其中, 会议主席图像可以在会议一开始就 进入最近发言者列表, 也可以在会议主席讲话后切入最近发言者列表中, 具体的, 若当前声 音最大的发言者为会议主席时, 将该会议主席图像放入最近发言者列表中。
         3、 关于最近发言者列表的更新, 有如下几种更新方式 :
         1)、 可以将当前声音最大的发言者放入最近发言者列表中, 具体的, 可以在将当前 声音最大的发言者图像切换到屏幕上显示之后, 将当前声音最大的发言者放入最近发言者 列表, 也可以在切换之前, 将当前声音最大的发言者放入最近发言者列表。
         2)、 在启动声控切换时, 将会场中当前各屏幕显示的与会者放入最近发言者列表 中。
         3)、 当最近发言者列表中与会者的个数大于会场中屏幕的个数时, 根据最近发言 者列表的排序结果, 将在最近发言者列表中的排序位数超过会场中屏幕的个数的与会者删 除; 或者, 当最近发言者列表中与会者的个数大于会场中屏幕的个数时, 清空最近发言者列 表。
         4)、 当最近发言者列表中有预定时间段内没有发言的与会者时, 将所述预定时间 段内没有发言的与会者从最近发言者列表中删除。5)、 最近发言者列表中与会者的个数大于会场中除特定屏幕以外的屏幕个数时, 将在最近发言者列表中的排序位数超过除特定屏幕以外的屏幕个数的与会者删除, 或者, 将最近发言者列表清空, 其中特定屏幕是不能进行图像切换的屏幕, 比如专用于显示会议 辅助资料的屏幕等。
         4、 当已确定最近发言者列表中的与会者所在的屏幕需要进行图像切换时, 也可以 采用下面这几种特殊策略 :
         第一、 选择能和当前声音最大的与会者达到眼对眼效果的屏幕显示该当前声音最 大的与会者的图像, 或者, 选择与能和当前声音最大的与会者达到眼对眼效果的屏幕相邻 的屏幕来显示该声音最大的与会者的图像。例如, 当前声音最大与会者为 A 会场左侧的与 会者, 假定能和当前声音最大的与会者达到眼对眼效果的屏幕为 B 会场左侧的屏幕, 则选 择 B 会场左侧的屏幕作为需要切换图像的屏幕, 或者, 选择 B 会场的中间屏幕作为需要切换 图像的屏幕。
         第二、 如果当前声音最大与会者与最近发言者列表中的某个与会者为同一会场中 的发言者时, 选择在同一会场的与会者图像所在屏幕的附近屏幕显示该当前声音最大的与 会者图像。
         第三、 优先切换主屏幕的图像。
         第四、 不切换本会场中的第一特定屏幕或者第一特定屏幕外侧的屏幕的图像, 其 中, 对第一特定屏幕的描述请参见第一个实施例步骤 202A 中的相关描述, 在此不再赘述。 第一特定屏幕外侧的屏幕为第一特定屏幕背向几何中心线一侧的屏幕, 比如一个五屏会 场, 如果第一特定屏幕为屏幕 4, 则第一特定屏幕外例的屏幕为屏幕 5, 如果第一特定屏幕 为屏幕 2, 则第一特定屏幕外侧的屏幕为屏幕 3。
         第五、 将最近发言者列表中声音最小的与会者的图像切换掉。
         5、 对于多屏会场, 每个摄像机拍摄一组与会者, 这组与会者共享一个或者多个 MIC( 麦克风, 简称麦克 ), 这组 MIC 的声音代表该会场声音的一个方位 ( 比如左、 中、 右中的 左方位 ), 各会场把不同方位的 MIC 的声音发送给 MCU, MCU 在声控切换时, 会把声音最大的 那组 MIC( 这组 MIC 对应了一个会场中的一个方位 ) 的对应的图像进行显示切换 ; 或者多个 摄像机拍摄一组与会者甚至整个会场的图像, 这组与会者共享一组 MIC, 这组 MIC 的声音代 表一个声音方位或者整个会场的声音 ( 比如单声音道语音协议的情况下, 就是代表整个会 场 ), 各会场把不同方位的 MIC 的声音发送给 MCU, MCU 在声控切换时, 会把声音最大的那组 MIC( 这组 MIC 对应了一个会场中的一个方位或者一个会场 ) 对应的图像 ( 多个摄像机所拍 摄的一组与会者的图像或者整个会场的图像 ) 进行显示切换 ; 对于上述两种情况, 还可以 有另外一种处理方式, 即各会场从本会场各组 MIC 对应的方位声音中选出前几大声音, 即 选出几组 MIC 的声音, 把选出的声音发送 MCU, MCU 再从整个会议中选出声音最大那组 MIC, 把其对应的图像进行显示切换。
         为了使本发明上述实施例更加清楚明白, 参阅图 6A, 如下以三屏会场为例, 详细说 明本发明实施例提供的多屏视频会议中对与会者图像显示进行调整的方法, 图中, A 会场、 B 会场、 C 会场、 D 会场都为 3 屏会场, E 会场、 F 会场、 G 会场都为 2 屏会场, J 会场、 K 会场都 为单屏会场, 具体的, 在启动声控切换之前, A 会场的屏幕 1、 2、 3 分别显示 E 会场中摄像机 E1 拍摄的图像, J 会场中摄像机 J1 拍摄的图像, G 会场中摄像机 G2 拍摄的图像 ; 启动声控切换之后, 当前与会者声音不断变化, 则会场 A 的图像切换过程包括 :
         1) 当前摄像机 E1 拍摄的图像中的与会者声音最小, 摄像机 F2 拍摄的图像中的与 会者声音最大, 则控制 A 会场的屏幕 1 显示的图像从摄像机 E1 拍摄的图像切换为摄像机 F2 拍摄的图像, 将摄像机 F2 拍摄的与会者放入最近发言者列表中 ;
         2)、 然后, 摄像机 F2 拍摄的图像中的与会者声音最小, 摄像机 J1 拍摄的图像中的 与会者声音次小, 摄像机 C2 拍摄的图像的与会者声音最大, 由于摄像机 F2 拍摄的与会者已 经在最近发言者列表中, 所以选择声音次小的与会者的图像进行切换, 此时, 控制 A 会场的 屏幕 2 显示的图像从摄像机 J1 拍摄的图像切换成摄像机 C2 拍摄的图像, 将摄像机 C2 拍摄 的与会者放入最近发言者列表 ;
         3)、 然后, 摄像机 G2 拍摄的图像中与会者声音最小, 摄像机 K1 拍摄的图像中与会 者声音最大, 控制 A 会场的屏幕 3 显示的图像从摄像机 G2 拍摄的图像切换成摄像机 K1 拍 摄的图像, 将摄像机 K1 拍摄的与会者放入最近发言者列表中 ;
         4)、 然后, 摄像机 F2 拍摄的图像中与会者声音最小, 摄像机 K1 拍摄的图像中与会 者声音最大, 由于摄像机 K1 拍摄的图像已经在屏幕 3 上显示, 所以不做处理 ;
         5)、 然后, 当前摄像机 K1 拍摄的图像的与会者声音最小, 摄像机 F2 拍摄的图像的 与会者声音次小, 摄像机 C3 拍摄的图像的与会者声音最大, 由于按照发言时间点从近到远 的顺序, 摄像机 F2 拍摄的与会者在最近发言者列表的最后位置, 因此, 控制屏幕 1 显示的图 像从摄像机 F2 拍摄的图像切换为摄像机 C3 拍摄的图像, 由于摄像机 C2 和 C3 都属于同一 会场, 调换摄像机 C2 和 C3 显示的屏幕, 控制屏幕 1 显示摄像机 C2 拍摄的图像, 控制屏幕 2 显示摄像机 C3 拍摄的图像。
         参阅图 6B, 如下以两屏会场为例, 详细说明本发明实施例提供的多屏视频会议中 对与会者图像显示进行调整的方法, 图中, A 会场、 B 会场、 C 会场、 D 会场都为 3 屏会场, E会 场、 F 会场、 G 会场都为 2 屏会场, J 会场、 K 会场都为单屏会场, 具体的, 在启动声控切换之 前, E 会场的屏幕 1、 2 分别显示 E 会场中摄像机 E2 拍摄的图像, J 会场中摄像机 J1 拍摄的 图像, 启动声控切换之后, 当前与会者声音不断变化, 则会场 E 的图像切换过程包括 : 1)、 当 前摄像机 J1 拍摄的图像的与会者声音最小, 摄像机 F2 拍摄的图像的与会者声音最大, 控制 屏幕 2 显示的图像从摄像机 J1 拍摄的图像切换成摄像机 F2 拍摄的图像, 将摄像机 F2 拍摄 的与会者放入最近发言者列表 ;
         2) 然后, 摄像机 E2 拍摄的图像与会者声音最小, 摄像机 C2 拍摄的图像与会者声音 最大, 控制屏幕 1 显示的图像从摄像机 E2 拍摄的图像切换成摄像机 C2 拍摄的图像, 将摄像 机 C2 拍摄的与会者放入最近发言者列表 ;
         3) 然后, 摄像机 C2 拍摄的图像与会者声音最小, 摄像机 K1 拍摄的图像与会者声音 最大, 按照最近发言者列表中与会者声音从大到小的顺序, 则摄像机 C2 拍摄的与会者位于 最近发言者列表的最后位置, 因此, 控制屏幕 1 显示的图像从摄像机 C2 拍摄的图像切换成 摄像机 K1 拍摄的图像, 将摄像机 K1 拍摄的与会者放入最近发言者列表, 同时从最近发言者 列表中删除摄像机 C2 拍摄的与会者 ;
         4) 然后, 摄像机 F2 拍摄的图像中与会者声音最小, 摄像机 K1 拍摄的图像中与会者 声音最大, 由于摄像机 K1 拍摄的图像已在屏幕中显示, 所以不做处理。
         5)、 摄像机 K1 拍摄的图像中与会者声音最小, 摄像机 C3 拍摄的图像中与会者声音最大, 控制屏幕 1 显示的图像从摄像机 K1 拍摄的图像切换成摄像机 C3 拍摄的图像 .
         对于一屏会场, 则控制该一屏会场中的屏幕显示的图像从原来的图像切换为当前 声音最大的图像。
         参阅图 7, 本发明实施例提供一种多屏视频会议中对与会者图像显示进行调整的 方法, 该方法与上述图 3、 4、 5 所示实施例的区别在于 : MCU 在考虑第一会场中能切换图像的 屏幕当前显示的与会者的排序的同时, 考虑了第一会场中屏幕的物理位置, 该方法具体包 括:
         701、 各个会场将与会者的声音和与会者的图像都发给 MCU。
         702、 MCU 启动声控切换。
         703、 MCU 确定当前声音最大的与会者, 该声音最大的与会者为待显示的与会者。
         704、 MCU 判断是否满足切换条件, 如果是, 执行 705, 如果否, 结束本流程。
         具体的, 可以是判断当前声音最大的与会者的声音是否持续一个预设时间段, 如 果是, 则满足切换条件, 否则不具备切换条件。
         705、 MCU 根据第一会场的屏幕当前显示的与会者的排序结果, 选择排在最后的与 会者。
         在该步骤之前, MCU 会按照排序条件对第一会场的屏幕当前显示的与会者进行排 序, 得到第一会场的屏幕当前显示的与会者的排序结果。 其中, 具体的排序方式和排序时间 参见步骤 204B 和步骤 202A 的相应描述, 在此不再赘述。
         706、 MCU 判断所述排在最后的与会者所在的屏幕是否是第一特定屏幕, 如果否, 执 行 707 ; 如果是, 执行 708。
         其中, 关于第一特定屏幕的描述请参见步骤 202A 中的相关描述, 在此不再赘述。
         707、 MCU 确定需要切换图像的屏幕为所述排在最后的与会者所在的屏幕。
         708、 MCU 选择所述排在最后的与会者的前一个与会者, 确定需要切换图像的屏幕 为所述排在最后的与会者的前一个与会者所在的屏幕。
         709、 MCU 控制需要切换图像的屏幕切换为当前声音最大的与会者图像。
         当第一会场中有三个以下屏幕 ( 包括三个屏幕 ) 时, 则步骤 706 中是判断排在最 后的与会者所在的屏幕是否是第一特定屏幕, 当第一会场中有四个屏幕、 五个屏幕、 或者更 多个数的屏幕时, 该步骤中是判断所述排在最后的与会者所在的屏幕是否是第一特定屏幕 或者第一特定屏幕外侧的屏幕, 第一特定屏幕外侧的屏幕为第一特定屏幕背向屏幕中心线 一侧的屏幕。 比如, 一个五屏会场, 第一特定屏幕为屏幕 4, 则第一特定屏幕外侧的屏幕为屏 幕5; 再如一个四屏幕, 第一特定屏幕为屏幕 3, 则第一特定屏幕外侧的屏幕为屏幕 4。且, 当第一会场中有五个屏幕时, 在步骤 708 中查找到所述排在最后的与会者的前一个与会者 之后, 会继续判断所述排在最后的与会者的前一个与会者所在的屏幕是否是第一特定屏幕 或者第一特定屏幕外侧的屏幕, 如果否, 则确定需要切换图像的屏幕为所述排在最后的与 会者的前一个与会者所在的屏幕, 如果是, 根据排序结果, 查找位于倒数第三位的与会者, 确定需要切换图像的屏幕为该与会者所在的屏幕。 比如, 对于一个五屏会场, 假定第一特定 屏幕为屏幕 4, 当所述排在最后的与会者位于屏幕 4 时, 则查找所述排在最后的与会者的前 一个与会者, 如果位于屏幕 5, 则查找位于倒数第三位的与会者, 确定需要切换图像的屏幕 为该与会者图像所在的屏幕。本发明实施例 MCU 在考虑第一会场中能切换图像的屏幕显示的与会者的排序的 同时, 考虑了第一会场中屏幕的物理位置, 避免声音最大的与会者图像切换到达不到眼对 眼效果的屏幕上显示, 提高与会者的体验。
         需要说明的是, 该方案也适用于 MCU 先选择需要切换屏幕的场景, 再选择声音最 大的与会者的场景, 同样适用于由第一会场的终端选择需要切换屏幕的场景。
         需要说明的是, MCU 可以按照上述实施例提供的方案将各会场中需要切换图像的 屏幕进行图像切换 ; 或者, 如果会议存在主席, 则先按照主席会场中各屏幕当前显示的与会 者的排序结果, 在主席会场中选择需要切换图像的屏幕, 控制所述需要切换图像的屏幕所 显示的图像切换为待显示与会者的图像, 然后, 根据所选屏幕在主席会场中的位置及其他 会场中的屏幕在相应会场中的位置, 控制待显示的与会者图像切换到其他会场中的相应屏 幕显示 ; 其中, 所述其他会场中的相应屏幕与所选屏幕具有相同的编号。 当会议中不存在主 席时, 则可以先按照一个会场中各屏幕当前显示的与会者的排序, 选择需要切换图像的屏 幕, 控制所选屏幕的图像切换为待显示的与会者的图像, 然后, 按照与上面相同的方式, 控 制待显示的与会者图像切换到其他会场中的相应屏幕显示。
         可选的, 也可以指定当前声音最大的与会者始终在远端会场特定的屏幕上显示, 比如一个三屏会场, 可以指定屏幕 3 显示当前声音最大的与会者。如图 6C 所示, 指定屏幕 3 显示当前声音最大的与会者的图像 ; 如图 6D 所示, 指定屏幕 2 显示当前声音最大的与会 者的图像。
         具体的, 可以根据策略需要可以对指定显示声音最大的与会者的屏幕进行改变。 对于单屏会场可以看当前声音最大的与会者的图像, 也可以看多画面图像 ( 通过多个子画 面可以显示多个与会者的图像 ), 其中当前声音最大的与会者的图像作为其中一个子画面 的图像。为了达到当前声音最大的与会者与本地会场与会者更好的眼对眼, 可把当前声音 最大与会者的图像始终在主屏上显示。再进一步, 会场调整摄像机对照本会场的与会者的 正面, 把该图像发送给远端 ; 对于一个三屏会场, 也可以指定左屏显示多画面图像、 中屏显 示会议主席, 右屏显示当前声音最大的与会者。
         为了能在该声音最大的与会者图像上叠加显示声音最大的与会者所在会场的全 景图像, 所以该方法还可以包括 : MCU 控制当前声音最大的与会者的会场全景图像经过图 像处理后, 叠加到当前声音最大的与会者的图像的部分区域上显示。具体的, MCU 将当前声 音最大的与会者的会场全景图像缩小, 并将缩小后的会场全景图像叠加到当前声音最大的 与会者的图像的部分区域上显示。如下举实例进行说明, 假定 F 会场是具有 3 个摄像机、 3 个屏幕、 3 个区域的会场, 这三个摄像机分别拍摄对应区域的与会者图像, F 会场中的终端 将各区域与会者图像传给 MCU, 假定当前摄像机 F1 拍摄的与会者的声音最大, 采用前面介 绍的技术方案, MCU 控制 A 会场 ( 假定为三屏会场 ) 的屏幕 1 显示摄像机 F1 拍摄的与会者 图像 ( 假定该与会者为声音最大的与会者 ), 此时假定 A 会场中的三个屏幕分别显示摄像机 F1 拍摄的与会者图像, 摄像机 C2 拍摄的与会者图像, 摄像机 G2 拍摄的与会者图像 ( 参阅图 8)。则, 该 MCU 将 F 会场中三个摄像机 (F1、 F2、 F3) 拍摄的与会者图像 (3 个与会者图像 ) 进行拼接成一个全景图像, 将该全景图像缩小后, 控制 A 会场中的屏幕 1 将缩小后的全景图 像叠加到摄像机 F1 拍摄的与会者图像上显示, 也可以将会场名叠加到该全景图像上显示, 或者, 将会场名叠加到摄像机 F1 拍摄的与会者图像的其他区域上显示。在上述本发明实施例提供的技术方案中, 可以通过如下方式保证声音和图像的良 好同步 :
         1)、 多声道技术, 即语音声道教和摄像机一样, 即可以实现每路摄像机的活动视频 都有自己的对应方位的声道语音数据 ;
         2)、 带方位信息的语音数据, 即会场把发给 MCU 的语音数据中携带该语音数据与 摄像机视频数据的对应关系 ; MCU 在处理这些数据时, 根据目的会场的屏幕数量、 音箱个数 等, 把目的会场观看的图像和音频对应起来, 使声音在其图像所显示的屏幕附近的音箱播 放。
         当某个多屏会场只有一个或者几个摄像机所拍摄的与会者图像被远端会场某个 或者某几个屏幕显示出来, 而该会场其他摄像机所拍摄区域中的与会者也在讲话时 ( 比如 已关闭声控切换或者该与会者的声音不足以产生图像切换 ), 控制该与会者的声音在显示 相邻与会者图像的屏幕所对应的放音设备中播出。其中, 相邻与会者是同该与会者相邻的 与会者。具体的, MCU 可以将该与会者的声音混音到相邻与会者对应的声道中, 这样, 就可 以将该与会者和相邻与会者的声音同时在显示相邻与会者图像的屏幕所对应的放音设备 中播出如图 9 所示。 在四屏的 B 会场的四个屏幕上分别显示摄像机 F2 拍摄的与会者图像、 摄像机 F3 拍摄的与会者图像、 摄像机 G2 拍摄的与会者图像、 摄像机 C2 拍摄的与会者图像。假定四屏 的 F 会场的摄像机排序为 F1、 F2、 F3 和 F4, 如果摄像机 F1 拍摄的与会者在讲话, 则 MCU 控 制 F1 拍摄的与会者和 F2 拍摄的与会者 ( 即与 F1 拍摄的与会者相邻的与会者 ) 的声音进 行混音, 并从显示摄像机 F2 拍摄的与会者图像的屏幕所对应的放音设备中播出, 这样, B会 场的与会者通过该放音设备听到了这两个与会者的声音, 就能确定这两个与会者相邻 ; 如 果摄像机 F4 拍摄的与会者在讲话, 则 MCU 控制 F3 拍摄的与会者和 F4 拍摄的与会者 ( 即与 F4 拍摄的与会者相邻的与会者 ) 的声音进行混音, 并从显示摄像机 F3 拍摄的与会者图像的 屏幕所对应的放音设备中播出, B 会场的与会者通过该放音设备听到了这两个与会者的声 音, 就能确定这两个与会者相邻。这样, B 会场的与会者通过放音设备放出的声音就能确定 声源的物理位置关系。
         进一步, 如果摄像机 F1 拍摄的与会者的声音变大, 则需要将该摄像机 F1 拍摄的与 会者图像显示出来, 其声音也跟随显示该图像的屏幕所对应的放音设备中播放, 比如摄像 机 F1 拍摄的与会者图像被切换到屏幕 4 显示, 该图像的声音应该从屏幕 4 所对应的放音设 备中播出。
         进一步, 比如摄像机 F1 拍摄的与会者图像被切换到屏幕 4 显示, 为了不使该图像 的声音突然从屏幕 1 所对应的放音设备跳跃到屏幕 4 所对应的放音设备, 可以采用声音过 渡的方法, 比如先使该图像的声音在屏幕 1 所对应的放音设备播放时衰减 3db, 在屏幕 4 所 对应的放音设备播放时也衰减 3db, 这样与会者听到的该图像的声音大小和实际声音大小 相同, 再逐步把屏幕 1 所对应的放音设备的声音衰减下去, 屏幕 4 所对应的放音设备的声音 逐步增大, 声音就过渡的到了屏幕 4 所对应的放音设备中。其中, 过渡过程中用于调节的衰 减值可根据两个屏幕之间的位置相对关系决定。
         为了保证当前声音最大的与会者在各会场中具有相同屏幕编号的屏幕中显示, 则 MCU 需要控制具有相同屏幕个数的各会场同一编号的屏幕具有相同的视频源, 具体的, 可以
         有如下几种方式 :
         第一种方式 : 在启动声控切换开始时, 在会场中某一与会者图像所对应的各会场 中的屏幕上配置相同的视频源。比如, 三个三屏会场, 会场 1、 会场 2 和会场 3, 会场 1 中区 域 1 的与会者图像在各会场 3 号屏幕上显示时能达到眼对眼的效果, 所以各会场 3 号屏幕 配置相同的视频源。同理, 各会场的 2 号屏幕也配置相同的视频源, 各会场的 1 号屏幕也 配置相同的视频源, 这样后续在声控切换时, MCU 针对各会场选择的待切换的图像都是相同 的, 所以每次声控切换时都保证了声音最大的与会者的图像能够切换到各个会场中同一编 号的屏幕上显示。即在各会场具有相同屏幕数目时, 则为各会场中相同屏幕号的屏幕配置 相同的视频源。
         第二种方式 : 获取当前声音最大的与会者的图像, 判断会场中第二特定屏幕是否 能显示所述声音最大的与会者的图像, 如果是, 控制所述第二特定屏幕显示所述声音最大 的与会者的图像 ; 如果否, 按照所述会场中其他屏幕到所述第二特定屏幕的物理距离由近 到远的顺序, 依次判断其他屏幕是否能显示所述声音最大的与会者的图像, 直到找到能显 示所述声音最大的与会者的图像的屏幕为止, 控制找到的屏幕显示所述当前声音最大的与 会者的图像, 其中, 所述第二特定屏幕是能和声音最大的与会者达到眼对眼效果的屏幕。 其 中, 对第二特定屏幕的举例说明请参见第一个实施例的相应描述, 在此不再赘述。
         其中, 该方式中的会场是指视频会议中的任意一个会场, 对任意一个会场都采用 上述方式进行处理, 就能保证各会场同一编号的屏幕具有相同的视频源。如果采用这种方 式, 则可以是在启动声控切换开始时, 先按照上述第二种方式, 将声音最大的与会者图像切 换到相应的屏幕上显示, 保证具有相同屏幕个数的各会场的同一编号的屏幕具有相同的视 频源之后, 再按照图 2B、 图 2C、 图 2D、 图 3、 图 4、 图 5、 图 7 所示实施例所述的方案进行切换。
         其中, 判断会场中第二特定屏幕是否能显示所述声音最大的与会者的图像具体可 以是 : 判断会场中第二特定屏幕当前是否正在显示会议主席图像, 如果是, 则表示第二特定 屏幕不能显示当前声音最大的与会者的图像 ; 判断会场中第二特定屏幕当前是否正在显示 多画面图像, 如果是, 则表示第二特定屏幕不能显示当前声音最大的与会者的图像 ; 判断会 场中第二特定屏幕当前是否正在显示最近发言者列表中的与会者, 如果是, 则表示第二特 定屏幕不能显示当前声音最大的与会者的图像 ; 当会场中第二特定屏幕当前显示的图像既 不是多画面图像, 也不是会议主席图像, 也不是最近发言者列表中的与会者图像时, 则可以 在该第二特定屏幕上显示该声音最大的与会者的图像。
         其中, 按照所述会场中其他屏幕到所述第二特定屏幕的物理距离由近到远的顺 序, 依次判断其他屏幕是否能显示所述声音最大的与会者的图像具体可以是 : 按照所述会 场中其他屏幕到所述第二特定屏幕的物理距离由近到远的顺序, 依次判断其他屏幕当前是 否正在显示会议主席图像, 如果是, 则表示该屏幕不能显示当前声音最大的与会者的图像 ; 或者, 依次判断其他屏幕当前是否正在显示多画面图像, 如果是, 则表示该屏幕不能显示当 前声音最大的与会者的图像 ; 或者, 依次判断其他屏幕当前是否正在显示最近发言者列表 中的图像, 如果是, 则表示该屏幕不能显示当前声音最大的与会者的图像 ; 只有所判断的屏 幕当前显示的图像既不是多画面图像, 也不是会议主席图像, 也不是最近发言者列表中的 图像时, 则可以在该屏幕上显示该声音最大的与会者的图像。
         第三种方式 : 如果会议存在主席, 则先按照主席会场中各屏幕显示的与会者图像中与会者声音的大小, 采用图 3、 4、 5、 7 所示实施例中选择需要切换图像的屏幕的方案, 选 择一个屏幕, 将主席会场中该屏幕的图像切换为该声音最大的与会者图像 ; 然后, 根据所选 屏幕在主席会场中的位置及其他会场中的屏幕在相应会场中的位置, 控制声音最大的与会 者图像切换到其他会场中的相应屏幕显示 ; 其中, 所述其他会场中的相应屏幕在其他会场 中屏幕组中的物理位置与所选屏幕在主席会场中屏幕组的物理位置相同 ; 或者, 所述其他 会场中的相应屏幕与所选屏幕具有相同的编号。当会议中不存在主席时, 则可以先按照一 个会场中各屏幕显示的与会者图像中与会者声音的大小, 采用图 3、 4、 5、 7 所示实施例中选 择需要切换图像的屏幕的方案, 选择一个屏幕, 控制该屏幕的图像切换为该声音最大的与 会者图像, 然后, 按照与上面相同的方式, 控制声音最大的与会者图像切换到其他会场中的 相应屏幕上显示, 这样可以保证具有相同屏幕个数的各会场的同一编号的屏幕具有相同的 视频源。
         第四种方式 : 按照各屏幕在会场中的排序, 将当前声音最大的与会者切换到相应 的屏幕上, 比如有三个三屏会场, 在启动声控切换后, 当声音最大的与会者的声音满足切换 条件时, 将该声音最大的与会者图像切换到这三个会场中的左屏幕上显示 ; 各与会者的声 音在不断变化, 此时又有声音最大的与会者的声音满足切换条件, 则将该声音最大的与会 者的图像切换到这三个会场中的中屏上显示 ; 再有声音最大的与会者的声音满足切换条件 时, 则将该声音最大的与会者的图像切换到这三个会场中的右屏上显示, 这样可以满足三 个三屏会场中具有同一编号的屏幕具有相同的视频源。
         可选的, 为了实现声音最大的与会者图像在一个屏幕上全屏显示的同时该声音最 大的与会者图像也在多画面中显示, 还可以包括 : MCU 可以控制用声音最大的与会者的图 像替换多画面图像中的某一个画面, 使该声音最大的与会者的图像在多画面图像中显示出 来。 这样, 就可以在同一会场中一个屏幕全屏显示声音最大的与会者图像时, 该声音最大的 与会者图像同时在多画面中显示。 具体的, 假定第一会场是 3 屏会场, 屏幕 1 显示摄像机 F1 拍摄的与会者图像, 屏幕 2 显示摄像机 C2 拍摄的与会者图像, 屏幕 3 显示多画面图像, 当前 摄像机 C2 拍摄的与会者为声音最大的与会者, MCU 将该声音最大的与会者的图像与其他多 个图像拼接成多画面图像, 控制屏幕 3 显示拼接后的多画面图像, 如图 10 所示。
         参阅图 11, 本发明实施例提供一种网络侧媒体处理设备, 其包括 :
         与会者选择单元 100, 用于按照当前会议中与会者音量从大到小的顺序, 从音量最 大的与会者开始, 依次确定预定个数的待显示的与会者 ;
         屏幕选择单元 300, 用于确定第一会场中预定个数的当前显示的与会者对应的屏 幕作为需要切换图像的屏幕。
         第一控制切换单元 400, 用于控制所述需要切换图像的屏幕所显示的图像切换为 所述预定个数的待显示与会者的图像。
         该设备还包括 :
         排序单元 200, 用于按照排序条件对第一会场的屏幕当前显示的与会者进行排序, 得到所述第一会场的屏幕当前显示的与会者的排序结果, 所述排序条件为如下条件之一 : 当前显示的与会者的声音大小、 发言时间点远近、 发言时长、 第一会场的屏幕当前显示的与 会者的发言次数和第一会场的屏幕当前显示的与会者所对应的屏幕是否为主屏。其中, 第 一会场的屏幕当前显示的与会者的具体排序方式请参见方法实施例的相应描述, 在此不再赘述。 屏幕选择单元 300 具体用于根据第一会场的屏幕当前显示的与会者的排序结果, 确定第一会场中预定个数的当前显示的与会者对应的屏幕作为需要切换图像的屏幕。
         其中, 预定个数可以为一个 ; 参阅图 12, 屏幕选择单元 300 包括 : 判断子单元 3001, 用于判断所述第一会场中能切换图像的屏幕所显示的与会者是否属于最近发言者列 表; 屏幕选择第一子单元 3002, 用于当所述第一会场中能切换图像的屏幕所显示的各与会 者中有属于最近发言者列表的与会者时, 从不属于最近发言者列表中的与会者中选择当前 显示的声音最小的与会者的图像, 将所选择的图像所在的屏幕作为需要切换图像的屏幕 ; 屏幕选择第二子单元 3003, 用于当所述第一会场中能切换图像的屏幕所显示的与会者均为 最近发言者列表中的与会者时, 按照最近发言者列表中与会者的排序结果, 选择排序结果 靠后的当前显示的与会者所在的屏幕为需要切换图像的屏幕, 其中, 最近发言者列表中与 会者的排序方式请参考方法实施例中的相应描述, 在此不再赘述。
         或者, 预定个数为一个 ; 参阅图 13, 屏幕选择单元 300 包括 : 第一选择子单元 3004, 用于根据第一会场的屏幕当前显示的与会者的排序结果, 选择排在最后的当前显示 的与会者所在的屏幕 ; 特定屏幕判断子单元 3005, 用于判断所述排在最后的当前显示的与 会者所在的屏幕是否是第一特定屏幕 ; 第二选择子单元 3006, 用于当特定屏幕判断子单元 3005 的判断结果为是时, 选择所述排在最后的当前显示的与会者的前一个当前显示的与会 者所在的屏幕 ; 确定子单元 3007, 用于当特定屏幕判断子单元 3005 的判断结果为否时, 确 定需要切换图像的屏幕为所述第一选择子单元 3004 所选择的屏幕 ; 当特定屏幕判断子单 元 3005 的判断结果为是时, 确定需要切换图像的屏幕为所述第二选择子单元 3006 所选择 的屏幕。 其中, 关于第一特定屏幕、 第二特定屏幕的定义和举例描述请参考方法实施例的相 应描述, 在此不再赘述。
         当所述预定个数为多个时, 第一控制切换单元 400 具体用于当所述预定个数的待 显示的与会者的图像中存在至少两个待显示的与会者的图像来自于第二会场时, 控制所述 需要切换图像的屏幕中至少两个屏幕所显示的图像切换为所述至少两个待显示与会者的 图像, 使得在所述第一会场中显示的所述至少两个待显示的与会者的图像的方向顺序与所 述至少两个待显示的与会者在所述第二会场中的物理位置的顺序相同。
         为了在显示声音最大的与会者图像的同时显示该与会者的全景图像, 该装置还包 括: 控制叠加单元 500, 用于控制当前声音最大的待显示的与会者所在会场的全景图像经 过图像处理后, 叠加到当前声音最大的待显示的与会者的图像的部分区域上显示, 具体的, 可以是控制当前声音最大的待显示的与会者所在会场的全景图像经过缩小处理后, 叠加到 当前声音最大的待显示的与会者的图像的部分区域上显示。
         为了保证将声音最大的与会者图像切换到各会场相同屏幕标号的屏幕上, 该装置 还包括 : 视频源控制单元 600, 用于控制具有相同屏幕个数的各会场同一编号的屏幕具有 相同的视频源。参阅图 14, 该视频源控制单元 600 可以具体包括 : 第一确定子单元 6001, 用 于判断第一会场中第二特定屏幕是否能显示当前声音最大的待显示的与会者的图像 ; 第二 确定子单元 6002, 用于在所述第一确定子单元 6001 的判断结果为否时, 则确定所述第一会 场中离所述第二特定屏幕的物理距离最近, 且能显示所述声音最大的待显示的与会者的图 像的屏幕 ; 控制显示子单元 6003, 用于在所述第一确定子单元的判断结果为是时, 控制所
         述第二特定屏幕显示所述声音最大的与会者的图像 ; 在所述第一确定子单元的判断结果为 否时, 控制所述第二判断子单元找到的屏幕显示所述声音最大的待显示的与会者的图像。 其中, 关于第二特定屏幕的定义和举例描述请参考方法实施例的相应描述, 在此不再赘述。
         为了保证将声音最大的与会者图像切换到各会场相同屏幕标号的屏幕上, 也可以 先将声音最大的与会者图像切换到一个会场的相应屏幕上显示, 然后对其他会场采用相同 的切换方式进行切换, 比如, 先将声音最大的待显示的与会者图像切换到第一会场的相应 屏幕上显示, 此时, 该装置还包括 : 第二控制切换单元 700, 还用于控制除第一会场以外的 其他会场的相应屏幕显示的图像切换为预定个数的待显示的与会者的图像 ; 其中, 所述其 他会场的相应屏幕与所选择的第一会场中需要切换图像的屏幕具有相同的编号。
         为了在显示声音最大的与会者图像的同时在多画面中显示该声音最大的与会者, 该装置还包括 : 多画面图像控制显示单元 800, 用于将声音最大的待显示的与会者的图像 与其他多个图像拼接成多画面图像, 控制所述第一会场的其他屏幕显示所述多画面图像, 所述其他屏幕为所述第一会场中除所选择的需要切换图像的屏幕以外的一个或者多个屏 幕。
         本发明实施例根据第一会场中屏幕显示的与会者的声音大小, 从第一会场的屏幕 中选择预定个数的屏幕作为需要切换图像的屏幕, 然后将需要切换图像的屏幕切换为预定 个数的与会者图像, 避免了像现有技术那样某一摄像机拍摄的图像只能在远方会场的特定 屏幕 ( 即该图像所缺省对应的屏幕 ) 上显示, 这种按屏幕声控切换, 能够使会场中的用户看 到参与讨论的与会者图像, 提高与会者的体验。
         以上对本发明所提供的一种多屏视频会议中对与会者图像显示进行调整的方法 及装置进行了详细介绍, 对于本领域的一般技术人员, 依据本发明实施例的思想, 在具体实 施方式及应用范围上均会有改变之处, 综上所述, 本说明书内容不应理解为对本发明的限 制。

    关 键  词:
    视频会议 与会者 图像 显示 进行 调整 方法 装置
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:多屏视频会议中对与会者图像显示进行调整的方法及装置.pdf
    链接地址:https://www.zhuanlichaxun.net/p-4305789.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1