书签 分享 收藏 举报 版权申诉 / 19

一种信息输入方法和装置.pdf

  • 上传人:000****221
  • 文档编号:1665261
  • 上传时间:2018-07-03
  • 格式:PDF
  • 页数:19
  • 大小:1.42MB
  • 摘要
    申请专利号:

    CN201510156133.2

    申请日:

    2015.04.02

    公开号:

    CN104714650A

    公开日:

    2015.06.17

    当前法律状态:

    授权

    有效性:

    有权

    法律详情:

    授权|||实质审查的生效IPC(主分类):G06F 3/01申请日:20150402|||公开

    IPC分类号:

    G06F3/01

    主分类号:

    G06F3/01

    申请人:

    三星电子(中国)研发中心; 三星电子株式会社

    发明人:

    张国梁; 陈列新; 程俊杰; 马飞; 徐杰; 刁伟

    地址:

    210061江苏省南京市高新区高新研发大厦9~12层

    优先权:

    专利代理机构:

    北京德琦知识产权代理有限公司11018

    代理人:

    谢安昆; 宋志强

    PDF完整版下载: PDF下载
    内容摘要

    本发明提供了一种信息输入方法和装置,应用于安装基于动态的双目摄像头的移动设备上,该移动设备通过双目摄像头获取操作物滑动过程中的各帧图像;对获取的各帧图像进行图像处理,获取操作物的位置坐标,并根据操作物的位置坐标,以及双目测距原理获取操作物滑动过程中的三维坐标对应的三维轨迹;将所述三维轨迹映射到平面上,获得该操作物的二维轨迹;根据所述二维轨迹进行字符识别,将使用字符识别结果在配置的数据库中匹配到对应的字符并显示;能够在多场景下低功耗实现信息的输入。

    权利要求书

    权利要求书
    1.  一种信息输入方法,其特征在于,应用于安装基于动态的双目摄像头的移动设备上,该方法包括:
    通过双目摄像头获取操作物滑动过程中的各帧图像;
    对获取的各帧图像进行图像处理,获取操作物的位置坐标,并根据操作物的位置坐标,以及双目测距原理获取操作物滑动过程中的三维坐标对应的三维轨迹;
    将所述三维轨迹映射到平面上,获得该操作物的二维轨迹;所述平面使获取的所有三维坐标点到该平面的距离之和最小;
    根据所述二维轨迹进行字符识别,将使用字符识别结果在配置的数据库中匹配到对应的字符并显示。

    2.  根据权利要求1所述的方法,其特征在于,所述方法进一步包括:配置窗口长度为W;其中,W为大于0的整数;
    所述对获取的各帧图像进行图像处理,获取操作物的位置坐标,并根据操作物的位置坐标,以及双目测距原理获取操作物滑动过程中的三维坐标对应的三维轨迹,包括:
    按照双目摄像头获取图像帧的顺序,将各摄像头获取的图像帧分别划分为W帧图像一组,针对每个摄像头的每组图像叠加为一帧图像;
    针对每个摄像头叠加处理后的各帧图像获取操作物上固定点的坐标;
    根据双目测距原理,使用针对每个摄像头获取的操作物上的固定点的坐标,计算出各顶点坐标对应的三维坐标;
    将计算出的三维坐标按计算获取顺序排列,作为该操作物滑动的三维轨迹。

    3.  根据权利要求1所述的方法,其特征在于,所述方法进一步包括:配置窗口长度为M,滑动步长为N;其中,M,N为大于0的整数;
    所述对获取的各帧图像进行图像处理,获取操作物的位置坐标,并根据操作物的位置坐标,以及双目测距原理获取操作物滑动过程中的三维坐标对应的三 维轨迹,包括:
    当所述操作物带有发光体时,针对双目摄像头中的每个摄像头每间隔N帧图像,针对M帧图像中的每帧图像中的发光体的中心坐标求平均值,作为所述M帧图像的发光体的中心坐标;
    根据双目测距原理,使用每个摄像头针对每组M帧图像获得操作物的发光体的三维中心坐标;
    将获得的发光体的三维中心坐标按获取顺序排列,作为该操作物滑动的三维轨迹。

    4.  根据权利要求3所述的方法,其特征在于,所述获得该操作物的二维轨迹之后,所述根据所述二维轨迹进行字符识别之前,所述方法进一步包括:
    确定获得操作物的发光体的三维中心坐标的个数是否为大于预设个数阈值,如果是,将所述获得的发光体的三维中心坐标按获取顺序排列,作为该操作物滑动的三维轨迹;否则,继续通过双目摄像头获取图像帧,按照不带发光体的操作物滑动过程处理,获得该操作物滑动的三维轨迹。

    5.  根据权利要求1所述的方法,其特征在于,所述移动设备为可带在眼睛上的移动设备;
    所述获得该操作物的二维轨迹之后,所述根据所述二维轨迹进行字符识别之前,所述方法进一步包括:
    确定所述移动设备是否显示虚拟键盘,如果是,根据所述二维轨迹确定经过所述虚拟键盘上的虚拟按键所指示的字符,并根据所述确定的经过所述虚拟键盘上的虚拟按键所指示的字符,以及当前选择的输入法匹配输出相关候选字符并显示;否则,执行所述根据二维轨迹进行二维字符识别及后续操作。

    6.  根据权利要求1所述的方法,其特征在于,所述移动设备为可带在眼睛上的移动设备;
    通过双目摄像头获取操作物点击虚拟键盘上的虚拟按键的各帧图像;
    对获取的各帧图像进行图像处理,获取操作物的位置信息,并根据操作物的位置信息,以及双目测距原理获得操作物点击过程中的三维坐标对应的三维轨 迹;
    并将所述三维轨迹映射到平面上,按照聚类、分类算法区分出落在所述平面上的点;并确定出区分出的落在所述平面上的点在所述虚拟键盘上对应位置的虚拟按键所指示的字符,根据确定出的字符,以及当前选择的输入法匹配出相关候选字符并显示;所述平面使获取的所有三维坐标点到该平面的距离之和最小。

    7.  根据权利要求5或6所述的方法,其特征在于,所述方法进一步包括:
    当通过双目摄像头获取操作点击选择候选字符的各帧图像时,根据候选字符显示的位置,以及获取的图像个数,确定操作物在各候选字符所在位置的停留时间,当确定所述操作物在任一候选字符所在位置停留时间大于预设时间阈值时,确定该候选字符为用户选中输入的字符并显示。

    8.  一种信息输入装置,其特征在于,应用于安装基于动态的双目摄像头的移动设备上,该装置包括:获取单元、处理单元、映射单元和识别显示单元;
    所述获取单元,用于通过双目摄像头获取操作物滑动过程中的各帧图像;
    所述处理单元,用于对所述获取单元获取的各帧图像进行图像处理,获取操作物的位置坐标,并根据操作物的位置坐标,以及双目测距原理获取操作物滑动过程中的三维坐标对应的三维轨迹;
    所述映射单元,用于将所述处理单元获得的所述三维轨迹映射到平面上,获得该操作物的二维轨迹;所述平面使获取的所有三维坐标点到该平面的距离之和最小;
    所述识别显示单元,用于根据所述映射单元获得的二维轨迹进行字符识别,将使用字符识别结果在配置的数据库中匹配到对应的字符并显示。

    9.  根据权利要求8所述的装置,其特征在于,所述装置进一步包括:配置单元;
    所述配置单元,用于配置窗口长度为W;其中,W为大于0的整数;
    所述处理单元,具体用于按照双目摄像头获取图像帧的顺序,将各摄像头获取的图像帧分别划分为所述配置单元配置的W帧图像一组,针对每个摄像头的 每组图像叠加为一帧图像;针对每个摄像头叠加处理后的各帧图像获取操作物上固定点的坐标;根据双目测距原理,使用针对每个摄像头获取的操作物上的固定点的坐标,计算出各顶点坐标对应的三维坐标;将计算出的三维坐标按计算获取顺序排列,作为该操作物滑动的三维轨迹。

    10.  根据权利要求8所述的装置,其特征在于,所述装置进一步包括:配置单元;
    所述配置单元,用于配置窗口长度为M,滑动步长为N;其中,M,N为大于0的整数;
    所述处理单元,具体用于当所述操作物带有发光体时,针对双目摄像头中的每个摄像头每间隔所述配置单元配置的N帧图像,针对M帧图像中的每帧图像中的发光体的中心坐标求平均值,作为所述M帧图像的发光体的中心坐标;根据双目测距原理,使用每个摄像头针对每组M帧图像获得操作物的发光体的三维中心坐标;将获得的发光体的三维中心坐标按获取顺序排列,作为该操作物滑动的三维轨迹。

    11.  根据权利要求10所述的装置,其特征在于,
    所述处理单元,进一步用于确定获得操作物的发光体的三维中心坐标的个数是否为大于预设个数阈值,如果是,将所述获得的发光体的三维中心坐标按获取顺序排列,作为该操作物滑动的三维轨迹;否则,继续通过双目摄像头获取图像帧,按照不带发光体的操作物滑动过程处理,获得该操作物滑动的三维轨迹。

    12.  根据权利要求8所述的装置,其特征在于,所述移动设备为可带在眼睛上的移动设备;
    所述识别显示单元,进一步用于确定本单元所在移动设备是否显示虚拟键盘,如果是,根据所述二维轨迹确定经过所述虚拟键盘上的虚拟按键所指示的字符,并根据所述确定的经过所述虚拟键盘上的虚拟按键所指示的字符,以及当前选择的输入法匹配输出相关候选字符并显示;否则,执行所述根据二维轨迹进行二维字符识别及后续操作。

    13.  根据权利要求8所述的装置,其特征在于,所述移动设备为可带在眼睛上的移动设备;
    所述获取单元,进一步用于通过双目摄像头获取操作物点击虚拟键盘上的虚拟按键的各帧图像;
    所述处理单元,进一步用于对获取的各帧图像进行图像处理,获取操作物的位置信息,并根据操作物的位置信息,以及双目测距原理获得操作物点击过程中的三维坐标对应的三维轨迹;
    所述映射单元,进一步用于将所述三维轨迹映射到平面上,所述平面使获取的所有三维坐标点到该平面的距离之和最小;
    所述识别显示单元,进一步用于按照聚类、分类算法区分出落在所述平面上的点;并确定出区分出的落在所述平面上的点在所述虚拟键盘上对应位置的虚拟按键所指示的字符,根据确定出的字符,以及当前选择的输入法匹配出相关候选字符并显示。

    14.  根据权利要求12或13所述的装置,其特征在于,
    所述处理单元,进一步用于当通过双目摄像头获取操作点击选择候选字符的各帧图像时,根据候选字符显示的位置,以及获取的图像个数,确定操作物在各候选字符所在位置的停留时间,当确定所述操作物在任一候选字符所在位置停留时间大于预设时间阈值时,确定该候选字符为用户选中输入的字符并触发所述识别显示单元显示。

    说明书

    说明书一种信息输入方法和装置
    技术领域
    本发明涉及通信技术领域,特别涉及一种信息输入方法和装置。
    背景技术
    字符,如字母、文字、数字等,作为一种普遍使用的信息传播和交流工具,在人机交互系统中扮演着重要的角色。
    目前广泛使用的字符输入方式包括:键盘、触屏、手写板等。这些输入方式都有各自的优点,但也存在着各自的不足,如键盘,受到大小和按键数量的限制,触屏和手写板等设备受到体积大小的限制、书写区域有限等。因此,设计更自然、便利、高效的文字输入方式尤为重要。
    发明内容
    有鉴于此,本申请提供一种信息输入方法和装置,能够在多场景下低功耗实现信息的输入。
    为解决上述技术问题,本申请的技术方案是这样实现的:
    一种信息输入方法,应用于安装基于动态的双目摄像头的移动设备上,该方法包括:
    通过双目摄像头获取操作物滑动过程中的各帧图像;
    对获取的各帧图像进行图像处理,获取操作物的位置坐标,并根据操作物的位置坐标,以及双目测距原理获取操作物滑动过程中的三维坐标对应的三维轨迹;
    将所述三维轨迹映射到平面上,获得该操作物的二维轨迹;所述平面使获取的所有三维坐标点到该平面的距离之和最小;
    根据所述二维轨迹进行字符识别,将使用字符识别结果在配置的数据库中匹 配到对应的字符并显示。
    一种信息输入装置,其特征在于,应用于安装基于动态的双目摄像头的移动设备上,该装置包括:获取单元、处理单元、映射单元和识别显示单元;
    所述获取单元,用于通过双目摄像头获取操作物滑动过程中的各帧图像;
    所述处理单元,用于对所述获取单元获取的各帧图像进行图像处理,获取操作物的位置坐标,并根据操作物的位置坐标,以及双目测距原理获取操作物滑动过程中的三维坐标对应的三维轨迹;
    所述映射单元,用于将所述处理单元获得的所述三维轨迹映射到平面上,获得该操作物的二维轨迹;所述平面使获取的所有三维坐标点到该平面的距离之和最小;
    所述识别显示单元,用于根据所述映射单元获得的二维轨迹进行字符识别,将使用字符识别结果在配置的数据库中匹配到对应的字符并显示。
    由上面的技术方案可知,本申请中移动设备通过基于动态的模式的摄像头获取滑动操作物和静止背景之间的二值图像,并通过图像处理获得操作物运动的二维轨迹,根据所述二维轨迹进行字符识别,将使用字符识别结果在配置的数据库中匹配到对应的字符并显示,能够在多场景下低功耗实现信息的输入。
    附图说明
    图1为本申请实施例一中信息输入方法流程示意图;
    图2为本申请实施例二中信息输入方法流程示意图;
    图3为本申请实施例三中信息输入方法流程示意图;
    图4本申请实施例中输入字符“exit”的三维轨迹示意图;
    图5为本申请实施例中连笔输入字符“exit”的二维轨迹;
    图6为本申请实施例中提供的一种眼镜示意图;
    图7为本申请实施例四中信息输入方法流程示意图;
    图8为本申请实施例中通过虚拟键盘输入字符“quick”的示意图;
    图9为本申请实施例五中信息输入方法流程示意图;
    图10为本申请实施例中应用于上述技术方案的装置结构示意图。
    具体实施方式
    为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图并举实施例,对本发明的技术方案进行详细说明。
    本申请实施例中提出一种信息输入方法,应用于安装基于动态模式的双目摄像头的移动设备上,移动设备通过基于动态的模式的摄像头获取滑动操作物和静止背景之间的二值图像,并通过图像处理获得操作物运动的二维轨迹,根据所述二维轨迹进行字符识别,将使用字符识别结果在配置的数据库中匹配到对应的字符并显示,能够在多场景下低功耗实现信息的输入。
    本申请实施例中,可以使用操作物在移动设备能够摄取图像的范围内,进行滑动输入,如在空中使用操作物滑动输入,输入的字符可以是英文单词,也可以是汉字拼音,也可以是数字等。操作物可以是手写笔、手指等。
    下面结合附图,详细说明本申请实施例中信息输入方法的实现。
    实施例一
    参见图1,图1为本申请实施例一中信息输入方法流程示意图。具体步骤为:
    步骤101,移动设备通过双目摄像头获取操作物滑动过程中的各帧图像。
    基于动态的双目摄像头,如DVS摄像头,在获取图像时,其基本原理为根据物体运动状态的变化,双目摄像头的每个摄像头分别获取到物体运动的二值图像。根据实际应用配置,如200ms,累计运动像素点得到一帧图像。
    因此,本申请的具体应用场景中,操作物在空中,或某一个平面上滑动时,背景中的各物体是相对静止的。
    步骤102,该移动设备对获取的各帧图像进行图像处理,获取操作物的位置坐标,并根据操作物的位置坐标,以及双目测距原理获取操作物滑动过程中的三维坐标对应的三维轨迹。
    该移动设备获取操作物的位置坐标,指操作物上固定位置的坐标,即针对该 操作物均选择一个位置点的坐标进行相关处理。
    步骤103,该移动设备将所述三维轨迹映射到平面上,获得该操作物的二维轨迹;所述平面使获取的所有三维坐标点到该平面的距离之和最小。
    步骤104,该移动设备根据所述二维轨迹进行字符识别,将使用字符识别结果在配置的数据库中匹配到对应的字符并显示。
    该移动设备根据二维轨迹进行字符识别,以及识别出的字符在数据库中的匹配的具体实现方式,本申请实施例中均不作限制。
    实施例二
    以未携带发光体的操作物为例,发光体可以为LED灯等;该操作物可以为写字笔,手指等。在该种实现方式下配置窗口长度为W;其中,W为大于0的整数,根据实际应用进行配置,如多少帧双目摄像头获取的图像叠加后能够清晰显示操作物的位置,则配置W的值为多少。
    参见图2,图2为本申请实施例二中信息输入方法流程示意图。具体步骤为:
    步骤201,移动设备通过双目摄像头获取操作物滑动过程中的各帧图像。
    步骤202,该移动设备按照双目摄像头获取图像帧的顺序,将各摄像头获取的图像帧分别划分为W帧图像一组,针对每个摄像头的每组图像叠加为一帧图像。
    本步骤中移动设备针对每个摄像头,将其获取的1到W帧图像叠加,然后将W+1到W+10帧图像叠加,直到处理完每个摄像头获取的所有图像;若最后获取的图像不到W帧,则获取几帧图像使用几帧图像进行叠加。
    步骤203,该移动设备针对每个摄像头叠加处理后的各帧图像获取操作物上固定点的坐标。
    当使用手指作为操作物滑动时,固定点的坐标可以使用手指尖的坐标;当使用手写笔作为操作物滑动时,固定点的坐标可以使用手写笔的顶点的坐标,本申请具体实现时,对于如何选取固定点的坐标不作限制,只是对同一批图像中选择同一位置作为固定点即可。
    如针对一次信息输入,在各图像帧中获取操作物的矩阵像素点后,均选择该 矩阵的左上角,或右上角的像素点的坐标作为操作物的固定点的做标。
    步骤204,该移动设备根据双目测距原理,使用针对每个摄像头获取的操作物上的固定点的坐标,计算出各顶点坐标对应的三维坐标;将计算出的三维坐标按计算获取顺序排列,作为该操作物滑动的三维轨迹。
    步骤205,该移动设备将所述三维轨迹映射到平面上,获得该操作物的二维轨迹;所述平面使获取的所有三维坐标点到该平面的距离之和最小。
    步骤206,该移动设备根据所述二维轨迹进行字符识别,将使用字符识别结果在配置的数据库中匹配到对应的字符并显示。
    当使用未带发光体的操作物进行滑动输入时,为了避免获取并处理大量不必要的图像时,可以使用一些特殊的动作来指示滑动输入的开始和结束,如在滑动输入信息开始时使用握拳、伸手掌等动作标识,在结束的时候也使用相同或不同的动作标识信息输入结束。
    实施例三
    以携带发光体的操作物为例,该操作物可以为携带发光体的写字笔等操作物,发光体可以携带在手写笔上能够被双目摄像头摄像到的位置。在该种实现方式下配置窗口长度为M,滑动步长为N;其中,M,N为大于0的整数,根据实际应用配置M、N的具体值。
    参见图3,图3为本申请实施例三中信息输入方法流程示意图。具体步骤为:
    步骤301,移动设备通过双目摄像头获取操作物滑动过程中的各帧图像。
    步骤302,当所述操作物带有发光体时,该移动设备针对双目摄像头中的每个摄像头每间隔N帧图像,针对M帧图像中的每帧图像中的发光体的中心坐标求平均值,作为所述M帧图像的发光体的中心坐标。
    即针对每个摄像头获取的第1到M帧图像中的发光体的中心坐标求平均值;然后再根据N到N+M帧图像中的发光体的中心坐标求平均值,以此类推,直到处理完每个摄像头获取的所有图像帧,通常实现时,配置N小于M。
    步骤303,该移动设备根据双目测距原理,使用每个摄像头针对每组M帧图像获得操作物的发光体的三维中心坐标,将获得的发光体的三维中心坐标按 获取顺序排列,作为该操作物滑动的三维轨迹。
    该移动设备获得该操作物的三维轨迹之后,确定获得操作物的发光体的三维中心坐标的个数是否为大于预设个数阈值,如果是,将所述获得的发光体的三维中心坐标按获取顺序排列,作为该操作物滑动的三维轨迹;否则,继续通过双目摄像头获取图像帧,按照不带发光体的操作物滑动过程处理,获得该操作物滑动的三维轨迹,即按照实施例二中的方式获得操作物滑动的三维轨迹。
    步骤304,该移动设备将所述三维轨迹映射到平面上,获得该操作物的二维轨迹;所述平面使获取的所有三维坐标点到该平面的距离之和最小。
    步骤305,该移动设备根据所述二维轨迹进行字符识别,将使用字符识别结果在配置的数据库中匹配到对应的字符并显示。
    假设本申请实施例一到三中操作物在空中滑动连笔输入字符“exit”,则通过实施例一到实施例三的处理操作,获得的操作物滑动的三维轨迹参见图4,图4本申请实施例中输入字符“exit”的三维轨迹示意图。
    图4中的三维轨迹示意图由获取的各三维坐标确定,三维坐标的个数由获取图像的帧数,以及窗口长度M,滑动步长N确定。
    参见图5,图5为本申请实施例中连笔输入字符“exit”的二维轨迹。图5为图4的三维轨迹映射到图5所示的平面上的二维轨迹,三维轨迹上的各坐标点到图5中的平面的距离之和最小。
    下面通过实施例四和实施例五来描述在虚拟键盘上操作而输入信息的方式的具体实现,这种方式的实现,移动设备需为可佩带在眼睛上的移动设备,如眼镜、眼睛前有透明遮挡物的头盔等,在眼镜的镜片上,或头盔上的眼前透明遮挡物上显示虚拟键盘。
    实施例四
    本申请实施例中通过操作物在虚拟键盘上滑动而输入信息的方式为例。
    参见图6,图6为本申请实施例中提供的一种眼镜示意图。图6中所示的眼镜的镜片上在需要输入信息时,显示虚拟键盘,在眼镜的镜片一侧安装了双目摄像头。图6中的眼镜只是本申请实施例中移动设备的一个例子的示意图,本 申请对实现本申请实施例的移动设备的结构并不做此限制,眼镜上的虚拟键盘同实际应用中的电脑键盘或移动设备上对应的输入键盘布局相同,图6中仅显示一个示意图。
    在该移动设备上可以通过按钮或显示菜单,选择在虚拟键盘上输入,还是在空中输入,如果显示在虚拟键盘上输入,才会在移动设备上显示虚拟键盘。
    参见图7,图7为本申请实施例四中信息输入方法流程示意图。具体步骤为:
    步骤701,移动设备通过双目摄像头获取操作物滑动过程中的各帧图像。
    步骤702,该移动设备对获取的各帧图像进行图像处理,获取操作物的位置坐标,并根据操作物的位置坐标,以及双目测距原理获取操作物滑动过程中的三维坐标对应的三维轨迹。
    本实施例中移动设备获取操作物滑动的三维坐标的方式也分为两种,一种是操作物为携带发光体的情况下,使用实施例三中获取操作物滑动的三维轨迹;一种是操作物未携带发光体的情况下,使用实施例二中获取操作物滑动的三维轨迹。在这里不再详细描述。
    步骤703,该移动设备将所述三维轨迹映射到平面上,获得该操作物的二维轨迹;所述平面使获取的所有三维坐标点到该平面的距离之和最小。
    步骤704,该移动设备确定所述移动设备是否显示虚拟键盘,如果是,执行步骤705;否则,执行步骤706。
    本申请实施例中是否使用虚拟键盘进行信息输入的具体处理方式不一致,因此,在这里需要判断一下是否使用虚拟键盘进行信息输入,具体使用方式,同配置如何选择虚拟键盘的方式相对比,如果在输入信息之前,选择使用虚拟键盘,这里则确定使用了虚拟键盘;如果在输入信息之前,未选择使用虚拟键盘,这里则确定未使用虚拟键盘。
    步骤705,该移动设备根据所述二维轨迹确定经过所述虚拟键盘上的虚拟按键所指示的字符,并根据所述确定的经过所述虚拟键盘上的虚拟按键所指示的字符,以及当前选择的输入法匹配输出相关候选字符并显示,结束本流程。
    步骤706,该移动设备根据所述二维轨迹进行字符识别,将使用字符识别结 果在配置的数据库中匹配到对应的字符并显示。
    参见图8,图8为本申请实施例中通过虚拟键盘输入字符“quick”的示意图。图8中,显示的是输入“quick”时,操作物滑动的二维轨迹图。移动设备处理出二维轨迹后,根据输入法,以及二维轨迹在虚拟键盘上的位置确定候选字符,如果是英文输入,则显示字符“quick”等,即二维轨迹所经过的虚拟键盘上的按键所显示的字符能够组成的英文单词,以供用户进一步选择真正要输入的词。
    如果使用汉语拼音输入法,或五笔输入法,则显示能够拼写出的汉字,或词组字符。本申请实施例中的字符,包括文字、数字、字母等,也可包括词组等。
    实施例五
    本申请实施例中通过操作物在虚拟键盘上点击而输入信息的方式为例。
    参见图9,图9为本申请实施例五中信息输入方法流程示意图。具体步骤为:
    步骤901,移动设备通过双目摄像头获取操作物点击虚拟键盘上的虚拟按键的各帧图像。
    步骤902,该移动设备对获取的各帧图像进行图像处理,获取操作物的位置信息,并根据操作物的位置信息,以及双目测距原理获得操作物点击过程中的三维坐标对应的三维轨迹。
    本实施例中移动设备获取操作物滑动的三维坐标的方式也分为两种,一种是操作物为携带发光体的情况下,使用实施例三中获取操作物滑动的三维轨迹;一种是操作物未携带发光体的情况下,使用实施例二中获取操作物滑动的三维轨迹。在这里不再详细描述。
    步骤903,该移动设备将所述三维轨迹映射到平面上,按照聚类、分类算法区分出落在所述平面上的点;并确定出区分出的落在所述平面上的点在所述虚拟键盘上对应位置的虚拟按键所指示的字符,根据确定出的字符,以及当前选择的输入法匹配出相关候选字符并显示。
    所述平面使获取的所有三维坐标点到该平面的距离之和最小。
    本申请具体实施例中,可以通过移动设备上的按键,或显示的菜单选择当前输入信息的方式为点击输入还是滑动输入,从而移动设备在处理图像时,根据 当前选择的输入方式确定针对获取到的图像的处理方式。
    针对实施例一到实施例五提供的实施例,均能够根据输入的信息显示出候选字符,使用者根据候选字符选择实际要输入的字符,下面详细描述在移动设备显示候选字符的基础上,选择一个候选字符的实现方式。
    移动设备当通过双目摄像头获取操作点击选择候选字符的各帧图像时,根据候选字符显示的位置,以及获取的图像个数,确定操作物在各候选字符所在位置的停留时间,当确定所述操作物在任一候选字符所在位置停留时间大于预设时间阈值时,确定该候选字符为用户选中输入的字符并显示。
    通过上述实施例可知,本申请具体实现时,分为使用携带发光体的操作物,和未携带发光体的操作物的实现为例,下面分别说明两种实现方式:
    移动设备通过双目摄像头获取的各帧图像,在具体实现时,可以处理一个摄像头获取的图像也可实现。
    当操作物为携带发光体的操作物时,移动设备根据显示的候选字符的在获取图像中的位置区域,确定该位置区域中显示携带发光体的操作物的图像帧数,再根据双目摄像头获取相邻两帧图片的时间,从而能够确定操作物在该候选字符上停留的时间,当确定停留时间大于预设时间阈值,则确定用户选择的字符为所述位置区域对应的字符。
    当操作物为未携带发光体的操作物时,移动设备配置窗口长度Q和滑动步长P。
    移动设备获取到图像时,每间隔P帧图像,针对Q帧图像,确定操作物从在各显示字符所在位置区域从显示到消失的过程中,所经过的图片帧的个数;也可以将Q和P均配置为1针对每帧图片,确定操作物从有到无,所经过的图片帧的个数,再根据双目摄像头获取相邻两帧图片的时间,从而能够确定操作物在该候选字符上停留的时间,当确定停留时间大于预设时间阈值,则确定用户选择的字符为所述位置区域对应的字符。
    本申请具体实现时,如果一个操作物上携带发光体,则可以通过开关控制该发光体是否发光,本申请实施例中提到携带发光体的操作物时,均指该 操作物针对发光体的开关是开启,即正在发光。
    发光体对背景和光线的要求更小一些,如果有携带发光体的操作物时,可优先使用该操作物。
    本申请实施例中对背景环境要求较小,并且获得的是二值图像,相对彩色摄像头来说,功耗较小。
    基于同样的发明构思,本申请还提出一种信息输入装置,应用于安装基于动态的双目摄像头的移动设备上。参见图10,图10为本申请实施例中应用于上述技术方案的装置结构示意图。该装置包括:获取单元1001、处理单元1002、映射单元1003和识别显示单元1004;
    获取单元1001,用于通过双目摄像头获取操作物滑动过程中的各帧图像;
    处理单元1002,用于对获取单元1001获取的各帧图像进行图像处理,获取操作物的位置坐标,并根据操作物的位置坐标,以及双目测距原理获取操作物滑动过程中的三维坐标对应的三维轨迹;
    映射单元1003,用于将处理单元1002获得的所述三维轨迹映射到平面上,获得该操作物的二维轨迹;所述平面使获取的所有三维坐标点到该平面的距离之和最小;
    识别显示单元1004,用于根据映射单元1003获得的二维轨迹进行字符识别,将使用字符识别结果在配置的数据库中匹配到对应的字符并显示。
    较佳地,所述装置进一步包括较佳地,配置单元1005;
    配置单元1005,用于配置窗口长度为W;其中,W为大于0的整数;
    处理单元1002,具体用于按照双目摄像头获取图像帧的顺序,将各摄像头获取的图像帧分别划分为配置单元1005配置的W帧图像一组,针对每个摄像头的每组图像叠加为一帧图像;针对每个摄像头叠加处理后的各帧图像获取操作物上固定点的坐标;根据双目测距原理,使用针对每个摄像头获取的操作物上的固定点的坐标,计算出各顶点坐标对应的三维坐标;将计算出的三维坐标按计算获取顺序排列,作为该操作物滑动的三维轨迹。
    较佳地,所述装置进一步包括:配置单元1005;
    配置单元1005,用于配置窗口长度为M,滑动步长为N;其中,M,N为大于0的整数;
    处理单元1002,具体用于当所述操作物带有发光体时,针对双目摄像头中的每个摄像头每间隔配置单元1005配置的N帧图像,针对M帧图像中的每帧图像中的发光体的中心坐标求平均值,作为所述M帧图像的发光体的中心坐标;根据双目测距原理,使用每个摄像头针对每组M帧图像获得操作物的发光体的三维中心坐标;将获得的发光体的三维中心坐标按获取顺序排列,作为该操作物滑动的三维轨迹。
    较佳地,
    处理单元1002,进一步用于确定获得操作物的发光体的三维中心坐标的个数是否为大于预设个数阈值,如果是,将所述获得的发光体的三维中心坐标按获取顺序排列,作为该操作物滑动的三维轨迹;否则,继续通过双目摄像头获取图像帧,按照不带发光体的操作物滑动过程处理,获得该操作物滑动的三维轨迹。
    较佳地,所述移动设备为可带在眼睛上的移动设备;
    识别显示单元1004,进一步用于确定本单元所在移动设备是否显示虚拟键盘,如果是,根据所述二维轨迹确定经过所述虚拟键盘上的虚拟按键所指示的字符,并根据所述确定的经过所述虚拟键盘上的虚拟按键所指示的字符,以及当前选择的输入法匹配输出相关候选字符并显示;否则,执行所述根据二维轨迹进行二维字符识别及后续操作。
    较佳地,所述移动设备为可带在眼睛上的移动设备;
    获取单元1001,进一步用于通过双目摄像头获取操作物点击虚拟键盘上的虚拟按键的各帧图像;
    处理单元1002,进一步用于对获取的各帧图像进行图像处理,获取操作物的位置信息,并根据操作物的位置信息,以及双目测距原理获得操作物点击过程中的三维坐标对应的三维轨迹;
    映射单元1003,进一步用于将所述三维轨迹映射到平面上,所述平面使获 取的所有三维坐标点到该平面的距离之和最小;
    识别显示单元1004,进一步用于按照聚类、分类算法区分出落在所述平面上的点;并确定出区分出的落在所述平面上的点在所述虚拟键盘上对应位置的虚拟按键所指示的字符,根据确定出的字符,以及当前选择的输入法匹配出相关候选字符并显示。
    较佳地,
    处理单元1002,进一步用于当通过双目摄像头获取操作点击选择候选字符的各帧图像时,根据候选字符显示的位置,以及获取的图像个数,确定操作物在各候选字符所在位置的停留时间,当确定所述操作物在任一候选字符所在位置停留时间大于预设时间阈值时,确定该候选字符为用户选中输入的字符并触发识别显示单元1004显示。
    上述实施例的单元可以集成于一体,也可以分离部署;可以合并为一个单元,也可以进一步拆分成多个子单元。
    综上所述,本申请通过移动设备通过基于动态的模式的摄像头获取滑动操作物和静止背景之间的二值图像,并通过图像处理获得操作物运动的二维轨迹,根据所述二维轨迹进行字符识别,将使用字符识别结果在配置的数据库中匹配到对应的字符并显示,能够在多场景下低功耗实现信息的输入。
    以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

    关 键  词:
    一种 信息 输入 方法 装置
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种信息输入方法和装置.pdf
    链接地址:https://www.zhuanlichaxun.net/p-1665261.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1