《定位图片中文本信息的方法及装置.pdf》由会员分享,可在线阅读,更多相关《定位图片中文本信息的方法及装置.pdf(12页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 104252475 A (43)申请公布日 2014.12.31 CN 104252475 A (21)申请号 201310262610.4 (22)申请日 2013.06.27 G06F 17/30(2006.01) (71)申请人 腾讯科技 (深圳) 有限公司 地址 518044 广东省深圳市福田区振兴路赛 格科技园 2 栋东 403 室 (72)发明人 张锦铭 (74)专利代理机构 上海波拓知识产权代理有限 公司 31264 代理人 杨波 (54) 发明名称 定位图片中文本信息的方法及装置 (57) 摘要 发明实施例提出一种定位图片中文本信息的 方法及装置, 其。
2、方法包括 : 接收用户输入的关键 信息 ; 获取待查找的至少一个图片 ; 识别所述获 取的图片, 判断是否存在包含所述关键信息的图 片 ; 若存在, 则对图片上所述关键信息的位置进 行标记 ; 展示含有标记的图片。通过本发明的方 法和装置, 用户可以快速查找出图片上的文本信 息, 免去了肉眼查找的低效和麻烦, 节约了大量的 时间成本。 (51)Int.Cl. 权利要求书 2 页 说明书 5 页 附图 4 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书5页 附图4页 (10)申请公布号 CN 104252475 A CN 104252475 A 1/2 页。
3、 2 1. 一种定位图片中文本信息的方法, 其特征在于, 包括 : 接收用户输入的关键信息 ; 获取待查找的至少一个图片 ; 识别所述获取的图片, 判断是否存在包含所述关键信息的图片 ; 若存在, 则对图片上所述关键信息的位置进行标记 ; 展示含有标记的图片。 2. 如权利要求 1 所述的定位图片中文本信息的方法, 其特征在于, 所述获取待查找的至少一个图片的步骤之前包括 : 展示供用户选择的图片获取方式 ; 接收用户输入的图片获取方式 ; 所述获取待查找的至少一个图片的步骤包括 : 根据用户输入的图片获取方式, 获取待 查找的至少一个图片。 3. 如权利要求 2 所述的定位图片中文本信息的方。
4、法, 其特征在于, 所述根据用户输入 的图片获取方式, 获取待查找的至少一个图片的步骤包括 : 根据用户输入的从预设的存储位置获取图片的图片获取方式, 获取待查找的至少一个 图片。 4. 如权利要求 2 所述的定位图片中文本信息的方法, 其特征在于, 所述根据用户输入 的图片获取方式, 获取待查找的至少一个图片的步骤包括 : 根据用户输入的照相的图片获取方式, 对待查找的区域进行拍摄, 并获取拍摄生成的 图片作为所述待查找的图片。 5. 如权利要求 1 所述的定位图片中文本信息的方法, 其特征在于, 所述展示含有标记 的图片的步骤包括 : 以宫格的形式展示含有标记的图片。 6. 如权利要求 1。
5、 所述的定位图片中文本信息的方法, 其特征在于, 所述接收用户输入的关键信息的步骤之前还包括 : 展示精确查找和模糊匹配的选项信 息 ; 当接收到用户选择的精确查找的选项信息时, 所述接收用户输入的关键信息的步骤包 括 : 接收用户输入的完整的文字信息作为关键信息。 7. 如权利要求 6 所述的定位图片中文本信息的方法, 其特征在于, 当接收到用户选择的模糊匹配的选项信息时, 所述接收用户输入的关键信息的步骤包 括 : 接收用户输入的文字信息 ; 将用户输入的文字信息分割成至少一个关键词, 并将一个关键词作为一个关键信息。 所述识别所述获取的图片, 判断是否存在包含所述关键信息的图片 : 依次。
6、根据每一个 关键词的关键信息对所述获取的图片进行识别, 判断是否存在包含任意一个关键信息的图 片。 8. 一种定位图片中文本信息的装置, 其特征在于, 包括 : 关键信息接收单元, 用于接收用户输入的关键信息 ; 图片获取单元, 用于获取待查找的至少一个图片 ; 图片识别单元, 用于识别所述获取的图片, 判断是否存在包含所述关键信息的图片 ; 标记单元, 用于在包含所述关键信息的图片上, 对所述关键信息的位置进行标记 ; 权 利 要 求 书 CN 104252475 A 2 2/2 页 3 图片展示单元, 用于展示含有标记的图片。 9. 如权利要求 8 所述的定位图片中文本信息的装置, 其特征。
7、在于, 所述定位图片中文 本信息的装置还包括 : 获取方式展示单元, 用于展示供用户选择的图片获取方式 ; 获取方式接收单元, 用于接收用户输入的图片获取方式, 以使所述图片获取单元根据 用户输入的图片获取方式, 获取待查找的至少一个图片。 10. 如权利要求 9 所述的定位图片中文本信息的装置, 其特征在于, 所述获取方式展示单元展示的图片获取方式包括从预设的存储位置获取图片的图片 获取方式。 所述图片获取单元根据用户输入的从预设的存储位置获取图片的图片获取方式, 获取 待查找的至少一个图片。 11. 如权利要求 9 所述的定位图片中文本信息的装置, 其特征在于, 所述获取方式展示单元展示的。
8、图片获取方式包括拍摄的图片获取方式 ; 所述图片获取单元根据用户输入的拍摄的图片获取方式, 对待查找的区域进行拍摄, 并获取拍摄生成的图片作为所述待查找的图片。 12. 如权利要求 8 所述的定位图片中文本信息的装置, 其特征在于, 所述图片展示单元 以宫格的形式展示含有标记的图片。 13. 如权利要求 8 所述的定位图片中文本信息的装置, 其特征在于, 所述定位图片中文 本信息的装置还包括 : 查找精度展示单元, 用于展示精确查找和模糊匹配的选项信息 ; 查找精度接收单元, 用于接收用户输入的查找精度的选项信息 ; 当所述查找精度接收单元接收到用户选择的精确查找的选项信息时, 所述关键信息接。
9、 收单元接收用户输入的完整的文字信息作为关键信息。 14. 如权利要求 13 所述的定位图片中文本信息的装置, 其特征在于, 所述关键信息接 收单元进一步包括 : 文字信息接收子单元, 用于接收用户输入的文字信息 ; 分割子单元, 用于在所述查找精度接收单元接收到用户选择的模糊匹配的选项信息 时, 将所述文字信息接收子单元接收到的文字信息分割成至少一个关键词, 并将一个关键 词作为一个关键信息。 所述图片识别单元依次根据每一个关键词的关键信息对所述图片获取单元获取的图 片进行识别, 判断图片上是否包含任意一个关键词的关键信息。 权 利 要 求 书 CN 104252475 A 3 1/5 页 。
10、4 定位图片中文本信息的方法及装置 技术领域 0001 本发明涉及图片识别技术领域, 特别涉及一种定位图片中文本信息的方法及装 置。 背景技术 0002 近年来, 移动终端技术发展日新月异。以手机为典型代表的移动终端在一定程度 上体现了通信技术的发展, 而通信技术的发展也相应地促进了移动终端的推广和使用, 移 动终端的功能也不再局限于打电话, 发短信, 而是扩展到拍照摄像、 上网收发电子邮件等。 0003 对于移动终端的照相功能, 其经常被用于记录文字信息, 例如对需要记录的纸质 文件进行拍照并保存, 以在需要时进行调用查看。 目前, 查看移动终端上储存的图片上的文 字信息时, 仍然采用的是人。
11、工查看的方式, 因而在会存在一些不便 : 0004 1、 当要查看的图片数量较多时, 用户需要对图片进行一张一张地查看, 效率低, 花 费时间多。 0005 2、 当图片上包含大量的文字信息, 而用户要查找的文字信息却很简短时, 往往导 致用户阅读大量的不必要的文字信息, 花费时间多。 发明内容 0006 本发明实施例的目的是提供一种定位图片中文本信息的方法及装置, 以解决现有 的查找图片上文字信息的方式效率低、 耗费时间多的问题。 0007 本发明实施例提出一种定位图片中文本信息的方法, 包括 : 0008 接收用户输入的关键信息 ; 0009 获取待查找的至少一个图片 ; 0010 识别所。
12、述获取的图片, 判断是否存在包含所述关键信息的图片 ; 0011 若存在, 则对图片上所述关键信息的位置进行标记 ; 0012 展示含有标记的图片。 0013 本发明实施例还提出一种定位图片中文本信息的装置, 包括 : 0014 关键信息接收单元, 用于接收用户输入的关键信息 ; 0015 图片获取单元, 用于获取待查找的至少一个图片 ; 0016 图片识别单元, 用于识别所述获取的图片, 判断是否存在包含所述关键信息的图 片 ; 0017 标记单元, 用于在包含所述关键信息的图片上, 对所述关键信息的位置进行标 记 ; 0018 图片展示单元, 用于展示含有标记的图片。 0019 相对于现有。
13、技术, 本发明的有益效果是 : 通过本发明的方法和装置, 用户可以快速 查找出图片上的文本信息, 也无须再一个一个图片进行查找, 免去了肉眼查找的低效和麻 烦, 节约了大量的时间成本。 说 明 书 CN 104252475 A 4 2/5 页 5 附图说明 0020 图 1 为本发明实施例的一种定位图片中文本信息的方法的流程图 ; 0021 图 2 为本发明实施例的另一种定位图片中文本信息的方法的流程图 ; 0022 图 3 为本发明实施例的一种定位图片中文本信息的装置的结构图 ; 0023 图 4 为本发明实施例的另一种定位图片中文本信息的装置的结构图。 具体实施方式 0024 有关本发明的。
14、前述及其他技术内容、 特点及功效, 在以下配合参考图式的较佳实 施例详细说明中将可清楚的呈现。通过具体实施方式的说明, 当可对本发明为达成预定目 的所采取的技术手段及功效得以更加深入且具体的了解, 然而所附图式仅是提供参考与说 明之用, 并非用来对本发明加以限制。 0025 请参见图 1, 其为本发明实施例的一种定位图片中文本信息的方法的流程图, 其包 括以下步骤 : 0026 S101, 接收用户输入的关键信息。 0027 所述的关键信息是指用户想要在图片上定位的文本信息, 其可以是字、 词、 句子 等。 0028 接收关键信息的方式可以根据实际需要来设定。 例如通过用户在输入框中输入文 字。
15、信息来获取关键信息 ; 又如通过接收用户发出的语音信号, 并将语言信号转换成文字信 息来获取关键信息等。 0029 S102, 获取待查找的至少一个图片。 0030 图片的获取方式可以根据需要来设置, 例如从预设存储位置的相册中获取一个或 多个图片, 又如通过对待查找区域即时拍摄来获取图片, 又如对视频进行分帧截图来获取 图片等。 0031 S103, 识别所述获取的图片, 判断是否存在包含所述关键信息的图片。 0032 识别图片时, 可以利用图片识别技术来识别获取的一个图片上是否包含文字信 息, 若包含文字信息, 则将关键信息与识别出的文字信息进行比对, 如果一致, 则说明该图 片上包含该关。
16、键信息, 反之则说明该图片上没有包含该关键信息。 如果获取的图片有多个, 则对所有图片进行依次识别。如果识别出有图片包含关键信息, 则进入下一步骤 ; 如果所 有获取的图片上都不包含所述关键信息, 则直接结束, 或者提示 “未在目标中搜索到关键信 息” 的相关信息。 0033 S104, 对图片上所述关键信息的位置进行标记。 0034 标记的方式可以根据需要来设定, 例如可以是框出图片上关键信息所占的区域, 或者可以将图片上关键信息所占的区域的背景颜色设置成预设的颜色等。 0035 S105, 展示含有标记的图片。 0036 本发明实施例优选采用宫格的形式展示含有标记的图片, 即如果只只搜索出。
17、一个 含有标记的图片, 则在页面展示区域展示这张图片 (1 宫格) , 如果搜索出 2 到 4 个含有标记 的图片, 则用 4 宫格展示这些图片, 以此类推, 图片可放大缩小, 这样便于用户直观地查看 这些带标记的图片。当然, 除此之外, 也可以采用其它形式来展示含有标记的图片, 例如列 说 明 书 CN 104252475 A 5 3/5 页 6 表的形式。 0037 本发明实施例的方法可以单独构建一个软件应用, 也可以集成在移动终端现成的 应用中, 例如可以集成在移动终端的浏览器中, 从而为浏览器增加图片文本信息搜索定位 的功能。 通过本发明实施例的方法, 用户可以快速查找出图片上的文本信。
18、息, 也无须再一个 一个图片进行查找, 免去了肉眼查找的低效和麻烦, 节约了大量的时间成本。 0038 请参见图 2, 其为本发明实施例的另一种定位图片中文本信息的方法的流程图, 其 包括以下步骤 : 0039 S201, 接收用户输入的文字信息。 0040 S202, 展示精确查找和模糊匹配的选项信息。 0041 S203, 接收用户输入的查找精度的选项信息。 0042 S204, 判断接收到的选项信息是精确查找还是模糊匹配。如果用户输入的选项信 息是精确查找, 则进入步骤 S205 ; 如果用户输入的选项信息是模糊匹配, 则进入步骤 S206。 0043 S205, 将用户输入的完整的文字。
19、信息作为关键信息, 并进入步骤 S207。 0044 S206, 将用户输入的文字信息分割成至少一个关键词, 并将一个关键词作为一个 关键信息。 0045 S207, 展示供用户选择的图片获取方式。 本实施例所展示图片获取方式包括两种 : 从预设的存储位置获取图片的图片获取方式, 以及照相的图片获取方式。可以通过选择按 钮的形式将图片获取方式展示给用户。在本实施例中, 通过 “从相册中选择图片” 以及 “扫 描图片” 的选择按钮来分别表示从预设的存储位置获取图片以及照相的图片获取方式。 0046 S208, 接收并判断用户输入的图片获取方式。如果用户点击 “从相册中选择图片” 的选择按钮, 则。
20、进入步骤 S209 ; 如果用户点击 “扫描图片” 的选择按钮, 则进入步骤 S211。 0047 S209, 展示预设存储位置的系统相册。 0048 S210, 接收用户从系统相册中选择的一个或多个图片, 并进入步骤 S213。 0049 S211, 调用系统摄像头。 0050 S212, 通过对待查找的区域进行拍摄, 获取拍摄生成的图片。 0051 S213, 识别所述获取的图片, 判断是否存在包含所述关键信息的图片。 0052 如果获取的图片有多个, 则对所有图片进行依次识别。如果存在包含关键信息的 图片, 则进入步骤 S214 ; 如果不存在包含关键信息的图片, 则直接结束, 或者提示。
21、 “未在目 标中搜索到关键信息” 的相关信息。 0053 值得注意的是, 当用户选择 “模糊匹配” 而有多个关键信息时, 依次用每一个关键 信息对各个图片执行多次查询, 判断各个图片上是否包含任意一个关键信息。 0054 S214, 对图片上所述关键信息的位置进行标记。 0055 S215, 展示含有标记的图片。可以以宫格的形式展示含有标记的图片。 0056 通过本发明实施例的方法, 可以对预存的一个或多个图片, 或者即时拍摄的照片 进行快速搜索, 判断图片上是否包含用户需要的文本信息, 并将标注了关键信息的图片展 示给用户, 免去了肉眼查找的低效和麻烦, 节约了大量的时间成本。 0057 本。
22、发明实施例还提成了一种定位图片中文本信息的装置, 请参见图 3, 其包括关键 信息接收单元 31、 图片获取单元 32、 图片识别单元 33、 标记单元 34 以及图片展示单元 35。 关键信息接收单元 31 和图片获取单元 32 均与图片识别单元 33 相连, 标记单元 34 与图片 说 明 书 CN 104252475 A 6 4/5 页 7 识别单元 33 相连, 图片展示单元 35 与标记单元 34 相连。 0058 关键信息接收单元 31 用于接收用户输入的关键信息。所述的关键信息是指用户 想要在图片上定位的文本信息, 其可以是字、 词、 句子等。接收关键信息的方式可以根据实 际需要。
23、来设定。例如通过用户在输入框中输入文字信息来获取关键信息 ; 又如通过接收用 户发出的语音信号, 并将语言信号转换成文字信息来获取关键信息等。 0059 图片获取单元 32 用于获取待查找的至少一个图片。图片的获取方式可以根据需 要来设置, 例如从预设存储位置的相册中获取一个或多个图片, 又如通过对待查找区域即 时拍摄来获取图片, 又如对视频进行分帧截图来获取图片等。 0060 图片识别单元 33 用于识别图片获取单元 32 获取的图片, 并判断是否存在包含所 述关键信息的图片。具体来说, 图片识别单元 33 在识别一个图片上是否包含关键信息时, 可以先利用图片识别技术来识别该图片上是否包含文。
24、字信息, 若包含文字信息, 则将关键 信息接收单元 31 接收到的关键信息与图片上的文字信息进行比对, 如果一致, 则说明该图 片上包含该关键信息, 反之则说明该图片上没有包含该关键信息。 如果获取的图片有多个, 则图片识别单元 33 会对所有图片进行依次识别。 0061 标记单元 34 用于在图片识别单元 33 识别出的包含关键信息的图片上, 对所述关 键信息的位置进行标记。标记的方式可以根据需要来设定, 例如可以是框出图片上关键信 息所占的区域, 或者可以将图片上关键信息所占的区域的背景颜色设置成预设的颜色等。 0062 图片展示单元 35 用于展示经过标记单元 34 标记的图片。图片展示。
25、单元 35 优选 采用宫格的形式展示含有标记的图片, 以便于用户直观地查看这些带标记的图片。 0063 通过本发明实施例的装置, 用户可以快速查找出图片上的文本信息, 也无须再一 个一个图片进行查找, 免去了肉眼查找的低效和麻烦, 节约了大量的时间成本。 0064 请参见图4, 其为本发明实施例的另一种定位图片中文本信息的装置的结构图。 与 图 3 的实施例相比, 本实施例定位图片中文本信息的装置还包括获取方式展示单元 36、 获 取方式接收单元 37、 查找精度展示单元 38 以及查找精度接收单元 39。获取方式接收单元 37分别与获取方式展示单元36及图片获取单元32相连, 查找精度接收单。
26、元39分别与查找 精度展示单元 38 及关键信息接收单元 31 相连。 0065 获取方式展示单元 36 用于在图片获取单元 32 获取图片之前, 向用户展示供用户 选择的图片获取方式。图片获取方式可以包括从预设的存储位置获取图片的图片获取方 式、 通过照相的图片获取方式等。获取方式展示单元 36 可以通过选择按钮的形式将图片获 取方式展示给用户, 例如可以向用户展示 “从相册中选择图片” 以及 “扫描图片” 的选择按 钮来分别表示从预设的存储位置获取图片以及照相的图片获取方式。 0066 获取方式接收单元 37 用于接收用户输入的图片获取方式。当获取方式接收单元 37 接收到用户输入的图片获。
27、取方式的信息后, 会向图片获取单元 32 发出控制信号, 以使图 片获取单元 32 按照用户选择的图片获取方式获取待查找的一个或多个图片。例如, 当用户 点击 “从相册中选择图片” 的选择按钮时, 图片获取单元 32 会根据预设的相册存储地址, 调 取相册中的图片供用户选择, 从而获取相应的待查找图片 ; 又如当用户点击 “扫描图片” 的 选择按钮时, 图片获取单元 32 会调用移动终端自带的摄像头, 供用户对待查找的区域进行 拍摄, 从而获取拍摄生成的待查找图片。 0067 查找精度展示单元 38 用于在用户输入要定位的文字信息之前, 展示精确查找和 说 明 书 CN 104252475 A。
28、 7 5/5 页 8 模糊匹配的选项信息。 所述精确查找是指以用户输入的完整的文字信息作为关键信息对图 片进行查找。所述的模糊匹配是指通过对用户输入的文字信息进行分词, 并以分词后的关 键词作为关键信息对图片进行查找。 0068 查找精度接收单元 39 用于接收用户输入的查找精度的选项信息, 并根据接收到 的选项信息向关键信息接收单元 31 发出控制信号, 以使关键信息接收单元 31 根据精确查 找或模糊匹配的方式接收用户输入的关键信息。 0069 由此, 本实施例的关键信息接收单元 31 又可以进一步包括文字信息接收子单元 311 和分割子单元 312。文字信息接收子单元 311 用于接收用。
29、户输入的文字信息。分割子 单元 312 用于在用户选择模糊匹配的选项信息后, 对文字信息接收子单元 311 接收到的文 字信息进行分割, 并划分成一个或多个关键词, 以将一个关键词作为一个关键信息。 0070 在用户选择模糊匹配的时候, 可能会包含多个关键信息, 此时图片识别单元 33 会 用每一个关键信息对所有待查找图片执行多次查询, 并由标记单元 34 对所有待查找图片 上的所有关键信息分别进行标记, 因此只要包含用户输入的文字信息中的任意关键词的待 查找图片, 均会由图片展示单元 35 展示出来。 0071 通过本发明实施例的装置, 可以对预存的一个或多个图片, 或者即时拍摄的照片 进行。
30、快速搜索, 判断图片上是否包含用户需要的文本信息, 并将标注了关键信息的图片展 示给用户, 免去了肉眼查找的低效和麻烦, 节约了大量的时间成本。 0072 通过以上的实施方式的描述, 本领域的技术人员可以清楚地了解到本发明实施例 可以通过硬件实现, 也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理 解, 本发明实施例的技术方案可以以软件产品的形式体现出来, 该软件产品可以存储在一 个非易失性存储介质 (可以是 CD-ROM, U 盘, 移动硬盘等) 中, 包括若干指令用以使得一台计 算机设备 (可以是个人计算机, 服务器, 或网络设备等) 执行本发明实施例各个实施场景所 述的方法。。
31、 0073 以上所述, 仅是本发明的较佳实施例而已, 并非对本发明作任何形式上的限制, 虽 然本发明已以较佳实施例揭露如上, 然而并非用以限定本发明, 任何熟悉本专业的技术人 员, 在不脱离本申请技术方案范围内, 当可利用上述揭示的技术内容作出些许更动或修饰 为等同变化的等效实施例, 但凡是未脱离本申请技术方案内容, 依据本发明的技术实质对 以上实施例所作的任何简单修改、 等同变化与修饰, 均仍属于本发明技术方案的范围内。 说 明 书 CN 104252475 A 8 1/4 页 9 图 1 说 明 书 附 图 CN 104252475 A 9 2/4 页 10 图 2 说 明 书 附 图 CN 104252475 A 10 3/4 页 11 图 3 说 明 书 附 图 CN 104252475 A 11 4/4 页 12 图 4 说 明 书 附 图 CN 104252475 A 12 。