一种文本转换方法及装置.pdf

资源ID：6148145 资源大小：1.04MB 全文页数：9页
资源格式： PDF 下载积分：30金币

快捷下载

账号登录下载

三方登录下载：

下载资源需要30金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

加入VIP,免费下载

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

一种文本转换方法及装置.pdf

1、(10)申请公布号 CN 103838866 A (43)申请公布日 2014.06.04 CN 103838866 A (21)申请号 201410105981.6 (22)申请日 2014.03.20 G06F 17/30(2006.01) G10L 13/08(2013.01) (71)申请人广东小天才科技有限公司地址 523860 广东省东莞市长安镇乌沙步步高大道 126 号二楼 (72)发明人简文杰 (74)专利代理机构北京品源专利代理有限公司 11332 代理人胡彬孟金喆 (54) 发明名称一种文本转换方法及装置 (57) 摘要本发明公开了一种文本转换方法及装置。

2、该方法包括：获取目标文本图像；对所述目标文本图像进行文字识别得到相应的文字信息；对所述文字信息进行分词，并确定分词的词性，根据所述词性从图片数据库中获取对应分词的图片信息和 / 或动作轨迹信息；根据所述文字信息中的语句的类型，从语音数据库中获取对应于所述文字信息的语音信息；将所述图片信息和 / 或动作轨迹信息与所述语音信息在进行适配后进行输出。本发明提出的技术方案能够实现将文字类的文章转换成相应的语音和图像，增加了信息的显示形式。 (51)Int.Cl. 权利要求书 2 页说明书 4 页附图 2 页 (19)中华人民共和国国家知识产权局 (12

3、)发明专利申请权利要求书2页说明书4页附图2页 (10)申请公布号 CN 103838866 A CN 103838866 A 1/2 页 2 1. 一种文本转换方法，其特征在于，包括：获取目标文本图像；对所述目标文本图像进行文字识别得到相应的文字信息；对所述文字信息进行分词，并确定分词的词性，根据所述词性从图片数据库中获取对应分词的图片信息和 / 或动作轨迹信息；根据所述文字信息中的语句的类型，从语音数据库中获取对应于所述文字信息的语音信息；将所述图片信息和 / 或动作轨迹信息与所述语音信息在进行适配后进行输出。 2. 根据权利要求 1 所述的文本转换

4、方法，其特征在于，获取目标文本图像，包括：向图片采集装置发出拍摄指令；接收所述图片采集装置拍摄的目标文本图像；或显示文本图像；接收作用在所述文本图像上的输入指令；根据所述输入指令确定所述文本图像中的目标文本图像。 3. 根据权利要求 1 所述的文本转换方法，其特征在于，对所述文字信息进行分词，并确定分词的词性，根据所述词性从图片数据库中获取对应分词的图片信息和 / 或动作轨迹信息，包括：对所述文字信息按着预设的分词技术进行分词；确定各分词的词性，得到所述文字信息中所包含的名词和 / 或对应于该名词的动词；从所述图片数据库中查找并获取所述

5、名词所对应的图片信息和 / 或所述动词所对应的动作轨迹信息。 4. 根据权利要求 1 所述的文本转换方法，其特征在于，根据所述文字信息中的语句的类型，从语音数据库中获取对应于所述文字信息的语音信息，包括：根据预设的标点符号集和 / 或关键动词集，识别所述文字信息中各语句的类型，其中所述类型包括陈述句和对话句；从语音数据库中查找并获取与所识别出的陈述句相匹配的语音信息及其与所识别出的对话句相匹配的语音信息。 5.根据权利要求1所述的文本转换方法，其特征在于，将所述图片信息和/或动作轨迹信息与所述语音信息在进行适配后进行输出，包括：根据所述文字信息，建立所

6、述图片信息和 / 或动作轨迹信息与所述语音信息之间的适配关系；根据所述适配关系，在对所述图片信息和 / 或动作轨迹信息进行显示的同时，对所述语音信息进行同步播放。 6. 一种文本转换装置，其特征在于，包括：文本图像获取单元，用于获取目标文本图像；文字信息识别单元，用于对所述目标文本图像进行文字识别得到相应的文字信息；图片轨迹获取单元，用于对所述文字信息进行分词，并确定分词的词性，根据所述词性从图片数据库中获取对应分词的图片信息和 / 或动作轨迹信息；语音信息获取单元，用于根据所述文字信息中的语句的类型，从语音数据库中获取对应于所述文字信息的语音

7、信息；图片语音输出单元，用于将所述图片信息和 / 或动作轨迹信息与所述语音信息在进行权利要求书 CN 103838866 A 2 2/2 页 3 适配后进行输出。 7. 根据权利要求 6 所述的文本转换装置，其特征在于，所述文本图像获取单元，具体用于：向图片采集装置发出拍摄指令；接收所述图片采集装置拍摄的目标文本图像；或显示文本图像；接收作用在所述文本图像上的输入指令；根据所述输入指令确定所述文本图像中的目标文本图像。 8. 根据权利要求 6 所述的文本转换装置，其特征在于，所述图片轨迹获取单元，具体用于：对所述文字信息按着预设的分词

8、技术进行分词；确定各分词的词性，得到所述文字信息中所包含的名词和 / 或对应于该名词的动词；从所述图片数据库中查找并获取所述名词所对应的图片信息和 / 或所述动词所对应的动作轨迹信息。 9. 根据权利要求 6 所述的文本转换方法，其特征在于，所述语音信息获取单元，具体用于：根据预设的标点符号集和 / 或关键动词集，识别所述文字信息中各语句的类型，其中所述类型包括陈述句和对话句；从语音数据库中查找并获取与所识别出的陈述句相匹配的语音信息及其与所识别出的对话句相匹配的语音信息。 10. 根据权利要求 6 所述的文本转换装置，其特征在于，图片语音输出单元，具

9、体用于：根据所述文字信息，建立所述图片信息和 / 或动作轨迹信息与所述语音信息之间的适配关系；根据所述适配关系，在对所述图片信息和 / 或动作轨迹信息进行显示的同时，对所述语音信息进行同步播放。权利要求书 CN 103838866 A 3 1/4 页 4 一种文本转换方法及装置技术领域 0001 本发明实施例涉及计算机技术领域，尤其涉及一种文本转换方法及装置。背景技术 0002 目前书籍作为一种主要工具，在人们获取信息和学习的过程当中承担着不可或缺的角色，例如儿童通常是通过阅读书籍来帮助自己了解世界，增长知识。但是，对于年龄较小的孩子，因认字不准

10、确或者完全不识字，造成了他们难以阅读故事较为复杂的文字类文章，从而使得孩子阅读的内容和范围受到限制，降低了其阅读的兴趣。 0003 随着计算机技术的日趋成熟，各式各样的电子设备（例如学习机、智能手机、个人数字助理等）蜂拥而现，为人们的日常生活、工作和学习等方面带来了极大的方便。如何利用电子设备将文字类的文章转换成其他能够被孩子易接收的形式显得十分重要。发明内容 0004 本发明提供一种文本转换方法及装置，以实现将文字类的文章转换成其他能够被孩子易接收的语音和图像。 0005 第一方面，本发明实施例提供了一种文本转换方法，该方法包括： 0006 获取目标文本

11、图像； 0007 对所述目标文本图像进行文字识别得到相应的文字信息； 0008 对所述文字信息进行分词，并确定分词的词性，根据所述词性从图片数据库中获取对应分词的图片信息和 / 或动作轨迹信息； 0009 根据所述文字信息中的语句的类型，从语音数据库中获取对应于所述文字信息的语音信息； 0010 将所述图片信息和 / 或动作轨迹信息与所述语音信息在进行适配后进行输出。 0011 第二方面，本发明实施例还提供了一种文本转换装置，该装置包括： 0012 文本图像获取单元，用于获取目标文本图像； 0013 文字信息识别单元，用于对所述目标文本图像进行文字识别得到相应的文

12、字信息； 0014 图片轨迹获取单元，用于对所述文字信息进行分词，并确定分词的词性，根据所述词性从图片数据库中获取对应分词的图片信息和 / 或动作轨迹信息； 0015 语音信息获取单元，用于根据所述文字信息中的语句的类型，从语音数据库中获取对应于所述文字信息的语音信息； 0016 图片语音输出单元，用于将所述图片信息和 / 或动作轨迹信息与所述语音信息在进行适配后进行输出。 0017 本发明提出的技术方案能够实现将文字类的文章转换成相应的语音和图像，增加了信息的显示形式。说明书 CN 103838866 A 4 2/4 页 5 附图说明 0018 图 1 是

13、本发明实施例一提供的一种文本转换方法的流程示意图； 0019 图 2 是本发明实施例二提供的一种文本转换装置的结构示意图。具体实施方式 0020 下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。 0021 实施例一 0022 图 1 是本发明实施例一提供的一种文本转换方法的流程示意图，该方法可以由文本转换装置来执行，所述装置可以配置在学习机、智能手机、平板电脑、个人数字助理或者其他任何一种具有处理器、存储器

14、和显示器的电子设备中，由软件和 / 或硬件来实现。参见图 1，该文本转换方法具体包括如下步骤： 0023 步骤 110、获取目标文本图像。 0024 在本实施例中，目标文本图像为包含有文字内容的图像，可以是对纸质的书本进行拍摄得到，也可以是直接读取本地磁盘相关数据得到，或者从相应服务器获取得到。 0025 具体的，文本转换装置获取目标文本图像的过程可为：向图片采集装置发出拍摄指令；接收图片采集装置拍摄的目标文本图像；或者还可为：显示文本图像；接收作用在文本图像上的输入指令；根据输入指令确定该文本图像中的目标文本图像。其中，输入指令用于确定

15、文本图像中待转换的目标文本图像。当文本转换装置配置在点读机中时，输入指令可以是用户使用点读笔在所显示的文本图像上所指定的范围。 0026 步骤 120、对所述目标文本图像进行文字识别得到相应的文字信息。 0027 文本转换装置在获取到目标文本图像后，采用设定的文字识别算法对该图像进行识别，产生相应的文字信息。其中，文字识别算法可以是：首先对该图像进行倾斜校正、二值化、去噪声、单字符区域切分等预处理；然后，提取切分后的各个字符的特征；进而，采用设定的匹配算法，将所提取的各字符特征与本地存储的模板特征进行比对，得到相应的识别结果（即文字信息）。

16、0028 当然本领域的普通人员应理解，文字识别算法还可以是其他形式的算法，例如，在对目标文本图像进行预处理之后，采用人工神经网络这一文字识别算法，直接将目标文本图像中各个字符区域的点阵信息送入网络模型进行学习训练，从而识别出目标文本图像中的文字内容，得到相应的文字信息。 0029 步骤 130、对所述文字信息进行分词，并确定分词的词性，根据所述词性从图片数据库中获取对应分词的图片信息和 / 或动作轨迹信息。 0030 在本实施例的一个具体的实施方式中，文本转换装置在得到目标文本图像相应的文字信息后，可首先，对所述文字信息按着预设的分词技术进行分词；然后，

17、进一步确定各分词的词性，得到文字信息中所包含的名词和 / 或对应于该名词的动词；进而，从所述图片数据库中查找并获取所述名词所对应的图片信息和 / 或所述动词所对应的动作轨迹信息。其中，所述分词技术包括但不限于：逐词遍历法、基于字典词库匹配的分词方法或基于知识理解的分词方法。说明书 CN 103838866 A 5 3/4 页 6 0031 步骤 140、根据所述文字信息中的语句的类型，从语音数据库中获取对应于所述文字信息的语音信息。 0032 在本实施例的一个具体的实施方式中，在得到目标文本图像相应的文字信息后，文本转换装置可根据预设的标点符号集和 /

18、或关键动词集，识别文字信息中各语句的类型，其中所述类型包括陈述句和对话句；进而，从语音数据库中查找并获取与所识别出的陈述句相匹配的语音信息及其与所识别出的对话句相匹配的语音信息。例如，预设的标点符号集中包括冒号双引号，关键动词集中包括 “说” 、“喊” 或者 “问” 等。文本转换装置在逐句查找到文字信息中包含有冒号双引号时，可识别出这一组标点符号之间的语句为对话句；将文字信息中未包含在冒号双引号之间的语句识别为陈述句。文本转换装置也可在逐句查找到文字信息中包含有关键动词集中的某个动词时，判断其后面所对应的一条语句为对话句。当然，文本转换装置还可同时结合

19、标点符号集和关键动词集，来识别文字信息中各语句的类型。 0033 在本实例中，如果识别文本信息中的某语句为陈述句时，从语音数据库中查找并获取与该陈述句相匹配的语音信息，例如按背景声朗读该语句的语音信号；如果识别文本信息中的某语句为对话句时，从语音数据库中查找并获取与该对话句相匹配的语音信息，例如按对应人物的声音发音的语音信号。 0034 步骤 150、将所述图片信息和 / 或动作轨迹信息与所述语音信息在进行适配后进行输出。 0035 在本实施例中，文本转换装置可根据执行步骤 120 时所得到的文字信息，建立执行步骤 130 时所得到的图片信息和 / 或动作轨迹信

20、息与执行步骤 140 时所得到的语音信息之间的适配关系；根据此适配关系，在对所述图片信息和 / 或动作轨迹信息进行显示的同时，对所述语音信息进行同步播放。 0036 本实施例提出的技术方案能够实现将文字类的文章转换成相应的语音和图像，增加了信息的显示形式。 0037 实施例二 0038 图2是本发明实施例二提供的一种文本转换装置的结构示意图。参见图2，该装置的具体结构如下： 0039 文本图像获取单元 210，用于获取目标文本图像； 0040 文字信息识别单元 220，用于对所述目标文本图像进行文字识别得到相应的文字信息； 0041 图片轨迹获取单元 230，

21、用于对所述文字信息进行分词，并确定分词的词性，根据所述词性从图片数据库中获取对应分词的图片信息和 / 或动作轨迹信息； 0042 语音信息获取单元 240，用于根据所述文字信息中的语句的类型，从语音数据库中获取对应于所述文字信息的语音信息； 0043 图片语音输出单元 250，用于将所述图片信息和 / 或动作轨迹信息与所述语音信息在进行适配后进行输出。 0044 进一步的，文本图像获取单元 210，具体用于： 0045 向图片采集装置发出拍摄指令；接收所述图片采集装置拍摄的目标文本图像；或 0046 显示文本图像；接收作用在所述文本图像上的输入指令；

22、根据所述输入指令确定说明书 CN 103838866 A 6 4/4 页 7 所述文本图像中的目标文本图像。 0047 进一步的，所述图片轨迹获取单元 230，具体用于： 0048 对所述文字信息按着预设的分词技术进行分词； 0049 确定各分词的词性，得到所述文字信息中所包含的名词和 / 或对应于该名词的动词； 0050 从所述图片数据库中查找并获取所述名词所对应的图片信息和 / 或所述动词所对应的动作轨迹信息。 0051 进一步的，所述语音信息获取单元 240，具体用于： 0052 根据预设的标点符号集和 / 或关键动词集，识别所述文字信息中各语句的类型，其

23、中所述类型包括陈述句和对话句； 0053 从语音数据库中查找并获取与所识别出的陈述句相匹配的语音信息及其与所识别出的对话句相匹配的语音信息。 0054 进一步的，图片语音输出单元 250，具体用于： 0055 根据所述文字信息，建立所述图片信息和 / 或动作轨迹信息与所述语音信息之间的适配关系； 0056 根据所述适配关系，在对所述图片信息和 / 或动作轨迹信息进行显示的同时，对所述语音信息进行同步播放。 0057 上述产品可执行本发明任意实施例所提供的方法，具备执行方法相应的功能模块和有益效果。 0058 注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。说明书 CN 103838866 A 7 1/2 页 8 图 1 说明书附图 CN 103838866 A 8 2/2 页 9 图 2 说明书附图 CN 103838866 A 9

注意事项: 本文（一种文本转换方法及装置.pdf）为本站会员（罗明）主动上传，专利查询网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知专利查询网（点击联系客服），我们立即给予删除！