有声电子书生成方法及装置.pdf

上传人:周** 文档编号:11066086 上传时间:2021-08-31 格式:PDF 页数:15 大小:605.38KB
收藏 版权申诉 举报 下载
有声电子书生成方法及装置.pdf_第1页
第1页 / 共15页
有声电子书生成方法及装置.pdf_第2页
第2页 / 共15页
有声电子书生成方法及装置.pdf_第3页
第3页 / 共15页
文档描述:

《有声电子书生成方法及装置.pdf》由会员分享,可在线阅读,更多相关《有声电子书生成方法及装置.pdf(15页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910779757.8 (22)申请日 2019.08.22 (71)申请人 北京达佳互联信息技术有限公司 地址 100085 北京市海淀区上地西路6号1 幢1层101D1-7 (72)发明人 卢耀 (74)专利代理机构 北京润泽恒知识产权代理有 限公司 11319 代理人 李娜 (51)Int.Cl. G09B 5/04(2006.01) G06F 17/27(2006.01) G10L 13/04(2013.01) G10L 13/047(2013.01) (54)发明。

2、名称 有声电子书生成方法及装置 (57)摘要 本公开公开了一种有声电子书生成方法、 装 置、 电子设备及计算机可读存储介质, 其中, 所述 方法包括: 确定电子书文本中包含的至少一个角 色; 根据文本上下文信息确定每个角色对应的文 本内容; 根据所述各个角色对应的文本内容分别 合成各自的音频。 本公开通过确定电子书文本中 包含的至少一个角色, 根据文本上下文信息确定 每个角色对应的文本内容, 根据所述各个角色对 应的文本内容分别合成各自的音频, 可以自动生 成多角色演说的有声电子书, 且成本较低。 权利要求书1页 说明书9页 附图4页 CN 110634336 A 2019.12.31 CN 。

3、110634336 A 1.一种有声电子书生成方法, 其特征在于, 包括: 确定电子书文本中包含的至少一个角色; 根据文本上下文信息确定每个角色对应的文本内容; 根据所述各个角色对应的文本内容分别合成各自的音频。 2.根据权利要求1所述的方法, 其特征在于, 所述根据文本上下文信息确定每个角色对 应的文本内容, 包括: 根据引号将所述电子书文本分割为对话文本和旁白文本, 将所述对话文本和旁白文本 分别作为不同角色对应的文本内容; 根据所述对话文本的上下文信息确定所述对话文本所属角色。 3.根据权利要求1所述的方法, 其特征在于, 所述根据所述各个角色对应的文本内容分 别合成各自的音频, 包括:。

4、 为每个角色分别配置对应的音频参数; 根据各个角色对应的文本内容和音频参数生成各自的音频。 4.根据权利要求1-3任一项所述的方法, 其特征在于, 所述确定电子书文本中包含的至 少一个角色, 包括: 对所述电子书文本进行分词和词性标注; 根据所述分词和词性标注的结果确定至少一个角色。 5.一种有声电子书生成装置, 其特征在于, 包括: 角色确定模块, 用于确定电子书文本中包含的至少一个角色; 内容确定模块, 用于根据文本上下文信息确定每个角色对应的文本内容; 音频合成模块, 用于根据所述各个角色对应的文本内容分别合成各自的音频。 6.根据权利要求5所述的装置, 其特征在于, 所述内容确定模块具。

5、体用于: 根据引号将 所述电子书文本分割为对话文本和旁白文本, 将所述对话文本和旁白文本分别作为不同角 色对应的文本内容; 根据所述对话文本的上下文信息确定所述对话文本所属角色。 7.根据权利要求5所述的装置, 其特征在于, 所述音频合成模块具体用于: 为每个角色 分别配置对应的音频参数; 根据各个角色对应的文本内容和音频参数生成各自的音频。 8.根据权利要求5-7任一项所述的装置, 其特征在于, 所述角色确定模块具体用于: 对 所述电子书文本进行分词和词性标注; 根据所述分词和词性标注的结果确定至少一个角 色。 9.一种电子设备, 其特征在于, 包括: 处理器; 用于存储处理器可执行指令的存。

6、储器; 其中, 所述处理器被配置为: 通过执行指令以实 现权利要求1-4任一项所述的有声电子书生成方法。 10.一种非临时性计算机可读存储介质, 当所述存储介质中的指令由移动终端的处理 器执行时, 使得移动终端能够执行权利要求1-4任一项所述的有声电子书生成方法。 权利要求书 1/1 页 2 CN 110634336 A 2 有声电子书生成方法及装置 技术领域 0001 本公开涉及计算机处理技术领域, 尤其涉及一种有声电子书生成方法、 装置、 电子 设备及计算机可读存储介质。 背景技术 0002 随着科技的发展, 特别是电子文档识别技术的发展, 安装了阅读软件后, 就可以阅 读电子图书了。 近。

7、年以喜马拉雅等为代表的有声电子书播放平台强势崛起, 人民能更方便、 更实惠地享受丰富多彩的电子书作品, 极大地促进文化的发展。 0003 在现有技术中, 通常组织多位演说家对同一个小说文本进行演说并录音, 或同一 位演说家模拟不同角色的声音, 得到多角色演说的有声电子书。 0004 但是, 上述方法存在演说成本高或无法真正实现多角色演说等问题。 发明内容 0005 本公开提供一种有声电子书生成方法、 装置、 电子设备及计算机可读存储介质, 以 至少解决相关技术中演说成本高或无法真正实现多角色演说的问题。 本公开的技术方案如 下: 0006 根据本公开实施例的第一方面, 提供一种有声电子书生成方。

8、法, 包括: 0007 确定电子书文本中包含的至少一个角色; 0008 根据文本上下文信息确定每个角色对应的文本内容; 0009 根据所述各个角色对应的文本内容分别合成各自的音频。 0010 进一步的, 所述根据文本上下文信息确定每个角色对应的文本内容, 包括: 0011 根据引号将所述电子书文本分割为对话文本和旁白文本, 将所述对话文本和旁白 文本分别作为不同角色对应的文本内容; 0012 根据所述对话文本的上下文信息确定所述对话文本所属角色。 0013 进一步的, 所述根据所述各个角色对应的文本内容分别合成各自的音频, 包括: 0014 为每个角色分别配置对应的音频参数; 0015 根据各。

9、个角色对应的文本内容和音频参数生成各自的音频。 0016 进一步的, 所述确定电子书文本中包含的至少一个角色, 包括: 0017 对所述电子书文本进行分词和词性标注; 0018 根据所述分词和词性标注的结果确定至少一个角色。 0019 根据本公开实施例的第二方面, 还提供一种有声电子书生成装置, 包括: 0020 角色确定模块, 用于确定电子书文本中包含的至少一个角色; 0021 内容确定模块, 用于根据文本上下文信息确定每个角色对应的文本内容; 0022 音频合成模块, 用于根据所述各个角色对应的文本内容分别合成各自的音频。 0023 进一步的, 所述内容确定模块具体用于: 根据引号将所述电。

10、子书文本分割为对话 文本和旁白文本, 将所述对话文本和旁白文本分别作为不同角色对应的文本内容; 根据所 说明书 1/9 页 3 CN 110634336 A 3 述对话文本的上下文信息确定所述对话文本所属角色。 0024 进一步的, 所述音频合成模块具体用于: 为每个角色分别配置对应的音频参数; 根 据各个角色对应的文本内容和音频参数生成各自的音频。 0025 进一步的, 所述角色确定模块具体用于: 对所述电子书文本进行分词和词性标注; 根据所述分词和词性标注的结果确定至少一个角色。 0026 根据本公开实施例的第三方面, 提供一种电子设备, 包括: 0027 处理器; 0028 用于存储处理。

11、器可执行指令的存储器; 其中, 所述处理器被配置为: 通过执行指令 以实现上述第一方面任一项所述的有声电子书生成方法。 0029 根据本公开实施例的第四方面, 提供一种非临时性计算机可读存储介质, 当所述 存储介质中的指令由移动终端的处理器执行时, 使得移动终端能够执行上述第一方面任一 项所述的有声电子书生成方法。 0030 根据本公开实施例的第五方面, 提供一种计算机产品, 包括上述第一方面任一项 所述的有声电子书生成方法。 0031 本公开的实施例提供的技术方案至少带来以下有益效果: 通过确定电子书文本中 包含的至少一个角色, 根据文本上下文信息确定每个角色对应的文本内容, 根据所述各个 。

12、角色对应的文本内容分别合成各自的音频, 可以自动生成多角色演说的有声电子书, 且成 本较低。 0032 应当理解的是, 以上的一般描述和后文的细节描述仅是示例性和解释性的, 并不 能限制本公开。 附图说明 0033 此处的附图被并入说明书中并构成本说明书的一部分, 示出了符合本公开的实施 例, 并与说明书一起用于解释本公开的原理。 0034 图1是本公开实施例一提供的一种有声电子书生成方法的流程图。 0035 图2是本公开实施例二提供的一种有声电子书生成方法的流程图。 0036 图3是本公开实施例三提供的一种有声电子书生成装置的结构框图。 0037 图4是本公开实施例四提供的一种电子设备的结构。

13、框图。 具体实施方式 0038 为了使本领域普通人员更好地理解本公开的技术方案, 下面将结合附图, 对本公 开实施例中的技术方案进行清楚、 完整地描述。 0039 需要说明的是, 本公开的说明书和权利要求书及上述附图中的术语 “第一” 、“第 二” 等是用于区别类似的对象, 而不必用于描述特定的顺序或先后次序。 应该理解这样使用 的数据在适当情况下可以互换, 以便这里描述的本公开的实施例能够以除了在这里图示或 描述的那些以外的顺序实施。 以下示例性实施例中所描述的实施方式并不代表与本公开相 一致的所有实施方式。 相反, 它们仅是与如所附权利要求书中所详述的、 本公开的一些方面 相一致的装置和方。

14、法的例子。 0040 实施例一 说明书 2/9 页 4 CN 110634336 A 4 0041 图1是本公开实施例一提供的一种有声电子书生成方法的流程图, 本实施例提供 的有声电子书生成方法的执行主体, 可为本公开实施例提供的有声电子书生成装置, 该装 置可以集成于移动终端设备(例如, 智能手机、 平板电脑等)、 笔记本或固定终端(台式电脑) 中, 该有声电子书生成装置可以采用硬件或软件实现。 如图1所示, 包括以下步骤: 0042 在步骤S11中, 确定电子书文本中包含的至少一个角色。 0043 其中, 电子书可以为小说, 角色为可以为小说中的人物, 包括主角、 配角, 以及小说 中的旁。

15、白也归为一个角色。 0044 具体的, 可以通过识别电子书文本中包含的人名, 根据人名确定角色。 例如, 针对 文本 “过了一会儿, 史强走进了病房, 在他的床前坐下” , 通过人名识别可以确定史强为一个 人名, 即可以确定史强为一个角色。 0045 在步骤S12中, 根据文本上下文信息确定每个角色对应的文本内容。 0046 其中, 上下文信息包括文本内容、 角色对应的人名等。 0047 例如, 对于文本 “过了一会儿, 史强走进了病房, 在他的床前坐下。“感觉怎么样, 穿 防弹衣中枪我有过三次, 应该没有太大的事。 ” 史强说。 ” 根据上文文本信息 “过了一会儿, 史 强走进了病房, 在他。

16、的床前坐下。 ” 可以初步确定下述文本内容 “感觉怎么样, 穿防弹衣中枪 我有过三次, 应该没有太大的事。 ” 为史强说的, 进一步根据下文文本信息 “史强说” 可以确 定上述文本内容 “感觉怎么样, 穿防弹衣中枪我有过三次, 应该没有太大的事。 ” 确实为史强 说的。 根据上述规则, 可以确定电子书中每个角色对应的文本内容, 即说话内容。 对于旁白 “过了一会儿, 史强走进了病房, 在他的床前坐下” 及 “史强说” 也将其作为一个独立的角色。 0048 在步骤S13中, 根据所述各个角色对应的文本内容分别合成各自的音频。 0049 具体的, 在确定了每个角色对应的文本内容之后, 分别合成各自。

17、的音频。 0050 例如, 对于文本 “过了一会儿, 史强走进了病房, 在他的床前坐下。“感觉怎么样, 穿 防弹衣中枪我有过三次, 应该没有太大的事。 ” 史强说。 ” 可以确定包含的角色为旁白和史 强, 旁白对应的文本内容为 “过了一会儿, 史强走进了病房, 在他的床前坐下” 及 “史强说” , 史强对应的文本内容为 “感觉怎么样, 穿防弹衣中枪我有过三次, 应该没有太大的事。 ” , 然 后分别合成旁白和史强对应的音频。 通过类似的方法, 可以得到电子书中所有角色的音频, 从而得到多角色演说的有声电子书。 0051 本实施例通过确定电子书文本中包含的至少一个角色, 根据文本上下文信息确定 。

18、每个角色对应的文本内容, 根据所述各个角色对应的文本内容分别合成各自的音频, 可以 自动生成多角色演说的有声电子书, 且成本较低。 0052 在一个可选的实施例中, 步骤S11具体包括: 0053 步骤S111: 对所述电子书文本进行分词和词性标注。 0054 步骤S112: 根据所述分词和词性标注的结果确定至少一个角色。 0055 具体的, 可以采用中文词法分析工具包(THU Lexical Analyzer for Chinese, THULAC)对所述电子书文本进行分词和词性标注。 例如, 采用的词性标注集如下: 0056 n/名词np/人名ns/地名ni/机构名nz/其它专名m/数词q。

19、/量词mq/数量词t/时间词 f/方位词s/处所词v/动词a/形容词d/副词h/前接成分k/后接成分i/习语j/简称r/代词c/ 连词p/介词u/助词y/语气助词e/叹词o/拟声词g/语素w/标点x/其它 0057 例如, 对于电子书文本 “过了一会儿, 史强走进了病房, 在他的床前坐下” , 对应的 说明书 3/9 页 5 CN 110634336 A 5 分词和词性标注结果为: 过_u了_u一会儿_m, _w史强_np走_v进_v了_u病房_n, _w在_p他_r 的_u床_n前_f坐下_v, 据此可以查找到np前的单元就是史强, 这样一段文字中的角色就找 出来了。 0058 在一个可选的。

20、实施例中, 步骤S12具体包括: 0059 步骤S121: 根据引号将所述电子书文本分割为对话文本和旁白文本, 将所述对话 文本和旁白文本分别作为不同角色对应的文本内容。 0060 步骤S122: 根据所述对话文本的上下文信息确定所述对话文本所属角色。 0061 具体的, 目前电子书格式完备, 尤其是小说, 对话内容基本都包含在引号( “” )里, 在一段文本内容中首先找到 “, 然后标注位置, 直到下一个” , 再次标注位置, 这两个位置之 间的文本就认为它是对话, 其他的就是旁白了, 这样就能把整个电子书中旁白和对话找出 来并按顺序保存下来。 0062 在确定了对话和旁白之后, 再根据所述。

21、对话文本的上下文信息确定所述对话文本 所属角色。 例如, 对于对话 “感觉怎么样, 穿防弹衣中枪我有过三次, 应该没有太大的事。 ” , 其对应的上文文本信息为 “过了一会儿, 史强走进了病房, 在他的床前坐下” 、 及下文文本信 息为 “史强说” , 可以确定该对话的角色为史强。 0063 例如, 对于旁白 “史强很快回来了, 对罗辑说” , 可采用如下代码实现确定对话文本 所属角色: 0064 0065 说明书 4/9 页 6 CN 110634336 A 6 0066 得到的结果为: 回来/VV nsubj史强/NN advmod很/AD dep快/ADaux:asp 了/ASpunct。

22、, /PU conj说/VV nmod:prep罗辑/NR case对/P 0067 其中, nsubj表示主语, NN表示人名, 因此nsubj史强/NN即为主语名为史强的人, 也即说话的人就是史强, 接下来的对话就归属为史强这个角色。 0068 在一个可选的实施例中, 步骤S13具体包括: 0069 步骤S131: 为每个角色分别配置对应的音频参数。 0070 步骤S132: 根据各个角色对应的文本内容和音频参数生成各自的音频。 0071 其中, 音频参数可以为以下至少一种: 语速、 音高、 音量、 半音和音色。 针对不同的 角色设置不同风格的音频参数。 其中, 音频音质可以通过机器学习模。

23、仿某个人的声音而获 得, 极大丰富音频质量和数量。 0072 实施例二 0073 图2是本公开实施例二提供的一种有声电子书生成方法的流程图, 本实施例以小 说 三体 片段为例对本公开进行详细说明, 如图2所示, 具体包括: 0074 三体 片段如下: 0075 过了一会儿, 史强走进了病房, 在他的床前坐下。“感觉怎么样, 穿防弹衣中枪我有 过三次, 应该没有太大的事。 ” 史强说。“大史, 你救了我的命。 ” 罗辑无力地说。 史强摆了下 手:“出了这事, 应该算是我们的失职吧, 当时, 我们没有采取最有效的保卫措施, 我们只能 听你的, 现在没事了。 ”“他们三个呢? ” 罗辑问。 大史马上。

24、就明白他指的是谁,“都很好, 他们 没有你这么轻率, 一个人走到外面。 ”“是ETO要杀我们吗? ”“应该是吧, 凶手已经被捕了, 幸 亏我们在你后面布置了蛇眼。 ”“什么? ”“一种很精密的雷达系统, 能根据子弹的弹道迅速确 定射手的位置。 那个凶手的身份已经确定, 是ETO军事组织的游击战专家。 我们没想到他居 然敢在那样的中心地带下手, 所以他这次行动几乎是自杀性质的。 ”“我想见他。 ”“谁, 凶 手? ” 罗辑点点头。“好的, 不过这不在我的权限内, 我只负责安全保卫, 我去请示一下。 ” 史强 说完, 起身出去了, 他现在显得谨慎而认真, 与以前那个看上去大大咧咧的人很不同, 一时。

25、 让罗辑有些不适应。 史强很快回来了, 对罗辑说:“可以了, 就在这儿见呢, 还是换个地方, 医 生说你起来走路没问题的。 ” 罗辑本想说换个地方, 并起身下床, 但转念一想, 这副病怏怏的 样子更合自己的意, 就又在床上躺了下来:“就在这儿吧。 ”“他们正在过来, 还要等一会儿, 你先吃点儿东西吧, 离飞机上吃饭已经过去一整天了。 我先去安排一下。 ” 史强说完, 起身又 出去了。 罗辑刚吃完饭, 凶手就被带了进来, 他是一个年轻人, 有着一副英俊的欧洲面孔, 但 最大的特征是他那淡淡的微笑, 那笑容像是长在他脸上似的, 从不消退。 0076 步骤S21: 确定电子书文本中包含的至少一个角色。

26、。 0077 具体的, 根据以上对话可以确定小说中的角色分别为: 旁白、 史强、 罗辑。 0078 步骤S22: 根据引号将所述电子书文本分割为对话文本和旁白文本, 将所述对话文 本和旁白文本分别作为不同角色对应的文本内容。 0079 具体的, 分割旁白文本和对话文本如下: 0080 旁白:过了一会儿, 史强走进了病房, 在他的床前坐下。 0081 对话: “感觉怎么样, 穿防弹衣中枪我有过三次, 应该没有太大的事。 ” 0082 旁白:史强说。 0083 对话: “大史, 你救了我的命。 ” 说明书 5/9 页 7 CN 110634336 A 7 0084 旁白:罗辑无力地说。 0085 。

27、旁白:史强摆了下手: 0086 对话: “出了这事, 应该算是我们的失职吧, 当时, 我们没有采取最有效的保卫措 施, 我们只能听你的, 现在没事了。 ” 0087 对话: “他们三个呢? ” 0088 旁白:罗辑问。 0089 对话: “都很好, 他们没有你这么轻率, 一个人走到外面。 ” 0090 对话: “是ETO要杀我们吗? ” 0091 对话: “应该是吧, 凶手已经被捕了, 幸亏我们在你后面布置了蛇眼。 ” 0092 对话: “什么? ” 0093 对话: “一种很精密的雷达系统, 能根据子弹的弹道迅速确定射手的位置。 那个凶 手的身份已经确定, 是ETO军事组织的游击战专家。 我。

28、们没想到他居然敢在那样的中心地带 下手, 所以他这次行动几乎是自杀性质的。 ” 0094 对话: “我想见他。 ” 0095 对话: “谁, 凶手? ” 0096 旁白:罗辑点点头。 0097 对话: “好的, 不过这不在我的权限内, 我只负责安全保卫, 我去请示一下。 ” 0098 旁白:史强说完, 起身出去了, 他现在显得谨慎而认真, 与以前那个看上去大大咧 咧的人很不同, 一时让罗辑有些不适应。 0099 旁白:史强很快回来了, 对罗辑说: 0100 对话: “可以了, 就在这儿见呢, 还是换个地方, 医生说你起来走路没问题的。 ” 0101 旁白:罗辑本想说换个地方, 并起身下床, 但。

29、转念一想, 这副病怏怏的样子更合自 己的意, 就又在床上躺了下来: 0102 对话: “就在这儿吧。 ” 0103 对话: “他们正在过来, 还要等一会儿, 你先吃点儿东西吧, 离飞机上吃饭已经过去 一整天了。 我先去安排一下。 ” 0104 旁白:史强说完, 起身又出去了。 0105 旁白:罗辑刚吃完饭, 凶手就被带了进来, 他是一个年轻人, 有着一副英俊的欧洲 面孔, 但最大的特征是他那淡淡的微笑, 那笑容像是长在他脸上似的, 从不消退。 0106 步骤S23: 根据所述对话文本的上下文信息确定所述对话文本所属角色。 0107 具体的, 确定结果如下: 0108 朗读者姓名: 旁白,角色:。

30、 1 0109 朗读内容: 过了一会儿, 史强走进了病房, 在他的床前坐下。 0110 - 0111 朗读者姓名: 史强,角色: 1000 0112 朗读内容:“感觉怎么样, 穿防弹衣中枪我有过三次, 应该没有太大的事。 ” 0113 - 0114 朗读者姓名: 旁白,角色: 1 0115 朗读内容: 说明书 6/9 页 8 CN 110634336 A 8 0116 史强说。 0117 - 0118 朗读者姓名: 罗辑,角色: 1001 0119 朗读内容:“大史, 你救了我的命。 ” 0120 - 0121 朗读者姓名: 旁白,角色: 1 0122 朗读内容: 罗辑无力地说。 0123 -。

31、 0124 朗读者姓名: 旁白,角色: 1 0125 朗读内容: 史强摆了下手: 0126 - 0127 朗读者姓名: 史强,角色: 1000 0128 朗读内容:“出了这事, 应该算是我们的失职吧, 当时, 我们没有采取最有效的保卫 措施, 我们只能听你的, 现在没事了。 ” 0129 - 0130 朗读者姓名: 罗辑,角色: 1001 0131 朗读内容:“他们三个呢? ” 0132 - 0133 朗读者姓名: 旁白,角色: 1 0134 朗读内容: 罗辑问。 0135 - 0136 朗读者姓名: 史强,角色: 1000 0137 朗读内容:“都很好, 他们没有你这么轻率, 一个人走到外面。

32、。 ” 0138 - 0139 朗读者姓名: 罗辑,角色: 1001 0140 朗读内容:“是ETO要杀我们吗? ” 0141 - 0142 步骤S24: 为每个角色分别配置对应的音频参数。 0143 步骤S25: 根据各个角色对应的文本内容和音频参数生成各自的音频。 0144 步骤S26: 利用语音合成软件将各段音频合成一整本有声电子书。 0145 实施例三 0146 图3是本公开实施例三提供的一种有声电子书生成装置框图。 该装置可以集成于 移动终端设备(例如, 智能手机、 平板电脑等)、 笔记本或固定终端(台式电脑)中, 该有声电 子书生成装置可以采用硬件或软件实现。 参照图3, 该装置包。

33、括: 角色确定模块31、 内容确定 模块32、 音频合成模块33; 其中, 0147 角色确定模块31用于确定电子书文本中包含的至少一个角色; 0148 内容确定模块32用于根据文本上下文信息确定每个角色对应的文本内容; 0149 音频合成模块33用于根据所述各个角色对应的文本内容分别合成各自的音频。 0150 进一步的, 所述内容确定模块32具体用于: 根据引号将所述电子书文本分割为对 说明书 7/9 页 9 CN 110634336 A 9 话文本和旁白文本, 将所述对话文本和旁白文本分别作为不同角色对应的文本内容; 根据 所述对话文本的上下文信息确定所述对话文本所属角色。 0151 进一。

34、步的, 所述音频合成模块33具体用于: 为每个角色分别配置对应的音频参数; 根据各个角色对应的文本内容和音频参数生成各自的音频。 0152 进一步的, 所述角色确定模块31具体用于: 对所述电子书文本进行分词和词性标 注; 根据所述分词和词性标注的结果确定至少一个角色。 0153 关于上述实施例中的装置, 其中各个模块执行操作的具体方式已经在有关该方法 的实施例中进行了详细描述, 此处将不做详细阐述说明。 0154 实施例四 0155 图4是根据一示例性实施例示出的一种用于有声电子书生成的装置400的框图。 例 如, 装置400可以是移动电话, 计算机, 数字广播终端, 消息收发设备, 游戏控。

35、制台, 平板设 备, 医疗设备, 健身设备, 个人数字助理等。 0156 参照图4, 装置400可以包括以下一个或多个组件: 处理组件402, 存储器404, 电力 组件406, 多媒体组件408, 音频组件410, 输入/输出(I/O)的接口412, 传感器组件414, 以及 通信组件416。 0157 处理组件402通常控制装置400的整体操作, 诸如与显示, 电话呼叫, 数据通信, 相 机操作和记录操作相关联的操作。 处理组件402可以包括一个或多个处理器420来执行指 令, 以完成上述的方法的全部或部分步骤。 此外, 处理组件402可以包括一个或多个模块, 便 于处理组件402和其他组。

36、件之间的交互。 例如, 处理组件402可以包括多媒体模块, 以方便多 媒体组件408和处理组件402之间的交互。 0158 存储器404被配置为存储各种类型的数据以支持在设备400的操作。 这些数据的示 例包括用于在装置400上操作的任何应用程序或方法的指令, 联系人数据, 电话簿数据, 消 息, 图片, 多媒体信息等。 存储器404可以由任何类型的易失性或非易失性存储设备或者它 们的组合实现, 如静态随机存取存储器(SRAM), 电可擦除可编程只读存储器(EEPROM), 可擦 除可编程只读存储器(EPROM), 可编程只读存储器(PROM), 只读存储器(ROM), 磁存储器, 快 闪存储。

37、器, 磁盘或光盘。 0159 电源组件406为装置400的各种组件提供电力。 电源组件406可以包括电源管理系 统, 一个或多个电源, 及其他与为装置400生成、 管理和分配电力相关联的组件。 0160 多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。 在一 些实施例中, 屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。 如果屏幕包括触摸面板, 屏 幕可以被实现为触摸屏, 以接收来自用户的输入信号。 触摸面板包括一个或多个触摸传感 器以感测触摸、 滑动和触摸面板上的手势。 所述触摸传感器可以不仅感测触摸或滑动动作 的边界, 而且还检测与所述触摸或滑动操作相关的持续时。

38、间和压力。 在一些实施例中, 多媒 体组件408包括一个前置摄像头和/或后置摄像头。 当设备400处于操作模式, 如拍摄模式或 多媒体信息模式时, 前置摄像头和/或后置摄像头可以接收外部的多媒体数据。 每个前置摄 像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。 0161 音频组件410被配置为输出和/或输入音频信号。 例如, 音频组件410包括一个麦克 风(MIC), 当装置400处于操作模式, 如呼叫模式、 记录模式和语音识别模式时, 麦克风被配 置为接收外部音频信号。 所接收的音频信号可以被进一步存储在存储器404或经由通信组 说明书 8/9 页 10 CN 110。

39、634336 A 10 件416发送。 在一些实施例中, 音频组件410还包括一个扬声器, 用于输出音频信号。 0162 I/O接口412为处理组件402和外围接口模块之间提供接口, 上述外围接口模块可 以是键盘, 点击信息的行为轮, 按钮等。 这些按钮可包括但不限于: 主页按钮、 音量按钮、 启 动按钮和锁定按钮。 0163 传感器组件414包括一个或多个传感器, 用于为装置400提供各个方面的状态评 估。 例如, 传感器组件414可以检测到设备400的打开/关闭状态, 组件的相对定位, 例如所述 组件为装置400的显示器和小键盘, 传感器组件414还可以检测装置400或装置400一个组件 。

40、的位置改变, 用户与装置400接触的存在或不存在, 装置400方位或加速/减速和装置400的 温度变化。 传感器组件414可以包括接近传感器, 被配置用来在没有任何的物理接触时检测 附近物体的存在。 传感器组件414还可以包括光传感器, 如CMOS或CCD图像传感器, 用于在成 像应用中使用。 在一些实施例中, 该传感器组件414还可以包括加速度传感器, 陀螺仪传感 器, 磁传感器, 压力传感器或温度传感器。 0164 通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。 装置 400可以接入基于通信标准的无线网络, 如WiFi, 运营商网络(如2G、 3G、 4G或5G)。

41、, 或它们的 组合。 在一个示例性实施例中, 通信组件416经由广播信道接收来自外部广播管理系统的广 播信号或广播相关信息。 在一个示例性实施例中, 所述通信组件416还包括近场通信(NFC) 模块, 以促进短程通信。 例如, 在NFC模块可基于射频识别(RFID)技术, 红外数据协会(IrDA) 技术, 超宽带(UWB)技术, 蓝牙(BT)技术和其他技术来实现。 0165 在示例性实施例中, 装置400可以被一个或多个应用专用集成电路(ASIC)、 数字信 号处理器(DSP)、 数字信号处理设备(DSPD)、 可编程逻辑器件(PLD)、 现场可编程门阵列 (FPGA)、 控制器、 微控制器、。

42、 微处理器或其他电子元件实现, 用于执行上述方法。 0166 在示例性实施例中, 还提供了一种包括指令的存储介质, 例如包括指令的存储器 404, 上述指令可由装置400的处理器420执行以完成上述方法。 可选地, 存储介质可以是非 临时性计算机可读存储介质, 例如, 所述非临时性计算机可读存储介质可以是ROM、 随机存 取存储器(RAM)、 CD-ROM、 磁带、 软盘和光数据存储设备等。 0167 本领域技术人员在考虑说明书及实践这里公开的发明后, 将容易想到本公开的其 它实施方案。 本申请旨在涵盖本公开的任何变型、 用途或者适应性变化, 这些变型、 用途或 者适应性变化遵循本公开的一般性。

43、原理并包括本公开未公开的本技术领域中的公知常识 或惯用技术手段。 说明书和实施例仅被视为示例性的, 本公开的真正范围和精神由下面的 权利要求指出。 0168 应当理解的是, 本公开并不局限于上面已经描述并在附图中示出的精确结构, 并 且可以在不脱离其范围进行各种修改和改变。 本公开的范围仅由所附的权利要求来限制。 说明书 9/9 页 11 CN 110634336 A 11 图1 说明书附图 1/4 页 12 CN 110634336 A 12 图2 说明书附图 2/4 页 13 CN 110634336 A 13 图3 说明书附图 3/4 页 14 CN 110634336 A 14 图4 说明书附图 4/4 页 15 CN 110634336 A 15 。

展开阅读全文
内容关键字: 有声 电子 书生 方法 装置
关于本文
本文标题:有声电子书生成方法及装置.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/11066086.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1