书签 分享 收藏 举报 版权申诉 / 8

WORD文件的排版方法和装置.pdf

  • 上传人:v****
  • 文档编号:5892683
  • 上传时间:2019-03-30
  • 格式:PDF
  • 页数:8
  • 大小:421.85KB
  • 摘要
    申请专利号:

    CN201310642581.4

    申请日:

    2013.12.03

    公开号:

    CN104679726A

    公开日:

    2015.06.03

    当前法律状态:

    驳回

    有效性:

    无权

    法律详情:

    发明专利申请公布后的驳回IPC(主分类):G06F 17/25申请公布日:20150603|||实质审查的生效IPC(主分类):G06F 17/25申请日:20131203|||公开

    IPC分类号:

    G06F17/25

    主分类号:

    G06F17/25

    申请人:

    北大方正集团有限公司; 方正信息产业控股有限公司; 北京北大方正电子有限公司

    发明人:

    魏超鹏

    地址:

    100871北京市海淀区成府路298号中关村方正大厦5层

    优先权:

    专利代理机构:

    北京英赛嘉华知识产权代理有限责任公司11204

    代理人:

    王达佐

    PDF完整版下载: PDF下载
    内容摘要

    本发明提供了一种Word文件的排版方法,包括:获取Word文件的文件内容的OOXML描述;利用xslt将OOXML描述转换为排版软件可识别的Xml结构;将Xml结构导入排版软件。本发明提供了一种Word文件的排版装置,包括:OOXML模块,用于获取Word文件的文件内容的OOXML描述;XML模块,用于利用xslt将OOXML描述转换为排版软件可识别的Xml结构;导入模块,用于将Xml结构导入排版软件。本发明提高了Word文件的排版效率。

    权利要求书

    权利要求书
    1.  一种Word文件的排版方法,其特征在于,包括:
    获取Word文件的文件内容的OOXML描述;
    利用xslt将所述OOXML描述转换为排版软件可识别的 Xml结构;
    将所述Xml结构导入所述排版软件。

    2.  根据权利要求1所述的方法,其特征在于,获取Word文件的 文件内容的OOXML描述包括:
    根据开放打包约定,使用解压程序将所述Word文件解压, 得到所述OOXML描述。

    3.  根据权利要求1所述的方法,其特征在于,利用xslt将所述 OOXML描述转换为排版软件可识别的xml结构包括:
    将所述OOXML中的文字内容转换为所述Xml结构中的 文字内容;
    将所述OOXML中的文字的样式及格式转换为所述Xml 结构中文字的样式及格式;
    将所述OOXML中的表格转换为所述Xml结构中的表格;
    将所述OOXML中的图片转换为所述Xml结构中的图片;
    将所述OOXML中的公式转换为所述Xml结构中的公式; 以及
    将所述OOXML中的其他结构转换为所述Xml结构中相 应的内容结构。

    4.  根据权利要求3所述的方法,其特征在于,将所述OOXML 中的公式转换为所述Xml结构中的公式包括:
    如果所述OOXML中的公式是Omath公式,则直接转换 为所述Xml结构中的公式;
    如果所述OOXML中的公式是MathType公式,则先处理 为MathML国际标准,然后转换为所述Xml结构中的公式。

    5.  根据权利要求1所述的方法,其特征在于,还包括:
    预先判断所述Word文件的版本;
    如果属于低于Word2007的版本,则将所述Word文件转 换到Word2007版本或高于Word2007的版本;所述高于Word 2007的版本包括但不限于Word2010、Word2013版本;所述 低于Word2007的版本包括但不限于Word2003、Word XP版 本。

    6.  一种Word文件的排版装置,其特征在于,包括:
    OOXML模块,用于获取Word文件的文件内容的OOXML 描述;
    XML模块,用于利用xslt将所述OOXML描述转换为排 版软件可识别的Xml结构;
    导入模块,用于将所述Xml结构导入所述排版软件。

    7.  根据权利要求6所述的装置,其特征在于,所述OOXML模 块根据开放打包约定,使用解压程序将所述Word文件解压, 得到所述OOXML描述。

    8.  根据权利要求6所述的装置,其特征在于,所述XML模块包 括:
    文字内容模块,用于将所述OOXML中的文字内容转换 为所述Xml结构中的文字内容;
    样式格式模块,用于将所述OOXML中的文字的样式及 格式转换为所述Xml结构中文字的样式及格式;
    表格模块,用于将所述OOXML中的表格转换为所述Xml 结构中的表格;
    图片模块,用于将所述OOXML中的图片转换为所述Xml 结构中的图片;
    公式模块,用于将所述OOXML中的公式转换为所述Xml 结构中的公式;以及
    其他模块,用于将所述OOXML中的其他结构转换为所 述Xml结构中相应的内容结构。

    9.  根据权利要求8所述的装置,其特征在于,所述公式模块包括:
    Omath模块,用于如果所述OOXML中的公式是Omath 公式,则直接转换为所述Xml结构中的公式;
    MathType模块,用于如果所述OOXML中的公式是 MathType公式,则先处理为MathML国际标准,然后转换为 所述Xml结构中的公式。

    10.  根据权利要求6所述的装置,其特征在于,还包括:
    版本模块,用于预先判断所述Word文件的版本;
    转换模块,用于如果所述版本低于Word2007,则将所述 Word文件转换到Word2007版本或高于Word2007的版本。

    说明书

    说明书Word文件的排版方法和装置
    技术领域
    本发明涉及排版领域,具体而言,涉及一种Word文件的排版 方法和装置。
    背景技术
    Word以其简单易用、功能丰富成为多年来最流行的办公排版软 件,各单位、个人积累了大量的各种版本的Word文件,专业排版 人员所接收的素材稿件目前也以Word文件为主。但目前大部分的 专业排版软件不能很好地兼容Word文件,大多只能做到文字内容 的导入,各种文字、段落属性以及各种图形、图像、表格、公式等 对象都被丢掉,需要重新排版制作,大大降低了Word原稿的利用 效率,造成了排版人员重复劳动,同时给排版工作带来很大不便, 阻碍了排版效率的提升。
    发明内容
    本发明旨在提供一种Word文件的排版方法和装置,以解决 Word文件排版效率太低的问题。
    在本发明的实施例中,提供了一种Word文件的排版方法,包 括:获取Word文件的文件内容的OOXML描述;利用xslt将OOXML 描述转换为排版软件可识别的Xml结构;将Xml结构导入排版软 件。
    在本发明的实施例中,提供了一种Word文件的排版装置,包 括:OOXML模块,用于获取Word文件的文件内容的OOXML描 述;XML模块,用于利用xslt将OOXML描述转换为排版软件可 识别的Xml结构;导入模块,用于将Xml结构导入排版软件。
    本发明上述实施例的Word文件的排版方法和装置可以自动地 将Word文件导入到排版软件中,从而提高了Word文件的排版效率。
    附图说明
    此处所说明的附图用来提供对本发明的进一步理解,构成本申 请的一部分,本发明的示意性实施例及其说明用于解释本发明,并 不构成对本发明的不当限定。在附图中:
    图1示出了根据本发明实施例的Word文件的排版方法的流程 图;
    图2示出了根据本发明实施例的docx文件解压后的文件夹主要 结构的屏幕截图;
    图3示出了根据本发明优选实施例的Word文件的排版方法的 流程图;
    图4示出了根据本发明实施例的Word文件的排版装置的示意 图。
    具体实施方式
    下面将参考附图并结合实施例,来详细说明本发明。
    图1示出了根据本发明实施例的Word文件的排版方法的流程 图,包括:
    步骤S10,获取Word文件的文件内容的OOXML描述;
    步骤S20,利用xslt将OOXML描述转换为排版软件可识别的 Xml结构;
    步骤S30,将Xml结构导入排版软件。
    现有的排版软件支持Xml结构,而现有程序可以将Word文件 转换成OOXML描述,还可以将OOXML描述转换为Xml结构, 本方法通过将这两个步骤联立,从而可以自动地将Word文件导入 到排版软件中,提高了Word文件的排版效率。
    优选地,步骤S10包括:根据开放打包约定,使用解压程序将 Word文件解压,得到OOXML描述。图2示出了根据本发明实施 例的docx文件(Word2007的word文件)解压后的文件夹主要结 构的屏幕截图,根据开放打包约定,使用解压程序将docx文件解压, 在指定目录形成一个临时文件夹,内含符合Office Open XML标准 的xml文件,其中的内容文件为word\document.xml,样式文件为 word\styles.xml。
    优选地,步骤S20包括:将OOXML中的文字内容转换为Xml 结构中的文字内容;将OOXML中的文字的样式及格式转换为Xml 结构中文字的样式及格式;将OOXML中的表格转换为Xml结构中 的表格;将OOXML中的图片转换为Xml结构中的图片;将OOXML 中的公式转换为Xml结构中的公式;以及将OOXML中的其他结构 转换为Xml结构中相应的内容结构;所述其他结构包括但不限于: 脚尾注、OLE对象、文本框对象、图元对象、目录、索引、拼音、 超链接、交叉引用等内容。本专利主要包括的整个Word文档排版 的方法。所述转换方法,包括:对OOXML中内容对象(如文字、 图片、表格等)与所述Xml结构中对应的内容对象的结构、属性等 进行比对,有直接对应关系(比如文字内容的描述、字体、字号等) 的,直接使用XSLT进行对应的转换;不能完全对应的(比如文本 框等),需要使用所述Xml结构中类似结构(比如文本盒子等)替 代进行转换;完全没有对应结构(如艺术字等)的,需要根据需要 选择内容转换(如艺术字只转换文本内容,不转换艺术字的展现形 式)或展示转换(如艺术字转为图片)或其他处理方式。)
    优选地,将OOXML中的公式转换为Xml结构中的公式包括: 如果OOXML中的公式是Omath公式,则直接转换为Xml结构中 的公式;所述直接转换是指,Omath公式描述方法和所述Xml结构 中公式描述方法都为Xml描述,主要公式类别(如分式、函数式、 根式、矩阵、积分等)有相互对应的结构及属性,可以通过Xslt进 行对应的直接转换;如果OOXML中的公式是MathType公式,则 先处理为MathML国际标准,然后转换为Xml结构中的公式。所述 先处理为MathML国际标准是指通过MathType程序提供的API函 数把Mathtype公式转换为MathML公式;所述转换为Xml结构中 的公式,转换方法与前述Omath格式的转换相同,使用XSLT进行 转换。
    图3示出了根据本发明优选实施例的Word文件的排版方法的 流程图,如图所示,本方法还包括:预先判断Word文件的版本(即 判断是否为docx文件);如果版本低于Word2007,则将Word文件 转换到Word2007版本或高于Word2007的版本。
    进一步,步骤(3)中,利用xslt将OOXML格式的word内容 转换为目标软件可识别的xml结构,对于某些OOXML支持而目标 格式不支持的内容需要做特殊处理,以保证内容不丢失及显示效果 基本一致。所述特殊处理是指根据需要选择内容转换(如艺术字只 转换文本内容,不转换艺术字的展现形式)或展示转换(如艺术字 转为图片)或其他处理方式或使用其他结构替代OOXML中的结构 (如目标格式不支持项目编号,需要把OOXML中的项目编号转为 目标格式中的文本内容)。
    图4示出了根据本发明实施例的Word文件的排版装置的示意 图,包括:
    OOXML模块10,用于获取Word文件的文件内容的OOXML 描述;
    XML模块20,用于利用xslt将OOXML描述转换为排版软件 可识别的Xml结构;
    导入模块30,用于将Xml结构导入排版软件。
    本装置提高了Word文件的排版效率。
    优选地,OOXML模块根据开放打包约定,使用解压程序将 Word文件解压,得到OOXML描述。
    优选地,XML模块包括:文字内容模块,用于将OOXML中 的文字内容转换为Xml结构中的文字内容;样式格式模块,用于将 OOXML中的文字的样式及格式转换为Xml结构中文字的样式及格 式;表格模块,用于将OOXML中的表格转换为Xml结构中的表格; 图片模块,用于将OOXML中的图片转换为Xml结构中的图片;公 式模块,用于将OOXML中的公式转换为Xml结构中的公式;以及 其他模块,用于将OOXML中的其他结构转换为Xml结构中相应的 内容结构。
    优选地,公式模块包括:Omath模块,用于如果OOXML中的 公式是Omath公式,则直接转换为Xml结构中的公式;MathType 模块,用于如果OOXML中的公式是MathType公式,则先处理为 MathML国际标准,然后转换为Xml结构中的公式。
    优选地,本装置还包括:版本模块,用于预先判断Word文件 的版本;转换模块,用于如果版本低于Word2007,则将Word文件 转换到Word2007版本或高于Word2007的版本。
    从以上的描述中可以看出,本发明简单清晰,简化了Word文 件排版过程的工作,减少了重复劳动,提高了排版的效率。
    显然,本领域的技术人员应该明白,上述的本发明的各模块或 各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算 装置上,或者分布在多个计算装置所组成的网络上,可选地,它们 可以用计算装置可执行的程序代码来实现,从而,可以将它们存储 在存储装置中由计算装置来执行,或者将它们分别制作成各个集成 电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模 块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
    以上所述仅为本发明的优选实施例而已,并不用于限制本发明, 对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在 本发明的精神和原则之内,所作的任何修改、等同替换、改进等, 均应包含在本发明的保护范围之内。

    关 键  词:
    WORD 文件 排版 方法 装置
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:WORD文件的排版方法和装置.pdf
    链接地址:https://www.zhuanlichaxun.net/p-5892683.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1