基于模板和XML在BS结构应用中生成word文件

80酷酷网    80kuku.com

  word|xml|模板

现在的各类应用系统中时常会需要动态生成Word文件,解决比较常见的两种方法是:

1.       利用Word提供的COM自动化接口控制Word生成文档

2.       利用Word对html的支持,制作html文件,并设置其contentType为"application/msword",使浏览器调用word打开

第一种方法靠Word进程实际完成文件生成工作,而Word并为设计为在服务器端处理并发调用,所以这种方法只适合单机应用。另外,如果要生成比较复杂的word文件,相应的代码会非常烦琐,排版和调试也需要花大量时间。
第二种方法的致命问题是html文档中无法保存二进制数据,比如图片,如果在服务器端生成一堆文件,即难以在浏览器中显示,也无法让用户直接下载。

比较完善的解决办法是基于WordML来生成word文件。WordML是微软为Word设计的xml架构,其完整语法可以在MSDN上找到。按照这个语法生成xml文件,可以在文档中随意得到各种word支持的格式。特别需要指出的是可以方便的在文件中内嵌图片,其语法基本是这样:

<w:pict>
    <v:shapetype id="_x0000_t75" ...>
    ... VML shape template definition ...
    </v:shapetype>
    <w:binData w:name="http://www.pushad.com/Info/wordml://02000001.jpg">/9j/4AAQSkZJRgABAgAAZABkAAD/7AARRHVja3kAAQAEAAAAPAAA/+4ADkFkb2JlAGTAAAAAAf/b
AIQABgQEBAUEBgUFBgkGBQYJCwgGBggLDAoKCwoKDBAMDAwMDAwQDA4PEA8ODBMTFBQTExwbGxsc
... 更多Base6编码的图片文件数据
    </w:binData>
    <v:shape id="_x0000_i1025" type="#_x0000_t75"
      w:st="on" unitname="pt" sourcevalue="212.4" hasspace="False" negative="False" numbertype="1" tcsc="0">212.4pt;height:159pt">
         <v:imagedata src="http://www.pushad.com/Info/wordml://02000001.jpg"
           o:title="Image title"/>
    </v:shape>
</w:pict>

其关键是图片的实际数据以base64编码之后放在<w:binData></w:binData>标记之间。

如果你看了MSDN上的WordML语法,会发现它非常复杂。这不奇怪,因为Word有非常多的功能,但要写程序根据这么多定义来生成文档就比较费事了。不过我们可以利用模板文件来解决这个问题。

同我们动态生成网页一样,要动态生成的word文件也有相当多部分是固定不变的,并且复杂的版面、格式一般都在这些固定不变的部分中。所以借用生成网页的思路,我们可以在word中先根据需要的版面和格式,结合一些虚拟的数据做出模板文件,然后将这个模板文件保存为xml格式,再在xml文件中找到那些虚拟的数据对应的文本,将它们替换为将采用的后台处理技术的数据处理指令,这样我们就可以在服务器端结合模板文件和数据库查询,生成word文件了。

下面举一个例子。假设我们采用JSP进行word文件生成,首先制作模板文件如下:

连宋个人简历

本人概况

姓名

连宋

出生日期

193777

免冠照片免冠照片免冠照片

性别

证件类型

身份证

学历

大学本科

证件号码

41043219700707011

婚姻状况

已婚

期望月薪

面议

户口所在地

    

    

    

然后将这个文件保存为xml格式,我们将得到如下内容的xml文件:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<?mso-application progid="Word.Document"?>
<w:wordDocument xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml" xmlns:v="urn:schemas-microsoft-com:vml" xmlns:w10="urn:schemas-microsoft-com:office:word" xmlns:sl="http://schemas.microsoft.com/schemaLibrary/2003/core" xmlns:aml="http://schemas.microsoft.com/aml/2001/core" xmlns:wx="http://schemas.microsoft.com/office/word/2003/auxHint" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882" xmlns:st1="urn:schemas-microsoft-com:office:smarttags" w:macrosPresent="no" w:embeddedObjPresent="no" w:ocxPresent="no" xml:space="preserve"><o:SmartTagType o:namespaceuri="urn:schemas-microsoft-com:office:smarttags" o:url="" o:name="chsdate"/><o:DocumentProperties><o:Title>个人简历</o:Title>
... ...
<w:rPr><w:rFonts w:hint="fareast"/><wx:font wx:val="宋体"/></w:rPr><w:t>连宋个人简历</w:t></w:r><w:proofErr w:type="gramStart"/><w:r><w:rPr><w:rFonts w:hint="fareast"/><wx:font wx:val="宋体"/></w:rPr>
... ...
<w:pict><v:shapetype id="_x0000_t75" coordsize="21600,21600" o:spt="75" o:preferrelative="t" path="m5l11115xe" filled="f" stroked="f"><v:stroke join eqn="if lineDrawn pixelLineWidth 0"/><v:f eqn="sum 0 1 0"/><v:f eqn="sum 0 0 1"/><v:f eqn="prod 2 1 2"/><v:f eqn="prod 3 21600 pixelWidth"/><v:f eqn="prod 3 21600 pixelHeight"/><v:f eqn="sum 0 0 1"/><v:f eqn="prod 6 1 2"/><v:f eqn="prod 7 21600 pixelWidth"/><v:f eqn="sum 8 21600 0"/><v:f eqn="prod 7 21600 pixelHeight"/><v:f eqn="sum 10 21600 0"/></v:formulas><v:path o:extrusionok="f" gradientshapeok="t" o:connecttype="rect"/><o:lock v:ext="edit" aspectratio="t"/></v:shapetype><w:binData w:name="http://www.pushad.com/Info/wordml://02000001.jpg">/9j/4AAQSkZJRgABAgAAZABkAAD/7AARRHVja3kAAQAEAAAAPAAA/+4ADkFkb2JlAGTAAAAAAf/b
... ...
</w:binData><v:shape id="_x0000_i1025" type="#_x0000_t75" w:st="on" unitname="pt" sourcevalue="75" hasspace="False" negative="False" numbertype="1" tcsc="0">75pt;height:75pt"><v:imagedata src="http://www.pushad.com/Info/wordml://02000001.jpg" o:title="cathy"/></v:shape></w:pict>
... ...
</w:sectPr></wx:sub-section></wx:sect></w:body></w:wordDocument>

接下来首先将这个文件按照xml格式进行排版,然后在其中找到需要动态生成的文字部分(WordML中文字以<w:t></w:t>标记起始),将其替换为从后台取数据生成文字的JSP指令,再在文件头部添加JSP控制指令,得到如下的xml文件:

<% page language="java" errorPage="/error.jsp" pageEncoding="GBK" contentType="application/msword;charset=UTF-8" %><%response.setHeader("Content-Disposition", "attachment; filename=resume.doc");%><?xml version="1.0" encoding="UTF-8" standalone="yes"?>

<% taglib uri="http://java.sun.com/jstl/core" prefix="c" %>
<% taglib uri="http://java.sun.com/jstl/fmt" prefix="fmt" %>


<?mso-application progid="Word.Document"?>
<w:wordDocument xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml" xmlns:v="urn:schemas-microsoft-com:vml" xmlns:w10="urn:schemas-microsoft-com:office:word" xmlns:sl="http://schemas.microsoft.com/schemaLibrary/2003/core" xmlns:aml="http://schemas.microsoft.com/aml/2001/core" xmlns:wx="http://schemas.microsoft.com/office/word/2003/auxHint" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882" w:macrosPresent="no" w:embeddedObjPresent="no" w:ocxPresent="no" xml:space="preserve">
 <o:DocumentProperties>
  <o:Title>个人简历</o:Title>
... ...
 <w:body>
  <wx:sect>
   <wx:sub-section>
    <w:p>
     <w:pPr>
      <w:pStyle w:val="a5"/>
      <w:rPr>
       <w:rFonts w:hint="fareast"/>
      </w:rPr>
     </w:pPr>
     <w:r>
      <w:rPr>
       <w:rFonts w:hint="fareast"/>
       <wx:font wx:val="宋体"/>
      </w:rPr>
      <w:t><c:out value="${command.name}"/>个人简历</w:t>
     </w:r>
    </w:p>
... ...
         <w:pict>
          <v:shapetype id="_x0000_t75" coordsize="21600,21600" o:spt="75" o:preferrelative="t" path="m5l11115xe" filled="f" stroked="f">
           <v:stroke join o:extrusionok="f" gradientshapeok="t" o:connecttype="rect"/>
           <o:lock v:ext="edit" aspectratio="t"/>
          </v:shapetype>
          <w:binData w:name="http://www.pushad.com/Info/wordml://02000001.jpg"><c:out value="${command.portraitBASE64}"/></w:binData>
          <v:shape id="_x0000_i1025" type="#_x0000_t75" w:st="on" unitname="pt" sourcevalue="75" hasspace="False" negative="False" numbertype="1" tcsc="0">75pt;height:75pt">
           <v:imagedata src="http://www.pushad.com/Info/wordml://02000001.jpg" o:title="portrait"/>
          </v:shape>
         </w:pict>
... ...
 </w:body>
</w:wordDocument>

将这个文件以jsp后缀保存,就可以在J2EE系统中配合后台程序生成word文件了。如果你需要浏览器提示保存这个文件,而不是在浏览器中打开,需要在文件头部加入这句:
response.setHeader("Content-Disposition", "attachment; filename=resume.doc");
有很多免费的第三方库可以用于生成图片文件的BASE64编码,JDK中也有BASE64 Encoder。

更简单的方法是在用word制作模板文件时直接在需要动态生成的部分输入jsp指令,然后再保存为xml文件,但要注意检查word保存为xml文件后有没有将jsp指令拆散或插入格式标记。

以上以JSP+JSTL为例,换成其它后台技术,比如Velocity,或者ASP、PHP,原理也是相同的。

实际上,在需要生成Word文件的应用中,多数时候需要套用固定的格式,这样本文所解释的方法就更加合适。


分享到
  • 微信分享
  • 新浪微博
  • QQ好友
  • QQ空间
点击: