查看原文
其他

老大说,你去实现一下类似百度网盘的预览功能:支持Word、Excel、Ppt,我懵逼了...

。作者:忠爱写BUG的小白

来源:https://urlify.cn/jq2E7b


本人技术小白一枚,前些天老大让我写一个office在线预览的一个功能,跟百度网盘类似,各种找资料,总结一下我觉得比较好用的方法。


网上大概有这几种office在线预览的方法。


# 第一种


利用office online实现在线预览,Office平台提供了通过url的指向达到预览效果。


http://view.officeapps.live.com/op/view.aspx?src=

后面的src填写文档上传到服务器的地址,地址需要通过用URLEncode进行编译。


例: 

http://view.officeapps.live.com/op/view.aspx?src=http%3a%2f%2fvideo.ch9.ms%2fbuild%2f2011%2fslides%2fTOOL-532T_Sutter.pptx


参照链接:

https://blog.csdn.net/csdn_cjgu/article/details/69389474


优点:这个功能由Office提供所以只需要拼接地址。


缺点:文档的访问地址不能直接使用 ip,需要通过域名访问,并且端口必须是 80 端口,Word、ppt文档的大小不能超过10M,Excel不能超过5M


# 第二种


1.通过第三方工具openoffice,将word、excel、ppt、txt等文件转换为pdf文件,


2.通过swfTools将pdf文件转换成swf格式的文件; 


3.通过FlexPaper文档组件在页面上进行展示。 


参照链接:

https://blog.csdn.net/tmac937436/article/details/70799687?locationNum=14&fps=1


总结一下这种方法的利弊


优点:openoffice有各种版本,支持跨平台,转换速度快;


缺点:转换的样式会有缺损,Excel和openoffice完美不兼容 =  . = ,转换的时候会出现折行,切分等情况,效果很不理想;


FlexPaper这个是用Flash插件显示的,展示的效果优点low。


# 第三种


利用poi实现office在线预览



public static void PoiWord07ToHtml (HttpServletRequest request) throws IOException{ String path= "C:\\Users\\Administrator\\Desktop\\"; String file = "C:\\Users\\Administrator\\Desktop\\word07.docx"; String file2 ="C:\\Users\\Administrator\\Desktop\\word07.html"; File f = new File(file); if (!f.exists()) { System.out.println("Sorry File does not Exists!"); } else { if (f.getName().endsWith(".docx") || f.getName().endsWith(".DOCX")) { //读取文档内容 InputStream in = new FileInputStream(f); XWPFDocument document = new XWPFDocument(in); File imageFolderFile = new File(path); //加载html页面时图片路径 XHTMLOptions options = XHTMLOptions.create().URIResolver( new BasicURIResolver("./")); //图片保存文件夹路径 options.setExtractor(new FileImageExtractor(imageFolderFile)); OutputStream out = new FileOutputStream(new File(file2)); XHTMLConverter.getInstance().convert(document, out, options); out.close(); } else { System.out.println("Enter only MS Office 2007+ files"); } }}


总结一下这种方法的利弊


优点:纯java代码不需要第三方软件,poi对于Excel的解析比较好,可以完美转换。


缺点:jar包真的好难找啊,各种版本不兼容问题,比如word03和word07生成的分别是.doc和docx,poi对于.doc不识别,然后各种报错,由于生成的是Html所以它会把Word中的图片单独存放在一个文件下很占空间。


# 第四种


使用jacob实现office转换pdf达到预览功能。


pom文件中引用

<dependency> <groupId>net.sf.jacob-project</groupId> <artifactId>jacob</artifactId> <version>1.14.3</version></dependency>

<dependency> <groupId>com.lowagie</groupId> <artifactId>itext</artifactId> <version>2.1.7</version></dependency><!--poi--><dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>3.14-beta1</version></dependency>

网上查找jacob对应版本包把jacob-1.14.3-x64.dll复制到需要在Java\jdk1.8.0\jre\bin目录下,


经过多次测试发现jacob对于Excel的转换有些问题,所以Excel的转换我用的是poi。


自定义一个工具类Word2Pdf


import com.jacob.activeX.ActiveXComponent;import com.jacob.com.Dispatch;import com.jacob.com.Variant;import java.io.*;

public class Word2Pdf { static final int wdDoNotSaveChanges = 0;// 不保存待定的更改。 static final int wdFormatPDF = 17;// word转PDF 格式 static final int ppSaveAsPDF = 32;// ppt 转PDF 格式

public static void main(String[] args) throws IOException {
}

public void word2pdf(String wordPath,String target,String wordName,String suffix){

System.out.println("启动Word"); long start = System.currentTimeMillis(); String source = wordPath + wordName + suffix; target = target + wordName ; ActiveXComponent app = null; try { app = new ActiveXComponent("Word.Application"); app.setProperty("Visible", false); app.setProperty("DisplayAlerts", new Variant(false)); Dispatch docs = app.getProperty("Documents").toDispatch(); System.out.println("打开文档" + source); Dispatch doc = Dispatch.call(docs,// "Open", // source,// FileName false,// ConfirmConversions true // ReadOnly ).toDispatch(); System.out.println("转换文档到PDF " + target); File tofile = new File(target); //验证目标路径是否存在 if (tofile.exists()) { System.out.println("存在"); } Dispatch.call(doc,// "SaveAs", // target, // FileName wdFormatPDF);

Dispatch.call(doc, "Close", false); long end = System.currentTimeMillis(); System.out.println("转换完成..用时:" + (end - start) + "ms.");// Cut.cutfile(str_s,str_d); } catch (Exception e) { System.out.println("========Error:文档转换失败:" + e.getMessage()); } finally { if (app != null) app.invoke("Quit", wdDoNotSaveChanges); } }

public void ppt2pdf(String wordPath,String target,String wordName,String suffix){ System.out.println("启动PPT"); String source = wordPath + wordName + suffix; target = target + wordName ; long start = System.currentTimeMillis(); ActiveXComponent app = null; try { app = new ActiveXComponent("Powerpoint.Application"); Dispatch presentations = app.getProperty("Presentations").toDispatch(); System.out.println("打开文档" + source); Dispatch presentation = Dispatch.call(presentations,// "Open", source,// FileName true,// ReadOnly true,// Untitled 指定文件是否有标题。 false // WithWindow 指定文件是否可见。 ).toDispatch();

System.out.println("转换文档到PDF " + target); File tofile = new File(target); if (tofile.exists()) { tofile.delete(); } Dispatch.call(presentation,// "SaveAs", // target, // FileName ppSaveAsPDF);

Dispatch.call(presentation, "Close"); long end = System.currentTimeMillis(); System.out.println("转换完成..用时:" + (end - start) + "ms.");

} catch (Exception e) { System.out.println("========Error:文档转换失败:" + e.getMessage()); } finally { if (app != null) app.invoke("Quit"); } }}


再定义一个poi转换Html的一个类ExcelToHtml

import com.jacob.activeX.ActiveXComponent;import com.jacob.com.ComThread;import com.jacob.com.Dispatch;import com.jacob.com.Variant;import java.io.FileInputStream;import java.io.FileOutputStream;

public class ExcelToHtml { private final static ExcelToHtml oOfficeToXML = new ExcelToHtml();

public static ExcelToHtml getInstance() { return oOfficeToXML; }

public ExcelToHtml() { }

/** * 因为poi转换的Html页面在浏览器中显示时会出现乱码问题,这里强制转换一下 * @param filePath */ public void html2utf(String filePath) { try { String content = "charset=utf-8"; String templateContent = ""; FileInputStream fileinputstream = new FileInputStream(filePath);// 读取模板文件 // 下面四行:获得输入流的长度,然后建一个该长度的数组,然后把输入流中的数据以字节的形式读入到数组中,然后关闭流 int lenght = fileinputstream.available(); byte bytes[] = new byte[lenght]; fileinputstream.read(bytes); fileinputstream.close(); // 通过使用默认字符集解码指定的 byte 数组,构造一个新的 //因为原来的html文件是gb2312格式,所以转为string时也要以GBK格式读取,不然依旧是乱码 templateContent = new String(bytes, "GBK"); templateContent = templateContent.replaceFirst("charset=gb2312", content); // 因为已经替换字符串了,所以使用UTF-8字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中。 byte tag_bytes[] = templateContent.getBytes("UTF-8"); FileOutputStream fileoutputstream = new FileOutputStream(filePath);// 建立文件输出流 fileoutputstream.write(tag_bytes); fileoutputstream.close(); } catch (Exception e) { System.out.print(e.toString()); } }

public boolean ExceltoHtml(String wordPath,String original_name,String target,String wordName,String suffix) { ComThread.InitSTA(); ActiveXComponent activexcomponent = new ActiveXComponent("Excel.Application"); String source = wordPath + original_name + suffix; target = target + wordName; boolean flag = false; try { activexcomponent.setProperty("Visible", new Variant(false)); Dispatch dispatch = activexcomponent.getProperty("Workbooks").toDispatch(); Dispatch dispatch1 = Dispatch.invoke(dispatch, "Open", 1, new Object[] { source, new Variant(false), new Variant(true) }, new int[1]).toDispatch(); Dispatch.call(dispatch1, "SaveAs", target, new Variant(44)); Variant variant = new Variant(false); Dispatch.call(dispatch1, "Close", variant); flag = true; } catch(Exception exception) { System.out.println("|||" + exception.toString()); } finally { activexcomponent.invoke("Quit", new Variant[0]); ComThread.Release(); ComThread.quitMainSTA(); } return flag; }

}


主要的两个类已完成,因为这只是一个小demo所以代码可能有些不太规范


controller类


import org.springframework.stereotype.Controller;import org.springframework.web.bind.annotation.RequestMapping;import org.springframework.web.bind.annotation.RequestMethod;import org.springframework.web.bind.annotation.RequestParam;import org.springframework.web.bind.annotation.ResponseBody;import org.springframework.web.multipart.MultipartFile;import org.springframework.web.servlet.ModelAndView;import pojo.UpFile;import tools.ExcelToHtml;import tools.Word2Pdf;import javax.servlet.http.HttpServletRequest;import java.io.File;import java.text.SimpleDateFormat;import java.util.Date;import java.util.HashMap;import java.util.Map;

@Controller@RequestMapping("/sys")public class controller {
Word2Pdf word2Pdf = new Word2Pdf();

@RequestMapping("/index") public ModelAndView index(){ ModelAndView modelAndView = new ModelAndView();// Word2Pdf word2Pdf = new Word2Pdf();// word2Pdf.word2pdf("G:\\Test\\","G:\\Test\\PDF\\","",".doc");// modelAndView.setViewName("index"); return modelAndView; }



@RequestMapping(value="/upload.json",method=RequestMethod.POST) @ResponseBody public Map<Object,Object> upload(@RequestParam("file") MultipartFile file, HttpServletRequest request) throws Exception { UpFile upFile = new UpFile(); Map<Object,Object> map = new HashMap<Object, Object>(); String suffix = file.getOriginalFilename().substring( file.getOriginalFilename().lastIndexOf(".")); String fileName = file.getOriginalFilename().substring(0, file.getOriginalFilename().lastIndexOf(".")); String time = new SimpleDateFormat("yyyyMMddHHmmssSSS") .format(new Date() ); String filePath = request.getSession().getServletContext().getRealPath("upload/"); String target = "G:\\Test_02\\target\\backend\\statics\\pdf\\";// String FileName = "\\statics\\pdf\\"+fileName+".pdf"; String FileName = "/statics/pdf/"+fileName+".pdf";// 上传到/target/backend/upload/的暂存文件夹下 File dir = new File(filePath,fileName+suffix); file.transferTo(dir); if (suffix.equals(".doc")||suffix.equals(".docx")){ WordToPdf(filePath,target,fileName,suffix); } else if (suffix.equals(".ppt")||suffix.equals(".pptx")){ PptToPdf(filePath,target,fileName,suffix); } else if (suffix.equals(".xls")||suffix.equals(".xlsx")) { //有些浏览器会把html名字中的中文进行编译,导致404 所以我名字我就用时间戳代替了 //原文件名 String original_name = fileName; //更改后的名字 String changeName = "Html" + time; ExcelToHtml(filePath, original_name, changeName, suffix); FileName = "\\statics\\Html\\" + changeName + ".htm"; } map.put("filename",FileName); return map; }

public void WordToPdf(String filePath,String target,String fileName,String suffix){ word2Pdf.word2pdf(filePath,target,fileName,suffix); }

public void PptToPdf(String filePath,String target,String wordName,String suffix){ word2Pdf.ppt2pdf(filePath,target,wordName,suffix); }



public void ExcelToHtml(String filePath,String original_name,String wordName,String suffix){ ExcelToHtml excelToHtml = new ExcelToHtml(); excelToHtml.ExceltoHtml(filePath,original_name,"G:\\Test_02\\target\\backend\\statics\\Html\\",wordName,suffix); excelToHtml.html2utf("G:\\Test_02\\target\\backend\\statics\\Html\\"+wordName+".htm"); }}


前台页面


<%@ page contentType="text/html;charset=UTF-8" language="java" %><html lang="en"><head> <meta charset="UTF-8"> <title>Title</title> <script type="text/javascript" src="/statics/jquery-3.2.1.min.js"></script> <script type="text/javascript"> var filePath = "";

function load(){ if (filePath==""||filePath.length==0){ alert("请先上传文件"); } document.getElementById("iframe").src=filePath }

function test(){ var form = new FormData(document.getElementById("form")); $.ajax({ url:"/sys/upload.json", type:"post", data:form, cache: false, processData: false, contentType: false, success:function(data){ filePath = (data.filename); alert("上传成功"); }, error:function(e){ alert(e.error); window.clearInterval(timer); } }) }</script></head><body><form class="form" enctype="multipart/form-data" id="form"> 选择文件:<input type="file" name="file" width="180px"> <input type="button" value="上传" οnclick="test()"> <input type="button" value="预览" οnclick="load()"></form><iframe src="" id="iframe" width="100%" height="650px"/></body></html>


总结一下jacob的利弊


优点:相对于其他方法可以较为完好的转换。


缺点:转换效率很低,通常一个Word需要4s左右,大一点的文件就很慢了,不支持跨平台,只能在windows下运行。


你有什么好的方案吗?欢迎在留言区讨论。


热文推荐

硅谷 IT 男“免裁”秘诀:整容,以保持竞争力、具有年轻活力

通过开源项目免费申请Jetbrains全家桶教程
太壕了!年终奖品:人手一部iPhone11 256GB




觉得不错,请给个「在看」

分享给你的朋友!


点我,查看更多精彩文章。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存