wkhtmltopdf 工具安装与使用
wkhtmltopdf是一个文件格式转化工具, 常用来将html格式文件转为pdf文件
下载工具
wkhtmltopdf 的官网地址是:https://wkhtmltopdf.org/downloads.html
Windows 系统选择图中 64-bit 进行下载
下载之后进行安装, 安装之后需要配置一下环境变量
在"此电脑" 点击右键, 选择"属性"
选择 “高级系统设置”
选择 “环境变量”
在下面的表格中找到 “系统变量” , 找到 “Path” 变量, 双击进行编辑
新建一个环境变量, 然后点击 “浏览” 按钮, 找到wkhtmltopdf的安装目录,选中目录中的bin文件夹
然后点击"确定" 保存配置内容
打开 cmd 命令行, 执行命令
wkhtmltopdf -V
看到如下内容即表示安装成功
现在执行一下命令
wkhtmltopdf D:\source\abc.html D:\target\abc.pdf
执行之后, 可以在 D:\target
文件夹下看到 abc.pdf
文件已经转换成功了
通过 java 代码完成转换
HtmlToPdf 类
package com.example.demo.utils;
import java.io.*;
import java.text.*;
import java.util.*;
import java.util.concurrent.*;
public class HtmlToPdf {
// wkhtmltopdf在系统中的路径
private static final String toPdfTool = "wkhtmltopdf";
/**
* html转pdf
*
* @param srcPath html路径,可以是硬盘上的路径,也可以是网络路径
* @param destPath pdf保存路径
* @return 转换成功返回true
*/
public static boolean convert(String srcPath, String destPath,String toPdfTool){
File file = new File(destPath);
File parent = file.getParentFile();
//如果pdf保存路径不存在,则创建路径
if(!parent.exists()){
parent.mkdirs();
}
StringBuilder cmd = new StringBuilder();
cmd.append(toPdfTool);
cmd.append(" ");
// cmd.append(" --header-line");//页眉下面的线
// cmd.append(" --margin-top 1cm ");//设置页面上边距 (default 10mm)
// cmd.append(" --header-html file:///"+WebUtil.getServletContext().getRealPath("")+FileUtil.convertSystemFilePath("\\style\\pdf\\head.html"));// (添加一个HTML页眉,后面是网址)
// cmd.append(" --header-spacing 5 ");// (设置页眉和内容的距离,默认0)
// cmd.append(" --footer-center (设置在中心位置的页脚内容)");//设置在中心位置的页脚内容
// cmd.append(" --footer-html file:///"+WebUtil.getServletContext().getRealPath("")+FileUtil.convertSystemFilePath("\\style\\pdf\\foter.html"));// (添加一个HTML页脚,后面是网址)
// cmd.append(" --footer-line");//* 显示一条线在页脚内容上)
// cmd.append(" --footer-spacing 5 ");// (设置页脚和内容的距离)
// 注意这里在文件前后都追加了双引号, 可以解决文件名中包含空格的问题
// wkhtmltopdf "D:\abc space.html" "D:\abc space.pdf"
cmd.append("\""+srcPath+"\"");
cmd.append(" ");
cmd.append("\""+destPath+"\"");
boolean result = true;
try{
Process proc = Runtime.getRuntime().exec(cmd.toString());
HtmlToPdfInterceptor error = new HtmlToPdfInterceptor(proc.getErrorStream());
HtmlToPdfInterceptor output = new HtmlToPdfInterceptor(proc.getInputStream());
error.start();
output.start();
proc.waitFor();
}catch(Exception e){
result = false;
e.printStackTrace();
}
return result;
}
public static void main(String[] args) {
SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
String startTime = sdf.format(new Date());
Long startMS = System.currentTimeMillis();
File sourcePath = new File("D:\\source\\");
int cacheNum = sourcePath.listFiles().length;
ExecutorService executor = Executors.newFixedThreadPool(cacheNum); // 创建拥有 cacheNum 个线程的线程池
CountDownLatch latch = new CountDownLatch(cacheNum); // 创建计数器,初始值为 cacheNum
for(File file : sourcePath.listFiles()){
executor.submit(() ->{
String source = file.getAbsolutePath();
System.out.println(source);
String target = source.replace("html", "pdf");
// 输出到 D:\target\ 目录下
target = target.replace("source", "target");
HtmlToPdf.convert(source, target, toPdfTool);
latch.countDown(); // 计数器减 1
});
}
try {
latch.await(); // 等待所有子线程的任务执行完毕
} catch (InterruptedException e) {
// 处理中断异常
}
Long endMS = System.currentTimeMillis();
System.out.println("convert finished");
System.out.println("总计耗时 " + (endMS - startMS) + " ms");
}
}
HtmlToPdfInterceptor 类
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
public class HtmlToPdfInterceptor extends Thread {
private InputStream is;
public HtmlToPdfInterceptor(InputStream is){
this.is = is;
}
public void run(){
try{
InputStreamReader isr = new InputStreamReader(is, "utf-8");
BufferedReader br = new BufferedReader(isr);
String line = null;
while ((line = br.readLine()) != null) {
System.out.println(line.toString()); //输出内容
}
}catch (IOException e){
e.printStackTrace();
}
}
}
main 方法中的调用方式是采用多线程进行处理, 获取文件下所有文件, 每个文件转换都启用一个线程, 然后监听所有线程完成
这里通过 java 执行 cmd 命令的形式, 在 java 代码中组装 cmd 命令
亲测转换效率如下
204个文件
顺序执行第1次 104995 ms
顺序执行第2次 101382 ms
并发执行第1次 57102 ms
并发执行第2次 54349 ms
并发执行第3次 57271 ms
并发执行第4次 58854 ms