首页 前端知识 wkhtmltopdf 工具安装与使用 java 代码执行调用 多线程执行

wkhtmltopdf 工具安装与使用 java 代码执行调用 多线程执行

2024-06-21 00:06:22 前端知识 前端哥 62 983 我要收藏

wkhtmltopdf 工具安装与使用

wkhtmltopdf是一个文件格式转化工具, 常用来将html格式文件转为pdf文件

下载工具

wkhtmltopdf 的官网地址是:https://wkhtmltopdf.org/downloads.html

Windows 系统选择图中 64-bit 进行下载
在这里插入图片描述
下载之后进行安装, 安装之后需要配置一下环境变量

在"此电脑" 点击右键, 选择"属性"
在这里插入图片描述
选择 “高级系统设置”
在这里插入图片描述
选择 “环境变量”

在这里插入图片描述

在下面的表格中找到 “系统变量” , 找到 “Path” 变量, 双击进行编辑

在这里插入图片描述
新建一个环境变量, 然后点击 “浏览” 按钮, 找到wkhtmltopdf的安装目录,选中目录中的bin文件夹

在这里插入图片描述
然后点击"确定" 保存配置内容
打开 cmd 命令行, 执行命令

wkhtmltopdf -V

看到如下内容即表示安装成功
在这里插入图片描述
现在执行一下命令

wkhtmltopdf D:\source\abc.html D:\target\abc.pdf

执行之后, 可以在 D:\target 文件夹下看到 abc.pdf 文件已经转换成功了
在这里插入图片描述

通过 java 代码完成转换

HtmlToPdf 类

package com.example.demo.utils;

import java.io.*;
import java.text.*;
import java.util.*;
import java.util.concurrent.*;

public class HtmlToPdf {

    //    wkhtmltopdf在系统中的路径
    private static final String toPdfTool = "wkhtmltopdf";

    /**
     * html转pdf
     *
     * @param srcPath  html路径,可以是硬盘上的路径,也可以是网络路径
     * @param destPath pdf保存路径
     * @return 转换成功返回true
     */
    public static boolean convert(String srcPath, String destPath,String toPdfTool){
        File file = new File(destPath);
        File parent = file.getParentFile();
        //如果pdf保存路径不存在,则创建路径
        if(!parent.exists()){
            parent.mkdirs();
        }
        StringBuilder cmd = new StringBuilder();
        cmd.append(toPdfTool);
        cmd.append(" ");
        // cmd.append(" --header-line");//页眉下面的线
        // cmd.append(" --margin-top 1cm ");//设置页面上边距 (default 10mm)
        // cmd.append(" --header-html file:///"+WebUtil.getServletContext().getRealPath("")+FileUtil.convertSystemFilePath("\\style\\pdf\\head.html"));// (添加一个HTML页眉,后面是网址)
        // cmd.append(" --header-spacing 5 ");// (设置页眉和内容的距离,默认0)
        // cmd.append(" --footer-center (设置在中心位置的页脚内容)");//设置在中心位置的页脚内容
        // cmd.append(" --footer-html file:///"+WebUtil.getServletContext().getRealPath("")+FileUtil.convertSystemFilePath("\\style\\pdf\\foter.html"));// (添加一个HTML页脚,后面是网址)
        // cmd.append(" --footer-line");//* 显示一条线在页脚内容上)
        // cmd.append(" --footer-spacing 5 ");// (设置页脚和内容的距离)
        // 注意这里在文件前后都追加了双引号, 可以解决文件名中包含空格的问题
        // wkhtmltopdf "D:\abc space.html" "D:\abc space.pdf"
        cmd.append("\""+srcPath+"\"");
        cmd.append(" ");
        cmd.append("\""+destPath+"\"");
        boolean result = true;
        try{
            Process proc = Runtime.getRuntime().exec(cmd.toString());
            HtmlToPdfInterceptor error = new HtmlToPdfInterceptor(proc.getErrorStream());
            HtmlToPdfInterceptor output = new HtmlToPdfInterceptor(proc.getInputStream());
            error.start();
            output.start();
            proc.waitFor();
        }catch(Exception e){
            result = false;
            e.printStackTrace();
        }
        return result;
    }
    
    public static void main(String[] args) {
        SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
        String startTime = sdf.format(new Date());
        Long startMS = System.currentTimeMillis();
        File sourcePath = new File("D:\\source\\");

        int cacheNum = sourcePath.listFiles().length;

        ExecutorService executor = Executors.newFixedThreadPool(cacheNum); // 创建拥有 cacheNum 个线程的线程池
        CountDownLatch latch = new CountDownLatch(cacheNum); // 创建计数器,初始值为 cacheNum
        for(File file : sourcePath.listFiles()){
            executor.submit(() ->{
                String source = file.getAbsolutePath();
                System.out.println(source);
                String target = source.replace("html", "pdf");
                // 输出到 D:\target\ 目录下
                target = target.replace("source", "target");
                HtmlToPdf.convert(source, target, toPdfTool);
                latch.countDown(); // 计数器减 1
            });
        }
        try {
            latch.await(); // 等待所有子线程的任务执行完毕
        } catch (InterruptedException e) {
            // 处理中断异常
        }
        Long endMS = System.currentTimeMillis();
        System.out.println("convert finished");
        System.out.println("总计耗时 " + (endMS - startMS) + " ms");
    }
}

HtmlToPdfInterceptor 类


import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;

public class HtmlToPdfInterceptor extends Thread {
    private InputStream is;

    public HtmlToPdfInterceptor(InputStream is){
        this.is = is;
    }

    public void run(){
        try{
            InputStreamReader isr = new InputStreamReader(is, "utf-8");
            BufferedReader br = new BufferedReader(isr);
            String line = null;
            while ((line = br.readLine()) != null) {
                System.out.println(line.toString()); //输出内容
            }
        }catch (IOException e){
            e.printStackTrace();
        }
    }
}

main 方法中的调用方式是采用多线程进行处理, 获取文件下所有文件, 每个文件转换都启用一个线程, 然后监听所有线程完成

这里通过 java 执行 cmd 命令的形式, 在 java 代码中组装 cmd 命令
亲测转换效率如下

204个文件
顺序执行第1次 104995 ms
顺序执行第2次 101382 ms

并发执行第1次 57102 ms
并发执行第2次 54349 ms
并发执行第3次 57271 ms
并发执行第4次 58854 ms

转载请注明出处或者链接地址:https://www.qianduange.cn//article/13035.html
标签
评论
发布的文章

JQuery中的load()、$

2024-05-10 08:05:15

大家推荐的文章
会员中心 联系我 留言建议 回顶部
复制成功!