SpringBoot Thymeleaf企业级真实应用：使用Flying Saucer结合iText5将HTML界面数据转换为PDF输出(一)

SpringBoot 生成PDF

Thymeleaf企业级真实应用：使用Flying Saucer结合iText5将HTML界面数据转换为PDF输出

参考： https://blog.51cto.com/u_13146445/6190475

https://blog.csdn.net/qq_27242695/article/details/115654447

0. 需求

后端渲染pdf生成（thymeleaf根据已有的html模板，springboot进行渲染后，生成pdf）
pdf中可放置图片(图片非引入文件方式,而是采用Base64方式)
注意：html文件需单独开发，css样式需内嵌，不允许外置css文件
暂时未整理Echarts图表部分，如需可参考顶部url参考部分

1. Thymeleaf说明

# 什么是Thymeleaf
- Thymeleaf是一种现代化的服务器端Java模板引擎，可以用于Web和独立环境中的HTML、XML、JavaScript、CSS和文本。在实际开发中，Thymeleaf可以用于生成动态的HTML页面，支持将数据与模板进行绑定，生成最终的HTML内容。它是一个开源的软件，采用Apache许可证2.0进行发布。

# Thymeleaf具有特点
- 与其他服务器端Java模板引擎相比，Thymeleaf具有以下特点：

- 语法简单易懂，支持自然的HTML标签
- 支持HTML5的规范和特性
- 支持CSS样式的绑定和操作
- 支持表达式语言（Expression Language，简称EL）和Spring表达式语言（Spring Expression Language，简称SpEL）
- 支持标准和Spring MVC的多种模板渲染方式
- 支持多种模板缓存策略
- 支持可扩展的引擎架构

- 在实际开发中，Thymeleaf可以用于生成动态的HTML页面，支持将数据与模板进行绑定，生成最终的HTML内容。它可以作为Web应用程序的模板引擎，也可以作为其他应用程序的模板引擎。由于其简单易用的语法和强大的功能，Thymeleaf已经成为Java领域中最受欢迎的模板引擎之一。

2. 将HTML界面数据转换为PDF输出逻辑说明

# 中心思想
- 使用模板引擎的模板文件和数据模型。模板文件定义了最终输出的PDF页面的结构和样式，而数据模型则提供了模板中要填充的动态数据。

- 具体来说，Thymeleaf使用Java对象作为数据模型，可以通过Spring的控制器将数据注入到数据模型中。然后，Thymeleaf将数据模型与模板文件结合起来，生成HTML内容。最后，使用PDF生成库将HTML内容转换为PDF输出。

# 操作说明
- 在实现PDF输出功能时，可以使用Spring Boot提供的`spring-boot-starter-thymeleaf`依赖，该依赖包含了Thymeleaf、PDF生成库以及其他必需的依赖项。可以在控制器中使用Thymeleaf的`TemplateEngine`对象将数据模型和模板文件合并，生成HTML内容。然后，可以使用PDF生成库将HTML内容转换为PDF格式。

- 需要注意的是，PDF输出可能需要一些特定的CSS样式和HTML标记，以便正确呈现和格式化PDF页面。因此，在生成PDF输出之前，可能需要对模板文件进行调整和优化，以确保输出的PDF页面具有所需的外观和布局。

# 具体步骤
- 定义HTML模板，需要输出的数据以HTML格式创建一个模板，生成.HTML文件
- 引入Thymeleaf中TemplateEngine->生成文本输出的Java模板引擎框架、Context->Web应用程序的上下文对象。生成html 模板渲染工具。处理上边我们定义的模板。得到一个String类的结果
- 读取这个结果byte[]，将byte数组 转换为 Base64字符串
- 最后将Base64字符串转换为PDF格式的数据，输出路径

3. 具体实现

3.1. 依赖

<!--thymeleaf-->
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-thymeleaf</artifactId>
</dependency>
<!-- html 转 pdf 需要用的jar -->
        <!-- https://mvnrepository.com/artifact/org.xhtmlrenderer/flying-saucer-pdf -->
<!--        <dependency>-->
<!--            <groupId>org.xhtmlrenderer</groupId>-->
<!--            <artifactId>flying-saucer-pdf</artifactId>-->
<!--            <version>9.1.22</version>-->
<!--        </dependency>-->
        <!-- https://mvnrepository.com/artifact/org.xhtmlrenderer/flying-saucer-pdf-itext5 -->
        <dependency>
            <groupId>org.xhtmlrenderer</groupId>
            <artifactId>flying-saucer-pdf-itext5</artifactId>
            <version>9.1.22</version>
        </dependency>

3.2. 依赖介绍

Flying Saucer是一个基于Java的开源库，用于将XHTML和CSS渲染为PDF、SVG、图像或打印输出。它是一个强大的工具，使您能够以编程方式生成高质量的PDF文档，同时利用CSS样式和布局来控制文档的外观。

该依赖是 flying-saucer-pdf-itext5，它是一个基于iText 5的开源Java库，用于将XHTML/CSS渲染为PDF文档。它提供了将HTML内容转换为PDF的功能，包括支持CSS样式和布局，生成复杂的PDF文档。

具体介绍该依赖的相关信息如下：

Group ID（组织标识）：org.xhtmlrenderer
Artifact ID（项目标识）：flying-saucer-pdf-itext5
Version（版本号）：9.1.22

这个依赖项允许您在Java应用程序中使用Flying Saucer库来生成和操作PDF文档。Flying Saucer使用XHTML和CSS作为输入，并使用iText库将其渲染为PDF。

您可以在项目的Maven配置文件（pom.xml）中添加该依赖项，以便在您的项目中使用它。通过在<dependencies>标签中添加上述代码，Maven将从中央存储库中下载并管理该依赖项的jar文件。

请注意，这只是Flying Saucer库的一个特定版本。如果需要更高版本或其他版本，请参考Flying Saucer项目的文档和存储库以获取最新信息。

更多关于Flying Saucer和iText的详细信息，请参考它们的官方文档和相关资源。

github地址 https://github.com/flyingsaucerproject/flyingsaucer

Flying Saucer提供了多个相关的Maven构件，每个构件提供不同的功能和特性。以下是这些构件的简要介绍：

org.xhtmlrenderer:flying-saucer-core：Flying Saucer的核心库，提供了XHTML和CSS解析以及基于Java2D的渲染功能。它可以将XHTML和CSS文档转换为Java2D图像，以便在Java应用程序中显示或输出。
org.xhtmlrenderer:flying-saucer-pdf：使用iText 2.x生成PDF输出的Flying Saucer构件。它基于flying-saucer-core，允许将XHTML和CSS文档转换为PDF格式。
org.xhtmlrenderer:flying-saucer-pdf-itext5：使用iText 5.x生成PDF输出的Flying Saucer构件。类似于flying-saucer-pdf，但使用iText 5.x版本库。
org.xhtmlrenderer:flying-saucer-pdf-openpdf：使用OpenPDF生成PDF输出的Flying Saucer构件。类似于flying-saucer-pdf，但使用OpenPDF库作为PDF生成引擎。
org.xhtmlrenderer:flying-saucer-swt：提供了基于SWT (Standard Widget Toolkit) 的输出功能的Flying Saucer构件。它允许将XHTML和CSS文档渲染为SWT界面。
org.xhtmlrenderer:flying-saucer-log4j：这是Flying Saucer的一个日志插件，用于与log4j日志框架集成，以记录Flying Saucer的日志消息。

需要注意的是，文档中提到iText 2.x存在未修复的安全漏洞，因此新项目应该避免使用它。推荐使用iText 5.x或OpenPDF作为PDF生成引擎。根据您的需求和项目要求，您可以选择适合的Flying Saucer构件来满足您的需求。

org.xhtmlrenderer:flying-saucer-pdf-itext5 和 org.xhtmlrenderer:flying-saucer-pdf-openpdf 有什么区别

org.xhtmlrenderer:flying-saucer-pdf-itext5 和 org.xhtmlrenderer:flying-saucer-pdf-openpdf 是 Flying Saucer 库中用于生成 PDF 输出的两个不同的构件。它们之间的区别在于使用的 PDF 生成引擎不同。

org.xhtmlrenderer:flying-saucer-pdf-itext5：
- 使用 iText 5.x 作为 PDF 生成引擎。
- iText 5.x 是一个广泛使用的 Java 库，提供了强大的 PDF 处理功能。
- 它具有丰富的 API 和功能，可以用于创建、修改和操作 PDF 文档。
- iText 5.x 版本库在过去被广泛使用，但目前已经过时，官方推荐使用更新的 iText 7.x 版本。
org.xhtmlrenderer:flying-saucer-pdf-openpdf：
- 使用 OpenPDF 作为 PDF 生成引擎。
- OpenPDF 是一个基于 iText 的开源项目，旨在提供一个简单易用的 PDF 处理库。
- 它是 iText 5.x 的一个分支，专注于提供基本的 PDF 生成和操作功能。
- OpenPDF 与 Flying Saucer 结合使用，可以将 XHTML 和 CSS 文档转换为 PDF。

选择使用哪个构件取决于您的具体需求和项目要求。如果您已经熟悉 iText 5.x 并且需要更丰富的 PDF 处理功能，那么 org.xhtmlrenderer:flying-saucer-pdf-itext5 可能是更好的选择。如果您希望使用一个轻量级的 PDF 生成引擎，并且只需要基本的 PDF 生成功能，那么 org.xhtmlrenderer:flying-saucer-pdf-openpdf 可能更适合您。

哪个用的更广泛一些

目前来说，org.xhtmlrenderer:flying-saucer-pdf-itext5 使用的更广泛一些。这是因为 iText 5.x 在过去被广泛采用，并且有大量的用户基础和社区支持。许多项目和应用程序都在使用 Flying Saucer 结合 iText 5.x 生成 PDF 输出。

然而，需要注意的是，iText 5.x 已经过时，官方推荐使用更新的 iText 7.x 版本。因此，随着时间的推移，更多的项目可能会转向使用 iText 7.x 或其他 PDF 生成引擎。

另一方面，org.xhtmlrenderer:flying-saucer-pdf-openpdf 使用的相对较少，因为 OpenPDF 是一个较新的项目，并且在广泛采用方面还没有达到与 iText 5.x 相当的水平。但是，如果您对使用较新的 PDF 生成引擎和较轻量级的解决方案感兴趣，那么使用 org.xhtmlrenderer:flying-saucer-pdf-openpdf 也是一个可行的选择。

最终选择取决于您的具体需求、项目要求以及对不同库的了解和熟悉程度。建议根据项目的需求和技术要求进行评估，并选择适合您项目的库。

有没有 iText 7.x 对应的flying-saucer

目前并没有针对 iText 7.x 的特定版本的 Flying Saucer。Flying Saucer 项目目前主要支持 iText 2.x 和 iText 5.x 版本。

如果您需要与 iText 7.x 结合使用 Flying Saucer，可以考虑以下两种方式：

使用 Flying Saucer 的核心库（org.xhtmlrenderer:flying-saucer-core）和 iText 7.x 进行自定义集成。Flying Saucer 的核心库提供了将 XHTML 渲染为 PDF 的功能，您可以使用 iText 7.x 的 API 来处理 PDF 相关操作。
寻找其他与 iText 7.x 兼容的 PDF 生成库或工具。iText 官方提供了 iText 7 的许多功能和组件，您可以直接使用 iText 7.x 提供的功能来生成 PDF，而无需额外依赖 Flying Saucer。

选择哪种方式取决于您对 Flying Saucer 和 iText 7.x 的依赖程度以及项目的具体要求。如果 Flying Saucer 提供的功能对您的项目至关重要，并且您想继续使用 Flying Saucer 的渲染引擎，那么与 iText 7.x 进行自定义集成可能是一个选择。如果您更倾向于直接使用 iText 7.x 提供的功能和 API，那么可以考虑直接使用 iText 7.x 生成 PDF，而不使用 Flying Saucer。

3.2. 定义好html模板

需要转成thymeleaf格式,如头部标签

@page为pdf的尺寸

<!DOCTYPE html>
<html lang="en" xmlns:th="http://www.thymeleaf.org">
<head>
    <title>Hello World!</title>
    <style>
        .setAa {
            background-color: red;
        }
        @page{
            size:297mm 210mm;
        }
    </style>
</head>

<body>
<h1 class="setAa" th:text="'Hello, ' + ${name} + '!'"></h1>
<p th:text="'You are ' + ${age} + ' years old.'"></p>
<img alt="" th:src="${imgSrc}"  style="margin:0 auto;"/>
</body>
</html>

3.3. html 模板渲染工具类

import com.lowagie.text.DocumentException;
import com.lowagie.text.pdf.BaseFont;
import org.springframework.stereotype.Component;
import org.thymeleaf.TemplateEngine;
import org.thymeleaf.context.Context;
import org.xhtmlrenderer.pdf.ITextFontResolver;
import org.xhtmlrenderer.pdf.ITextRenderer;
import sun.misc.BASE64Decoder;
import sun.misc.BASE64Encoder;

import javax.annotation.Resource;
import java.io.*;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.Map;

/**
 * @Author：wangdi
 * @Date：2023/6/9 14:58
 * @Des: HtmlToPdfUtil 转换pdf工具类
 */
@Component
public class HtmlToPDFUtil {

    @Resource
    private TemplateEngine templateEngine;


    /**
     * 使用 Thymeleaf 渲染 HTML
     *
     * @param template HTML模板路径
     * @param params   渲染的参数
     * @return 返回渲染后的html代码
     * @throws Exception
     */
    public String render(String template, Map<String, Object> params) {
        Context context = new Context();
        if (params.size() > 0) {
            context.setVariables(params);
        }
        //将数据填充到模板里，开始处理模板
        return templateEngine.process(template, context);
    }

    /**
     * 根据html生成pdf的base64格式
     *
     * @param html
     * @return
     */
    public static String getPDFBase64ByHtml(String html) throws DocumentException, IOException {
        ByteArrayOutputStream baos = new ByteArrayOutputStream();//构建字节输出流
        ITextRenderer renderer = new ITextRenderer();
        ITextFontResolver fontResolver = renderer.getFontResolver();
        //指定文件字体添加到PDF库，指定字体不作为内部字体，而是外部字体被加载
        fontResolver.addFont("font/SimSun.ttf", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
        renderer.setDocumentFromString(html);
        renderer.layout();
        renderer.createPDF(baos);
        return new BASE64Encoder().encode(baos.toByteArray());
    }


    /**
     * 根据pdf的base64格式和路径生成pdf文件
     *
     * @param base64 pdf的base64格式
     * @param path   生成pdf的路径
     * @return
     */
    public static String base64ToPDF(String base64, String path) {


        SimpleDateFormat sdf = new SimpleDateFormat("yyyyMMdd");
        String fileAdd = sdf.format(new Date());
        //先判断文件是否存在
        path = path + "/" + fileAdd;
        String fileName = path + "/" + System.currentTimeMillis() + ".pdf";//新的文件名

        BufferedInputStream bin = null;
        FileOutputStream fout = null;
        BufferedOutputStream bout = null;
        BASE64Decoder decoder = new BASE64Decoder();
        try {
            byte[] bytes = decoder.decodeBuffer(base64);

            ByteArrayInputStream bais = new ByteArrayInputStream(bytes);
            // 创建从底层输入流中读取数据的缓冲输入流对象
            bin = new BufferedInputStream(bais);

            //获取文件夹路径
            File file = new File(path);
            //如果文件夹不存在则创建
            if (!file.exists() && !file.isDirectory()) {
                file.mkdirs();
            }
            // 创建到指定文件的输出流
            fout = new FileOutputStream(fileName);
            // 为文件输出流对接缓冲输出流对象
            bout = new BufferedOutputStream(fout);
            byte[] buffers = new byte[1024];
            int len = bin.read(buffers);
            while (len != -1) {
                bout.write(buffers, 0, len);
                len = bin.read(buffers);
            }
            // 刷新此输出流并强制写出所有缓冲的输出字节，必须这行代码，否则有可能有问题
            bout.flush();
            //返回存储的路径
            return fileName;
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                bin.close();
                fout.close();
                bout.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        return "";
    }


}

字体

SimSun.ttf 自行搜索下载

HTML中的字体,pdf不能识别,需添加字体文件

注意，在添加字体文件时，需要确保字体文件的路径正确，并且字体文件能够被读取到。此外，还需要确保字体文件的格式正确，可以使用BaseFont.IDENTITY_H指定字体编码，使用BaseFont.NOT_EMBEDDED指定字体文件是否嵌入到PDF文件中。

ITextRenderer说明

ITextRenderer是一个基于iText库的Java库，它可以将HTML、XHTML或XML等文档渲染成为PDF、XLS、PNG、JPEG等格式的文件。

ITextRenderer库提供了一个ITextRenderer类，该类提供了丰富的API，用于将HTML、XHTML或XML文档转换成为PDF等格式的文件。该类内部使用了iText库的PDF生成和操作功能，同时也支持使用Flying Saucer库对文档进行渲染和布局。

使用ITextRenderer库进行PDF输出的基本流程如下：

1)创建一个ITextRenderer对象；
2)使用setDocument()方法将要转换的文档设置到渲染器中；
3)使用layout()方法对文档进行排版布局；
4)使用createPDF()方法将文档渲染为PDF，并输出到输出流或文件中。

ITextFontResolver说明

ITextFontResolver是ITextRenderer库中的一个类，它用于管理和解析字体文件，为PDF生成提供字体支持。

在ITextRenderer库中，当使用HTML文档生成PDF时，由于PDF不支持HTML中使用的所有字体，因此需要在生成PDF之前将HTML中的字体替换为PDF支持的字体。ITextFontResolver提供了一个addFont()方法，该方法用于将字体文件添加到ITextFontResolver中进行管理，以便在PDF生成时使用。

转换为Base64说明

Base64是一种用于将二进制数据转换成文本数据的编码方式，通过Base64编码可以将图片、音频、视频等二进制数据转换成文本数据，从而方便在网络上传输。

3.4. 图片转Base64 工具类

import org.apache.commons.lang.StringUtils;

import javax.xml.bind.DatatypeConverter;
import java.io.*;
import java.net.HttpURLConnection;
import java.net.URL;

/**
 * @Author：wangdi
 * @Date：2023/6/9 15:34
 * @Des: ImgBase64Util 图片转Base64 工具类
 */
public class ImgBase64Util {

    public final static String IMG_PRE = "data:image/png;base64,";

    public static void main(String[] args) throws Exception {
        //本地图片地址
        String url = "D:/Soft/IDEA/IDEA_PLUGINS/Img/727eee40a3202c6799fffe55c9d6a026.jpg";
        //在线图片地址
        String string = "https://devpress.csdnimg.cn/489fad64a62648818eaaebc28e5c8659.jpg";
        String str = ImageToBase64ByLocal(url);
        System.out.println(str);
        String ste = ImageToBase64ByOnline(string);
//        Base64Utils.Base64ToImage(str,"C:/Users/Administrator/Desktop/test1.jpg");
//        Base64Utils.Base64ToImage(ste, "C:/Users/Administrator/Desktop/test2.jpg");
    }


    /**
     * 本地图片转换成base64字符串
     *
     * @param imgFile 图片本地路径
     * @return
     */
    public static String ImageToBase64ByLocal(String imgFile) {// 将图片文件转化为字节数组字符串，并对其进行Base64编码处理


        InputStream in = null;
        byte[] data = null;

        // 读取图片字节数组
        try {
            in = new FileInputStream(imgFile);

            data = new byte[in.available()];
            in.read(data);

        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                if (in != null) {
                    in.close();
                }
            } catch (IOException e) {
                e.printStackTrace();
            }
        }

        return DatatypeConverter.printBase64Binary(data);
    }


    /**
     * 在线图片转换成base64字符串
     *
     * @param imgURL 图片线上路径
     * @return
     */
    public static String ImageToBase64ByOnline(String imgURL) {
        ByteArrayOutputStream data = new ByteArrayOutputStream();
        InputStream is = null;
        try {
            // 创建URL
            URL url = new URL(imgURL);
            byte[] by = new byte[1024];
            // 创建链接
            HttpURLConnection conn = (HttpURLConnection) url.openConnection();
            conn.setRequestMethod("GET");
            conn.setConnectTimeout(5000);
            is = conn.getInputStream();
            // 将内容读取内存中
            int len = -1;
            while ((len = is.read(by)) != -1) {
                data.write(by, 0, len);
            }
            // 关闭流

        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                if (is != null) {
                    is.close();
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
        return DatatypeConverter.printBase64Binary(data.toByteArray());
//        // 对字节数组Base64编码
//        BASE64Encoder encoder = new BASE64Encoder();
//        return encoder.encode(data.toByteArray());
    }


    /**
     * base64字符串转换成图片
     *
     * @param imgStr      base64字符串
     * @param imgFilePath 图片存放路径
     * @return
     */
    public static boolean Base64ToImage(String imgStr, String imgFilePath) { // 对字节数组字符串进行Base64解码并生成图片

        if (StringUtils.isEmpty(imgStr)) // 图像数据为空
            return false;

        OutputStream out = null;
        try {

            byte[] b = DatatypeConverter.parseBase64Binary(imgStr);
            for (int i = 0; i < b.length; ++i) {
                if (b[i] < 0) {// 调整异常数据
                    b[i] += 256;
                }
            }

            out = new FileOutputStream(imgFilePath);
            out.write(b);
            out.flush();
            return true;
        } catch (Exception e) {
            return false;
        } finally {
            try {
                if (out != null) {
                    out.close();
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }

    }

}

3.5. 测试使用

在这里插入图片描述


@Autowired
private HtmlToPDFUtil htmlToPDFUtil;


/*
    * 渲染pdf注意：
    * 要生成一个独立的html文件
    * 其中css样式必须内嵌，不可以单独是css文件，否则会渲染不成功
    * 图片的处理采用base64方式进行渲染，可以将图片全部保存到项目里面，采用代码转换base64进行塞参数渲染，或者直接在html中图片就使用base64格式
    * */

@Test
public void changeTaskReport() throws Exception {
    Map<String, Object> data = new HashMap();
    data.put("name", "Alice");
    data.put("age", 20);
    // 此处的图片可以用相对路径，配合Thread.currentThread().getContextClassLoader().getResource("").getPath(); 获取路径使用，注意测试类启动的和SpringBoot启动的路径地址不一致
    data.put("imgSrc", ImgBase64Util.IMG_PRE + ImgBase64Util.ImageToBase64ByLocal("C:\\Users\\wangdi13\\Desktop\\Snipaste_2023-06-09_15-43-25.png"));

    

    String html = htmlToPDFUtil.render("test.html", data);
    System.out.println(html);
    String base64 = HtmlToPDFUtil.getPDFBase64ByHtml(html);
    String pdfAdd = HtmlToPDFUtil.base64ToPDF(base64, "D:\\______________________________________WorkSpace\\demo-wy-test\\src\\main\\resources\\");
    System.out.println(pdfAdd);
}

接下一篇 SpringBoot Thymeleaf企业级真实应用：使用Flying Saucer结合iText5将HTML界面数据转换为PDF输出(二) 设置多字体, 以及中文不显示的问题