Apache FOP 是基于 Java 的开源排版引擎,将 XSL-FO 格式 XML 转换为 PDF 等印刷级输出;XSL-FO 是 W3C 定义的页面布局专用 XML 语言,需通过 XSLT 从业务 XML 生成;使用流程为准备 FO 文件→调用 FOP 工具→输出 PDF,适合需严格分页与归档的文档自动化场景。

Apache FOP 是一个开源的、基于 Java 的排版引擎,它把符合 XSL-FO(Extensible Stylesheet Language Formatting Objects)规范的 XML 文档,转换成 PDF、PostScript、AFP 等格式的输出文件。 它不处理 HTML 或 CSS,也不直接渲染网页;它的核心任务是:接收结构化、带格式描述的 XSL-FO 文件,按规范精确排版,生成高质量的印刷级 PDF。
XSL-FO 是什么?不是 CSS,也不是 HTML
XSL-FO 是 W3C 定义的一种 XML 标记语言,专门用于描述页面布局和样式(比如页边距、分栏、字体、表格对齐、页码、脚注等)。它通常由 XSLT 从原始 XML 数据(如订单、报告、文档)转换而来。你可以把它理解为“PDF 的源代码”——用 XML 写的排版指令。
例如,一个最简的 FO 片段:
怎么用 Apache FOP 生成 PDF
基本流程是三步:准备 FO 文件 → 调用 FOP 命令行或 API → 输出 PDF。
-
下载并安装 FOP:到官网(https://xmlgraphics.apache.org/fop/)下载二进制包,解压后确保
java可用,bin 目录下的fop(Linux/macOS)或fop.bat(Windows)就能运行 -
验证 FO 文件是否合法:用命令行执行
fop -xml input.fo -pdf output.pdf(注意:FOP 默认要求 FO 是 well-formed XML,且命名空间正确) -
常见输入方式不止直接写 FO:
- 手写 XSL-FO(适合简单固定模板)
- 用 XSLT 把业务 XML(如订单 XML)+ XSL 样式表 → 动态生成 FO(推荐,真正实用的方式)
- 某些工具(如 DocBook 工具链)可自动输出 FO 中间格式
-
调试技巧:
- FOP 日志很详细,加
-d参数看调试信息 - 先用
-foout temp.fo把 XSLT 输出保存下来,确认 FO 结构无误再转 PDF - 中文支持需配置字体(如 Noto Sans CJK),否则显示方块或报错
- FOP 日志很详细,加
为什么现在用的人少了?但仍有不可替代场景
FOP 学习成本高、调试繁琐、对复杂 CSS 效果支持弱(比如阴影、渐变、Flex 布局),所以 Web 转 PDF(Puppeteer、WeasyPrint)更流行。但它在以下场景仍是首选:
- 需要严格分页控制(如发票每单一页、合同带固定页眉页脚)
- 企业级文档自动化(银行账单、保险保单),要求输出稳定、可审计、零依赖浏览器环境
- 已有成熟 XSLT + FO 模板体系,迁移成本高
- 必须输出 PDF/A(长期归档标准),FOP 支持较好
快速上手建议
- 别从零写 FO —— 下载 FOP 自带的
examples/,跑通一个basic.fo示例是最短路径 - 中文务必配置字体:修改
fop.xconf,添加字体路径和embed-url,否则连“你好”都出不来 - 避免在 FO 里写逻辑,把数据加工、条件判断全交给 XSLT 做,FO 只管“怎么排”,不管“排什么”
- 用
而不是 div 模拟表格,FOP 对表格分页、跨页断行有专门优化
基本上就这些。FOP 不复杂但容易忽略细节,关键是理解它“XML 驱动排版”的定位——不是前端工具,而是出版流水线里的印前引擎。










