0

0

怎样用Java操作PDF文件?iText库使用教程

蓮花仙者

蓮花仙者

发布时间:2025-07-07 17:14:02

|

882人浏览过

|

来源于php中文网

原创

本文介绍了使用itext在java中操作pdf文件的常用方法。1. 添加itext依赖:maven项目可在pom.xml中引入itext7-core模块,根据需要还可添加其他模块。2. 创建pdf文档:通过pdfwriter和document类创建空白文档并添加段落内容。3. 读取pdf文本:使用pdfreader和pdftextextractor提取页面文字,适用于有文本层的pdf文件。4. 修改现有pdf:如添加水印,可通过canvas在每页绘制透明文字,并可设置样式与旋转角度。

怎样用Java操作PDF文件?iText库使用教程

操作PDF文件在很多Java项目中是常见的需求,比如生成发票、报告或者处理表单数据。iText 是一个非常流行的 Java 库,可以用来创建、读取和修改 PDF 文件。本文就来聊聊如何用 iText 来实现一些常用的操作。

怎样用Java操作PDF文件?iText库使用教程

添加iText依赖

要使用 iText,首先要把它引入你的项目中。如果你用的是 Maven 项目,可以在 pom.xml 中添加如下依赖:

怎样用Java操作PDF文件?iText库使用教程

    com.itextpdf
    itext7-core
    7.1.15

注意版本号可能会更新,建议查看官网或仓库确认最新版本。Gradle 用户可以用类似方式添加依赖。

立即学习Java免费学习笔记(深入)”;

另外,iText 从 7 版本开始分成了多个模块,如果你需要处理 PDF 表单或加密功能,可能还需要额外引入对应的模块。

怎样用Java操作PDF文件?iText库使用教程

创建一个简单的PDF文档

这是最基础的用法:创建一个空白 PDF 并写入一些文字。下面是核心代码示例:

import com.itextpdf.kernel.pdf.PdfWriter;
import com.itextpdf.layout.Document;
import com.itextpdf.layout.element.Paragraph;

public class CreatePdf {
    public static void main(String[] args) throws Exception {
        PdfWriter writer = new PdfWriter("hello.pdf");
        Document document = new Document(writer);
        document.add(new Paragraph("Hello, iText!"));
        document.close();
    }
}

上面这段代码做了几件事:

X Detector
X Detector

最值得信赖的多语言 AI 内容检测器

下载
  • 创建了一个 PdfWriter 实例,指向输出文件路径。
  • 使用这个 writer 构建了一个 Document 对象。
  • 向文档中添加了一个段落。
  • 最后关闭了文档以确保内容写入磁盘。

这只是一个起点,你可以在这个基础上加图片、表格、样式等。


读取并提取PDF文本内容

有时候你不需要创建 PDF,而是想从已有 PDF 中提取文字内容。这时候可以用 iText 的 PdfReaderLocationTextExtractionStrategy

import com.itextpdf.kernel.pdf.PdfReader;
import com.itextpdf.kernel.pdf.PdfDocument;
import com.itextpdf.kernel.pdf.canvas.parser.PdfTextExtractor;

public class ReadPdf {
    public static void main(String[] args) throws Exception {
        PdfReader reader = new PdfReader("hello.pdf");
        PdfDocument pdfDoc = new PdfDocument(reader);
        int pages = pdfDoc.getNumberOfPages();

        for (int i = 1; i <= pages; i++) {
            String text = PdfTextExtractor.getTextFromPage(pdfDoc.getPage(i));
            System.out.println(text);
        }

        pdfDoc.close();
        reader.close();
    }
}

几点说明:

  • getTextFromPage() 返回的是页面上的所有文本内容。
  • 如果你处理的是扫描件或图片转 PDF 的内容,这种方式可能无法提取文字,因为没有嵌入文本层。
  • 提取出来的内容格式可能不太整齐,需要后续清洗。

修改现有PDF(例如添加水印)

修改 PDF 是比较高级的功能。比如,我们可以给每一页加上一个水印文字。主要思路是打开一个已有 PDF,在每页上绘制透明文字:

import com.itextpdf.kernel.pdf.*;
import com.itextpdf.layout.Canvas;
import com.itextpdf.layout.element.Paragraph;
import com.itextpdf.kernel.colors.ColorConstants;
import com.itextpdf.kernel.geom.PageSize;

public class AddWatermark {
    public static void main(String[] args) throws Exception {
        PdfReader reader = new PdfReader("input.pdf");
        PdfWriter writer = new PdfWriter("output_with_watermark.pdf");
        PdfDocument pdfDoc = new PdfDocument(reader, writer);

        int pageCount = pdfDoc.getNumberOfPages();
        for (int i = 1; i <= pageCount; i++) {
            PdfPage page = pdfDoc.getPage(i);
            PageSize pageSize = page.getPageSize();
            Canvas canvas = new Canvas(page, pageSize);
            canvas.setFontColor(ColorConstants.LIGHT_GRAY)
                  .setFontSize(60)
                  .showTextAligned("CONFIDENTIAL", pageSize.getWidth() / 2, pageSize.getHeight() / 2, i,
                          com.itextpdf.layout.property.TextAlignment.CENTER,
                          com.itextpdf.layout.property.VerticalAlignment.MIDDLE,
                          45); // 旋转角度
            canvas.close();
        }

        pdfDoc.close();
    }
}

关键点包括:

  • 使用 Canvas 在页面上绘图。
  • 设置字体颜色为浅灰色,避免遮挡原有内容。
  • 设置旋转角度让水印倾斜显示。

这种方式还可以用来添加页码、签名、边框等内容。


基本上就这些。iText 功能强大但细节多,初学者可以从创建简单文档开始,逐步掌握更复杂的功能。实际开发中遇到问题时,记得查阅官方文档或社区资源。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

832

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

738

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

734

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

430

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16925

2023.08.03

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

61

2026.01.14

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.5万人学习

C# 教程
C# 教程

共94课时 | 6.7万人学习

Java 教程
Java 教程

共578课时 | 46.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号