使用第三方库可删除PDF注释,首选Apache PDFBox或iText。1. PDFBox通过page.removeAnnotation(annot)遍历移除页面注释;2. iText 7需解析PdfArray并过滤Subtype类型后重建数组;3. 操作前需解密PDF,删除后须保存文件;4. 注意嵌套结构、交互影响及合规性验证;5. PDFBox适合开源场景,iText适合精细控制需求。

Java本身不直接支持PDF操作,需借助第三方库。最常用的是Apache PDFBox和iText,两者都可删除PDF中的注释(如高亮、下划线、文本注释等),但实现方式和限制略有不同。
使用PDFBox删除所有注释
PDFBox 2.x 提供了对注释(PDAnnotation)的完整访问能力。每个页面的注释保存在 PDPage.getAnnotations() 中,可遍历并移除:
- 调用
page.getAnnotations()获取注释列表 - 遍历列表,对每个注释调用
page.removeAnnotation(annotation) - 注意:必须在保存前执行,且部分注释类型(如表单字段关联的注释)可能受保护
- 示例关键代码:
for (PDAnnotation annot : page.getAnnotations()) {
page.removeAnnotation(annot);
}
使用iText 7删除指定类型注释
iText 7 的 PdfPage 提供 getAnnotations(),返回 PdfArray,需手动解析和过滤:
- 获取注释数组后,逐个读取
PdfDictionary - 检查
Subtype字段(如Text、Highlight、Underline)决定是否删除 - 用
page.getPdfObject().removeItem(PdfName.Annots)清空全部,或重建注释数组剔除目标项 - 注意:iText 社区版(AGPL)允许使用,但商用需授权;删除后务必调用
pdfDoc.close()保存
注意事项与常见问题
实际操作中容易忽略以下细节:
立即学习“Java免费学习笔记(深入)”;
- PDF中的注释可能嵌套在结构化元素(如标记内容、附件、图层)中,单纯删页面注释不一定彻底
- 加密PDF需先解密(
document.setUnethicalReading(true)或提供密码),否则抛出BadPasswordException - 某些注释由JavaScript或动态表单驱动,删除后可能影响交互逻辑,建议测试渲染效果
- PDF/A等合规格式对注释有特殊要求,删除后需重新验证合规性(如用
preFlight工具)
基本上就这些。选PDFBox适合轻量、开源优先场景;选iText 7适合已有iText生态或需要精细控制subtype的项目。不复杂但容易忽略解密和重保存步骤。










