0

0

PDF如何实现PDF批量重命名_PDF文档属性提取与更名教程

P粉602998670

P粉602998670

发布时间:2026-01-02 09:22:02

|

319人浏览过

|

来源于php中文网

原创

可通过四种方法批量重命名PDF:一、Python脚本(pikepdf)提取元数据;二、Adobe Acrobat Pro动作向导;三、PDFtk+Shell脚本(macOS/Linux);四、PowerShell脚本(Windows)。

pdf如何实现pdf批量重命名_pdf文档属性提取与更名教程

如果您拥有一批PDF文件,但它们的文件名缺乏统一规范或无法反映文档内容,可以通过提取PDF元数据(如标题、作者、创建日期等)来批量重命名。以下是实现PDF批量重命名的具体操作方法:

一、使用Python脚本提取PDF属性并重命名

该方法基于PyPDF2或pikepdf库读取PDF文档的内置元数据(Document Information Dictionary),提取Title、Author、CreationDate等字段,并按预设模板生成新文件名。适用于Windows、macOS和Linux系统,需提前安装Python环境。

1、打开终端或命令提示符,执行pip install pikepdf安装依赖库。

2、新建一个文本文件,将后缀改为.py,例如rename_pdfs.py

3、在文件中写入以下代码:
import os
import pikepdf
from datetime import datetime

pdf_dir = "请替换为您的PDF所在文件夹绝对路径"
for filename in os.listdir(pdf_dir):
  if filename.lower().endswith(".pdf"):
    filepath = os.path.join(pdf_dir, filename)
    try:
      pdf = pikepdf.Pdf.open(filepath)
      meta = pdf.docinfo
      title = str(meta.Title).strip() if meta.Title else "Untitled"
      author = str(meta.Author).strip() if meta.Author else "Unknown"
      date_str = ""
      if meta.CreationDate:
        try:
          date_obj = datetime.strptime(str(meta.CreationDate), "D:%Y%m%d%H%M%S%z")
          date_str = date_obj.strftime("_%Y%m%d")
        except:
          date_str = "_unknown"
      new_name = f"{title[:50].replace('/', '-').replace(':', '-')}_{author[:20].replace('/', '-')} {date_str}.pdf"
      new_path = os.path.join(pdf_dir, new_name)
      os.rename(filepath, new_path)
    except Exception as e:
      print(f"跳过 {filename}:{e}")

4、修改代码中pdf_dir变量值为实际PDF文件夹路径,确保路径中不含中文或特殊符号(建议使用英文路径)。

5、在终端中进入该.py文件所在目录,运行python rename_pdfs.py

二、使用Adobe Acrobat Pro批量重命名

Adobe Acrobat Pro内置“动作向导”功能支持基于PDF属性(如文档标题、作者、主题)构建命名规则,并对多个PDF文件一次性执行重命名。此方法无需编程基础,但需已安装Acrobat Pro DC版本。

1、启动Adobe Acrobat Pro DC,点击右上角工具 > 动作向导 > 创建新动作

2、在“开始”部分选择选取文件,点击添加按钮,在弹出窗口中勾选包含子文件夹中的文件

3、在“完成”部分点击添加操作,搜索并双击重命名文件

4、在“重命名文件”设置中,点击添加项目,依次插入:文档标题下划线作者下划线创建日期(格式选YYYYMMDD)

5、点击保存,为动作命名为“按属性重命名”,然后点击完成

6、在动作列表中选中刚创建的动作,点击开始,选择目标PDF文件夹,确认执行。

arXiv Xplorer
arXiv Xplorer

ArXiv 语义搜索引擎,帮您快速轻松的查找,保存和下载arXiv文章。

下载

三、使用PDFtk与Shell脚本(macOS/Linux)

PDFtk是一款命令行PDF处理工具,配合shell脚本可从PDF中提取Info字段并调用mv命令重命名。适用于熟悉终端操作的用户,不依赖图形界面。

1、在macOS上通过Homebrew安装PDFtk:brew install pdftk-java;在Ubuntu上执行sudo apt install pdftk

2、进入PDF所在目录,运行ls *.pdf | head -n 5确认文件列表正常显示。

3、执行以下命令生成重命名脚本:
for f in *.pdf; do info=$(pdftk "$f" dump_data | grep -E "InfoKey: (Title|Author)|InfoValue:" | sed 's/InfoKey: //; s/InfoValue: //'); title=$(echo "$info" | grep "Title" -A1 | tail -n1 | sed 's/^ *//'); author=$(echo "$info" | grep "Author" -A1 | tail -n1 | sed 's/^ *//'); datestr=$(date -r "$f" +%Y%m%d 2>/dev/null || stat -f "%Sm" -t "%Y%m%d" "$f" 2>/dev/null); newname="${title:-Unknown}_${author:-Unknown}_${datestr:-unknown}.pdf"; echo mv "$f" "$newname"; done > rename.sh

4、检查生成的rename.sh内容是否符合预期,删除所有echo前缀以启用真实重命名:sed -i '' 's/^echo mv/mv/' rename.sh(macOS)或sed -i 's/^echo mv/mv/' rename.sh(Linux)。

5、赋予执行权限并运行:chmod +x rename.sh && ./rename.sh

四、使用PowerShell脚本(Windows原生方案)

Windows系统可利用PowerShell结合开源库iTextSharp或直接解析PDF二进制结构中的Info字典区段,提取关键属性。本方案使用PowerShell原生命令配合正则匹配PDF原始信息流,无需额外安装软件。

1、以管理员身份打开PowerShell,执行Set-ExecutionPolicy RemoteSigned -Scope CurrentUser允许本地脚本运行。

2、新建文本文件,扩展名为.ps1,例如pdf_rename.ps1

3、在文件中粘贴以下内容:
$folder = "请替换为您的PDF文件夹路径"
Get-ChildItem $folder -Filter "*.pdf" | ForEach-Object {
  $content = [System.IO.File]::ReadAllText($_.FullName)
  $title = if ($content -match "/Title\s+\(([^)]+)\)") { $matches[1] } else { "Untitled" }
  $author = if ($content -match "/Author\s+\(([^)]+)\)") { $matches[1] } else { "Unknown" }
  $date = Get-Date $_.CreationTime -Format "yyyyMMdd"
  $safe_title = $title -replace '[\\/*?:"|]', '-'
  $safe_author = $author -replace '[\\/*?:"|]', '-'
  $newName = "$safe_title`_$safe_author`_$date.pdf"
  $newPath = Join-Path $folder $newName
  Rename-Item $_.FullName $newPath -ErrorAction SilentlyContinue
}

4、修改脚本中$folder变量为实际路径,注意路径使用反斜杠且需加引号。

5、在PowerShell中执行.\pdf_rename.ps1(首次运行需确认策略提示)。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

718

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

627

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

744

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1236

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

700

2023.08.11

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

74

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 6.4万人学习

Git 教程
Git 教程

共21课时 | 2.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号