Files.copy()可直接复制单个文件,需配合REPLACE_EXISTING选项覆盖;备份目录须用Files.walk()遍历并手动处理异常、创建父目录、还原相对路径,同时注意中文路径、只读文件及增量校验。

用 Files.copy() 实现基础文件复制备份
Java 7+ 的 Files.copy() 是最直接的备份起点,它封装了底层流操作,避免手动处理 InputStream/OutputStream。但要注意:它默认不覆盖目标文件,且不递归处理目录。
- 若目标路径已存在,会抛出
FileAlreadyExistsException—— 备份前需显式检查或传入StandardCopyOption.REPLACE_EXISTING - 只复制单个文件;要备份整个目录,必须配合
Files.walk()或递归遍历 - 大文件(如 >500MB)下,
Files.copy()内部仍使用堆外内存缓冲,一般够用;但若频繁调用且内存敏感,可改用带固定缓冲区的FileChannel.transferTo()
Path source = Paths.get("/data/report.xlsx");
Path target = Paths.get("/backup/report_20240520.xlsx");
Files.copy(source, target, StandardCopyOption.REPLACE_EXISTING);
用 Files.walk() 遍历并备份整个目录
这是实现“文件夹级备份”的关键。相比 File.listFiles(),Files.walk() 返回的是惰性流(Stream),天然支持过滤、映射和并发处理,也自动跳过无法访问的子路径(如权限不足的目录)。
- 必须用
try-with-resources包裹流,否则可能泄露文件句柄(尤其在 Windows 上) - 路径映射时注意相对路径还原:源路径为
/home/user/docs/a.txt,目标应是/backup/docs/a.txt,推荐用source.relativize(child)计算相对路径 - 不要在流中直接调用
Files.copy()而不捕获异常——一个文件失败会导致整个流中断;应使用forEachOrdered()+ 手动 try/catch
Path sourceDir = Paths.get("/home/user/docs");
Path backupRoot = Paths.get("/backup/20240520");
Files.walk(sourceDir)
.filter(Files::isRegularFile)
.forEachOrdered(child -> {
try {
Path target = backupRoot.resolve(sourceDir.relativize(child));
Files.createDirectories(target.getParent());
Files.copy(child, target, StandardCopyOption.REPLACE_EXISTING);
} catch (IOException e) {
System.err.println("跳过 " + child + ": " + e.getMessage());
}
});
处理中文路径、特殊字符与只读文件
实际备份中,源路径含中文、空格或点号(如 新建文件夹/测试.abc)很常见,而只读文件(如系统生成的日志)在 Windows 下常因属性导致 copy 失败。
- Java NIO 默认支持 UTF-8 路径,无需额外编码处理;但若从命令行参数接收路径,确保终端/IDE 使用 UTF-8 编码(否则
Paths.get(args[0])可能乱码) - 只读文件需先修改属性:
Files.setAttribute(child, "dos:readonly", false)(Windows)或Files.setPosixFilePermissions()(Linux/macOS) - 目标路径中父目录不存在时,
Files.copy()会报NoSuchFileException—— 必须提前调用Files.createDirectories(target.getParent())
增量备份判断:用 Files.getLastModifiedTime() 和 Files.size()
全量备份效率低。简单增量逻辑可基于最后修改时间 + 文件大小双校验(比计算 MD5 快得多,且能覆盖绝大多数变更场景)。
立即学习“Java免费学习笔记(深入)”;
-
Files.getLastModifiedTime()返回FileTime,比较时用.compareTo(),不是.equals()(毫秒精度可能有舍入差异) - 仅靠修改时间不可靠:NFS 挂载、某些编辑器保存机制可能导致时间戳未更新;加
Files.size()判断可规避大部分误判 - 备份前建议记录本次扫描到的所有源文件元数据到临时 JSON 或 SQLite,供下次对比 —— 否则每次都要遍历全部源目录
真正难的不是写对一行 copy,而是让工具在断网、磁盘满、权限突变、用户中途拔U盘这些情况里不静默失败,也不删错原文件。备份逻辑里每一步的异常分支,都得想清楚“此时该继续?重试?跳过?还是中止并报警”。










