0

0

Java常用压缩类库与ZipInputStream

P粉602998670

P粉602998670

发布时间:2026-01-11 12:36:09

|

992人浏览过

|

来源于php中文网

原创

应使用Apache Commons Compress的ZipArchiveInputStream并显式指定GBK等编码,或升级JDK至8u20+以支持ZIP64;避免用available()判断流结束,注意目录创建与路径穿越风险。

java常用压缩类库与zipinputstream

ZipInputStream读取中文文件名乱码怎么办

Java原生ZipInputStream不支持GBK、GB2312等中文编码,默认按UTF-8解码文件名,遇到老系统打包的ZIP(尤其是Windows下用WinRAR/7-Zip默认GBK)会返回?????.txt或抛IllegalArgumentException

解决思路不是“修复ZipInputStream”,而是绕过它——改用支持编码指定的第三方库,或在读取前预处理字节数组。JDK 7+ 的java.util.zip.ZipFile配合Charset参数仍不可用,真正可用的是:

  • org.apache.commons:commons-compress(推荐),其ZipArchiveInputStream允许传入Charset
  • net.sf.sevenzipjbinding(复杂,适合需要7z/LZMA场景)
  • 手动对ZipEntry.getName().getBytes(StandardCharsets.UTF_8)做编码转换(高风险,仅限已知原始编码且无特殊字符)

示例:用commons-compress读GBK编码ZIP

ZipArchiveInputStream zis = new ZipArchiveInputStream(
    new FileInputStream("test_gbk.zip"), 
    "GBK", // 显式指定编码
    true   // skipBytesForExtraField
);
ZipArchiveEntry entry;
while ((entry = zis.getNextZipEntry()) != null) {
    System.out.println(entry.getName()); // 正确输出中文名
    IOUtils.copy(zis, new FileOutputStream(entry.getName()));
}

ZipInputStream无法正确识别ZIP64扩展项

当ZIP文件中单个文件 > 4GB 或总条目数 > 65535,必须启用ZIP64格式。但JDK 6/7的ZipInputStream默认不识别ZIP64的central directory locator,会抛ZipException: invalid CEN header (invalid zip64 extra data)或直接跳过后续条目。

立即学习Java免费学习笔记(深入)”;

Dbsite企业网站管理系统1.5.0
Dbsite企业网站管理系统1.5.0

Dbsite企业网站管理系统V1.5.0 秉承"大道至简 邦达天下"的设计理念,以灵巧、简单的架构模式构建本管理系统。可根据需求可配置多种类型数据库(当前压缩包支持Access).系统是对多年企业网站设计经验的总结。特别适合于中小型企业网站建设使用。压缩包内包含通用企业网站模板一套,可以用来了解系统标签和设计网站使用。QQ技术交流群:115197646 系统特点:1.数据与页

下载

该问题在JDK 8u20+已修复,但仍有遗留环境运行旧JRE。验证方式:unzip -l broken.zip若提示zip64 end of central directory locator即为ZIP64。

  • JDK 8u20及以上:原生ZipInputStream可安全使用
  • JDK 7或更早:必须升级JRE,或改用commons-compress(从1.13起完整支持ZIP64)
  • 避免用ZipInputStream.available()判断流是否结束——它在ZIP64下始终返回0,应依赖getNextEntry() == null

ZipInputStream与ZipFile性能和资源管理差异

很多人误以为ZipInputStreamZipFile“更轻量”,其实相反:ZipInputStream是纯顺序读,无法随机访问;而ZipFile会将central directory加载进内存,支持getEntry("a/b.txt")直接定位,适合需多次查找特定文件的场景。

  • ZipInputStream:适合单次遍历、流式解压(如HTTP响应体直解)、内存受限环境
  • ZipFile:适合需随机读取、校验某几个文件、或提前获取所有条目元数据(size、time)的场景
  • ZipFile必须显式调用close(),否则底层RandomAccessFile句柄泄露;ZipInputStream也需关闭,但漏关只影响当前流
  • 二者都不支持边写边读ZIP——要生成ZIP请用ZipOutputStream

用ZipInputStream解压时跳过目录条目还是保留?

ZipInputStream读到的ZipEntry可能代表目录(entry.isDirectory() == true),也可能只是普通文件。是否创建对应目录,取决于你的业务逻辑。

  • 大多数解压工具(如unzip命令)默认创建目录结构,所以代码中应检查entry.isDirectory()mkdirs()
  • 若目标路径已存在同名文件,new File(entry.getName()).mkdirs()会静默失败,需提前delete()或跳过
  • 注意路径穿越风险:entry.getName()可能是../../etc/passwd,务必用FilenameUtils.normalize()(commons-io)或手动校验路径是否以"../"开头
  • 不要依赖entry.getSize() == 0判断目录——有些ZIP工具打空目录时会设非零size

真正的难点不在代码怎么写,而在你是否清楚这个ZIP是谁打的、用什么工具、在什么系统上、有没有隐藏属性——这些信息缺失时,光靠ZipInputStream本身无法还原原始意图。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

831

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

737

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

733

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

430

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16925

2023.08.03

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

80

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.4万人学习

C# 教程
C# 教程

共94课时 | 6.5万人学习

Java 教程
Java 教程

共578课时 | 44.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号