XLSX文件本质是ZIP压缩包,解压后由XML文件构成标准化结构,核心包括[Content_Types].xml、\_rels/、docProps/和xl/目录,其中xl/含workbook.xml、worksheets/、sharedStrings.xml、styles.xml等,通过索引与引用实现数据、样式和字符串的高效共享与管理。

Excel的XLSX文件本质上是一个ZIP压缩包,解压后可见一套标准化的XML文件结构,所有数据、样式、关系和元信息都以XML形式组织在特定目录下。理解这套结构,是高效解析、修改或生成XLSX文件的基础。
核心目录与文件布局
XLSX解压后的根目录通常包含以下关键部分:
- [Content_Types].xml:全局内容类型注册表,声明每个文件的MIME类型(如sheet1.xml是application/vnd.openxmlformats-officedocument.spreadsheetml.worksheet+xml)
- _rels/:存放各类“关系”定义文件(如workbook.xml.rels),描述组件间的引用依赖(例如工作簿如何关联到各工作表)
- docProps/:存储文档属性,包括app.xml(应用信息)、core.xml(作者/创建时间等基础元数据)
- xl/:真正的核心目录,几乎所有业务数据都在此
xl目录下的核心XML组件
进入xl/目录,你会看到这些关键文件和子目录:
技术上面应用了三层结构,AJAX框架,URL重写等基础的开发。并用了动软的代码生成器及数据访问类,加进了一些自己用到的小功能,算是整理了一些自己的操作类。系统设计上面说不出用什么模式,大体设计是后台分两级分类,设置好一级之后,再设置二级并选择栏目类型,如内容,列表,上传文件,新窗口等。这样就可以生成无限多个二级分类,也就是网站栏目。对于扩展性来说,如果有新的需求可以直接加一个栏目类型并新加功能操作
- workbook.xml:工作簿主控文件,定义工作表列表、全局设置(如默认主题版本)、计算链开关等
-
worksheets/sheet1.xml(及sheet2.xml等):每张工作表的实际内容,含
节点,内嵌行()与单元格();单元格的r属性标定地址(如"A1"),t属性标明数据类型("s"=共享字符串索引,"n"=数字,"b"=布尔等) -
sharedStrings.xml:所有文本字符串的集中池,避免重复存储;sheet中单元格值若为字符串,实际存的是该文件中
元素的0基索引 -
styles.xml:统一管理字体、填充、边框、数字格式和单元格样式;单元格通过
s属性引用中的样式索引 - theme/theme1.xml:定义配色方案、字体集等主题资源,供样式间接调用
数据关联的关键机制
XLSX不是扁平文件,各XML之间靠显式引用协同工作:
- 一个字符串型单元格(如
)表示:第B2列第2行的内容,是5 sharedStrings.xml中第6个项(索引从0开始) - 带样式的单元格(如
)表示:使用styles.xml中节点下第3个样式定义(索引0起) -
workbook.xml.rels会声明sheet1.xml的路径和ID,而workbook.xml中则通过该ID完成绑定
为什么这样设计
这种模块化、引用驱动的XML结构带来三大优势:
- 空间效率:共享字符串、复用样式大幅压缩体积,尤其对含大量重复文本或统一格式的报表
-
可维护性:修改字体只需改
styles.xml一处,无需遍历所有sheet - 容错性:某张工作表损坏(如sheet2.xml异常),其他sheet仍可正常打开









