Python处理XML主要用xml.etree.ElementTree和lxml;前者是标准库,轻量简单但功能基础,适合基本操作;后者功能强大,支持XPath、XSLT等高级特性,性能更好但需安装;解析、遍历、查找、修改操作类似,ElementTree适用于简单场景,lxml适合复杂需求。

Python处理XML文件主要有两种常用方法:使用内置的xml.etree.ElementTree模块和第三方库lxml。它们都能解析、创建和修改XML数据,但在功能和性能上略有不同。
1. 使用 xml.etree.ElementTree(标准库)
这是Python自带的XML处理模块,适合大多数基本操作,无需额外安装依赖。
优点:轻量、简单、标准库自带
缺点:功能较基础,不支持XPath高级查询
常见操作示例:
立即学习“Python免费学习笔记(深入)”;
-
解析XML字符串或文件:
import xml.etree.ElementTree as ET tree = ET.parse('example.xml') # 解析文件 root = tree.getroot() -
遍历元素:
for child in root: print(child.tag, child.attrib) -
查找特定标签(有限支持):
for elem in root.iter('tag_name'): print(elem.text) -
修改并写回文件:
root.find('tag').text = 'new value' tree.write('output.xml')
2. 使用 lxml 库(第三方增强库)
lxml是功能更强大的XML处理库,基于libxml2,支持XPath、XSLT、命名空间等高级特性。
HT-EWCMS 为 Hetty - Enterprise Web Content Management System 的英文缩写,即海霆企业网站内容管理系统,HT-EWCMS为您提供一个高效快速和强大的企业网站解决方案,兼容各种主流操作系统和浏览器。HT-EWCMS著作权已在中华人民共和国国家版权局注册,海霆科技为 HT-EWCMS 产品的开发商,依法独立拥有 HT-EWCMS 产品著作权,著作
优点:速度快、功能丰富、支持XPath 1.0
缺点:需要安装:pip install lxml
常见操作示例:
立即学习“Python免费学习笔记(深入)”;
-
解析XML:
from lxml import etree tree = etree.parse('example.xml') root = tree.getroot() -
使用XPath查找元素:
for elem in root.xpath('//book[@category="fiction"]'): print(elem.get('id'), elem.find('title').text) -
支持CSS选择器风格路径:
from lxml.cssselect import CSSSelector sel = CSSSelector('book > title') results = sel(root) -
生成格式化输出:
print(etree.tostring(root, pretty_print=True, encoding='unicode'))
基本上就这些。如果只是读写简单配置文件,用ElementTree足够;若涉及复杂查询、大量数据或需XPath支持,推荐lxml。两者语法相似,切换成本不高。










