0

0

Python怎么解析XML文件_Python解析XML文件的几种方法

月夜之吻

月夜之吻

发布时间:2025-11-03 20:56:02

|

562人浏览过

|

来源于php中文网

原创

ElementTree适合中小型文件解析,SAX适用于大文件,lxml功能强大支持XPath,可按需选择。

python怎么解析xml文件_python解析xml文件的几种方法

Python 提供了多种方式来解析 XML 文件,选择哪种方法主要取决于文件大小、操作习惯以及是否需要修改 XML 内容。下面介绍几种常用的 XML 解析方法:DOM、SAX、ElementTree 和 lxml。

1. 使用 xml.etree.ElementTree(推荐初学者)

ElementTree 是 Python 标准库中的模块,简单易用,适合处理中小型 XML 文件。它将整个 XML 加载到内存中,以树形结构表示,便于遍历和查找。

示例 XML 文件(data.xml):



  
    Alice
    22
  

  
    Bob
    24
  

使用 ElementTree 解析:

立即学习Python免费学习笔记(深入)”;

import xml.etree.ElementTree as ET

tree = ET.parse('data.xml')
root = tree.getroot()

for student in root.findall('student'):
  sid = student.get('id')
  name = student.find('name').text
  age = student.find('age').text
  print(f"ID: {sid}, Name: {name}, Age: {age}")

优点:语法简洁,支持 XPath 子集,无需额外安装。适合读取和构建简单 XML。

2. 使用 SAX(适用于大文件)

SAX(Simple API for XML) 是事件驱动的解析方式,逐行读取,不加载整个文档到内存,适合处理大型 XML 文件。

需要继承 xml.sax.ContentHandler 并重写方法:

import xml.sax

class StudentHandler(xml.sax.ContentHandler):
  def init(self):
    self.current = ""
    self.name = ""
    self.age = ""

  def startElement(self, tag, attrs):
    if tag == "student":
      print("Student ID:", attrs["id"])

  def characters(self, content):
    if self.current == "name":
      self.name += content
    elif self.current == "age":
      self.age += content

  def endElement(self, tag):
    if tag == "name":
      print("Name:", self.name)
      self.name = ""
    elif tag == "age":
      print("Age:", self.age)
      self.age = ""
    self.current = ""

parser = xml.sax.make_parser()
handler = StudentHandler()
parser.setContentHandler(handler)
parser.parse("data.xml")

优点:内存占用小。缺点:代码较复杂,不能随机访问节点。

Pixlr
Pixlr

Pixlr是一款2008年推出的在线图片编辑和AI图片处理工具,目前已推出AI 图像生成器、AI 生成填充、AI 删除背景、AI 删除对象和 AI 图像扩展等现代 AI 工具。

下载

3. 使用第三方库 lxml(功能强大)

lxml 不是标准库,但功能比 ElementTree 更强,支持完整的 XPath、命名空间和 XML Schema。安装方式:

pip install lxml

使用示例:

from lxml import etree

tree = etree.parse('data.xml')
root = tree.getroot()

使用 XPath 查找所有学生姓名

names = root.xpath('//student/name/text()')
for name in names:
  print(name)

优点:性能好,支持高级查询。适合复杂 XML 处理场景。

4. 手动创建和写入 XML

ElementTree 也可以用来生成 XML 文件:

import xml.etree.ElementTree as ET

创建根节点

root = ET.Element("students")

添加子节点

stu = ET.SubElement(root, "student", id="3")
ET.SubElement(stu, "name").text = "Charlie"
ET.SubElement(stu, "age").text = "23"

写入文件

tree = ET.ElementTree(root)
tree.write("output.xml", encoding="utf-8", xml_declaration=True)

生成的 output.xml 包含声明和格式化内容。

基本上就这些常见方式。ElementTree 足够应付大多数日常任务,lxml 适合更复杂的项目,SAX 用于超大文件。根据需求选择合适的方法即可。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

707

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

624

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

734

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

616

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1234

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

573

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

695

2023.08.11

苹果官网入口直接访问
苹果官网入口直接访问

苹果官网直接访问入口是https://www.apple.com/cn/,该页面具备0.8秒首屏渲染、HTTP/3与Brotli加速、WebP+AVIF双格式图片、免登录浏览全参数等特性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

10

2025.12.24

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 2.4万人学习

SciPy 教程
SciPy 教程

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号