使用xml.etree.ElementTree可解析XML,首先通过ET.parse()读取文件并获取根节点root,接着用root.findall()遍历book子节点,利用find()获取title、author、price等元素的文本内容,同时通过get()方法提取属性如id,支持.//语法进行递归查找,注意处理节点不存在情况及字符串转数值类型。

Python读取XML节点内容主要通过内置的xml.etree.ElementTree模块实现,操作简单且无需安装第三方库。本文带你一步步实战解析XML文件中的节点内容。
1. 准备一个XML文件
假设我们有一个名为books.xml的文件,内容如下:
2. 读取XML并解析根节点
使用ElementTree.parse()加载XML文件,获取根元素:
tree = ET.parse('books.xml')
root = tree.getroot()
print("根节点标签:", root.tag) # 输出: library
3. 遍历子节点并提取内容
通过遍历root的子元素,访问每个book节点的内容:
立即学习“Python免费学习笔记(深入)”;
for book in root:print(f"书籍ID: {book.get('id')}")
print("书名:", book.find('title').text)
print("作者:", book.find('author').text)
print("价格:", book.find('price').text)
print("-" * 20)
输出结果:
书名: Python入门教程
作者: 张三
价格: 59.90
--------------------
书籍ID: 2
书名: 数据分析实战
作者: 李四
价格: 78.50
--------------------
4. 查找特定节点(模糊匹配)
如果只想获取所有节点,可以直接用findall或iter:
for t in titles:
print(t.text)
输出所有书名。其中.//title表示递归查找所有title节点。
注意点:
- 确保XML文件路径正确,否则会报
FileNotFoundError - 使用
.find()时,若节点不存在会返回None,调用.text会出错,建议先判断是否存在 - 文本内容默认是字符串类型,数值需手动转换,如
float(book.find('price').text)
基本上就这些。掌握getroot()、find()、findall()和.text这几个核心方法,就能轻松处理大多数XML读取需求。










