Python ElementTree怎么处理处理指令

星降

发布时间：2026-01-08 11:49:02

827人浏览过

来源于php中文网

原创

ElementTree默认丢弃处理指令（PI），因其定位为轻量级数据处理器；需用XMLParser配自定义Target类捕获PI，或改用支持PI的lxml.etree。

python elementtree怎么处理处理指令

ElementTree 默认会丢弃处理指令（PI）

Python 标准库的 xml.etree.ElementTree 在解析 XML 时，默认跳过所有处理指令（如、），既不保留在树中，也不提供回调接口。这不是 bug，而是设计取舍：ElementTree 定位是“轻量级、面向数据的 XML 处理”，而非完整 XML 1.0 合规解析器。

想保留 PI，必须用 `XMLParser` 配合自定义 `target`

标准方式是绕过高层 API，手动构造 XMLParser，传入实现了 start_pi 和 end_pi 方法的 Target 对象。注意：start_pi 的参数是 (target, name, data)，其中 name 是处理指令目标名（如 "xml-stylesheet"），data 是其内容字符串（不含前后空格，但含内部所有空白）。

from xml.etree import ElementTree as ET
class PITarget:
def init(self):
self.pis = []
def start_pi(self, target, data):
self.pis.append((target, data))
def end_pi(self):
pass
def start_element(self, args):
pass
def end_element(self, args):
pass
def data(self, data):
pass
def close(self):
return None
parser = ET.XMLParser(target=PITarget())
with open("doc.xml", "rb") as f:
result = parser.close()  # 注意：不是 parser.parse()
result.pis 现在包含所有 PI 元组

`lxml` 是更现实的选择

如果你实际需要可靠地读写带 PI 的 XML（比如 XHTML 文档头部的样式表声明、SVG 中的 XML 声明扩展），lxml.etree 是更可行的方案。它原生支持 PI 节点，可被当作普通元素操作：

etree.ProcessingInstruction 类型节点存在于 .getchildren() 或迭代结果中
可用 tree.iter("{http://www.w3.org/2000/xmlns/}processing-instruction") 查找（注意命名空间前缀）
序列化时默认保留 PI，无需额外配置

代价是引入第三方依赖，但对生产环境中的 XML 处理来说，这通常是值得的。

DeepAI

为天生具有创造力的人提供的AI工具

下载

立即学习“Python免费学习笔记（深入）”；

别试图用正则或字符串替换补救

常见误区是先用 ET.tostring() 得到 bytes，再用正则插入 PI——这极易破坏编码声明位置（XML 声明必须在第一行）、损坏 UTF-8 BOM、或导致后续解析失败。ElementTree 的输出不保证格式稳定，且不处理 PI 重排逻辑。真要插 PI，应直接操作底层 lxml 的节点树，或在生成原始 XML 字符串阶段就组织好。

PHP SimpleXML怎么用 SimpleXML读取XML文件教程

PHP DOMDocument怎么创建和插入一个新节点

PHP的libxml扩展怎么开启和配置

如何配置XML解析器禁用外部实体防止XXE攻击

PHP如何解析XML文件 PHP SimpleXML使用教程

相关标签:

php python html svg 处理器编码 app 标准库 Python php xhtml 命名空间 xml 字符串接口对象 bom 样式表 http bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在AWS Lambda函数中处理S3上的XML文件下一篇：Mybatis的XML文件怎么配置 Mybatis映射文件标签详解

作者最新文章

个人所得税年度汇算怎么申报个人所得税APP汇算清缴完整教程

2026-01-09 10:12

a0纸尺寸是多少厘米 a0纸大小

2026-01-09 10:20

一亩多少平方米一亩地等于多少平方米

2026-01-09 10:23

Avalonia如何实现跨平台开发 Avalonia支持哪些平台

2026-01-09 10:28

抖币充值折扣平台抖币充值5到6折渠道入口

2026-01-09 10:29

C# LINQ to XML怎么处理带命名空间的XML

2026-01-09 11:00

Avalonia怎么给控件设置光标样式 Avalonia Cursor属性

2026-01-09 11:04

正则表达式是什么语言_正则表达式自身作为模式描述语言的本质

2026-01-09 11:13

XPath怎么查找一个节点后面的第一个指定节点

2026-01-09 11:13

高德地图怎么查看路况拥堵情况高德地图实时路况热力图开启【方法】

2026-01-09 11:21

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

737

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

633

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

755

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

617

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1259

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

705

2023.08.11

Golang 分布式缓存与高可用架构

本专题系统讲解 Golang 在分布式缓存与高可用系统中的应用，涵盖缓存设计原理、Redis/Etcd集成、数据一致性与过期策略、分布式锁、缓存穿透/雪崩/击穿解决方案，以及高可用架构设计。通过实战案例，帮助开发者掌握如何使用 Go 构建稳定、高性能的分布式缓存系统，提升大型系统的响应速度与可靠性。

2026.01.09

热门下载

网站特效

网站源码

网站素材

前端模板