Python如何处理自闭合标签的解析

幻夢星雲

发布时间：2025-12-26 03:49:17

781人浏览过

来源于php中文网

原创

Python解析器不将视为自闭合标签，而是解析为含空文本的双标签元素；真正的自闭合标签是；判断逻辑为空需手动检查text、tail和子元素数量。

python如何处理自闭合标签 <tag/> 的解析

Python 中的 XML/HTML 解析器（如 xml.etree.ElementTree、lxml、BeautifulSoup）**不把当作自闭合标签处理，而是当作普通开始+结束标签**，即包含一个空文本子节点的元素。真正的自闭合标签是像这样的写法。

ElementTree 默认行为：空标签 ≠ 自闭合

xml.etree.ElementTree 会把解析为一个有开始和结束标签的普通元素，其 .text 为 None 或空字符串（取决于解析方式），但结构上仍是双标签。它不会自动合并或重写为。

如果原始 XML 是，解析后 elem.text 通常是 None（若标签间无空白）或 '\n '（若有缩进）
elem.tag 是 'item'，len(list(elem)) 是 0，表示无子元素
要判断是否“逻辑上为空”，需手动检查：not elem.text and not elem.tail and len(elem) == 0

lxml 支持输出自闭合形式（可选）

lxml.etree 在序列化时可通过 method='xml' 和 xml_declaration=True 输出标准 XML，并支持 selfclosing_tags 参数（仅限写入时控制格式）：

默认情况下，etree.tostring(elem) 对空元素仍输出
若希望输出，需在创建元素时用 etree.Element('tag', **{'/': ''})（不推荐）或使用 etree.tostring(..., method='xml', xml_declaration=False) 并配合 etree.XMLParser(remove_blank_text=True) 预处理
更稳妥的做法是：解析后识别空元素，再用字符串替换或自定义序列化逻辑统一转为自闭合形式

BeautifulSoup 处理更宽松，但不区分语义

BeautifulSoup（尤其搭配 html.parser 或 lxml 解析器）会把和都视为同一元素，且默认输出时倾向于用双标签形式。

小艺

华为公司推出的AI智能助手

下载

立即学习“Python免费学习笔记（深入）”；

它不保留原始标签语法差异，只关注 DOM 结构
若需输出自闭合格式，可用 soup.prettify(formatter=lambda s: s.strip() if s.strip() else '') 辅助，但无法直接强制所有空标签变 />
对 HTML，部分标签如、在解析时会被自动标准化为自闭合（取决于解析器和文档类型）

实际建议：按需判断，而非依赖解析器自动转换

大多数场景下，你不需要“修复”标签形式，而应关注内容逻辑。若必须统一为自闭合格式（如生成配置文件、对接严格 XML Schema）：

先遍历所有元素，用条件 not elem.text and not elem.tail and len(elem) == 0 and not elem.attrib 找出纯空元素
用 lxml 的 etree.tostring() + 正则替换，或改用 xml.dom.minidom（支持 toxml() 中的 selfClosingTags 参数）
注意：XML 规范中和完全等价，除非下游系统有特殊要求，否则无需强求格式一致

Python lxml的iterparse如何处理特定事件

Python如何移除XML中的命名空间

如何用Python的requests-xml库简化XML请求

如何用Ansible的xml模块修改配置文件

Python如何安全地解析不可信的XML DefusedXML

相关标签:

python html ai 配置文件 Python html beautifulsoup if xml 字符串 Lambda len dom

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何用Python解析PubMed的XML数据下一篇：怎么用Go语言的encoding/xml包处理XML

作者最新文章

起点新书怎么冲榜起点中文网新书榜排名规则解析

2025-12-25 16:04

企查查查询教程企查查新用户使用入口指南

2025-12-25 16:05

悟空浏览器网页版免费使用悟空浏览器网页版在线免费登录

2025-12-25 16:13

2025年ARM架构电脑系统前景分析 | Windows on ARM与macOS的未来

2025-12-25 16:14

超星学习通统一身份认证入口_网页版官方平台登录页面

2025-12-25 16:56

Win10系统怎么重装IE浏览器 IE11浏览器重新安装方法

2025-12-25 17:13

货拉拉跨市怎么收费货拉拉长途搬家价格【计算方法】

2025-12-25 17:18

Excel怎么随机生成数字 Excel随机生成数字公式Rand【教程】

2025-12-25 17:32

流眼泪能排出毒素，真的假的蚂蚁庄园今日答案12.25

2025-12-25 17:33

蚂蚁庄园今日最新答案12.25

2025-12-25 17:34

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

707

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

625

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

735

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

616

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1234

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

573

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

695

2023.08.11