0

0

如何递归清理 HTML 结构:仅保留 li 标签,其余元素降级为纯文本

心靈之曲

心靈之曲

发布时间:2026-01-14 12:57:19

|

284人浏览过

|

来源于php中文网

原创

如何递归清理 HTML 结构:仅保留 li 标签,其余元素降级为纯文本

本文详解为何原递归函数无法处理 `

` 等非 `li` 元素,并提供基于 `for...of` 的健壮解决方案,确保所有非 `li` 元素(如 `

`、``、`

    `)被安全展开为其子文本节点,最终输出符合预期的纯净 html 片段。

问题根源在于 NodeList.prototype.forEach() 的执行时序与 DOM 树动态变更的冲突。当递归调用 testFn(e) 后立即执行 e.replaceWith(...e.childNodes) 时,e 被从 DOM 中移除,其子节点被插入到原位置——这会修改当前 node.childNodes 的长度和索引顺序。而 forEach() 内部是基于初始快照遍历的,后续迭代仍按原始 NodeList 进行,导致部分节点被跳过(尤其是紧邻被替换节点之后的兄弟节点),造成

等元素未被处理。

使用 for...of 循环可规避该问题,因为它在每次迭代时都重新获取当前 childNodes 的迭代器,能响应实时 DOM 变化;更重要的是,它使控制流更清晰、避免闭包陷阱,便于逻辑调试。

以下是修正后的完整实现:

let html = `
  1. foo link text;
  2. bar link text;

Paragraph text baz and biz text.

Solvely
Solvely

AI学习伴侣,数学解体,作业助手,家教辅导

下载

立即学习前端免费学习笔记(深入)”;

Paragraph text.

`; html = `${html}`; const parsed = new DOMParser().parseFromString(html, 'text/html'); function flattenNonLiElements(node) { for (const child of node.childNodes) { // 先递归处理子节点(深度优先) flattenNonLiElements(child); // 仅对元素节点进行判断和替换 if (child.nodeType !== Node.ELEMENT_NODE) continue; // 仅保留
  • ,其余元素全部展开为子节点(含文本、注释等) if (child.nodeName.toLowerCase() !== 'li') { // 注意:replaceWith(...) 会将 child 替换为其所有直接子节点 // 若 child 无子节点(如空

    ),则被替换为空白(即消失) child.replaceWith(...child.childNodes); } } } flattenNonLiElements(parsed.body); console.log(parsed.body.innerHTML); // 输出: //
  • foo link text;
  • //
  • bar link text;
  • // Paragraph text baz and biz text. // Paragraph text.

    关键要点总结

    • ❌ 避免在 DOM 修改过程中使用 forEach() 遍历 childNodes;
    • ✅ 优先选用 for...of 或传统 for (let i = 0; i
    • ✅ replaceWith(...childNodes) 是安全展开元素内容的标准方式,天然支持混合节点类型(文本、元素、注释);
    • ⚠️ 注意:若目标元素(如

      )内含嵌套 HTML(如 ),它们也会被一并展开——这正是需求所要求的“只留文本”效果;如需保留特定内联标签,需额外白名单逻辑;

    • ? 建议在真实项目中添加边界检查(如 node && node.childNodes),增强鲁棒性。

    该方案简洁、可预测,适用于任意层级 HTML 结构的语义化精简处理。

    相关文章

    HTML速学教程(入门课程)
    HTML速学教程(入门课程)

    HTML怎么学习?HTML怎么入门?HTML在哪学?HTML怎么学才快?不用担心,这里为大家提供了HTML速学教程(入门课程),有需要的小伙伴保存下载就能学习啦!

    下载

    本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

    相关专题

    更多
    html版权符号
    html版权符号

    html版权符号是“©”,可以在html源文件中直接输入或者从word中复制粘贴过来,php中文网还为大家带来html的相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

    606

    2023.06.14

    html在线编辑器
    html在线编辑器

    html在线编辑器是用于在线编辑的工具,编辑的内容是基于HTML的文档。它经常被应用于留言板留言、论坛发贴、Blog编写日志或等需要用户输入普通HTML的地方,是Web应用的常用模块之一。php中文网为大家带来了html在线编辑器的相关教程、以及相关文章等内容,供大家免费下载使用。

    646

    2023.06.21

    html网页制作
    html网页制作

    html网页制作是指使用超文本标记语言来设计和创建网页的过程,html是一种标记语言,它使用标记来描述文档结构和语义,并定义了网页中的各种元素和内容的呈现方式。本专题为大家提供html网页制作的相关的文章、下载、课程内容,供大家免费下载体验。

    466

    2023.07.31

    html空格
    html空格

    html空格是一种用于在网页中添加间隔和对齐文本的特殊字符,被用于在网页中插入额外的空间,以改变元素之间的排列和对齐方式。本专题为大家提供html空格的相关的文章、下载、课程内容,供大家免费下载体验。

    245

    2023.08.01

    html是什么
    html是什么

    HTML是一种标准标记语言,用于创建和呈现网页的结构和内容,是互联网发展的基石,为网页开发提供了丰富的功能和灵活性。本专题为大家提供html相关的各种文章、以及下载和课程。

    2885

    2023.08.11

    html字体大小怎么设置
    html字体大小怎么设置

    在网页设计中,字体大小的选择是至关重要的。合理的字体大小不仅可以提升网页的可读性,还能够影响用户对网页整体布局的感知。php中文网将介绍一些常用的方法和技巧,帮助您在HTML中设置合适的字体大小。

    503

    2023.08.11

    html转txt
    html转txt

    html转txt的方法有使用文本编辑器、使用在线转换工具和使用Python编程。本专题为大家提供html转txt相关的文章、下载、课程内容,供大家免费下载体验。

    311

    2023.08.31

    html文本框代码怎么写
    html文本框代码怎么写

    html文本框代码:1、单行文本框【<input type="text" style="height:..;width:..;" />】;2、多行文本框【textarea style=";height:;"></textare】。

    423

    2023.09.01

    Java 桌面应用开发(JavaFX 实战)
    Java 桌面应用开发(JavaFX 实战)

    本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

    2

    2026.01.14

    热门下载

    更多
    网站特效
    /
    网站源码
    /
    网站素材
    /
    前端模板

    精品课程

    更多
    相关推荐
    /
    热门推荐
    /
    最新课程
    Bootstrap 5教程
    Bootstrap 5教程

    共46课时 | 2.9万人学习

    AngularJS教程
    AngularJS教程

    共24课时 | 2.6万人学习

    CSS教程
    CSS教程

    共754课时 | 18.8万人学习

    关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
    php中文网:公益在线php培训,帮助PHP学习者快速成长!
    关注服务号 技术交流群
    PHP中文网订阅号
    每天精选资源文章推送

    Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号