需将HTML解析为JS对象树,可用五种方法:一、DOMParser安全解析字符串;二、递归遍历现有DOM元素;三、innerHTML+临时div兼容旧环境;四、XMLSerializer反向序列化(限XML兼容HTML);五、htmlparser2流式解析大型HTML。

如果您拥有HTML字符串或DOM元素,需要将其结构化为JavaScript对象以便程序化操作,则需将HTML解析为树状对象模型。以下是实现此转换的多种方法:
DOMParser可在不依赖页面上下文的情况下,将HTML字符串安全地解析为Document对象,进而遍历构建自定义JS对象树。
1、创建DOMParser实例:const parser = new DOMParser();
2、调用parseFromString方法,传入HTML字符串与MIME类型:const doc = parser.parseFromString(htmlString, 'text/html');
立即学习“Java免费学习笔记(深入)”;
3、获取body子节点并递归遍历其childNodes,提取tagName、attributes、textContent及children属性,组装为嵌套对象。
针对已挂载或临时创建的Element节点,可通过原生DOM API逐层读取属性与子节点,构造符合需求的对象结构。
1、定义递归函数,接收一个Element参数:function elementToObject(el) { ... }
2、初始化对象,包含tagName、id、className等基础属性:const obj = { tagName: el.tagName.toLowerCase(), attributes: {} };
3、遍历el.attributes,将name和value存入obj.attributes对象中。
4、若el.hasChildNodes()为true,则对el.childNodes过滤出Element节点,映射调用elementToObject,结果存入obj.children数组。
适用于无法使用DOMParser的旧环境(如部分IE版本),通过临时插入HTML并读取其子节点来构建对象模型。
1、创建临时div元素:const temp = document.createElement('div');
2、设置其innerHTML为待解析的HTML字符串:temp.innerHTML = htmlString;
3、检查temp.firstElementChild是否存在,若存在则以其为根节点启动递归对象构建流程。
当HTML结构严格符合XML语法(如所有标签闭合、属性带引号),可先用XMLSerializer转为字符串,再以XML方式解析,确保节点层级精确还原。
1、创建XMLSerializer实例:const serializer = new XMLSerializer();
2、对目标Element执行serializeToString:const xmlStr = serializer.serializeToString(el);
3、使用DOMParser以'application/xml'类型解析该字符串,获取XMLDocument后按元素节点类型提取数据字段。
对于大型HTML字符串或需高度可控解析行为的场景,htmlparser2提供事件驱动机制,在start、end、text等钩子中累积构建对象模型,避免完整DOM树内存开销。
1、安装并引入库:const { Parser } = require('htmlparser2');
2、初始化Parser实例,监听onopentag、onclosetag、ontext等事件。
3、在onopentag中推入新对象至栈顶,在ontext中填充当前节点textContent,在onclosetag中弹出并附加到父节点children数组。
以上就是html如何转化成对象_将HTML元素转化为JavaScript对象模型【模型】的详细内容,更多请关注php中文网其它相关文章!
HTML怎么学习?HTML怎么入门?HTML在哪学?HTML怎么学才快?不用担心,这里为大家提供了HTML速学教程(入门课程),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号