0

0

如何从HTML字符串中高效提取标签的src属性

DDD

DDD

发布时间:2025-09-28 10:13:01

|

177人浏览过

|

来源于php中文网

原创

如何从HTML字符串中高效提取<script>标签的src属性
标签的src属性 " />

本教程将指导您如何利用JavaScript的DOM解析能力,从给定的HTML字符串中准确提取所有标签,其属性顺序、引号类型、标签内部内容都可能变化,正则表达式难以优雅地处理这些情况。尝试用正则表达式解析html通常会导致代码脆弱、难以维护且容易出错。

使用DOMParser解析HTML字符串

JavaScript提供了DOMParser接口,它允许我们将HTML或XML字符串解析成一个可操作的DOM文档对象。这种方法是处理HTML字符串的标准且推荐的方式,因为它能准确模拟浏览器解析HTML的行为,并提供强大的DOM API来遍历和操作元素。

以下是如何使用DOMParser将HTML字符串转换为DOM文档的示例:

const html_code = `





  
  

其他内容

`; // 创建一个DOMParser实例 const parser = new DOMParser(); // 使用parseFromString方法解析HTML字符串 // 第一个参数是待解析的字符串,第二个参数指定MIME类型为'text/html' const html_doc = parser.parseFromString(html_code, 'text/html'); console.log("解析后的DOM文档:", html_doc);

执行上述代码后,html_doc将是一个完整的Document对象,我们可以像操作浏览器中的document对象一样来操作它。

立即学习前端免费学习笔记(深入)”;

提取

一旦我们有了DOM文档对象,就可以利用其提供的querySelectorAll方法,结合CSS选择器来精准地查找目标元素。对于提取所有带有src属性的

querySelectorAll方法返回一个NodeList,它是一个类似数组的对象,包含所有匹配的元素。为了方便地进行迭代和数据转换,我们通常会将其转换为真正的数组,然后使用map方法来提取每个元素的src属性。

Petalica Paint
Petalica Paint

用AI为你的画自动上色!

下载
const html_code = `





  
  

其他内容

`; const parser = new DOMParser(); const html_doc = parser.parseFromString(html_code, 'text/html'); // 使用querySelectorAll查找所有带有src属性的script标签 const script_tags = html_doc.querySelectorAll('script[src]'); // 将NodeList转换为数组,并使用map方法提取每个script标签的src属性值 const sources = Array.from(script_tags).map((s) => s.getAttribute('src')); console.log("提取到的脚本源URL:", sources); // 预期输出: ["https://code.jquery.com/jquery-3.7.0.slim.min.js", "/assets/script.js", "/assets/footer.js"]

在这个例子中,script[src]选择器确保我们只选取那些明确定义了src属性的

在浏览器环境中直接提取

如果您的HTML内容已经存在于当前的浏览器DOM中,例如您想从当前页面中提取所有脚本的src,那么您不需要使用DOMParser。可以直接使用document.querySelectorAll方法来完成相同的任务:

// 假设您在浏览器控制台中运行此代码
// 它将从当前页面的DOM中提取所有带有src属性的script标签的URL
const current_page_script_sources = Array.from(document.querySelectorAll('script[src]')).map((s) => s.getAttribute('src'));

console.log("当前页面脚本源URL:", current_page_page_script_sources);

注意事项

  • 安全性: 当处理来自不可信源的HTML字符串时,请务必小心。虽然DOMParser本身不会执行脚本,但将解析后的内容插入到实际DOM中可能会引入跨站脚本攻击(XSS)的风险。在展示或操作外部HTML时,应进行适当的净化和验证。
  • 性能: 对于非常庞大或复杂的HTML字符串,DOMParser的解析可能会消耗一定的性能。在极端情况下,如果需要处理海量HTML,可能需要考虑流式解析或其他更优化的方案。
  • 非标准HTML: DOMParser会尽力解析非标准的HTML,但如果HTML结构严重损坏,可能无法得到预期的DOM结构。

总结

从HTML字符串中提取特定信息,特别是像

相关专题

更多
js获取数组长度的方法
js获取数组长度的方法

在js中,可以利用array对象的length属性来获取数组长度,该属性可设置或返回数组中元素的数目,只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值,也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容,供大家免费下载使用。

552

2023.06.20

js刷新当前页面
js刷新当前页面

js刷新当前页面的方法:1、reload方法,该方法强迫浏览器刷新当前页面,语法为“location.reload([bForceGet]) ”;2、replace方法,该方法通过指定URL替换当前缓存在历史里(客户端)的项目,因此当使用replace方法之后,不能通过“前进”和“后退”来访问已经被替换的URL,语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

374

2023.07.04

js四舍五入
js四舍五入

js四舍五入的方法:1、tofixed方法,可把 Number 四舍五入为指定小数位数的数字;2、round() 方法,可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

731

2023.07.04

js删除节点的方法
js删除节点的方法

js删除节点的方法有:1、removeChild()方法,用于从父节点中移除指定的子节点,它需要两个参数,第一个参数是要删除的子节点,第二个参数是父节点;2、parentNode.removeChild()方法,可以直接通过父节点调用来删除子节点;3、remove()方法,可以直接删除节点,而无需指定父节点;4、innerHTML属性,用于删除节点的内容。

476

2023.09.01

JavaScript转义字符
JavaScript转义字符

JavaScript中的转义字符是反斜杠和引号,可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容,供大家免费下载体验。

394

2023.09.04

js生成随机数的方法
js生成随机数的方法

js生成随机数的方法有:1、使用random函数生成0-1之间的随机数;2、使用random函数和特定范围来生成随机整数;3、使用random函数和round函数生成0-99之间的随机整数;4、使用random函数和其他函数生成更复杂的随机数;5、使用random函数和其他函数生成范围内的随机小数;6、使用random函数和其他函数生成范围内的随机整数或小数。

990

2023.09.04

如何启用JavaScript
如何启用JavaScript

JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍:1、内联脚本是将JavaScript代码直接嵌入到HTML标签中;2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中;3、外部脚本是将JavaScript代码放置在一个独立的文件;4、外部脚本是将JavaScript代码放置在一个独立的文件。

656

2023.09.12

Js中Symbol类详解
Js中Symbol类详解

javascript中的Symbol数据类型是一种基本数据类型,用于表示独一无二的值。Symbol的特点:1、独一无二,每个Symbol值都是唯一的,不会与其他任何值相等;2、不可变性,Symbol值一旦创建,就不能修改或者重新赋值;3、隐藏性,Symbol值不会被隐式转换为其他类型;4、无法枚举,Symbol值作为对象的属性名时,默认是不可枚举的。

551

2023.09.20

php与html混编教程大全
php与html混编教程大全

本专题整合了php和html混编相关教程,阅读专题下面的文章了解更多详细内容。

3

2026.01.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Sass 教程
Sass 教程

共14课时 | 0.8万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 2.9万人学习

CSS教程
CSS教程

共754课时 | 18.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号