0

0

发布 f `@xmldom/xmldom`

WBOY

WBOY

发布时间:2024-08-31 09:06:10

|

1106人浏览过

|

来源于dev.to

转载

语境

xmldom 是一个 javascript ponyfill,用于向其他运行时提供现代浏览器中存在的以下 api: 将 xml 字符串转换为 dom 树 new domparser().parsefromstring(xml, mimetype) => document 创建、访问和修改 dom 树 new domimplementation().createdocument(...) => document 将 dom 树序列化回 xml 字符串 new xmlserializer().serializetostring(node) => string

来源:xmldom 自述文件

历史

自从我在 2020 年 6 月开始为分叉的 xmldom 库做出贡献以来,已经发布了 40 个版本。

这是一个非常有趣且具有挑战性的项目,并且很可能会在相当长的一段时间内保持这种状态。

github 称,自分叉以来已有 50 多人为其做出了贡献。

再次感谢所有贡献者。

这并不包括所有设法从原始无作用域 xmldom 包迁移到有作用域 @xmldom/xmldom 包版本 0.7.0 以获得所有安全修复程序的人。
作为 lts 标签发布的最新版本是 0.7.13。

最后一个具有重大更改的版本是 0.8.0,发布于 2021 年 12 月 22 日,大约 3 年前。
最新发布的版本是0.8.10。

0.9.0 (2024-08-29)

但是我今天要讲的是自 2022 年 10 月以来在 next 标签下发布的所有内容。

我对这些变化感到非常兴奋,因为它们为未来潜在的变化提供了明确的基础。

tldr:与规范更加一致,差异尽可能明确。

1. 强制mimetype交还控制权

使实现变得复杂的一个方面是解析 xml 与 html 的规则不同。
xmldom(在某种程度上)从一开始就“支持”这两种风格。甚至根本不需要传递 mimetype:应用什么规则是根据当前正在解析的 xml 字符串/节点的当前默认命名空间决定的。

这以 0.9.0 结束:从现在开始,domparser.parsefromstring(xml, mimetype) 中的 mimetype 是强制性的,并且是唯一被检查以决定是否应用 xml 或 html 规则的东西。巴斯塔。

该信息会保留在生成的文档(新类型属性)中,因此在序列化它时,会再次应用正确的规则。

这是一个巨大的(并且可能是破坏性的)变化,但我真的很高兴它已经准备好了,因为它使大量相关的错误修复变得可能/更容易实现,并且还降低了 api 和实现的复杂性。

此外,它现在只接受指定的 mime 类型,并在任何其他情况下抛出 typeerror。

严格性和错误处理

我个人对原生浏览器 api 的错误处理感到困惑的是,它总是返回一个 document,如果出现问题,parsererror 节点将是主体的第一个子节点:

发布 f `@xmldom/xmldom`

由于错误处理在 xmldom 中从来没有以这种方式工作,但现有的错误处理非常复杂、混乱且文档记录很差,0.9.0 对其进行了简化,现在对解析过程中发生的任何潜在错误具有(更加)一致的行为:
它会抛出一个 parseerror ?,例如有下列情况之一的:

  • 在以前的版本中,对于某些格式不正确的 xml 字符串,返回的 document 可能没有 documentelement,这很可能会导致后面的代码出现 typeerrors。
  • 几个格式不正确的 xml 字符串现在将正确报告为 fatalerror,现在总是阻止任何进一步的处理。
  • 一些以前未报告为错误或仅报告为警告的事情现在也报告为 fatalerror

仍然有一些情况会被报告为警告(尤其是在解析 html 时)或错误,但不会阻止数据的处理,但是新的错误处理可以很容易地决定代码的严格程度需要使用 xmldom。

可以传递给 domparser 构造函数的(不符合规范的)选项称为 onerror。
它需要一个具有以下签名的函数:

function onerror(level:errorlevel, message:string, context: domhandler):void;
  • errorlevel 是警告、错误或 fatalerror
  • xmldom 已经为两个最常见的用例提供了实现:
    • onerrorstopparsing 也会针对所有错误级别问题抛出 parseerror
    • onwarningstopparsing 也会针对所有错误级别问题抛出 parseerror

建议应用其中一个来在出现任何意外的第一个信号时停止处理 xml:

// prevent parsing of XML that has `error`s
new DOMParser({onError: onErrorStopParsing}).parseFromString(...)
// prevent parsing of XML that has `warning`s
new DOMParser({onError: onWarningStopParsing}).parseFromString(...)

comparedocumentposition,扩展 html 实体,null 而不是 undefined,...

原始 xmldom 存储库的另一个分支通过将 html 实体扩展到完整集(在 0.8.x 中也可用)并移植comparedocumentposition api 的实现,使其重新回到我们的存储库中。谢谢你,欢迎@zorkow

你好星识
你好星识

你的全能AI工作空间

下载

在此过程中,xmldom 迄今为止返回未定义而不是 null 的几个地方已得到修复,以符合规范。

而且我发现前作者似乎更喜欢在很多地方从列表的末尾开始迭代,属性在多个地方以相反的顺序处理,现在已修复。

removechild api 的实现发生了很大的变化,以符合规范并在应该抛出 domexception 的时候。

并且修复了 3 个相关错误,明确说明了 xmldom 的未来方向:
仅当适当严格的 xml 解析不受其影响时,才会提供对宽松 html 解析规则的支持。
以前(已损坏的)html 中自动自关闭标签的“支持”已经消失了。

coctype内部子集

最近,@shunkica 投入了大量的时间来解决以前处理 !doctype 内部子集部分时出现的大量问题。

它现在被保留为文档文档类型的internalsubset属性的一部分,并且现在可以正确检测到许多错误的文档类型声明并报告为 fatalerror。

同时感谢@kboshold 在该领域的最新错误修复。

在此过程中,我们创建了一个包含相关语法正则表达式的新模块,正确性检查基于这些模块,并且测试正确地覆盖了它们。

xmldom 的目标不是成为验证解析器,但这是支持那些带有更复杂 dtd 的文档的重要一步。

还有更多

到目前为止,开发是使用 node v10 完成的,因为这也是 xmldom 当前支持的最低版本。作为即将推出的版本工作的一部分,我决定切换到 v18 进行开发,因为越来越多的 devdependency 也使这成为最低要求。从该版本开始,这将是目前新的最低运行时版本。

我发起了一项公众投票/讨论,询问人们他们需要支持哪个版本的 node 或其他运行时。
如果没有反馈表明有什么不同,下一个重大版本很可能会放弃对某些旧 node 版本的支持。

一路走来,很多 api 都收到了具有正确类型的 jsdoc 注释。

谢谢

感谢您花时间阅读所有这些。

这些变化相当大,我很高兴能够交付这些变化。

我希望你和我一样兴奋:)

如果您需要更多详细信息,可以查看非常详细的变更日志,或者前往存储库并加入或开始讨论或提出问题。

相关专题

更多
js获取数组长度的方法
js获取数组长度的方法

在js中,可以利用array对象的length属性来获取数组长度,该属性可设置或返回数组中元素的数目,只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值,也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容,供大家免费下载使用。

553

2023.06.20

js刷新当前页面
js刷新当前页面

js刷新当前页面的方法:1、reload方法,该方法强迫浏览器刷新当前页面,语法为“location.reload([bForceGet]) ”;2、replace方法,该方法通过指定URL替换当前缓存在历史里(客户端)的项目,因此当使用replace方法之后,不能通过“前进”和“后退”来访问已经被替换的URL,语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

374

2023.07.04

js四舍五入
js四舍五入

js四舍五入的方法:1、tofixed方法,可把 Number 四舍五入为指定小数位数的数字;2、round() 方法,可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

731

2023.07.04

js删除节点的方法
js删除节点的方法

js删除节点的方法有:1、removeChild()方法,用于从父节点中移除指定的子节点,它需要两个参数,第一个参数是要删除的子节点,第二个参数是父节点;2、parentNode.removeChild()方法,可以直接通过父节点调用来删除子节点;3、remove()方法,可以直接删除节点,而无需指定父节点;4、innerHTML属性,用于删除节点的内容。

477

2023.09.01

JavaScript转义字符
JavaScript转义字符

JavaScript中的转义字符是反斜杠和引号,可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容,供大家免费下载体验。

394

2023.09.04

js生成随机数的方法
js生成随机数的方法

js生成随机数的方法有:1、使用random函数生成0-1之间的随机数;2、使用random函数和特定范围来生成随机整数;3、使用random函数和round函数生成0-99之间的随机整数;4、使用random函数和其他函数生成更复杂的随机数;5、使用random函数和其他函数生成范围内的随机小数;6、使用random函数和其他函数生成范围内的随机整数或小数。

990

2023.09.04

如何启用JavaScript
如何启用JavaScript

JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍:1、内联脚本是将JavaScript代码直接嵌入到HTML标签中;2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中;3、外部脚本是将JavaScript代码放置在一个独立的文件;4、外部脚本是将JavaScript代码放置在一个独立的文件。

656

2023.09.12

Js中Symbol类详解
Js中Symbol类详解

javascript中的Symbol数据类型是一种基本数据类型,用于表示独一无二的值。Symbol的特点:1、独一无二,每个Symbol值都是唯一的,不会与其他任何值相等;2、不可变性,Symbol值一旦创建,就不能修改或者重新赋值;3、隐藏性,Symbol值不会被隐式转换为其他类型;4、无法枚举,Symbol值作为对象的属性名时,默认是不可枚举的。

551

2023.09.20

公务员递补名单公布时间 公务员递补要求
公务员递补名单公布时间 公务员递补要求

公务员递补名单公布时间不固定,通常在面试前,由招录单位(如国家知识产权局、海关等)发布,依据是原入围考生放弃资格,会按笔试成绩从高到低递补,递补考生需按公告要求限时确认并提交材料,及时参加面试/体检等后续环节。要求核心是按招录单位公告及时响应、提交材料(确认书、资格复审材料)并准时参加面试。

0

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 2.7万人学习

Git版本控制工具
Git版本控制工具

共8课时 | 1.5万人学习

Git中文开发手册
Git中文开发手册

共0课时 | 0人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号