0

0

C#“XML文档中存在错误”异常处理方法

月夜之吻

月夜之吻

发布时间:2025-12-29 16:03:45

|

631人浏览过

|

来源于php中文网

原创

应通过XmlReaderSettings配合XmlReader捕获行号列号精确定位XML解析错误,并预检XML声明与实际编码(含BOM)的一致性,避免因格式不合法、编码错配、标签未闭合或控制字符引发异常。

c#“xml文档中存在错误”异常处理方法

当C#程序在加载或解析XML文档时抛出“XML文档中存在错误”异常,通常是由于XML内容格式不合法、编码不匹配、标签未正确闭合或存在不可见控制字符所致。以下是针对该异常的多种处理方法:

一、验证XML字符串合法性并捕获具体错误位置

使用XmlReaderSettings配合XmlReader可捕获详细的解析错误信息,包括行号和列号,便于准确定位问题源。

1、创建XmlReaderSettings实例,并将ValidationType设为None,同时启用DtdProcessing以支持外部DTD检查(如需)。

2、设置XmlReaderSettings的XmlResolver为null,防止意外加载外部实体。

3、使用XmlReader.Create()传入XML字符串流和配置好的XmlReaderSettings,并在外层包裹try-catch块捕获XmlException。

4、在catch块中读取XmlException.LineNumber和XmlException.LinePosition属性,输出错误发生的精确行号与列号

二、预检XML声明与编码一致性

XML文档开头的声明(如)必须与实际字节流编码严格一致,否则会触发解析失败。

1、读取XML原始字节数组,使用Encoding.UTF8.GetString()或对应编码解码前,先检测BOM(字节顺序标记)。

2、若XML字符串以"

3、根据提取的编码名(如"UTF-8"、"GBK")动态选择Encoding.GetEncoding()获取对应编码对象。

4、使用该编码对象重新将原始字节数组解码为字符串,再传入XDocument.Load()或XmlReader。

5、若编码声明缺失或无法识别,默认采用UTF-8且忽略BOM以外的编码提示

三、清理不可见控制字符与非法Unicode字符

XML 1.0标准禁止部分Unicode控制字符(如U+0000–U+0008、U+000B–U+000C、U+000E–U+001F),其存在会导致XmlException。

1、定义正则表达式@"[\x00-\x08\x0B\x0C\x0E-\x1F]"用于匹配非法控制字符。

2、对原始XML字符串调用Regex.Replace(),将匹配到的字符替换为空字符串。

笔灵AI论文写作
笔灵AI论文写作

免费生成毕业论文、课题论文、千字大纲,几万字专业初稿!

下载

3、额外检查是否存在U+FFFE、U+FFFF等永久未分配字符,使用Regex(@"\uFFFE|\uFFFF")进行清除。

4、清理后再次尝试加载,确保所有XML非法控制字符已被移除

四、使用XDocument.Validate()执行XSD模式验证

即使XML语法合法,若不符合业务定义的XSD结构,也可能在后续操作中引发隐性错误;提前验证可暴露元素缺失、类型错误等问题。

1、加载XSD文件为XmlSchemaSet实例,并添加至集合中。

2、创建ValidationEventHandler委托,用于接收验证警告与错误。

3、调用XDocument.Validate()方法,传入XmlSchemaSet和事件处理器。

4、在事件处理器中判断EventArgs.Severity是否为XmlSeverityType.Error,若是则记录XSD层面的具体约束违反项

五、回退至容错解析:使用HtmlAgilityPack模拟宽松加载

当XML来源不可控(如第三方HTTP响应、用户上传文件),且必须尽力提取有效节点时,可借助HTML解析器的容错能力间接处理类XML片段。

1、安装HtmlAgilityPack NuGet包。

2、创建HtmlDocument实例,调用LoadHtml()方法传入原始XML字符串。

3、禁用HtmlDocument.OptionFixNestedTags以避免自动修正嵌套逻辑。

4、遍历HtmlDocument.DocumentNode.SelectNodes("//node()")获取所有节点,手动映射为XElement结构。

5、此方式不保证XML标准合规性,但可绕过严格解析失败,提取可识别的标签与文本内容

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

227

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

432

2024.03.01

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1846

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2080

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

917

2024.11.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

246

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

204

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1429

2023.10.24

ip地址修改教程大全
ip地址修改教程大全

本专题整合了ip地址修改教程大全,阅读下面的文章自行寻找合适的解决教程。

121

2025.12.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Rust 教程
Rust 教程

共28课时 | 3.9万人学习

Git 教程
Git 教程

共21课时 | 2.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号