0

0

如何配置XML解析器禁用外部实体 防止XXE攻击

煙雲

煙雲

发布时间:2026-01-02 11:26:02

|

903人浏览过

|

来源于php中文网

原创

禁用外部实体引用可防止XXE攻击,需在Java(DOM/SAX/StAX)、.NET、Python、PHP及Node.js等各平台解析器中分别配置安全选项,如禁用DOCTYPE、关闭外部实体加载、启用安全处理模式等。

如何配置xml解析器禁用外部实体 防止xxe攻击

如果您在应用程序中使用XML解析器处理不受信任的XML输入,而未禁用外部实体引用,则可能遭受XML外部实体(XXE)攻击。以下是禁用外部实体以防止XXE攻击的多种配置方法:

一、Java DOM解析器配置

Java的DOM解析器默认允许加载外部实体,需显式设置相关属性来禁用该行为。通过DocumentBuilderFactory控制解析器的安全特性可有效阻止XXE。

1、创建DocumentBuilderFactory实例并设置为非验证模式。

2、调用setFeature方法禁用http://apache.org/xml/features/disallow-doctype-decl特性。

3、调用setFeature方法禁用http://xml.org/sax/features/external-general-entitieshttp://xml.org/sax/features/external-parameter-entities特性。

4、设置http://javax.xml.XMLConstants/feature/secure-processing为true以启用安全处理模式。

5、使用configureFactory获得DocumentBuilder并解析XML输入。

二、Java SAX解析器配置

SAX解析器通过XMLReader或SAXParser控制解析行为,必须在解析前关闭外部实体加载能力,否则将暴露于XXE风险。

1、获取SAXParserFactory实例并调用setFeature方法。

2、禁用http://xml.org/sax/features/external-general-entities特性。

3、禁用http://xml.org/sax/features/external-parameter-entities特性。

4、启用http://javax.xml.XMLConstants/feature/secure-processing特性。

5、使用SAXParser解析XML流时确保上述配置已生效。

三、Java StAX解析器配置

StAX解析器(如Woodstox或Sun's default)需通过XMLInputFactory设置安全属性,防止在事件驱动解析过程中加载外部DTD或实体。

1、调用XMLInputFactory.newInstance()获取工厂实例。

2、设置javax.xml.stream.isSupportingExternalEntities属性为false。

3、设置javax.xml.stream.supportDTD属性为false。

4、若使用Woodstox,额外设置com.ctc.wstx.prop.loadExternalDTD为false。

5、使用createXMLStreamReader创建解析器并传入受控输入源。

四、.NET XmlReader配置

.NET平台中的XmlReader默认启用DTD处理,需显式禁用外部实体解析以规避XXE漏洞。通过XmlReaderSettings对象集中管理安全策略。

1、新建XmlReaderSettings实例并设置DtdProcessing属性为DtdProcessing.Prohibit。

2、将XmlResolver属性设为null以阻止任何外部资源解析。

ChatX翻译
ChatX翻译

最实用、可靠的社交类实时翻译工具。 支持全球主流的20+款社交软件的聊天应用,全球200+语言随意切换。 让您彻底告别复制粘贴的翻译模式,与世界各地高效连接!

下载

3、设置IgnoreComments、IgnoreProcessingInstructions和IgnoreWhitespace为true以减少攻击面。

4、启用MaxCharactersFromEntities限制实体展开深度。

5、使用XmlReader.Create方法配合该Settings实例创建安全解析器。

五、Python xml.etree.ElementTree配置

Python标准库中的ElementTree默认不解析DTD,但若与xmlparser配合使用或启用recover模式,仍可能触发外部实体加载。需强制隔离解析上下文。

1、避免使用xml.etree.ElementTree.parse()直接解析不可信输入。

2、改用xml.etree.ElementTree.XMLParser()并传入target=TreeBuilder()

3、在构造XMLParser时指定resolve_entities=False参数。

4、对输入XML预处理,移除DOCTYPE声明及内部子集中的ENTITY定义。

5、使用defusedxml库替代标准xml模块,其defusedxml.ElementTree.parse()默认禁用全部外部实体。

六、PHP libxml配置

PHP的libxml扩展(如simplexml_load_string、DOMDocument)依赖底层libxml设置。必须在解析前全局或局部禁用外部实体加载功能。

1、调用libxml_disable_entity_loader(true)全局禁用实体加载。

2、若使用DOMDocument,设置$dom->loadXML($xml, LIBXML_NOENT | LIBXML_DTDLOAD)改为仅使用LIBXML_NOENT且不包含LIBXML_DTDLOAD

3、调用libxml_set_external_entity_loader(null)清除自定义加载器。

4、对simplexml_load_string等函数,确保第二个参数未启用LICENSE_XML_DTD标志。

5、升级libxml至2.9.0以上版本,并确认编译时未启用--with-libxml以外的危险选项。

七、Node.js xmldom或xml2js配置

Node.js生态中常用xmldom或xml2js解析XML,二者均存在默认启用外部实体的风险,需通过选项或补丁方式关闭。

1、使用xmldom时,在创建DOMParser实例时传入{ forbidDTD: true, forbidEntity: true }选项。

2、若使用旧版xmldom,手动重写DOMImplementation.prototype.createDocument以拦截实体解析逻辑。

3、对于xml2js,设置options.explicitRoot = false并启用options.ignoreAttrs = true降低攻击可能性。

4、在xml2js中注入自定义attrValueProcessors,过滤含SYSTEMPUBLIC关键字的实体声明。

5、优先选用@rgrove/sanitize-xml等专用防护库对输入进行预清洗,移除DOCTYPE及ENTITY节点。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

718

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

627

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

744

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1236

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

700

2023.08.11

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

74

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 8.2万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 6.9万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号