CDATA是XML中用于包裹不被解析的原始文本的标记,以结尾,中间内容原样保留;适用于SQL、HTML、JavaScript等含敏感字符的场景,但不可嵌套且不能包含]]>。

CDATA 是 XML 中用来包裹“不希望被解析的原始文本”的特殊标记。它的核心作用就一个:让解析器跳过其中内容,原样保留,不作任何语法处理。
CDATA 的基本写法
格式固定,必须严格遵守:
- 以 开头(注意:左方括号前是感叹号,无空格)
- 中间放任意文本,包括
、>、&、双引号等 XML 敏感字符 - 以 ]]> 结尾(三个字符紧连,不能有空格或换行)
例如:
为什么需要 CDATA
XML 解析器默认会把所有文本当作“可解析内容”处理。一旦遇到 就可能误判为新标签开始,& 可能被当成实体引用开头,导致报错或数据截断。CDATA 就是给这类“危险内容”划出安全区。
常见触发场景包括:
- SQL 语句里含
、>=等比较符(如 MyBatis 的 XML 映射文件) - 内嵌 HTML 片段,比如富文本字段:
欢迎加粗]]> - CSS 或 JavaScript 代码块,避免样式/逻辑被 XML 解析干扰
- 日志、错误信息、用户输入等含不可控字符的纯文本
使用时要注意的关键细节
看似简单,但几个硬性限制常被忽略:
-
不能嵌套:CDATA 区块内部不能再出现
或]]> -
结尾字符串不能拆分:
]]>必须连续出现,中间加空格、换行或注释都会导致解析失败 -
不解决所有问题:如果整个元素本身被动态标签(如 MyBatis 的
)包裹,再套 CDATA 反而会让 XML 解析器跳过条件逻辑——CDTA 只保护它直接包裹的内容 - 范围尽量小:只把真正含特殊字符的部分放进 CDATA,不要整段内容都包,否则可能掩盖结构问题
CDATA 和转义字符怎么选
两者都能解决特殊字符问题,但策略不同:
- 少量字符(比如单个
&或)用转义更轻量:&、zuojiankuohaophpcn - 大段内容、含多处敏感符号、或需保持可读性(如代码、HTML)时,CDATA 更清晰可靠
- 如果内容由程序生成且无法预知是否含
]]>,要先做清理或改用转义,因为 CDATA 内出现]]>会提前终止区块
基本上就这些。用对地方,CDATA 是 XML 里很安静又很管用的一个小工具。










