XML是一种结构清晰、可读性强的标记语言,用于存储和传输数据。1. 基本结构包括XML声明、根元素和嵌套的子元素与属性,如The Great Gatsby;2. 元素区分大小写,必须正确闭合和嵌套,命名不能以数字或“xml”开头,可包含字母、数字、连字符等;3. 属性提供额外信息,需用引号包围,一个元素内属性名不可重复,不支持多值;4. 特殊字符需用实体引用表示,如&代表&,也可使用CDATA区块包裹含特殊字符的内容;5. 注释格式为,空白字符会被保留,需注意格式化对可读性和文件大小的影响。掌握这些规则即可编写合法的XML文档。

XML(可扩展标记语言)是一种用于存储和传输数据的标记语言,它的设计重点是简洁、可读性强,并且结构清晰。下面介绍 XML 的基本语法和规则,帮助你快速入门。
1. XML 文档的基本结构
一个标准的 XML 文档通常包含以下部分:
- XML 声明:写在文档最开头,用来声明 XML 版本和编码方式(可选但推荐)。
- 根元素:整个文档必须有且仅有一个根元素,所有其他元素都嵌套在它里面。
- 元素和属性:用于组织和描述数据。
上面的例子中,bookstore 是根元素,book 是子元素,category 是属性。
2. XML 元素语法规则
元素是 XML 的核心构建块,必须遵循以下规则:
- 元素名称区分大小写:
和是不同的。 - 元素必须正确闭合:每个开始标签
必须有对应的结束标签,或使用自闭合形式。 - 元素必须正确嵌套:不能交叉嵌套,例如
是错误的。 - 元素名不能以数字或 XML 开头,如
或不合法。 - 元素名可以包含字母、数字、连字符、下划线和点,但建议使用有意义的名称。
3. XML 属性规则
属性提供有关元素的额外信息,写在开始标签内:
- 属性值必须用引号包围,可以是双引号或单引号,推荐使用双引号。
- 一个元素可以有多个属性,但属性名不能重复。
- 属性不能包含多个值(不像 HTML 的 class),如需多个值应使用子元素。
示例:
4. 特殊字符与实体引用
某些字符在 XML 中有特殊含义,不能直接使用,需用实体引用代替:
-
&写成& 写成zuojiankuohaophpcn-
>写成youjiankuohaophpcn -
"写成" -
'写成'
也可以使用 CDATA 区块包裹大段含特殊字符的内容:
costs 500 pages long.]]>
5. 注释和空白处理
注释用于说明内容,不会被解析器处理:
XML 会保留换行、空格等空白字符,所以格式化时要注意可读性与文件大小的平衡。
基本上就这些。掌握这些基础语法规则后,你就能写出结构正确、易于解析的 XML 文件了。不复杂但容易忽略细节,多练习几次就能熟练。










