讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

XPath的@符号是什么意思？怎么选择属性？

畫卷琴夢

发布时间：2025-08-11 21:24:02

|

985人浏览过

|

来源于php中文网

原创

xpath中根据属性值定位元素的关键是使用@符号结合属性名和匹配条件，最常见的写法是//tagname[@attributename='attributevalue']，例如//div[@id='main']可精准定位id为main的div元素；当需要处理不完全匹配的场景时，可借助contains(@attributename, 'substring')判断属性值是否包含指定子串，如//[contains(@class, 'active')]用于匹配class包含active的元素；starts-with(@attributename, 'prefix')可匹配以特定字符串开头的属性值，如//[starts-with(@id, 'user-')]用于选取id以user-开头的元素；ends-with函数（仅xpath 2.0+支持）可判断结尾字符串；normalize-space()可用于清理属性值中的多余空白；还可通过and、or逻辑运算符组合多个属性条件，如//a[@href='/products' and @class='nav-link']；当属性名不确定时，可用@匹配任意属性，或结合name()函数判断属性名，如//[starts-with(name(@*), 'data-')]用于选取具有以data-开头属性名的元素；此外，属性选择（@）与文本内容选择（text()）有本质区别，@用于获取标签内的元数据（如id、class），而text()用于获取标签间的文本内容，二者不可混淆，正确理解这一差异是高效使用xpath的基础。

XPath的@符号是什么意思？怎么选择属性？

XPath表达式中的

符号，它是一个明确的指示符，告诉解析器你正在寻找的是元素的“属性”（attribute），而不是它的子元素或文本内容。简单来说，它就是用来选择HTML或XML标签内部那些键值对信息（比如

id="myId"

或

class="button"

）的。当你需要根据这些属性来定位或提取数据时，

符号就是你的利器。

解决方案

理解

符号的关键在于，它将你的焦点从元素本身转移到了元素的元数据上。一个HTML标签，比如

，它有

div

这个标签名，也有

id

和

class

这两个属性。如果你想选择这个

div

元素，通常会用

//div

。但如果你想基于它的

id

属性来选择，或者仅仅是想获取它的

class

属性值，

就派上用场了。

最常见的用法是

@attributeName

。例如，要选择所有带有

id

属性的元素，你可以写

//*[@id]

。这里的

代表任何元素，

[@id]

则表示这个元素必须有一个

id

属性。如果我想更精确地选择那个

id

为

main

的

div

，表达式会是

//div[@id='main']

。这真的是我用XPath时最常用的模式之一，因为它能非常精准地定位到页面上独一无二的元素。

当然，你也可以直接选择某个元素的特定属性值。比如，要获取上述

div

的

class

属性值，表达式是

//div[@id='main']/@class

。这个表达式会返回

container

这个字符串。这种能力在处理那些内容不固定，但属性值相对稳定的元素时特别有用，比如一个按钮的

data-action

属性。

XPath其实也提供了一个更冗长的写法，叫做

attribute::attributeName

，比如

//div/attribute::id

。但说实话，日常开发中几乎没人这么写，

符号实在是太简洁、太直观了，它已经成了XPath里一个约定俗成的惯例。在我看来，这种简洁性是XPath能够如此流行的原因之一。

XPath中如何根据属性值定位元素？

在我个人的经验里，根据属性值定位元素是XPath最核心、最实用的功能之一，简直是网页抓取和自动化测试的基石。当你面对一个复杂的网页，仅仅靠标签名或层级关系往往不够，因为很多元素可能长得一样，但它们的属性值却能区分彼此。

最直接的方式就是使用等号

进行精确匹配：

//tagName[@attributeName='attributeValue']

例如，如果你想找到所有

class

属性值为

button primary

的按钮，你可以写：

//button[@class='button primary']

这会找到所有

这样的元素。

但实际情况往往更复杂，属性值可能不完全匹配，或者包含动态部分。这时候，XPath提供了一些非常实用的函数来处理这种情况：

```
contains(string, substring)
```
：检查一个字符串是否包含另一个子字符串。这在我处理CSS类名时特别常见，一个元素可能同时有多个类，比如
```
class="item active selected"
```
。如果我只关心它是否是
```
active
```
的，我就会用：
```
//*[contains(@class, 'active')]
```
这会匹配任何
```
class
```
属性中包含
```
active
```
这个词的元素。这比精确匹配要灵活得多，也更能适应前端框架动态添加类名的场景。
```
starts-with(string, substring)
```
：检查一个字符串是否以某个子字符串开头。这对于那些有命名规范的属性非常有用，比如
```
id="user-123"
```
、
```
id="user-456"
```
。如果你想找到所有用户相关的元素，可以这样：
```
//*[starts-with(@id, 'user-')]
```
```
ends-with(string, substring)
```
(XPath 2.0及以上支持，很多浏览器内置的XPath解析器可能不支持，需要注意兼容性)：检查一个字符串是否以某个子字符串结尾。
```
//*[ends-with(@src, '.png')]
```
```
normalize-space(string)
```
：移除字符串开头和结尾的空白字符，并用单个空格替换字符串内部的连续空白字符。这在处理一些不规范的HTML时非常有用，比如属性值可能有多余的空格。
```
//div[normalize-space(@class)='card']
```

or

和
and
运算符：你可以组合多个条件来更精确地定位。

//a[@href='/products' and @class='nav-link']

或者

//button[@id='submit' or @name='send']

这些灵活的匹配方式，让XPath在处理各种复杂的网页结构时显得游刃有余。我经常发现，一个看似无从下手的问题，通过巧妙地组合这些属性匹配函数，就能迎刃而解。

NanoAI

NanoAI

AI绘画与智能图片编辑平台

下载

当属性名不确定时，XPath如何灵活选择？

有时候，你会遇到一些“顽皮”的网页，它们的属性名可能不是固定的，或者你希望选择所有具有任何属性的元素。这种情况下，XPath同样提供了解决方案，让我觉得它在设计上考虑得相当周全。

最直接的方式是使用

通配符来匹配任何属性：

//*[@*]

这个表达式会选择页面上所有至少拥有一个属性的元素。这在某些场景下非常有用，比如你想统计页面上所有带有自定义属性（如

data-*

）的元素，但你不知道具体的属性名。

如果你需要更进一步，例如，你只想选择那些属性名以特定前缀开头的属性，或者你想获取所有属性的名称，

name()

函数就能派上用场了。

//*[starts-with(name(@*), 'data-')]

这个表达式会选择所有至少有一个属性，且该属性名以

data-

开头的元素。这对于处理现代前端框架中大量使用的

data-

属性非常有效。比如，你可能想抓取所有

data-id

或

data-value

的元素，而不需要关心具体的

data-

属性名是什么。

另一个场景是，你可能知道元素肯定有一个特定的属性，但它的名字可能会变。例如，一个验证码图片的URL可能在

src

属性里，也可能在

data-src

里。这时候，你可以用

or

来尝试匹配多个可能的属性名：

//img[@src or @data-src]

这会匹配任何有

src

属性或者有

data-src

属性的

img

标签。

虽然这些高级用法不那么常用，但它们的存在，无疑增强了XPath处理复杂、动态网页的能力。我个人觉得，当你需要处理一些“非典型”的定位需求时，这些技巧往往能帮你打开思路。

XPath属性选择与文本内容选择有何不同？

这是XPath初学者经常会混淆的一个点，但理解它们的区别至关重要。简单来说，属性选择是关于元素“标签内部的元信息”，而文本内容选择则是关于元素“标签之间包裹的内容”。

想象一个HTML片段：

Hello World!

属性选择 (
```
@
```
)：当你使用
```
@
```
符号时，你是在关注
标签内部的
```
class="intro"
```
这部分。
- ```
//p/@class
```
  ：这会返回
```
intro
```
  。它获取的是
```
p
```
  元素的
```
class
```
  属性的值。
- 你不能用
```
//p/@text()
```
  ，因为
```
text()
```
  不是一个属性，它是内容。
文本内容选择 (
```
text()
```
)：当你使用
```
text()
```
函数时，你是在关注
标签开始和结束标签之间包裹的可见文本。
- ```
//p/text()
```
  ：这会返回
```
Hello
```
  和
```
!
```
  （注意，它会返回直接子文本节点，不包含子元素
  内的文本）。
- 如果你想获取一个元素及其所有子元素拼接起来的完整文本内容（包括
```
World
```
  中的
```
World
```
  ），通常会直接选择元素，然后获取其
```
string-value
```
  ，或者在某些库中调用
```
.text()
```
  方法。在XPath表达式中，
```
//p
```
  通常会代表整个
```
p
```
  元素的节点，当它被转换为字符串时，会包含其所有后代文本。
- 你不能用
```
//p[@text()='Hello World!']
```
  来定位，因为
```
text()
```
  是节点测试，不是属性。正确的定位方式是
```
//p[contains(., 'Hello World!')]
```
  或者
```
//p[text()='Hello World!']
```
  （如果文本是直接子节点）。

核心区别总结：

@attributeName
：指向元素的某个特定属性的值。它存在于元素的“开标签”内部。
text()
：指向元素的直接文本子节点。它存在于元素的“开标签”和“闭标签”之间。
.
(点号)：在谓语中，
```
.
```
代表当前节点。当用于字符串比较时，它通常会取当前节点的字符串值，这通常是其所有后代文本内容的拼接。例如，
```
//p[contains(., 'World')]
```
会匹配包含“World”的
```
p
```
元素，无论“World”是在
```
p
```
的直接文本中还是在其子元素
```
span
```
中。

理解这个根本差异，是高效编写XPath表达式的关键。在我看来，区分清楚“元数据”（属性）和“实际内容”（文本）是XPath学习过程中非常重要的一步，它能帮助你避免很多常见的错误，并更精准地定位目标。

相关文章

如何将XML数据可视化 XML数据图表生成方法

Schematron是什么基于规则的XML验证语言

C# XmlDocument怎么用 XmlDocument类操作XML教程

Oracle数据库怎么处理XML数据 Oracle XML DB使用教程

如何用Ansible的xml模块修改配置文件

相关标签:

css 浏览器 ai 区别键值对 css html 前端框架 String 运算符逻辑运算符 xml 字符串 class Attribute href 自动化

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：XML的XInclude错误处理机制有哪些注意事项？下一篇：XPath的last()函数有什么作用？怎么用？

作者最新文章

在线使用美图秀秀网页版美图秀秀P图软件官网入口

2025-12-24 13:04

Python如何安全地解析不可信的XML DefusedXML

2025-12-24 13:19

币圈十大交易所app排行榜(2026年最新排名)

2025-12-24 13:59

中通快递手机号查单号中通快递官方授权查询入口

2025-12-24 14:00

欧意交易所app官方下载v6.151.0官方安卓版

2025-12-24 14:12

百度搜索栏ai怎么关百度搜索栏ai图标去除教程

2025-12-24 14:35

C# XmlDocument怎么用 XmlDocument类操作XML教程

2025-12-24 14:50

如何用Python的requests-xml库简化XML请求

2025-12-24 14:53

爱奇艺会员中心登录入口爱奇艺VIP官方网站入口

2025-12-24 14:54

Excel怎么导入XML数据 XML数据源设置方法

2025-12-24 14:54

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

css

css

css是层叠样式表，用来表现HTML或XML等文件样式的计算机语言，不仅可以静态地修饰网页，还可以配合各种脚本语言动态地对网页各元素进行格式化。php中文网还为大家带来html的相关下载资源、相关课程以及相关文章等内容，供大家免费下载使用。

495

2023.06.15

css居中

css居中

css居中：1、通过“margin: 0 auto; text-align: center”实现水平居中；2、通过“display:flex”实现水平居中；3、通过“display:table-cell”和“margin-left”实现居中。本专题为大家提供css居中的相关的文章、下载、课程内容，供大家免费下载体验。

258

2023.07.27

css如何插入图片

css如何插入图片

cssCSS是层叠样式表(Cascading Style Sheets)的缩写。它是一种用于描述网页或应用程序外观和样式的标记语言。CSS可以控制网页的字体、颜色、布局、大小、背景、边框等方面，使得网页的外观更加美观和易于阅读。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

731

2023.07.28

css超出显示...

css超出显示...

在CSS中，当文本内容超出容器的宽度或高度时，可以使用省略号来表示被隐藏的文本内容。本专题为大家提供css超出显示...的相关文章，相关教程，供大家免费体验。

531

2023.08.01

css字体颜色

css字体颜色

CSS中，字体颜色可以通过属性color来设置，用于控制文本的前景色，字体颜色在网页设计中起到很重要的作用，具有以下表现作用：1、提升可读性；2、强调重点信息；3、营造氛围和美感；4、用于呈现品牌标识或与品牌形象相符的风格。

746

2023.08.10

什么是css

什么是css

CSS是层叠样式表（Cascading Style Sheets）的缩写，是一种用于描述网页（或其他基于 XML 的文档）样式与布局的标记语言，CSS的作用和意义如下：1、分离样式和内容；2、页面加载速度优化；3、实现响应式设计；4、确保整个网站的风格和样式保持统一。

592

2023.08.10

css三角形怎么写

css三角形怎么写

CSS可以通过多种方式实现三角形形状，本专题为大家提供css三角形怎么写的相关教程，大家可以免费体验。

554

2023.08.21

css设置文字颜色

css设置文字颜色

CSS（层叠样式表）可以用于设置文字颜色，这样做有以下好处和优势：1、增加网页的可视化效果；2、突出显示某些重要的信息或关键字；3、增强品牌识别度；4、提高网页的可访问性；5、引起不同的情感共鸣。

386

2023.08.22

苹果官网入口直接访问

苹果官网入口直接访问

苹果官网直接访问入口是https://www.apple.com/cn/，该页面具备0.8秒首屏渲染、HTTP/3与Brotli加速、WebP+AVIF双格式图片、免登录浏览全参数等特性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

10

2025.12.24

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

XPath 参考手册

XPath 参考手册

共0课时 | 0人学习

XPath 教程

XPath 教程

共9课时 | 3.6万人学习

Sass 教程

Sass 教程

共14课时 | 0.7万人学习

最新文章

更多

SBML是什么系统生物学标记语言XML规范

Python如何从XML中提取所有URL链接

怎么用CSS选择器选择XML元素

Salesforce的package.xml文件怎么写

Ant的xmlproperty任务怎么用加载XML属性

Java怎么用JAXB注解控制XML元素名 @XmlElement

Java怎么用JAXB生成XSD Schema

Web Service中XML怎么用 SOAP消息XML结构

DTD中的ATTLIST怎么定义元素属性

XML和YAML哪个更好 YAML与XML详细对比

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部