XPath 2.0 的 for、if、in 均为表达式而非语句,必须嵌入合法上下文;for 需 return 构造序列,if 必须带 else 且类型一致,in 仅用于成员判断且右操作数须为序列。

XPath 2.0 的 for、if、in 不是独立语句,而是表达式的一部分,必须嵌入在合法的 XPath 表达式上下文中(比如路径结尾、函数参数里),不能单独执行。
for 表达式:怎么写循环并拼接结果
for 是一个序列映射构造器,类似函数式语言的 map,不是传统 for 循环。它必须配合 return 子句,且整个表达式返回一个序列。
- 语法结构固定:
for $x in $seq return $x * 2,$x是绑定变量,$seq必须是可迭代序列(如节点集、数字列表) - 常见错误:漏写
return→ 报错XPDY0002(unexpected token "in") - 不能修改外部变量,也不支持 break/continue
- 典型用途:批量计算属性值、生成新节点序列、转换文本列表
for $i in (1, 2, 3) return $i * 10
结果是序列:(10, 20, 30)
if 表达式:必须带 else,且类型要一致
if 是三元表达式,不是控制语句。XPath 2.0 要求必须有 else 分支,否则语法错误(XPST0003)。
- 条件部分必须是布尔值或可转为布尔的序列(空序列→
false(),非空→true()) -
then和else返回值类型最好一致;若不一致(如一个返回字符串、一个返回数字),XPath 引擎可能隐式转换,也可能报错(取决于实现) - 不能只用于“副作用”,比如
if (@type = 'email') then xdmp:log('found')在标准 XPath 中无效——xdmp:log是 MarkLogic 扩展,纯 XPath 2.0 没有副作用函数
if (@price > 100) then 'expensive' else 'affordable'
in 运算符:只用于成员判断,不是 for 的一部分
in 是二元运算符,用于测试单个项是否属于某个序列,和 Python 的 in 类似,但**不能**出现在 for $x in ... 之外的任意位置作逻辑判断(比如不能写 @id in ('a', 'b') 当作谓词直接用——这是合法的;但不能写 if (@id in 'a') then ...,因为右边不是序列)。
- 左边必须是单个原子值(如字符串、数字),右边必须是原子值序列
- 常见误用:
@status in 'active'→ 错,'active'是字符串,不是序列;应写成@status = 'active'或@status in ('active') - 等价但更常用的是
=(自动集合比较),in更适合明确枚举多个候选值
@role in ('admin', 'editor', 'reviewer')组合使用:for + if + in 的典型场景
真正实用的写法往往是嵌套组合,比如过滤后映射:
- 先用
for遍历节点,再在return里用if分支处理,其中条件可能含in - 注意括号优先级:
for $n in //item return if ($n/@cat in ('book', 'mag')) then $n/title else () - 返回空序列
()表示跳过该节点,最终结果只含匹配项的title - 性能提示:避免在
for内部重复执行耗时路径(如//config/value),应提前绑定到变量
for $u in /users/user
return if ($u/role in ('vip', 'staff'))
then concat('VIP-', $u/id)
else $u/name最容易被忽略的是:所有这些表达式都运行在静态上下文里,没有变量赋值、没有状态、不能递归调用自身——它们只是对输入序列的一次性、无副作用的函数式变换。写之前先确认你的处理器(如 Saxon、BaseX、浏览器 DOM)确实支持 XPath 2.0;多数浏览器仅支持 XPath 1.0,for/if/in 会直接报语法错误。










