
for $s in doc('ps.xml')//symocc: 这部分迭代 xml 文档 ps.xml 中所有
元素。$s 变量代表每个 元素。 where $s/DATE > '2012-06-05': 这部分过滤掉日期早于或等于 2012 年 6 月 5 日的
元素。 -
and (every $s1 in doc('Ps.xml')//SYMOCC satisfies not($s1/DATE > '2012-06-05') or $s1/DATE >= $s/DATE): 这部分是最复杂的部分。它使用 every 关键字来检查文档中的 每个
元素 ($s1) 是否满足以下条件之一: - not($s1/DATE > '2012-06-05'): $s1 的日期不晚于 2012 年 6 月 5 日。
- $s1/DATE >= $s/DATE: $s1 的日期晚于或等于 $s 的日期。
换句话说,只有当 $s 的日期是 2012 年 6 月 5 日之后最早的日期时,整个 where 子句才会为真。
satisfies 和 not 的工作方式
satisfies 关键字用于检查序列中的每个元素是否满足某个条件。not() 函数用于否定一个条件。
在原始查询中,satisfies not($s1/DATE > '2012-06-05') 意味着对于文档中的每个
satisfies ($s1/DATE = '2012-06-05') 等价。但与 satisfies not($s1/DATE > '2012-06-05')不等价,因为当
OR 与 AND 的选择
使用 OR 是因为我们需要确保 $s 的日期是满足条件的最早日期。如果使用 AND,则条件会变得更加严格,可能导致查询返回空结果。
使用 >= 而不是 >
使用 >= 是为了处理多个症状在同一天出现的情况。如果只使用 >,则只会返回第一个符合条件的症状,而忽略同一天出现的其他症状。
更简洁的解决方案
原始查询的逻辑比较复杂,可读性较差。可以使用以下更简洁的 XQuery 解决方案:
let $selected :=
for $s in doc('Ps.xml')//SYMOCC[DATE]
where $s/DATE > '2012-06-05'
order by $s/DATE
return $s
return $selected[DATE = $selected[1]/DATE]这个查询的工作方式如下:
-
for $s in doc('Ps.xml')//SYMOCC[DATE]: 迭代 XML 文档 Ps.xml 中所有包含
子元素的 元素。 -
where $s/DATE > '2012-06-05': 过滤掉日期早于或等于 2012 年 6 月 5 日的
元素。 -
order by $s/DATE: 按照
子元素的值对结果进行排序。 -
return $s: 返回排序后的
元素。 - return $selected[DATE = $selected[1]/DATE]: 返回所有日期等于排序后第一个元素的日期的元素。这确保了只返回最早日期的所有症状。
这个查询更加简洁易懂,并且通常比原始查询更有效率。
注意事项
- 确保 XML 文档 Ps.xml 存在并且可以被 BaseX 访问。
子元素的格式必须是 YYYY-MM-DD。 - 如果 XML 文档中没有晚于 2012 年 6 月 5 日的症状,则查询将返回空结果。
总结
XQuery 是一种强大的语言,可以用于查询和转换 XML 数据。理解 XQuery 的声明式编程思想是编写高效查询的关键。通过分析原始查询并提供更简洁的解决方案,本文旨在帮助你更好地理解 XQuery 的工作方式,并掌握如何使用它来解决实际问题。记住,编写可读性强的代码至关重要,即使这意味着需要花费更多的时间来思考更简洁的解决方案。










