最常用工具是Nokogiri库,支持XML和HTML解析、搜索与修改,安装通过gem install nokogiri或添加至Gemfile,需注意系统依赖如libxml2,在Ubuntu上用apt-get安装必要开发包。

Ruby 处理 XML 数据最常用、最强大的工具是 Nokogiri 库。它支持 XML 和 HTML 的解析、搜索和修改,接口清晰,性能优秀。下面介绍 Nokogiri 的安装方式及其核心用法。
安装 Nokogiri
Nokogiri 是一个 Ruby gem,可通过以下命令安装:
gem install nokogiri如果你使用 Bundler 管理项目依赖,在 Gemfile 中添加:
gem 'nokogiri'然后运行:
bundle install安装过程中可能会提示缺少系统依赖(如 libxml2、libxslt),在 Linux 或 macOS 上可使用包管理器安装。例如在 Ubuntu 上:
sudo apt-get install build-essential patch ruby-dev zlib1g-dev liblzma-dev libxml2-dev libxslt1-dev解析 XML 数据
Nokogiri 可以轻松解析字符串或文件中的 XML 内容。
示例 XML 字符串:
xml_data =XML
使用 Nokogiri 解析:
require 'nokogiri'doc = Nokogiri::XML(xml_data)
puts doc.class # => Nokogiri::XML::Document
查询与遍历节点
Nokogiri 支持通过 CSS 选择器或 XPath 查询节点。
- 使用 CSS 选择器获取所有 book 节点:
books.each do |book|
puts "ID: #{book['id']}"
puts "标题: #{book.at_css('title').content}"
puts "作者: #{book.at_css('author').content}"
end
- 使用 XPath 查询(更灵活):
titles.each { |t| puts t.text }
- 获取属性值:
修改与构建 XML
Nokogiri 也支持修改现有文档或创建新 XML。
- 修改某个节点内容:
title_node.content = 'Ruby 进阶指南'
- 添加新节点:
XML
doc.root.add_child(new_book)
- 输出修改后的 XML:
基本上就这些。Nokogiri 让 Ruby 操作 XML 变得简单高效,无论是读取配置、处理接口数据还是生成报告,都能胜任。熟悉 CSS 和 XPath 语法能大幅提升使用体验。不复杂但容易忽略细节,比如命名空间或编码问题,需根据实际情况调整解析选项。










