0

0

Ruby如何处理xml数据 Nokogiri库的安装与核心用法

煙雲

煙雲

发布时间:2025-11-12 18:23:13

|

197人浏览过

|

来源于php中文网

原创

最常用工具是Nokogiri库,支持XML和HTML解析、搜索与修改,安装通过gem install nokogiri或添加至Gemfile,需注意系统依赖如libxml2,在Ubuntu上用apt-get安装必要开发包。

ruby如何处理xml数据 nokogiri库的安装与核心用法

Ruby 处理 XML 数据最常用、最强大的工具Nokogiri 库。它支持 XML 和 HTML 的解析、搜索和修改,接口清晰,性能优秀。下面介绍 Nokogiri 的安装方式及其核心用法。

安装 Nokogiri

Nokogiri 是一个 Ruby gem,可通过以下命令安装:

gem install nokogiri

如果你使用 Bundler 管理项目依赖,在 Gemfile 中添加:

gem 'nokogiri'

然后运行:

bundle install

安装过程中可能会提示缺少系统依赖(如 libxml2、libxslt),在 Linux 或 macOS 上可使用包管理器安装。例如在 Ubuntu 上:

sudo apt-get install build-essential patch ruby-dev zlib1g-dev liblzma-dev libxml2-dev libxslt1-dev

解析 XML 数据

Nokogiri 可以轻松解析字符串或文件中的 XML 内容。

Word-As-Image for Semantic Typography
Word-As-Image for Semantic Typography

文字变形艺术字、文字变形象形字

下载

示例 XML 字符串:

xml_data =

Ruby 入门
张三


Rails 实战
李四


XML

使用 Nokogiri 解析:

require 'nokogiri'

doc = Nokogiri::XML(xml_data)
puts doc.class # => Nokogiri::XML::Document

查询与遍历节点

Nokogiri 支持通过 CSS 选择器或 XPath 查询节点。

  • 使用 CSS 选择器获取所有 book 节点:
books = doc.css('book')
books.each do |book|
puts "ID: #{book['id']}"
puts "标题: #{book.at_css('title').content}"
puts "作者: #{book.at_css('author').content}"
end
  • 使用 XPath 查询(更灵活):
titles = doc.xpath('//book/title')
titles.each { |t| puts t.text }
  • 获取属性值:
book_id = doc.at_xpath('//book/@id').value # 获取第一个 book 的 id

修改与构建 XML

Nokogiri 也支持修改现有文档或创建新 XML。

  • 修改某个节点内容:
title_node = doc.at_css('book[id="1"] title')
title_node.content = 'Ruby 进阶指南'
  • 添加新节点:
new_book =
Nokogiri 使用手册
王五

XML

doc.root.add_child(new_book)
  • 输出修改后的 XML:
puts doc.to_xml

基本上就这些。Nokogiri 让 Ruby 操作 XML 变得简单高效,无论是读取配置、处理接口数据还是生成报告,都能胜任。熟悉 CSS 和 XPath 语法能大幅提升使用体验。不复杂但容易忽略细节,比如命名空间或编码问题,需根据实际情况调整解析选项。

相关专题

更多
html版权符号
html版权符号

html版权符号是“©”,可以在html源文件中直接输入或者从word中复制粘贴过来,php中文网还为大家带来html的相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

591

2023.06.14

html在线编辑器
html在线编辑器

html在线编辑器是用于在线编辑的工具,编辑的内容是基于HTML的文档。它经常被应用于留言板留言、论坛发贴、Blog编写日志或等需要用户输入普通HTML的地方,是Web应用的常用模块之一。php中文网为大家带来了html在线编辑器的相关教程、以及相关文章等内容,供大家免费下载使用。

638

2023.06.21

html网页制作
html网页制作

html网页制作是指使用超文本标记语言来设计和创建网页的过程,html是一种标记语言,它使用标记来描述文档结构和语义,并定义了网页中的各种元素和内容的呈现方式。本专题为大家提供html网页制作的相关的文章、下载、课程内容,供大家免费下载体验。

458

2023.07.31

html空格
html空格

html空格是一种用于在网页中添加间隔和对齐文本的特殊字符,被用于在网页中插入额外的空间,以改变元素之间的排列和对齐方式。本专题为大家提供html空格的相关的文章、下载、课程内容,供大家免费下载体验。

240

2023.08.01

html是什么
html是什么

HTML是一种标准标记语言,用于创建和呈现网页的结构和内容,是互联网发展的基石,为网页开发提供了丰富的功能和灵活性。本专题为大家提供html相关的各种文章、以及下载和课程。

2849

2023.08.11

html字体大小怎么设置
html字体大小怎么设置

在网页设计中,字体大小的选择是至关重要的。合理的字体大小不仅可以提升网页的可读性,还能够影响用户对网页整体布局的感知。php中文网将介绍一些常用的方法和技巧,帮助您在HTML中设置合适的字体大小。

500

2023.08.11

html转txt
html转txt

html转txt的方法有使用文本编辑器、使用在线转换工具和使用Python编程。本专题为大家提供html转txt相关的文章、下载、课程内容,供大家免费下载体验。

306

2023.08.31

html文本框代码怎么写
html文本框代码怎么写

html文本框代码:1、单行文本框【<input type="text" style="height:..;width:..;" />】;2、多行文本框【textarea style=";height:;"></textare】。

417

2023.09.01

俄罗斯搜索引擎Yandex最新官方入口网址
俄罗斯搜索引擎Yandex最新官方入口网址

Yandex官方入口网址是https://yandex.com;用户可通过网页端直连或移动端浏览器直接访问,无需登录即可使用搜索、图片、新闻、地图等全部基础功能,并支持多语种检索与静态资源精准筛选。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1

2025.12.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Ruby中文文档
Ruby中文文档

共0课时 | 0人学习

极客学院Ruby基础视频教程
极客学院Ruby基础视频教程

共22课时 | 4.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号