PHP如何解析RSS或Atom feed的XML

畫卷琴夢

发布时间：2026-01-09 12:04:02

981人浏览过

来源于php中文网

原创

最可靠方式是用 SimpleXML 配合 libxml 容错处理：先调用 libxml_use_internal_errors(true)，再用 simplexml_load_string($xml, 'SimpleXMLElement', LIBXML_NOCDATA | LIBXML_NONET | LIBXML_NOWARNING)，最后 libxml_clear_errors()。

php如何解析rss或atom feed的xml

PHP 解析 RSS 或 Atom feed 的 XML，最可靠的方式是用 SimpleXML 配合 libxml 的容错处理——不是所有 feed 都严格符合规范，直接 simplexml_load_string() 容易报错中断。

为什么 `simplexml_load_string()` 常失败？

RSS/Atom feed 常含以下问题：XML declaration 编码声明不匹配、BOM 字节、命名空间混用、HTML 实体未转义、CDATA 块嵌套非法字符。默认调用会因 DOMDocument::loadXML() 的严格解析而抛出警告或返回 false。

必须先用 libxml_use_internal_errors(true) 抑制错误
再用 simplexml_load_string($xml, 'SimpleXMLElement', LIBXML_NOCDATA | LIBXML_NONET | LIBXML_NOWARNING)
LIBXML_NONET 防止解析器尝试加载外部 DTD（安全且提速）
解析后记得调用 libxml_clear_errors() 避免污染后续 XML 操作

如何统一处理 RSS 2.0 和 Atom 1.0 的结构差异？

RSS 用包裹条目，Atom 用；条目标签分别是和。别硬写两套逻辑，用命名空间 + XPath 更稳：

if ($xml->getName() === 'rss') {
    $items = $xml->channel->item;
} elseif ($xml->getName() === 'feed' && $xml->getNamespaces()) {
    $atom = $xml->getNamespaces()[''];
    $items = $xml->xpath('//entry');
} else {
    $items = $xml->xpath('//item | //entry');
}

注意：$xml->getNamespaces() 返回空数组 ≠ 没命名空间，Atom 常用默认命名空间（xmlns="http://www.w3.org/2005/Atom"），此时需显式传入 '' 键取值。

立即学习“PHP免费学习笔记（深入）”；

剪刀手

全自动AI剪辑神器：日剪千条AI原创视频，零非原创风险，批量高效制作引爆流量！免费体验，轻松上手！

下载

提取标题、链接、发布时间时容易踩哪些坑？

字段名看似一致，实际分布混乱：

RSS 的是字符串，需用 strtotime() 转时间戳；Atom 的或是 ISO 8601 格式，可用 DateTime::createFromFormat() 或直接传给 new DateTime()
链接字段：RSS 用（可能为文本内容或属性 href），Atom 必须查的 href 属性
内容字段：RSS 多用或（需注册命名空间），Atom 用或，且可能含 type="html" 属性

建议封装一个 getSafeText($node, $tagName) 函数，内部用 ->__toString() + trim() + htmlspecialchars_decode() 统一清理。

要不要用第三方库？比如 `php-feed-reader`？

小项目够用，但要注意：php-feed-reader 内部仍基于 SimpleXML，只是封装了命名空间和字段映射。它对 malformed feed 的容错没比手写强多少，反而增加一层抽象导致调试困难。真正省心的场景只有两个：需要自动发现 feed 链接（从 HTML 提取），或要同时支持 JSON Feed。否则，20 行以内手写解析更可控。

复杂点永远在 feed 源本身——同一个站点今天发标准 RSS，明天加个自定义命名空间字段，或者把写成。别指望一次解析适配所有源，留好 fallback 字段和日志记录才是关键。

PHP SimpleXML的xpath()方法怎么处理默认命名空间

PHP SimpleXML怎么用 SimpleXML读取XML文件教程

PHP DOMDocument怎么创建和插入一个新节点

PHP的libxml扩展怎么开启和配置

如何配置XML解析器禁用外部实体防止XXE攻击

PHP速学教程(入门到精通)

PHP怎么学习？PHP怎么入门？PHP在哪学？PHP怎么学才快？不用担心，这里为大家提供了PHP速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

php html js json node 编码字节 lsp 为什么 php json html 命名空间封装 date xml Libxml simpleXML 字符串 channel bom href http atom

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：XML文档对象模型（DOM）是什么下一篇：XML命名空间(namespace)怎么用 XML xmlns详解

作者最新文章

长江雨课堂扫码登录入口微信绑定账号快速进入

2026-01-09 16:25

死神vs火影无敌版在线体验 BVN小游戏畅玩入口

2026-01-09 16:41

快手极速版官网入口网页版官方正版入口

2026-01-09 16:51

自然人电子税务局web端入口个人所得税网上查询系统

2026-01-09 16:57

Word怎么自动生成目录 Word目录生成与更新教程【一键搞定】

2026-01-09 17:38

Word怎么删除空白页 Word多余空白页删除技巧【多种方法】

2026-01-09 17:50

红果短剧在线看入口红果短剧PC端网页入口

2026-01-09 18:14

AO3镜像网站精选 AO3中文版面免费访问入口

2026-01-09 18:28

一亩等于多少公顷土地一公顷是多少亩土地

2026-01-09 18:35

Python怎么转换中文_Python处理中文字符编码转换方法

2026-01-09 18:37

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

php文件怎么打开

打开php文件步骤：1、选择文本编辑器；2、在选择的文本编辑器中，创建一个新的文件，并将其保存为.php文件；3、在创建的PHP文件中，编写PHP代码；4、要在本地计算机上运行PHP文件，需要设置一个服务器环境；5、安装服务器环境后，需要将PHP文件放入服务器目录中；6、一旦将PHP文件放入服务器目录中，就可以通过浏览器来运行它。

2303

2023.09.01