文章专题 AI工具学习下载问答源码最近更新

PHP

会员中心讲师中心微信公众号

首页 > 后端开发 > php教程 > 正文

php simple dom html 解析乱码

php中文网

发布： 2016-08-08 09:28:17

原创

1498人浏览过

1. 乱码解决

毫无疑问, 一上来就碰到了乱码问题, 固然我已按文档所述, 所有的字符使用 UTF-8 编码:

$html = '<p>你好</p><p><span>立即学习</span>“<a href="https://pan.quark.cn/s/7fc7563c4182" style="text-decoration: underline !important; color: blue; font-weight: bolder;" rel="nofollow" target="_blank">PHP免费学习笔记（深入）</a>”；</p>'; $dom = new DOMDocument(); @$dom->loadHTML($html); echo $dom->documentElement->nodeValue;

登录后复制

可是, 若是改成:

$html = '<p>你好</p><p><span>立即学习</span>“<a href="https://pan.quark.cn/s/7fc7563c4182" style="text-decoration: underline !important; color: blue; font-weight: bolder;" rel="nofollow" target="_blank">PHP免费学习笔记（深入）</a>”；</p>'; $dom = new DOMDocument(); @$dom->loadXML($html); echo $dom->documentElement->nodeValue;

登录后复制

就没有问题. 后来才发现, 本来 loadHTML 会依靠 HTML 中的声明 meta 标签. 假如没有这样的标签, 就看成 iso-8859-1 字符集, 所以乱码. 要解决, 就给字符串加上如许的一个标签在头部:

$meta = '<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>'; @$dom->loadHTML($meta . $html);

登录后复制

2. 递归

HTML/XML 是递归布局, 所以必然会递归遍历:

function _pretty_html_node($node){ // 递归终止前提 // 1. XML_TEXT_NODE // 2. XML_ELEMENT_NODE // 3. 没有子节点 foreach($node->childNodes as $n){ $child_text .= _pretty_html_node($n); } // 然后对分歧的标签做不同的处置 switch($tag){ case 'a': $href = $node->getAttribute('href'); $text .= "<a href=\"$href\">$child_text</a>"; ... } return $text; }

登录后复制

3. 转义字符处置惩罚

对文本节点, 其 nodeValue 要颠末 htmlspeciachars() 转义. 由于读取 HTML/XML 时, 会对文本进行反转义, 比如 > 在内存中已经是 >了.

下载源码:pretty_html.php

Related posts:

C# 版的 SimpleXML
自架设Apache办事器过程当中的网页乱码问题
if-else对优化代码冗余度的反感化
Wordpress分页代码
用Javascript生成弹出窗口

以上就介绍了php simple dom html 解析乱码，包括了方面的内容，希望对PHP教程有兴趣的朋友有所帮助。

PHP速学教程(入门到精通)

PHP速学教程(入门到精通)

PHP怎么学习？PHP怎么入门？PHP在哪学？PHP怎么学才快？不用担心，这里为大家提供了PHP速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

来源：php中文网

上一篇：nginx 源码（2）运行下一篇：nginx作为php站点的负载均衡实践

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

最新问题

PHP怎样解析.NET DLL文件 DLL解析方法快速获取程序集信息 PHP无法直接解析.NETDLL文件，但可通过桥梁技术间接实现。核心方法包括：1.使用COM组件：将.NETDLL注册为COM组件，通过PHP的COM()类调用其功能，需在Windows环境下运行；2.利用Web服务：创建ASP.NETWebAPI封装DLL功能，PHP通过HTTP请求调用接口，适合跨平台但需额外部署；3.第三方扩展：如PHP/.NETBridge，存在兼容性风险；4.解析PE文件：手动提取DLL元数据，需深入了解PE结构并编写扩展；5.调用外部程序：通过exec()执行.NET

2025-06-12 12:51:01

819

PHP中的Web服务：如何在PHP中创建和消费Web服务在PHP中创建和消费Web服务可通过SOAP或REST实现。使用SOAP时，1.编写服务逻辑类；2.创建SoapServer实例并绑定类；3.通过WSDL定义接口；例如用SoapServer和SoapClient类实现方法调用。构建REST服务则更轻量，1.根据请求方法处理操作类型；2.获取参数并执行业务逻辑；3.返回JSON数据；如用$_GET获取参数并输出JSON响应。消费外部服务可使用file_get_contents、cURL或Guzzle库发送HTTP请求；例如用cURL发起GET请求

2025-06-11 12:30:02

536

PHP中的队列系统：如何在PHP中实现任务队列处理在PHP中实现任务队列主要通过消息中间件来完成，常见的选择包括Redis、RabbitMQ、Beanstalkd、AmazonSQS和Kafka，其中Redis和RabbitMQ最为常用；队列消费者可通过CLI常驻进程或定时任务触发两种方式实现，前者响应快但需注意内存管理，后者实现简单但延迟较高；为确保任务不丢失且不重复执行，应启用持久化机制、使用手动确认（ack）、设计幂等性逻辑，并设置失败重试策略。

2025-06-10 21:09:01

274

PHP中如何比较两个值的大小？在PHP中，比较两个值的大小可以使用各种运算符，包括==、!=、===、!==、>、=、、=、

2025-06-10 20:00:02

951

PHP中的授权管理：如何在PHP中实现用户权限控制实现PHP用户权限控制需四步：1.明确权限结构，通过用户、角色、权限三层次设计，关联表结构清晰管理权限；2.登录后加载权限信息，通过查询角色权限并缓存减少数据库压力；3.前后端结合控制访问，前端优化体验，后端严格判断权限标识；4.根据业务决定是否引入行级权限，如限制仅编辑自己创建内容，确保系统安全与灵活扩展。

2025-06-10 19:06:01

640

PHP中的索引优化：如何提高数据库查询性能索引是提升数据库查询速度的关键。它像书的目录一样，帮助数据库快速定位数据，避免全表扫描。常见类型包括主键索引、唯一索引、普通索引和复合索引。选择合适字段建立索引应优先考虑频繁查询条件、连接字段和排序分组字段；不适合加索引的情况包括重复率高、很少查询或小数据量表的字段。使用复合索引时需遵循最左匹配原则，避免冗余与过度索引。可通过EXPLAIN、SHOWINDEX等工具查看和优化现有索引，并定期清理无效索引以提升性能。

2025-06-10 18:54:01

127

PHP中的Trait特性：如何使用Trait实现代码复用 Trait是PHP中用于代码复用的机制，允许在多个类间共享方法实现。它通过trait关键字定义，并使用use引入到类中，例如traitUniqueId{publicfunctiongenerateId(){returnuniqid();}}配合classUser{useUniqueId;}可生成唯一ID。当多个Trait存在同名方法时，需手动处理冲突，如LogB::loginsteadofLogA指定保留某方法，或通过LogA::logaslogFromA起别名。Trait常用于通用工具方法、行

2025-06-10 18:27:01

217

PHP中的文件压缩：如何用PHP实现ZIP压缩解压在PHP中实现ZIP压缩与解压需先启用zip扩展，再使用ZipArchive类完成操作。1.首先确认环境已启用zip扩展，若未启用则在php.ini中开启extension=zip并重启服务；2.使用ZipArchive类创建ZIP文件时，实例化对象后调用open方法创建或打开文件，通过addFile添加文件至压缩包，最后close保存；3.解压时同样实例化ZipArchive，open目标ZIP文件后调用extractTo指定解压路径，注意路径必须存在且有写权限；4.其他注意事项包括处理大文件

2025-06-10 17:06:02

213

PHP中的短信发送：如何集成第三方短信服务商要在PHP项目中集成短信发送功能，必须注册第三方服务商账号并获取API信息，使用HTTP请求方式封装发送函数，严格遵守模板和签名审核要求，并处理常见异常问题。具体步骤包括：1.注册账号并获取AccessKey、API地址、签名、模板ID等参数，配置至.env或config.php文件中；2.使用cURL或Guzzle发起POST/GET请求，构造包含手机号、模板ID、模板参数的请求体，建议将发送逻辑封装为独立类或函数；3.提前申请并通过短信签名与模板审核，确保签名如【某某科技】、模板如“验证码是

2025-06-10 15:48:02

686

PHP中的命令行脚本：如何在PHP中编写命令行工具要运行PHP命令行脚本，需确认安装PHPCLI，创建.php文件并添加shebang行，随后通过phpfilename.php或赋予执行权限后运行；处理参数可通过$argv和$argc获取，也可使用getopt()或第三方库；打造专业CLI工具应支持颜色输出、帮助文档、清晰错误提示及交互输入，并注意权限设置、避免Web依赖函数、管理内存与日志记录。1.确认安装PHPCLI并创建脚本；2.使用$argv/$argc获取参数或用getopt()解析复杂参数；3.添加ANSI颜色、显示帮助信息、提供错

2025-06-10 15:06:02

442

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

ThinkPHP5快速开发企业站点[全程实录]

399486次学习
收藏
PHP Workerman 基础与实战：即时通讯聊天系统（ThinkPHP6）

51101次学习
收藏
Thinkphp3.2.3个人博客开发

212645次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

PHP中文网抖音号: 发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部