file_get_contents
curl
php simple html dom解析器
三种方法获取html,图片都不会显示,curl也模拟了浏览器。
以下图文页链接为例
微信图文页面
比如以html dom方式获取代码:
<code>$html = new simple_html_dom(); $html->load_file($artical_url); echo "$html";</code>
php获取代码后,第一张图片的代码:
<code>@@##@@</code>
浏览器访问页面正常显示图片的代码:
立即学习“PHP免费学习笔记(深入)”;
<code>@@##@@</code>
咋么办??
file_get_contents
curl
php simple html dom解析器
三种方法获取html,图片都不会显示,curl也模拟了浏览器。
以下图文页链接为例
微信图文页面
比如以html dom方式获取代码:
<code>$html = new simple_html_dom(); $html->load_file($artical_url); echo "$html";</code>
php获取代码后,第一张图片的代码:
<code>@@##@@</code>
浏览器访问页面正常显示图片的代码:
立即学习“PHP免费学习笔记(深入)”;
<code>@@##@@</code>
咋么办??
感谢楼上的回答,应该不是防盗链的问题,感觉是抓取的时候dom的规则不能判断data-src和src的属性。后来研究了半天,发现simple_html_dom确实个好东西,应该可以在抓取回来后用替换的方式。无奈因对php还不是很熟,语句老是写不正确。后来用js土办法曲线救国,取得php变量内容并正则替换的方式解决了问题。
另外加一句,用html_dom后,别忘了$html->clear。
修改curl header参数 试试
https://segmentfault.com/q/1010000005046169
感觉你的问题跟这个有点像,你试试看
微信是一款手机通信软件,支持通过手机网络发送语音短信、视频、图片和文字。微信可以单聊及群聊,还能根据地理位置找到附近的人,带给大家全新的移动沟通体验,有需要的小伙伴快来保存下载体验吧!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号