Curl 采摘乱码与采集不到 PHP

php中文网
发布: 2016-06-13 11:18:12
原创
1176人浏览过

Curl 采集乱码与采集不到 PHP
PHP程序是用gbk2312编码的:

$url = "http://www.sina.com.cn";//gbk2312编码
//$url = "http://www.163.com";//gbk2312编码
//$url = "http://www.sohu.com";//gbk2312编码
 

  $ch = curl_init($url);
  curl_setopt($ch, CURLOPT_RETURNTRANSFER , true);//返回获取的输出的文本流
  $ret = curl_exec($ch);
  curl_setopt($ch, CURLOPT_TIMEOUT, 1);
  curl_close($ch);
   echo $ret;

?>

在采集sina.com.cn时,是正常的,但是采集163.com时是为空的,采集sohu.com时是丢码的.
这是怎么回事呢?如何解决?有哪位怎么呀?先谢谢了!!!没多少分了,不好意思。


------解决方案--------------------
别的不说,我就是来拿分的.楼主记得给全分

<br><br>$curl=curl_init('http://www.163.com');<br>curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);<br>curl_setopt($curl,CURLOPT_USERAGENT,'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)');<br>$html=curl_exec($curl);<br>var_dump($html);<br><br><br>$curl=curl_init('http://www.sohu.com');<br>curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);<br>curl_setopt($curl,CURLOPT_USERAGENT,'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)');<br>$html=curl_exec($curl);<br>//$html=strstr($html,'$html=gzdecode($html);<br>var_dump($html);<br><br><br>function gzdecode($data) {   <br>  $len = strlen($data);   <br>  if ($len <font color="#FF8000">------解决方案--------------------</font><br> strcmp(substr($data,0,2),"\x1f\x8b")) {   <br>   return null;  // Not GZIP format (See RFC 1952)   <br>  }   <br>  $method = ord(substr($data,2,1));  // Compression method   <br>  $flags  = ord(substr($data,3,1));  // Flags   <br>  if ($flags &amp; 31 != $flags) {   <br>   // Reserved bits are set -- NOT ALLOWED by RFC 1952   <br>   return null;   <br>  }   <br>  // NOTE: $mtime may be negative (PHP integer limitations)   <br>  $mtime = unpack("V", substr($data,4,4));   <br>  $mtime = $mtime[1];   <br>  $xfl  = substr($data,8,1);   <br>  $os    = substr($data,8,1);   <br>  $headerlen = 10;   <br>  $extralen  = 0;   <br>  $extra    = "";   <br>  if ($flags &amp; 4) {   <br>   // 2-byte length prefixed EXTRA data in header   <br>   if ($len - $headerlen - 2      return false;    // Invalid format   <br>   }   <br>   $extralen = unpack("v",substr($data,8,2));   <br>   $extralen = $extralen[1];   <div class="clear"></div>
登录后复制
相关标签:
PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号