本文实例讲述了python读取网页内容的方法。分享给大家供大家参考。具体如下:
import urllib2
#encoding = utf-8
class Crawler:
def main(self):
#req = urllib2.Request('http://www.baidu.com/')
#req.add_header('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:5.0)')
#urllib2.socket.setdefaulttimeout(10) # 超时10秒
#page = urllib2.urlopen(req)
page = urllib2.urlopen('http://www.google.com', timeout=10)
data = page.read()
print data
print len(data) #计算字节长度
if __name__ == '__main__':
me=Crawler()
me.main()
希望本文所述对大家的Python程序设计有所帮助。
米歌_实用企业网站管理系统 Mixge Web Manage (简称:米歌MWM),我们的与众不同在于:彻底颠覆了传统网站的固定模式变成可操控模式。米歌WMW简单,实用,灵活,为非专业人士而设计开发。正如, 第一步添加栏目,第二步发布内容,剩下的就是一些设置。新增功能:1.增加了右侧的联系方式(包括电话、QQ、MSN和旺旺);2.自动缩略图功能,在首页提取和栏目提取自动显示缩略图,并且在文章插入大










