python 怎么获取网页内容

(*-*)浩

发布时间：2019-06-28 11:36:25

15446人浏览过

来源于php中文网

原创

python用做数据处理还是相当不错的，如果你想要做爬虫，python是很好的选择，它有很多已经写好的类包，只要调用，即可完成很多复杂的功能。

python 怎么获取网页内容

1 Pyhton获取网页的内容(也就是源代码)（推荐学习：Python视频教程）

page = urllib2.urlopen(url)   
contents = page.read()   
#获得了整个网页的内容也就是源代码  
print(contents)

url代表网址，contents代表网址所对应的源代码，urllib2是需要用到的包，以上三句代码就能获得网页的整个源代码

2 获取网页中想要的内容(先要获得网页源代码，再分析网页源代码，找所对应的标签，然后提取出标签中的内容)

立即学习“Python免费学习笔记（深入）”；

徐大大网页版

徐大大网页版(无手续费，立刻开通)是一个支付宝跳转页面源码，可以应用于会员充值等支付功能。var MyAccount='18067560950';//您的支付宝账号，请在index.html文件中配置var UserName='';//此处获取当前充值的用户名var remark='';//此处是备注内容var TheMoney='';//(可选) 直接获取固定金额，当没有获取固定金额时，就会出现

下载

以豆瓣电影排名为例子

现在我需要获得当前页面的所有电影的名字，评分，评价人数，链接

#coding:utf-8  
''''' 
@author: jsjxy 
'''  
import urllib2   
import re   
from bs4 import BeautifulSoup  
from distutils.filelist import findall  

page = urllib2.urlopen('http://movie.douban.com/top250?format=text')   
contents = page.read()   
 #print(contents)  
soup = BeautifulSoup(contents,"html.parser")  
print("豆瓣电影TOP250" + "\n" +" 影片名              评分       评价人数     链接 ")    
for tag in soup.find_all('div', class_='info'):    
   # print tag  
    m_name = tag.find('span', class_='title').get_text()        
    m_rating_score = float(tag.find('span',class_='rating_num').get_text())          
    m_people = tag.find('div',class_="star")  
    m_span = m_people.findAll('span')  
    m_peoplecount = m_span[3].contents[0]  
    m_url=tag.find('a').get('href')  
    print( m_name+"        "  +  str(m_rating_score)   + "           " + m_peoplecount + "    " + m_url )

控制台输出,你也可以写入文件中

更多Python相关技术文章，请访问Python教程栏目进行学习！

如何根据函数参数的实际字面值精确推断返回类型

如何在 Python 中将一个函数生成的变量安全传递给另一个函数作为参数

Python常见正则错误总结_新手避坑指南【教程】

Python数据结构系统学习路线第35讲_核心原理与实战案例详解【技巧】

Python生成器yield原理解析_暂停与恢复执行机制【技巧】

python速学教程(入门到精通)

python怎么学习？python怎么入门？python在哪学？python怎么学才快？不用担心，这里为大家提供了python速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

python

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：python 怎么获取文件名下一篇：python中的eval函数是什么

作者最新文章

win10重置卡在键盘布局解决办法

2020-01-15 09:09

win10许可证过期怎么激活

2020-01-15 09:22

win10要装杀毒软件么

2020-01-15 09:28

win10蓝牙耳机麦克风不能用

2020-01-15 09:36

win10游戏闪退修复办法

2020-01-15 09:58

win10更新要多久

2020-01-15 10:08

win10更新1909要多久

2020-01-15 10:16

win10怎么连接外国网络

2020-01-15 10:34

win10安装.Net Framework 3.5 sp1

2020-01-15 10:58

win10 1809稳定吗

2020-01-15 11:18

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

javascript void运算符

void是一元运算符，执行右侧表达式但始终返回undefined；用于丢弃返回值、阻止a标签跳转、IIFE忽略结果、动态导入不取Promise、安全获取undefined。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2025.12.29

vscode的界面字体大小调整

调整VSCode界面字体大小可通过设置编辑器或整体UI缩放实现；2.修改"Editor:FontSize"改变代码字体；3.设置"Window:ZoomLevel"调整整体界面字体；4.使用Ctrl+滚轮快捷键临时缩放。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2025.12.29

VSCode的注释快捷键

单行注释快捷键为Ctrl+/（Windows/Linux）或Cmd+/（macOS），块注释使用Shift+Alt+A（Windows/Linux）或Shift+Option+A（macOS），VSCode会根据语言类型自动匹配语法，如JavaScript用//，Python用#，C++用//，若快捷键无效需检查语言扩展或插件冲突。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2025.12.29