Python网络请求分HTTP封装(如requests)和底层Socket两种路径:前者简洁高效,适合常规API调用;后者可控性强,适用于定制协议、TCP长连接等场景。

Python做网络请求,核心就两条路:走HTTP协议用高层封装(比如requests),或者直接操作Socket走底层通信。选哪条,取决于你想要多大控制权、是否需要自定义协议、对性能有没有特殊要求。
HTTP请求:简洁高效,适合绝大多数场景
HTTP是应用层协议,Python里最常用的是requests库——它把连接管理、编码处理、Cookie维护、重定向、SSL验证等都封装好了,一行代码就能发GET,三行就能带参数和头发POST。
- 安装只需:
pip install requests - 基础GET:
requests.get("https://httpbin.org/get"),返回Response对象,.text取响应体,.json()自动解析JSON - 带参数的GET:
requests.get("https://httpbin.org/get", params={"key": "value"}),自动拼成URL查询字符串 - POST提交表单:
requests.post("https://httpbin.org/post", data={"name": "Alice"});传JSON则用json=...参数,自动设Content-Type - 加请求头、超时、会话复用(Session)也很直观,不用手动管连接池或重试逻辑
Socket编程:贴近TCP/UDP,适合定制化通信
Socket是操作系统提供的网络通信接口,Python通过socket标准库暴露了底层能力。它不关心HTTP,只负责收发原始字节流——这意味着你可以实现自己的协议、调试网络问题、写TCP长连接服务,或者和非HTTP设备(如嵌入式模块)通信。
- 创建TCP客户端示例:
import socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.connect(("httpbin.org", 80))
s.send(b"GET /get HTTP/1.1\\r\\nHost: httpbin.org\\r\\n\\r\\n")
data = s.recv(4096)
s.close() - 注意:必须手动构造HTTP请求行、头部、空行;要处理换行符
\\r\\n;需自己解析响应状态码和分块传输;没有自动重连或超时保护 - UDP更简单但不可靠:
socket.SOCK_DGRAM,适合日志上报、DNS查询等容忍丢包的场景 - 真实项目中,除非有特殊需求(如实时音视频信令、IoT设备直连),否则不建议从零写HTTP客户端
HTTP vs Socket:关键区别不是“难易”,而是“职责边界”
HTTP库帮你扛了协议细节、错误恢复、安全策略;Socket让你掌控每一段字节的来去。它们不是替代关系,而是协作关系——requests底层其实也用socket,只是替你屏蔽了复杂性。
立即学习“Python免费学习笔记(深入)”;
- 需要快速获取网页内容、调API、上传文件?用
requests或httpx - 要写一个TCP代理、监听本地端口、实现MQTT客户端、抓包分析?直接上
socket - 想理解HTTPS握手过程、看TLS层怎么协商?可以结合
ssl模块包装socket - 遇到requests报错“ConnectionResetError”?可能得回到底层socket查是服务端断连还是防火墙拦截
进阶提示:别忽略编码与异常处理
实际开发中,很多问题不出在逻辑,而出在细节处理:
- HTTP响应的
response.content是bytes,response.text是str——如果没指定response.encoding,requests会按HTTP头或HTML meta推测编码,可能出错;中文网站建议显式设r.encoding = "utf-8" - Socket收发默认是阻塞模式,长时间无响应会卡住;用
s.settimeout(5)设超时,再配合try/except捕获socket.timeout或ConnectionRefusedError - requests默认不校验SSL证书(开发环境常见),上线前务必确认
verify=True(或配好CA路径) - 高并发下,requests的Session可复用连接,比反复新建快得多;但若需异步,改用
httpx.AsyncClient或aiohttp










