Python里pickle序列化对象序列化模块pickle的安全隐患解析-Python教程-PHP中文网

Python里pickle序列化对象序列化模块pickle的安全隐患解析

裘德小鎮的故事

发布： 2025-06-10 14:03:03

原创

459人浏览过

pickle存在安全隐患的原因是反序列化时会执行任意代码。pickle模块用于将python对象转换为字节流以便存储或传输，但加载不可信数据时可能触发恶意指令。例如攻击者可通过构造特殊对象，在反序列化时调用系统命令。常见风险场景包括网络传输、缓存机制及日志配置文件中误用pickle格式。为安全使用pickle应做到：1.仅加载可信来源的pickle文件；2.避免用其做跨语言通信；3.对输入数据进行签名验证；4.在沙箱环境中加载pickle；5.优先选用json等更安全的替代格式。总之务必遵循原则“永远不要加载你不信任的数据”。

在Python中，pickle 是一个常用的对象序列化模块，可以将复杂的Python对象转换为字节流，便于存储或传输。但如果你从不可信的来源加载了 pickle 数据，那可能会带来严重的安全隐患。

什么是Pickle序列化？

Pickle 模块的作用是“把Python对象变成一串字节”，这个过程叫做序列化。它非常适合用于保存程序运行时的状态，比如缓存数据、保存模型参数等。使用起来也非常简单：

import pickle

data = {"name": "Alice", "age": 30}
with open("data.pkl", "wb") as f:
    pickle.dump(data, f)

登录后复制

读取的时候也是一样方便：

with open("data.pkl", "rb") as f:
    loaded_data = pickle.load(f)

登录后复制

看起来很美好，但问题就出在反序列化（load）这一步。

立即学习“Python免费学习笔记（深入）”；

Pickle为什么存在安全隐患？

核心问题是：pickle 在反序列化时会执行任意代码。

序列猴子开放平台

具有长序列、多模态、单模型、大数据等特点的超大规模语言模型

查看详情

它不仅还原数据，还会尝试重建对象，包括调用构造函数和自定义的 __reduce__ 方法。这就意味着，攻击者可以通过构造恶意的 .pkl 文件，在你加载文件时执行任意命令，比如删除文件、窃取信息甚至远程连接。

举个简单的例子：

import os
import pickle

class MaliciousData:
    def __reduce__(self):
        return (os.system, ("rm -rf /tmp/test",))

mal_data = pickle.dumps(MaliciousData())
# 如果你不小心加载了这个数据……
pickle.loads(mal_data)

登录后复制

一旦执行了上面的 pickle.loads，就会执行 rm -rf /tmp/test 命令。这就是所谓的“反序列化漏洞”。

什么场景下容易踩坑？

网络传输中使用了Pickle
有些人为了方便，直接通过网络传输 pickle.dumps() 的结果。如果对方不可信，或者中间有人篡改数据包，就可能触发恶意代码。
缓存机制中用了Pickle文件
比如用 pickle 存储用户提交的数据，之后再加载回来。如果有攻击者上传了一个恶意构造的 .pkl 文件，服务器加载时就会被攻击。
日志或配置文件中误用了Pickle格式
虽然不常见，但如果某些系统组件写入了可被用户修改的 .pkl 文件，并由高权限进程加载，也可能成为攻击入口。