Python处理JSON的核心是json模块,提供序列化(dumps/dump)和反序列化(loads/load)功能,需注意类型映射、中文支持、文件I/O用法及自定义Encoder/Decoder扩展。

Python 中处理 JSON 数据的核心是 json 模块,它提供 序列化(编码) 和 反序列化(解码) 两种基本能力:把 Python 对象转成 JSON 字符串叫序列化,把 JSON 字符串还原为 Python 对象叫反序列化。关键不在于记函数名,而在于理解数据类型映射和常见坑点。
JSON 与 Python 数据类型的对应关系要清楚
JSON 是轻量级数据交换格式,只支持有限的几种原生类型。Python 的 json 模块在转换时会自动做类型映射,但不是所有 Python 类型都能直接处理:
- JSON object → Python dict
- JSON array → Python list
- JSON string → Python str
- JSON number (int/float) → Python int/float
- JSON true/false → Python True/False
- JSON null → Python None
注意:Python 的 tuple、set、自定义类实例、datetime 等类型默认无法直接序列化,需要额外处理。
用 json.dumps() 和 json.loads() 完成基础编解码
这是最常用的两个函数,分别用于内存中对象与字符串之间的转换:
立即学习“Python免费学习笔记(深入)”;
-
json.dumps(obj):把 Python 对象转成 JSON 字符串。可加参数如indent=2美化输出,ensure_ascii=False支持中文不转义。 -
json.loads(s):把 JSON 格式的字符串解析为 Python 对象。输入必须是合法 JSON,否则抛json.JSONDecodeError。
示例:
json_str = json.dumps(data, ensure_ascii=False, indent=2)
# 输出带缩进的中文 JSON 字符串
parsed = json.loads(json_str)
# parsed 就是原来的字典,类型一致
读写文件时用 json.dump() 和 json.load()
当 JSON 数据来自或要保存到文件时,推荐直接使用文件对象接口,更安全高效:
-
json.dump(obj, file_obj):把对象写入已打开的文件对象(需以w模式打开)。 -
json.load(file_obj):从已打开的文件对象读取并解析 JSON(需以r模式打开)。
典型用法:
with open("data.json", "w", encoding="utf-8") as f:json.dump(data, f, ensure_ascii=False, indent=2)
with open("data.json", "r", encoding="utf-8") as f:
loaded = json.load(f)
处理不支持的类型:自定义 Encoder 和 Decoder
遇到 datetime、Decimal 或自定义类时,需扩展序列化逻辑:
- 继承
json.JSONEncoder,重写default()方法,告诉它“遇到某类对象怎么转”。 - 对反序列化,可在
json.loads()中传入object_hook函数,对每个 dict 做后处理。
例如把 datetime 转为 ISO 格式字符串:
def default(self, obj):
if isinstance(obj, datetime.datetime):
return obj.isoformat()
return super().default(obj)
json.dumps({"time": datetime.now()}, cls=DateTimeEncoder)
不复杂但容易忽略。掌握这四点,日常 JSON 处理基本够用。










