Python怎么把字节（bytes）转换为字符串_Python字节与字符串的编解码转换

尼克

发布时间：2025-09-12 19:42:01

1060人浏览过

来源于php中文网

原创

字节与字符串转换需指定编码方式，如UTF-8；decode()将字节转为字符串，encode()将字符串转为字节，编码不匹配会导致UnicodeDecodeError或UnicodeEncodeError，应优先使用UTF-8并处理错误以确保数据正确性。

python怎么把字节（bytes）转换为字符串_python字节与字符串的编解码转换

Python里要把字节串（bytes）变成字符串（str），通常用的是

decode()

方法；反过来，想把字符串变成字节串，就用

encode()

。这俩操作的核心，都是要指定一个“编码方式”，比如我们最常用的

'utf-8'

。搞清楚这个，基本就抓住了核心。

在Python里，字节和字符串是两种截然不同的数据类型，这和一些其他语言有点区别，我觉得这是Python设计上一个非常明智的地方，它强制我们去思考数据到底是什么。

当你有了一串字节，比如从网络接收到的数据，或者从二进制文件里读出来的东西，它本质上就是一堆0和1，没有内在的“文字”含义。这时候，如果你想把它当成可读的文本来处理，比如打印出来，或者进行字符串操作，你就得告诉Python，这些字节是按照哪种规则编码成文本的。这就是

decode()

出场的时候：

# 假设我们有一串UTF-8编码的字节
byte_data = b'\xe4\xbd\xa0\xe5\xa5\xbd' # 这是“你好”的UTF-8编码
string_data = byte_data.decode('utf-8')
print(f"字节转换为字符串: {string_data}") # 输出: 你好

# 如果编码不对，就会报错
try:
    byte_data.decode('gbk') # 尝试用GBK解码UTF-8字节
except UnicodeDecodeError as e:
    print(f"解码错误示例: {e}") # 会抛出UnicodeDecodeError

# 处理错误，比如忽略或替换不认识的字符
broken_bytes = b'hello\xed\xa0\xbdworld' # 包含无效的UTF-8序列
safe_string = broken_bytes.decode('utf-8', errors='ignore') # 忽略错误字符
print(f"忽略错误字符: {safe_string}") # 输出: helloworld

replaced_string = broken_bytes.decode('utf-8', errors='replace') # 替换错误字符
print(f"替换错误字符: {replaced_string}") # 输出: hello�world

反过来，当你有一个字符串，比如用户输入的内容，或者代码里定义的一段文本，你想把它发送到网络上，或者写入二进制文件，你就需要把它转换成字节。因为网络和文件系统通常处理的是字节流。这时候，

encode()

就派上用场了：

立即学习“Python免费学习笔记（深入）”；

# 一个普通的字符串
my_string = "你好，世界！"

# 将字符串编码为UTF-8字节
utf8_bytes = my_string.encode('utf-8')
print(f"字符串转换为UTF-8字节: {utf8_bytes}") # 输出: b'\xe4\xbd\xa0\xe5\xa5\xbd\xef\xbc\x8c\xe4\xb8\x96\xe7\x95\x8c\xef\xbc\x81'

# 编码成GBK字节
gbk_bytes = my_string.encode('gbk')
print(f"字符串转换为GBK字节: {gbk_bytes}") # 输出: b'\xc4\xe3\xda\xcf\xa3\xac\xca\xc0\xbd\xe7\xa3\xa1'

# 如果字符串中包含目标编码无法表示的字符，同样会报错
# 比如，一个GBK无法表示的字符
weird_string = "你好✨" # ✨这个字符GBK不支持
try:
    weird_string.encode('gbk')
except UnicodeEncodeError as e:
    print(f"编码错误示例: {e}") # 会抛出UnicodeEncodeError

# 同样可以处理错误
safe_bytes = weird_string.encode('gbk', errors='replace')
print(f"替换错误字符编码: {safe_bytes}") # 输出: b'\xc4\xe3\xda\xcf??'

这里有个经验之谈，我个人在处理编解码的时候，总是尽量保持一致性，特别是在同一个系统内部，默认都用

utf-8

。这能省去很多不必要的麻烦，因为

utf-8

几乎能表示所有Unicode字符。

灵云AI开放平台

下载

Python字节和字符串转换中常见的编码问题及应对策略

我发现，在Python里处理字节和字符串的转换，最让人头疼的往往不是忘记调用

encode()

或

decode()

，而是“编码错误”——那些让人抓狂的

UnicodeDecodeError

和

UnicodeEncodeError

。这通常发生在两个地方：

```
UnicodeDecodeError
```
：当你尝试用一种编码（比如
```
'gbk'
```
）去解码实际上是另一种编码（比如
```
'utf-8'
```
）的字节序列时。举个例子，你从一个UTF-8编码的文件里读了一堆字节，但你代码里不小心用了
```
data.decode('gbk')
```
，结果就是一堆乱码，或者直接抛出
```
UnicodeDecodeError: 'gbk' codec can't decode byte 0xXX in position Y: illegal multibyte sequence
```
。这就像你拿着一本英文词典去查中文，肯定对不上号。
- 应对策略： 核心是找出原始字节的正确编码。如果是在网络通信中，通常协议会指定编码（比如HTTP头部的
```
Content-Type
```
  ）。如果是文件，可能需要检查文件本身的元数据，或者根据经验猜测（中文环境可能是
```
gbk
```
  或
```
utf-8
```
  ，英文可能就是
```
latin-1
```
  或
```
ascii
```
  ）。如果实在不确定，
```
'utf-8'
```
  是首选，因为它的兼容性最好。如果还不行，可以尝试
```
chardet
```
  这样的第三方库来猜测编码，虽然它也不是百分之百准确，但能提供一个不错的起点。在实在无法确定且又不想程序崩溃时，可以考虑使用
```
errors='ignore'
```
  或
```
errors='replace'
```
  参数，但这会丢失数据，通常只作为最后的手段。
```
UnicodeEncodeError
```
：当你尝试用一种编码（比如
```
'ascii'
```
或
```
'gbk'
```
）去编码一个包含它不支持字符的字符串时。比如，你的字符串里有表情符号（
```
✨
```
），但你却想把它编码成
```
'gbk'
```
，因为
```
gbk
```
不支持这些字符，它就会报错：
```
UnicodeEncodeError: 'gbk' codec can't encode character '\U00002728' in position X: illegal multibyte sequence
```
。
- 应对策略： 最直接的办法是使用一个能支持所有字符的编码，比如
```
'utf-8'
```
  。如果你确实需要用一个有限的编码（比如为了兼容老系统），那么在编码前，你需要确保字符串里不包含该编码不支持的字符。这可能涉及到对字符串进行清洗，或者在编码时使用
```
errors='replace'
```
  或
```
errors='xmlcharrefreplace'
```
  来替换无法编码的字符。我个人觉得，除非有非常明确的理由，否则尽量坚持使用
```
'utf-8'
```
  来编码字符串，这能避免99%的编码错误。

理解这两类错误发生的根本原因，即编码和解码时使用的字符集不匹配，是解决问题的关键。我总是强调，处理文本数据时，一定要清楚数据的“身份”：它是字节还是字符串？如果是字节，它是什么编码的？如果是字符串，它内部是Unicode，要编码成什么？

在实际应用中，何时以及如何处理Python字节与字符串的转换？

在我日常的开发工作中，字节和字符串的转换简直无处不在。它不是一个孤立的知识点，而是贯穿于数据输入输出的方方面面。我总结了一些常见场景，以及我在这些场景下的处理心得：

文件I/O：
- 读写文本文件： 当你用
```
open()
```
  函数打开文件时，如果指定了
```
encoding
```
  参数（比如
```
open('file.txt', 'r', encoding='utf-8')
```
  ），Python会自动帮你处理编解码。你读出来的是字符串，写入的是字符串。这是最省心的做法。
- 读写二进制文件： 如果你不指定
```
encoding
```
  ，或者以
```
'rb'
```
  /
```
'wb'
```
  模式打开文件，那么你读写的就是原始字节。这时，你从文件读到的数据就是
```
bytes
```
  类型，需要手动
```
decode()
```
  成字符串才能处理

Python 3 中实现字节串格式化：替代 %b 的标准方法

Python 3 中如何为内置类型生成字节串格式化结果

Python 3 中字节串格式化：如何正确将内置类型转换为 bytes

如何在 Windows 11 上成功安装 TA-Lib（Python 版）

如何在Python中正确获取类实例变量的最新值

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

751

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

636

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

618

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

706

2023.08.11