如何理解Python的并发与并行？-Python教程-PHP中文网

答案：Python中并发指任务交错执行，看似同时运行，而并行指任务真正同时执行；由于GIL限制，多线程无法实现CPU并行，仅适用于I/O密集型任务，而真正的并行需依赖multiprocessing或多核支持的底层库。

如何理解python的并发与并行？

理解Python的并发与并行，核心在于区分“看起来同时进行”和“实际同时进行”。并发（Concurrency）指的是系统能够处理多个任务，这些任务可能在同一时间段内交错执行，给人的感觉是它们在同时运行，但实际上，在任何一个精确的瞬间，处理器可能只在处理一个任务。而并行（Parallelism）则意味着多个任务或任务的不同部分在同一时刻被多个处理器核心或处理单元实际地同时执行。在Python的世界里，由于全局解释器锁（GIL）的存在，这两者之间的界限和实现方式显得尤为特殊和重要。

理解这个问题，我们首先要明确Python在处理多任务时的几种主要策略，以及它们各自的适用场景和局限性。在我看来，很多人初学时会混淆线程（threading）和进程（multiprocessing）的用途，甚至对异步（asyncio）的工作机制一知半解，这往往导致在性能优化上走了不少弯路。

Python的并发策略：线程与异步IO

当谈到并发，Python主要提供了两种内建机制：多线程（

threading

登录后复制

模块）和异步IO（

asyncio

登录后复制

模块）。这两种方式都致力于让程序在面对大量I/O密集型任务时，不至于因为等待外部资源（如网络请求、文件读写）而完全阻塞。

多线程，从操作系统的角度看，确实创建了多个执行流。每个线程共享相同的内存空间，这使得数据共享相对容易，但也带来了复杂的同步问题。然而，在Python中，由于GIL的存在，即便我们启动了多个线程，它们也无法真正地在多个CPU核心上并行执行CPU密集型任务。GIL保证了在任何时刻，只有一个线程能够持有Python解释器的控制权。这意味着，如果你的任务是计算密集型的，多线程并不会带来性能上的提升，甚至可能因为线程切换的开销而略有下降。我个人认为，多线程在Python里最适合的场景是那些I/O密集型任务，因为当一个线程在等待I/O操作完成时（比如等待网络响应），它会主动释放GIL，让其他线程有机会运行。这就像一家餐厅里，虽然只有一个厨师（GIL），但他可以在等待烤箱里的蛋糕（I/O）时，去处理另一份沙拉（另一个线程的CPU任务）。

立即学习“Python免费学习笔记（深入）”；

异步IO，以

asyncio

登录后复制

为代表，则是另一种完全不同的并发模型。它基于事件循环（event loop）和协程（coroutines），通过单线程协作式多任务的方式实现并发。简单来说，你的代码会明确地“告诉”解释器，当某个操作（通常是I/O操作）需要等待时，它可以暂停当前任务，去执行其他已经准备好的任务，等到等待的操作完成后再回来继续。这就像一个高效的厨师，在等待烤箱里的蛋糕时，会主动去切菜、备料，而不是傻傻地站着。

asyncio

登录后复制

的优势在于其极高的并发效率和资源利用率，尤其适合处理成千上万个并发连接的场景，比如Web服务器、爬虫等。它的缺点是需要代码以

async/await

登录后复制

的方式编写，并且需要所有涉及的库都支持异步操作，否则就可能遇到阻塞。

Python的全局解释器锁（GIL）到底意味着什么，它如何影响并发？

Python的全局解释器锁（Global Interpreter Lock，简称GIL）是一个在CPython（Python最常用的实现）中存在的机制，它确保在任何时间点，只有一个线程在执行Python字节码。这听起来有点反直觉，尤其是在多核处理器普及的今天。但它的存在有其历史原因和技术考量，主要是为了简化CPython的内存管理，并使C语言扩展更容易集成。

在我看来，GIL是理解Python并发和并行之间差异的关键。它直接导致了Python的多线程无法实现真正的并行计算，即无法利用多核CPU的优势来加速CPU密集型任务。当你的Python程序启动多个线程去执行大量计算时，它们实际上是在争夺GIL，每次只有一个线程能获得执行权。这就像你有很多工人（线程），但他们都挤在一个狭窄的门口（GIL），一次只能通过一个人。这样一来，增加工人数量并不会让工作完成得更快，反而可能因为争抢和协调而降低效率。

然而，GIL并非一无是处，它在I/O密集型任务中表现得并不那么“坏”。当Python线程执行I/O操作（如读写文件、网络通信）时，它会主动释放GIL，允许其他线程获取GIL并执行Python代码。这意味着，如果你的程序大部分时间都在等待外部响应，那么多线程仍然可以有效地提高程序的吞吐量。举个例子，一个下载文件的线程在等待网络数据时释放GIL，另一个线程就可以去处理用户界面更新，或者发起另一个网络请求。这正是

threading

登录后复制

模块在I/O密集型场景下依然有其价值的原因。但需要注意的是，这种“并发”仍然不是“并行”，因为CPU核心并没有被多个Python线程同时利用。

行者AI

行者AI绘图创作，唤醒新的灵感，创造更多可能

100

查看详情

什么时候应该用

threading

登录后复制

，什么时候用

asyncio

登录后复制

，它们有什么本质区别？

选择

threading

登录后复制

还是

asyncio

登录后复制

，这往往是开发者在面对并发任务时的一个常见困惑。我个人觉得，这两种技术各有侧重，理解它们的本质区别能帮助我们做出更明智的决策。

threading

登录后复制

（多线程）更适合那些：

I/O密集型任务：如网络请求、文件读写、数据库操作等，这些操作在等待时会释放GIL，允许其他线程执行。
现有阻塞API的集成：如果你需要与大量使用阻塞式I/O的第三方库或系统API交互，
```
threading
```
登录后复制
可能是更直接、更简单的选择，因为你可以直接将阻塞调用放在一个单独的线程中。
少量并发任务：对于少量、独立的并发任务，
```
threading
```
登录后复制
的实现通常更简单直观。

asyncio

登录后复制

（异步IO）则更适合：

高并发I/O密集型任务：当你的应用需要同时处理成千上万个并发连接时（例如Web服务器、高性能爬虫），
```
asyncio
```
登录后复制
的非阻塞、事件驱动模型能提供更高的效率和更低的资源消耗。
需要精细控制任务调度：
```
asyncio
```
登录后复制
的协程模型允许你对任务的暂停和恢复有更细粒度的控制，这对于构建复杂的异步逻辑非常有用。
新的项目或生态系统：如果你的项目从一开始就设计为异步，并且使用的库都支持
```
async/await
```
登录后复制
语法，那么
```
asyncio
```
登录后复制
会是一个非常强大的选择。

本质区别在于它们的并发模型：

threading
登录后复制
是基于操作系统的抢占式多任务：操作系统负责线程的调度和切换，它可以在任何时候中断一个线程去执行另一个线程。线程是重量级的，创建和切换开销相对较大。
asyncio
登录后复制
是基于单线程的协作式多任务：它在单个OS线程中运行，通过一个事件循环来调度协程。协程需要明确地通过
```
await
```
登录后复制
关键字“让出”控制权，才能让事件循环去执行其他任务。协程是轻量级的，切换开销极小。

在我看来，

threading

登录后复制

更像是“被动”的并发，它依赖于GIL的释放和操作系统的调度；而

asyncio

登录后复制

则是“主动”的并发，它要求开发者在代码层面明确地管理任务的切换。

如何在Python中实现真正的并行计算？

multiprocessing

登录后复制

是唯一的选择吗？

要在Python中实现真正的并行计算，即充分利用多核CPU的优势，

multiprocessing

登录后复制

模块是目前最直接、最常用的原生解决方案。它通过创建新的进程来绕过GIL的限制。每个新进程都有自己独立的Python解释器和内存空间，因此它们各自拥有一个GIL，互不影响，从而实现了真正的并行执行。

multiprocessing

登录后复制

的工作原理和适用场景：

multiprocessing

登录后复制

模块提供了

Process

登录后复制

类，可以像使用

threading.Thread

登录后复制

一样创建和启动进程。它的核心思想是“以空间换时间”，通过复制父进程的内存空间（或在Unix-like系统上使用写时复制，copy-on-write）来创建子进程。这使得每个进程都能独立运行CPU密集型任务，互不干扰。

优点：
- 绕过GIL：实现真正的并行计算，充分利用多核CPU。
- 进程隔离：不同进程之间内存独立，避免了多线程中常见的共享数据竞争问题（但也带来了进程间通信的复杂性）。
缺点：
- 资源开销大：创建和管理进程比线程更消耗系统资源（内存、CPU）。
- 进程间通信（IPC）复杂：由于内存隔离，进程间需要通过队列（
```
Queue
```
  登录后复制
  ）、管道（
```
Pipe
```
  登录后复制
  ）、共享内存等机制进行通信，这比线程间直接共享数据要复杂。
- 数据序列化：在进程间传递数据时，通常需要进行序列化和反序列化，这会带来额外的开销。

multiprocessing

登录后复制

是唯一的选择吗？ 从Python原生库的角度看，

multiprocessing

登录后复制

确实是实现单机多核并行计算的“主力军”。但如果把视野放宽，还有其他一些方式可以实现或辅助实现并行计算：

C/C++扩展（如NumPy、SciPy）：许多高性能的Python库（尤其是科学计算领域）底层是用C、C++或Fortran实现的。这些底层代码在执行时可以释放GIL，从而允许底层的C代码在多个CPU核心上并行运行，即使Python解释器本身只有一个GIL。当我们使用NumPy进行矩阵运算时，它内部的C代码可以并行执行，这正是Python在数据科学领域表现出色的一个重要原因。
JIT编译器（如PyPy、Numba）：一些替代的Python实现（如PyPy）或库（如Numba）通过即时编译（JIT）技术，可以将Python代码转换为更高效的机器码，有时甚至可以绕过GIL或提供更优化的并行执行能力。Numba的
```
@jit(nopython=True, parallel=True)
```
登录后复制
装饰器就是一个例子，它可以将Python循环转换为并行执行的机器码。
分布式计算框架（如Dask、Ray、Apache Spark）：对于需要跨多台机器甚至集群进行并行计算的场景，这些框架提供了更高层次的抽象。它们通常会在底层使用进程或更复杂的调度机制来管理任务，将计算分布到多个节点上。虽然它们不是直接替代
```
multiprocessing
```
登录后复制
的单机并行方案，但它们是解决更大规模并行计算问题的答案。

总的来说，对于大多数Python开发者而言，当需要利用多核CPU进行CPU密集型任务时，