Python中如何创建多线程？多线程编程需要注意哪些问题？

下次还敢

发布时间：2025-06-29 23:54:02

713人浏览过

来源于php中文网

原创

python创建多线程主要有两种方式：1.使用threading模块创建thread对象或继承thread类重写run方法；2.使用concurrent.futures模块的threadpoolexecutor提交任务。多线程编程需注意线程安全问题，常用锁（lock）、信号量（semaphore）或条件变量（condition）实现同步，避免数据竞争。gil限制了python多线程的cpu密集型性能，但i/o密集型任务仍可受益于多线程。为避免死锁，应破坏其四个必要条件之一，如按序获取资源或设置超时机制。线程间通信推荐使用queue.queue等线程安全结构，确保数据传递的安全性和顺序性。

Python中如何创建多线程？多线程编程需要注意哪些问题？

Python创建多线程，主要依赖threading模块，当然，concurrent.futures也是一个不错的选择，它提供了更高级的接口，可以更容易地管理线程池。多线程编程，坑不少，需要小心翼翼。

使用threading模块，你可以直接创建Thread对象，并传入要执行的函数。或者，更优雅一点，可以创建一个继承自Thread的类，重写run方法。

使用concurrent.futures，你可以创建一个ThreadPoolExecutor，然后使用submit方法提交任务。这个方法返回一个Future对象，你可以用它来获取任务的结果，或者检查任务是否完成。

立即学习“Python免费学习笔记（深入）”；

创建多线程的方法有很多，选择哪种取决于你的具体需求。

多线程编程需要注意以下问题：

线程安全：如何避免数据竞争？

线程安全是多线程编程的核心问题。多个线程同时访问和修改共享数据时，如果没有适当的同步机制，就可能出现数据竞争，导致程序出现意想不到的错误。想象一下，两个线程同时对一个银行账户进行操作，一个存款，一个取款，如果没有任何保护措施，账户余额可能会变得一团糟。

要避免数据竞争，最常用的方法是使用锁。Python提供了threading.Lock对象，你可以用它来保护共享资源。在访问共享资源之前，线程需要先获取锁；访问完成后，需要释放锁。这样，同一时刻只有一个线程可以访问共享资源，从而避免数据竞争。

除了锁，还可以使用其他的同步机制，比如threading.Semaphore、threading.Condition等。Semaphore可以控制同时访问某个资源的线程数量；Condition则可以实现线程之间的等待和通知。

选择哪种同步机制，取决于你的具体需求。一般来说，如果只是简单地保护共享资源，使用锁就足够了。如果需要实现更复杂的线程同步逻辑，可以考虑使用Semaphore或Condition。

例如，下面是一个使用锁保护共享资源的例子：

import threading

balance = 0
lock = threading.Lock()

def deposit(amount):
    global balance
    lock.acquire()
    try:
        balance += amount
    finally:
        lock.release()

def withdraw(amount):
    global balance
    lock.acquire()
    try:
        if balance >= amount:
            balance -= amount
        else:
            print("余额不足")
    finally:
        lock.release()

在这个例子中，deposit和withdraw函数都使用了锁来保护balance变量。这样，即使多个线程同时调用这两个函数，也不会出现数据竞争。

GIL：Python多线程的性能瓶颈？

GIL，Global Interpreter Lock，全局解释器锁，是Python解释器中的一个机制。它保证同一时刻只有一个线程可以执行Python字节码。这意味着，即使你的机器有多个CPU核心，Python的多线程程序也无法真正地并行执行。这无疑是Python多线程的一个重大限制。

那么，GIL的存在是否意味着Python多线程毫无用处呢？当然不是。对于I/O密集型任务，比如网络请求、文件读写等，多线程仍然可以提高程序的性能。这是因为，当一个线程在等待I/O操作完成时，GIL会被释放，允许其他线程执行。这样，多个线程可以交替执行，从而提高程序的整体吞吐量。

对于CPU密集型任务，多线程的性能提升并不明显。甚至在某些情况下，由于线程切换的开销，多线程的性能可能还不如单线程。

要绕过GIL的限制，可以使用多进程。Python的multiprocessing模块允许你创建多个进程，每个进程都有自己的Python解释器和GIL。这样，多个进程就可以真正地并行执行，从而充分利用多核CPU的性能。

Dreamhouse AI

AI室内设计，快速重新设计你的家，虚拟布置家具

下载

当然，多进程编程也有自己的缺点。进程之间的通信需要使用IPC（Inter-Process Communication）机制，比如管道、队列、共享内存等，这比线程之间的通信要复杂一些。此外，进程的创建和销毁开销也比线程要大。

所以，在选择多线程还是多进程时，需要根据你的具体需求进行权衡。如果你的任务是I/O密集型的，多线程可能是一个不错的选择。如果你的任务是CPU密集型的，或者你需要充分利用多核CPU的性能，那么应该考虑使用多进程。

死锁：如何避免线程互相等待？

死锁是指两个或多个线程互相等待对方释放资源，导致所有线程都无法继续执行的情况。这就像两辆车在狭窄的道路上迎头相撞，谁也无法前进。

死锁的发生通常需要满足以下四个条件：

互斥条件：资源只能被一个线程占用。
占有且等待条件：线程已经占有了一些资源，但还在等待其他线程释放资源。
不可剥夺条件：线程已经占有的资源不能被强制剥夺。
循环等待条件：多个线程形成一个循环等待资源的链。

要避免死锁，最常用的方法是破坏其中的一个或多个条件。

比如，可以避免循环等待条件。可以对所有资源进行编号，线程必须按照编号顺序获取资源。这样，就不会出现循环等待的情况。

或者，可以避免占有且等待条件。线程在获取所有需要的资源之后才能开始执行。如果无法获取所有资源，就释放已经占有的资源，稍后再尝试。

还可以使用超时机制。如果线程在等待资源的时间超过了设定的阈值，就放弃等待，释放已经占有的资源。

死锁是一个复杂的问题，需要仔细分析和设计，才能有效地避免。

线程间的通信：如何安全地传递数据？

线程之间需要共享数据或者传递消息，需要选择合适的通信机制。

一种简单的方法是使用共享变量。但是，正如前面所说，共享变量需要使用锁来保护，否则可能会出现数据竞争。

另一种方法是使用队列。Python的queue模块提供了线程安全的队列，可以用于线程之间传递数据。一个线程可以将数据放入队列，另一个线程可以从队列中取出数据。队列可以保证数据的顺序和完整性。

例如：

import threading
import queue

data_queue = queue.Queue()

def producer():
    for i in range(10):
        data_queue.put(i)
        print(f"Producer put {i} into queue")

def consumer():
    while True:
        data = data_queue.get()
        print(f"Consumer got {data} from queue")
        data_queue.task_done() # 通知队列任务完成

producer_thread = threading.Thread(target=producer)
consumer_thread = threading.Thread(target=consumer)

producer_thread.start()
consumer_thread.start()

data_queue.join() # 等待队列中的所有任务完成

在这个例子中，producer线程将数据放入data_queue，consumer线程从data_queue中取出数据。queue.Queue保证了线程安全。

除了队列，还可以使用其他的通信机制，比如管道、信号量等。选择哪种通信机制，取决于你的具体需求。

总而言之，Python多线程编程需要小心处理线程安全、GIL、死锁和线程间通信等问题。只有充分理解这些问题，才能编写出高效、稳定的多线程程序。

如何为 DataFrame 计算反映函数调用层级的 call_level 列

如何为 DataFrame 计算“调用层级”（Call Level）列

如何通过键盘事件动态重置辐射剂量计算参数

如何为 DataFrame 中的调用栈数据高效计算“调用层级”列

PythonDjango系统学习路线第547讲_核心原理与实战案例详解【教程】