
本文探讨了#%#$#%@%@%$#%$#%#%#$%@_23eeeb4347bdd26bfc++6b7ee9a3b755dd并行化调用c/c++原生库函数的策略。分析了多进程与多线程在原生代码执行时的适用性,强调全局解释器锁(gil)在此类场景下的作用。文章指出,python内置并行机制通常已足够高效,并评估了转向底层语言重写的必要性与成本,为开发者提供优化决策指导。
在Python中,并行化策略的选择通常围绕着全局解释器锁(GIL)展开。GIL是一个互斥锁,它确保在任何给定时刻只有一个线程执行Python字节码。这导致了对CPU密集型任务通常推荐使用multiprocessing(多进程),而对I/O密集型任务则推荐使用threading(多线程)的普遍经验法则。
然而,更深层次的理解是:
值得注意的是,如果一个CPU密集型任务的大部分计算是在原生(C/C++)代码中完成的,那么它也可能属于“大部分时间不需要GIL”的类别。这是因为当Python代码调用原生库函数时,原生代码在执行期间通常会释放GIL,允许其他Python线程运行。
当Python函数(例如train_xgboost)几乎所有时间都在调用底层的C++库代码时,无论是使用multiprocessing还是threading,都可能获得显著的性能提升。以XGBoost为例,其核心算法是用C++实现的。当Python脚本调用train_xgboost时,大部分计算发生在C++层面,此时GIL会被释放。
立即学习“Python免费学习笔记(深入)”;
考虑以下场景,我们希望并行训练多个XGBoost模型:
import concurrent.futures
import time
import random
# 假设这是一个模拟的XGBoost训练函数,内部调用C++代码
def train_xgboost(col_name):
    print(f"开始训练模型 for {col_name}...")
    # 模拟调用C++库的耗时操作,期间GIL可能被释放
    time.sleep(random.uniform(1, 3))
    print(f"完成训练模型 for {col_name}.")
    return f"Model trained for {col_name}"
col_list = [f"feature_{i}" for i in range(10)]在这种情况下,我们可以尝试使用concurrent.futures模块进行并行化:
print("\n--- 使用 ProcessPoolExecutor ---")
with concurrent.futures.ProcessPoolExecutor() as pool:
    results_process = list(pool.map(train_xgboost, col_list))
print("多进程训练结果:", results_process)ProcessPoolExecutor会创建独立的Python进程。每个进程都有自己的Python解释器和内存空间,因此它们之间不存在GIL竞争。这确保了真正的并行执行,但进程创建和通信的开销相对较高。
print("\n--- 使用 ThreadPoolExecutor ---")
with concurrent.futures.ThreadPoolExecutor() as pool:
    results_thread = list(pool.map(train_xgboost, col_list))
print("多线程训练结果:", results_thread)ThreadPoolExecutor会在同一个Python进程中创建多个线程。由于train_xgboost函数在调用C++库时会释放GIL,多个线程可以并发地执行这些原生代码,从而实现并行加速。相较于多进程,多线程的启动开销和内存占用通常更小。
在这两种情况下,如果train_xgboost函数确实大部分时间都在执行原生代码,那么两种方法都可能带来显著的加速。具体哪种效果更好,往往取决于任务的粒度、Python与原生代码交互的频率以及系统资源。
对于主要调用C/C++库的Python函数,是否需要完全重写为C/C++(例如使用XGBoost的C API并结合OpenMP)来进一步提升性能?
通常情况下,答案是不一定,并且很可能收益不大。原因如下:
在对主要调用原生库的Python函数进行并行化时:
以上就是优化Python并行:原生代码执行场景下的多进程与多线程实践的详细内容,更多请关注php中文网其它相关文章!
 
                        
                        每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
 
                Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号