如何在 Python 多进程环境中安全使用 NumPy 向量化函数

花韻仙語

发布时间：2026-01-17 10:14:23

459人浏览过

来源于php中文网

原创

如何在 Python 多进程环境中安全使用 NumPy 向量化函数

本文详解为何 `np.vectorize()` 创建的函数无法被 `multiprocessing` 或 `pathos.multiprocess` 正确序列化，并提供可落地的解决方案：延迟初始化向量化函数，确保其在子进程中构建而非跨进程传递。

在使用 multiprocessing.Process 或 pathos.multiprocess 进行并行计算时，Python 依赖 pickle（或 dill）对函数、对象及其状态进行序列化与反序列化，以在子进程中重建执行环境。然而，np.vectorize() 返回的对象是一个特殊的 numpy.vectorize 实例，其底层封装了原始函数（如 _wind_dfn）并生成一个不可直接 pickle 的 ufunc-类对象。当该对象作为类属性在主进程初始化（如 __init__ 中赋值），再随实例传入子进程时，pickle 会尝试序列化该向量化函数——但因其动态生成、无全局可导入路径（不在 __main__ 或模块顶层命名空间中），最终抛出类似以下错误：

_pickle.PicklingError: Can't pickle : attribute lookup _wind_dfn (vectorized) on __main__ failed

根本原因：np.vectorize 不是“纯函数构造器”，它返回的实例绑定着闭包和内部状态，且 pickle 无法可靠还原其来源；而 multiprocessing 要求所有跨进程传递的对象必须可被 pickle 完整序列化。

✅ 推荐解决方案：惰性初始化（Lazy Initialization）
避免在 __init__ 中预先创建 np.vectorize 对象，改为在首次调用时按需构建，并缓存于实例属性中。这样，向量化函数总是在当前进程内创建，完全绕过序列化瓶颈。

以下是修正后的代码结构（基于原示例优化）：

import abc
import numpy as np
from multiprocessing import Process

class ProblemClassBase(metaclass=abc.ABCMeta):
    def __init__(self):
        # ✅ 不在此处创建 vectorize 对象
        self._problem_function_vectorized = None

    @abc.abstractmethod
    def problem_function(self, arg):
        pass

    def use(self, arg):
        # ✅ 惰性构建：仅在第一次 use() 调用时初始化
        if self._problem_function_vectorized is None:
            self._problem_function_vectorized = np.vectorize(
                self.problem_function,
                otypes=[np.float64]
            )
        return self._problem_function_vectorized(arg)

class ProblemClass(ProblemClassBase):
    def problem_function(self, arg):
        if arg > 2:
            return arg + 1
        else:
            return arg - 1

class NestingClass:
    def __init__(self, problem_object):
        self.po = problem_object

    def make_problem(self, arg):
        return self.po.use(arg)

class MainClass:
    def __init__(self):
        self.problem_obj = ProblemClass()
        self.nesting_obj = NestingClass(self.problem_obj)

    def run(self, arg):
        return self.nesting_obj.make_problem(arg)

    @classmethod
    def run_multiproc(cls, arg):
        obj = cls()
        result = obj.run(arg)
        print(f"Process result for {arg}: {result}")
        return result  # 可通过 Queue / Pipe 返回

def run_parallel():
    proc = Process(target=MainClass.run_multiproc, args=(5,))
    proc.start()
    proc.join()

if __name__ == "__main__":
    run_parallel()

? 关键改进点说明：

白瓜AI

白瓜AI，一个免费图文AI创作工具，支持 AI 仿写，图文生成，敏感词检测，图片去水印等等。

下载

立即学习“Python免费学习笔记（深入）”；

self._problem_function_vectorized 初始化为 None，不触发 np.vectorize；
use() 方法中检查缓存，未初始化则当场构建并保存，后续调用直接复用；
所有 np.vectorize 调用均发生在子进程内部（run_multiproc → cls() → use()），彻底规避跨进程传递问题。

⚠️ 注意事项：

若需支持高并发多调用（如每次 use() 输入不同 dtype），建议显式指定 otypes 并确保 problem_function 返回类型稳定；
np.vectorize 本身不提升性能（仅为语法糖），真实加速应依赖 numba.jit、numpy.ufunc 原生操作或 dask 等；此处仅解决可序列化问题；
使用 pathos.multiprocess（基于 dill）虽能序列化更多对象，但 np.vectorize 实例仍属高危项，惰性初始化仍是更健壮、可移植的设计。

? 总结：多进程场景下，切勿将 np.vectorize、lambda、嵌套函数、闭包或任何非模块级可导入对象作为类/实例属性提前初始化。坚持“进程内构建、按需缓存”原则，即可兼顾简洁性与并行鲁棒性。

Python 如何让一个类的方法在运行时动态替换

Python dataclass 如何让 post_init 里修改默认值

如何用Python优雅实现逗号分隔列表（含“and”连接）

Python 如何在类型提示里表示“这个参数不能是 None 但可以缺省”

Python 如何安全删除目录树（即使里面有只读文件）

相关标签:

python ai win Python numpy 命名空间封装 Lambda 闭包并发对象

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何基于首次出现的下划线分割 Pandas 列为两部分下一篇：如何基于首次出现的下划线分割 Pandas 列

作者最新文章

Python 列表为空？警惕循环中意外重置变量的常见陷阱

2026-01-17 12:29

RTX50系显卡出货大砍！今年一整年恐无新显卡

2026-01-17 12:31

解析 Python 类型注解字符串以提取泛型参数（如 Tuple 中的子类型）

2026-01-17 12:32

Go 中 map 迭代顺序的不确定性与格式化动词无关

2026-01-17 12:34

如何通过按钮点击复制并重命名文件（PHP 实现）

2026-01-17 13:05

《生化危机9：安魂曲》回归浣熊市原因曝光！让系列重回主线

2026-01-17 13:06

如何用Python优雅实现逗号分隔列表（含“and”连接）

2026-01-17 13:09

《勇者斗恶龙7 Reimagined》职业系统/强敌怪物等介绍

2026-01-17 13:15

Go语言解析SOAP响应XML的完整教程：解决命名空间导致的结构体字段为空问题

2026-01-17 13:15

《上古卷轴4：湮灭重制版》在PS5平台卖出110万份

2026-01-17 13:28

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

758

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

639

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

761

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

618

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1264

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

548

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

708

2023.08.11