0

0

Python ctypes结构体深度复制技巧:解决指针字段问题

聖光之護

聖光之護

发布时间:2025-09-25 13:59:41

|

947人浏览过

|

来源于php中文网

原创

python ctypes结构体深度复制技巧:解决指针字段问题

本教程详细介绍了如何在Python中使用ctypes库对包含指针字段的结构体进行深度复制。通过结合from_buffer_copy进行浅层复制,并手动迭代和复制指针指向的外部数据,我们能够确保生成一个完全独立的新结构体实例,避免原始数据修改对副本造成影响。

引言

Python的ctypes库为Python程序提供了与C语言兼容的数据类型,并允许直接调用动态链接库中的函数。在处理复杂的C结构体时,我们经常会遇到结构体中包含指针字段的情况。当需要对这类结构体进行复制时,标准的浅层复制(如copy.copy或直接赋值)只会复制指针的地址,而不会复制指针所指向的实际数据。这意味着原始结构体和其副本会共享同一块外部内存,任何对原始数据或副本数据的修改都会相互影响,这在许多场景下并非我们所期望的行为。为了避免这种数据共享问题,我们需要执行深度复制,确保副本拥有其独立的外部数据。

挑战:ctypes.Structure中指针字段的深度复制

当ctypes.Structure中包含ctypes.POINTER类型的字段时,简单的复制操作会带来问题。例如,如果一个结构体有一个POINTER(ct.c_float)字段,它指向一个浮点数数组。直接复制这个结构体只会复制这个指针的内存地址。因此,原结构体和副本中的指针将指向同一块内存区域。

原始尝试中遇到的TypeError: invalid type错误,通常发生在尝试将一个类型(如c_float*self.ChSize[n_channel])而不是一个实例传递给期望实例的方法,或者错误地处理内存地址和类型转换时。addressof函数需要一个ctypes实例作为参数来获取其内存地址,而不能直接用于类型或未正确分配内存的局部变量。此外,将局部ctypes数组的地址赋给结构体字段也存在生命周期问题,一旦局部数组超出作用域,其内存可能被回收,导致指针失效。

正确的深度复制策略

针对ctypes.Structure中包含指针字段的深度复制,我们需要采取一种两阶段策略:

立即学习Python免费学习笔记(深入)”;

  1. 结构体本身的浅层复制: 首先,创建一个新的结构体实例,并复制原始结构体中所有非指针(值类型)字段的内容。对于指针字段,此时它们会复制原始的指针地址。
  2. 指针指向数据的深度复制: 遍历所有指针字段。对于每个指针,创建一个新的内存区域,并将原始指针所指向的数据内容完整地复制到这个新区域。最后,更新副本中对应的指针字段,使其指向这个新分配的内存区域。

这种方法确保了结构体内部的值类型字段被复制,同时,所有外部引用(通过指针)的数据也被独立复制,从而实现了真正的深度复制。

Figstack
Figstack

一个基于 Web 的AI代码伴侣工具,可以帮助跨不同编程语言管理和解释代码。

下载

示例代码

下面是一个完整的示例,展示了如何为一个包含多个POINTER(ct.c_float)字段的Group结构体实现深度复制:

import ctypes as ct

class Group(ct.Structure):
    _fields_ = (('ChSize', ct.c_uint32 * 9),          # 存储每个数据通道的尺寸
                ('DataChannel', ct.POINTER(ct.c_float) * 9), # 9个指向浮点数数组的指针
                ('TriggerTimeLag', ct.c_uint32),
                ('StartIndexCell', ct.c_uint16))

    def __repr__(self):
        """
        为Group对象提供一个可读的字符串表示,便于调试和验证。
        """
        s = f'Group(ChSize={self.ChSize[:]}, TriggerTimeLag={self.TriggerTimeLag}, StartIndexCell={self.StartIndexCell})\n'
        for i in range(9):
            # 尝试访问DataChannel指向的数据,如果指针有效且ChSize指示长度大于0
            try:
                if self.DataChannel[i] and self.ChSize[i] > 0:
                    s += f'  DataChannel[{i}] = {self.DataChannel[i][:self.ChSize[i]]}\n'
                else:
                    s += f'  DataChannel[{i}] = []\n'
            except Exception:
                s += f'  DataChannel[{i}] = \n'
        return s

    def deepcopy(self):
        """
        实现Group结构体的深度复制。
        """
        # 步骤一:创建结构体本身的浅层副本
        # from_buffer_copy会复制所有固定大小的字段,包括指针值。
        copy = Group.from_buffer_copy(self)

        # 步骤二:深度复制指针指向的外部数据
        for i, (size, channel_ptr) in enumerate(zip(self.ChSize, self.DataChannel)):
            if size > 0 and channel_ptr: # 确保通道有数据且指针有效
                # 创建一个新的ctypes数组来存储数据副本
                # (*channel_ptr[:size]) 将原始指针指向的数据解引用并作为列表传递给新数组
                new_data_array = (ct.c_float * size)(*channel_ptr[:size])
                # 将新数组的地址转换为POINTER(ct.c_float)类型,并赋值给副本的DataChannel字段
                copy.DataChannel[i] = ct.cast(new_data_array, ct.POINTER(ct.c_float))
            else:
                # 如果原始通道无数据或指针无效,则副本对应通道也为空
                copy.DataChannel[i] = None 
        return copy

# --- 验证深度复制功能 ---

# 1. 创建、初始化并显示一个原始Group对象
group = Group()
group.ChSize[:] = [1, 2, 3, 4, 5, 6, 7, 8, 9] # 设置每个通道的数据长度
for i, size in enumerate(group.ChSize):
    # 为每个DataChannel分配并初始化独立的浮点数数组
    data = (ct.c_float * size)(*[1.5 * n for n in range(size)])
    group.DataChannel[i] = ct.cast(data, ct.POINTER(ct.c_float))
group.TriggerTimeLag = 123
group.StartIndexCell = 456
print("--- 原始 Group 对象 ---")
print(group)

# 2. 创建原始Group对象的深度副本
copy = group.deepcopy()

# 3. 修改原始Group对象的数据,以验证副本的独立性
print("\n--- 修改原始 Group 对象的数据 ---")
group.ChSize[:] = [0] * 9 # 将所有通道的尺寸设为0
group.DataChannel[:] = [None] * 9 # 将所有DataChannel指针设为None
group.TriggerTimeLag = 999
group.StartIndexCell = 888

print("\n--- 修改后的原始 Group 对象 ---")
print(group)

print("\n--- 深度复制后的 Group 对象 (应保持不变) ---")
print(copy)

输出结果:

--- 原始 Group 对象 ---
Group(ChSize=[1, 2, 3, 4, 5, 6, 7, 8, 9], TriggerTimeLag=123, StartIndexCell=456)
  DataChannel[0] = [0.0]
  DataChannel[1] = [0.0, 1.5]
  DataChannel[2] = [0.0, 1.5, 3.0]
  DataChannel[3] = [0.0, 1.5, 3.0, 4.5]
  DataChannel[4] = [0.0, 1.5, 3.0, 4.5, 6.0]
  DataChannel[5] = [0.0, 1.5, 3.0, 4.5, 6.0, 7.5]
  DataChannel[6] = [0.0, 1.5, 3.0, 4.5, 6.0, 7.5, 9.0]
  DataChannel[7] = [0.0, 1.5, 3.0, 4.5, 6.0, 7.5, 9.0, 10.5]
  DataChannel[8] = [0.0, 1.5, 3.0, 4.5, 6.0, 7.5, 9.0, 10.5, 12.0]

--- 修改原始 Group 对象的数据 ---

--- 修改后的原始 Group 对象 ---
Group(ChSize=[0, 0, 0, 0, 0, 0, 0, 0, 0], TriggerTimeLag=999, StartIndexCell=888)
  DataChannel[0] = []
  DataChannel[1] = []
  DataChannel[2] = []
  DataChannel[3] = []
  DataChannel[4] = []
  DataChannel[5] = []
  DataChannel[6] = []
  DataChannel[7] = []
  DataChannel[8] = []

--- 深度复制后的 Group 对象 (应保持不变) ---
Group(ChSize=[1, 2, 3, 4, 5, 6, 7, 8, 9], TriggerTimeLag=123, StartIndexCell=456)
  DataChannel[0] = [0.0]
  DataChannel[1] = [0.0, 1.5]
  DataChannel[2] = [0.0, 1.5, 3.0]
  DataChannel[3] = [0.0, 1.5, 3.0, 4.5]
  DataChannel[4] = [0.0, 1.5, 3.0, 4.5, 6.0]
  DataChannel[5] = [0.0, 1.5, 3.0, 4.5, 6.0, 7.5]
  DataChannel[6] = [0.0, 1.5, 3.0, 4.5, 6.0, 7.5, 9.0]
  DataChannel[7] = [0.0, 1.5, 3.0, 4.5, 6.0, 7.5, 9.0, 10.5]
  DataChannel[8] = [0.0, 1.5, 3.0, 4.5, 6.0, 7.5, 9.0, 10.5, 12.0]

从输出可以看出,即使原始group对象的数据(包括ChSize、DataChannel指向的数据以及其他值类型字段)被修改,copy对象依然保持了其创建时的状态,证明了深度复制的成功。

注意事项

  • ctypes.Structure.from_buffer_copy(): 这是实现结构体本身浅层复制的关键。它通过复制内存缓冲区来创建新实例,确保所有固定大小的字段(包括指针地址)被复制。
  • ctypes.cast(): 用于将一个ctypes对象(如新创建的ctypes数组实例)的地址转换为特定的POINTER类型。这是将新分配的数据地址赋给结构体指针字段的正确方式。
  • 内存管理: 通过 (ct.c_float * size)(*channel_ptr[:size]) 这种方式创建的 ctypes 数组实例,其内存由Python的垃圾回收机制管理。这意味着我们无需像C语言那样手动 malloc 和 free 内存。只要有对 new_data_array 或其 ct.cast 结果的引用存在,内存就不会被释放。
  • 字段类型与长度信息: 在实现深度复制时,必须清楚地知道哪些字段是指针,以及这些指针指向的数据的类型和长度。通常,数据长度信息会存储在结构体中的其他字段(如本例中的ChSize)中。
  • __repr__ 方法: 为ctypes.Structure实现一个清晰的__repr__方法对于调试和验证深度复制结果至关重要。它能直观地展示结构体及其指针字段的内容。

总结

对包含指针字段的ctypes.Structure进行深度复制是Python与C语言交互时的一个常见需求。通过结合ctypes.Structure.from_buffer_copy()进行结构体本身的浅层复制,并手动迭代、创建新的ctypes数组并使用ctypes.cast()更新指针字段,我们可以有效地实现完全独立的深度副本。这种方法确保了数据的完整性和独立性,避免了因共享内存而导致的潜在问题,是ctypes编程中处理复杂结构体的专业实践。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

758

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

639

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

761

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

618

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1265

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

548

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

708

2023.08.11

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

43

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 12.2万人学习

成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号