
本教程旨在详细讲解如何在Python中使用`ctypes`库接收并解析通过UDP发送的C语言嵌套结构体数组数据。我们将探讨C语言侧的数据序列化方法,以及Python侧使用`ctypes`进行复杂结构体数据反序列化的正确姿势,并提供一种更简洁的纯Python `struct` 模块实现方案,以提高数据处理效率和代码可读性。
1. 引言:C/C++与Python的数据交互挑战
在跨语言通信,特别是C/C++与Python之间进行数据交换时,经常需要处理复杂的数据结构。当这些结构体包含嵌套结构体或动态数组(通过指针表示)时,通过网络(如UDP)传输原始内存数据会遇到挑战。C语言中的指针在序列化时,其值(内存地址)本身并无意义,我们需要发送的是指针所指向的实际数据内容。本教程将以一个包含嵌套结构体数组的C结构体为例,演示如何在Python中正确接收和解析此类数据。
2. C/C++端数据序列化
原始的C代码尝试通过memcpy(&testStruct, buffer, sizeof(MyStruct))直接复制结构体内存来发送数据。然而,当结构体中包含指针(如MyInnerStruct *InnerStruct)时,memcpy只会复制指针变量本身的值(即一个内存地址),而不会复制指针所指向的实际数组内容。这导致Python端接收到的指针值是无效的,无法正确访问数组数据。
正确的C端序列化方法是,将结构体的所有基本类型字段以及指针所指向的数组元素逐一写入一个字节缓冲区。
立即学习“Python免费学习笔记(深入)”;
C/C++结构体定义:
#include#include #include // For memcpy #include // For network operations (optional for serialization logic) // 禁用一些警告,实际项目中应谨慎处理 #define _WINSOCK_DEPRECATED_NO_WARNINGS #define _CRT_SECURE_NO_WARNINGS #pragma comment(lib, "Ws2_32.lib") struct MyInnerStruct { int intValue; float floatValue; }; struct MyStruct { int intValue; // This field will also serve as the count of InnerStructs float floatValue; MyInnerStruct *InnerStruct; // Pointer to an array of MyInnerStruct }; // 辅助函数:将MyStruct及其内部数组序列化为字节向量 std::vector serializeMyStruct(const MyStruct& s, int innerStructCount) { std::vector buffer; // 确保使用小端序(Little-endian)以匹配Python的' serialized_data = serializeMyStruct(testStruct, innerArrayCount); // 3. UDP发送部分 (此处仅作示例,实际需完善错误处理) WSADATA wsaData; if (WSAStartup(MAKEWORD(2, 2), &wsaData) != 0) { std::cerr << "Failed to initialize winsock." << std::endl; return 1; } int udpSocket = socket(AF_INET, SOCK_DGRAM, 0); if (udpSocket == -1) { perror("Error creating socket"); WSACleanup(); return 1; } sockaddr_in serverAddr; serverAddr.sin_family = AF_INET; serverAddr.sin_port = htons(5000); // 目标端口 serverAddr.sin_addr.s_addr = inet_addr("127.0.0.1"); // 目标IP if (sendto(udpSocket, serialized_data.data(), serialized_data.size(), 0, reinterpret_cast (&serverAddr), sizeof(serverAddr)) == -1) { perror("Error sending data"); closesocket(udpSocket); WSACleanup(); return 1; } std::cout << "Struct sent successfully. Data size: " << serialized_data.size() << " bytes." << std::endl; // 清理 delete[] testStruct.InnerStruct; closesocket(udpSocket); WSACleanup(); return 0; }
关键点:
- serializeMyStruct函数负责将MyStruct的字段和MyInnerStruct数组的每个元素逐个复制到std::vector
缓冲区中。 - testStruct.intValue被用作MyInnerStruct数组的元素数量,这是一种常见的将数组长度与结构体一同传输的方式。
- 字节序(Endianness)非常重要。C++端需要与Python端(struct.pack或struct.unpack的格式字符串)保持一致。本例中,Python使用
3. Python端接收与解析(ctypes方法)
Python的ctypes库允许我们定义与C语言结构体对应的Python类,并直接操作内存。然而,对于从网络接收到的原始字节流,我们不能直接将其强制转换为包含指针的ctypes结构体。因为字节流中的“指针”不再是有效的内存地址,而是序列化时混入的数据。
正确的做法是:
- 首先使用struct模块解析出顶层结构体的基本字段(特别是数组长度)。
- 根据数组长度,动态创建ctypes数组。
- 迭代地从字节流中解析出数组的每个元素,并填充到ctypes数组中。
- 将填充好的ctypes数组的引用赋值给顶层ctypes结构体中的指针字段。
Python ctypes接收端代码:
import socket
import struct
import ctypes as ct
# 定义与C语言对应的内部结构体
class MyInnerStruct(ct.Structure):
_fields_ = (('field4', ct.c_int),
('field5', ct.c_float))
def __repr__(self): # 用于方便打印显示
return f'({self.field4}, {self.field5})'
# 定义与C语言对应的外部结构体
class MyStruct(ct.Structure):
_fields_ = (('field1', ct.c_int),
('field2', ct.c_float),
('field3', ct.POINTER(MyInnerStruct))) # 指向内部结构体数组的指针
def __repr__(self): # 用于方便打印显示
# 访问field3时,需要确保它已被正确赋值为一个数组
if self.field3:
# 使用切片[:self.field1]来获取实际的数组元素,self.field1是数组长度
return f'[{self.field1}, {self.field2}, {list(self.field3[:self.field1])}]'
else:
return f'[{self.field1}, {self.field2}, (null_pointer)]'
# UDP socket设置
HOST = '' # 监听所有可用接口
PORT = 5000
sock = socket.socket(type=socket.SOCK_DGRAM)
sock.bind((HOST, PORT))
print(f"Listening on UDP port {PORT}...")
try:
while True:
# 接收数据,假设最大数据包大小为40960字节
data, addr = sock.recvfrom(40960)
print(f"Received {len(data)} bytes from {addr}")
# 1. 解包MyStruct的field1和field2
# '关键点:
- struct.unpack_from('
- MyInnerStruct * field1:动态创建一个包含field1个MyInnerStruct元素的ctypes数组类型。
- inner_array_type():实例化这个数组类型,得到一个实际的ctypes数组对象。
- struct.calcsize('
- received_struct.field3 = inner_array:这是最关键的一步,将动态创建并填充好的ctypes数组赋值给MyStruct实例中的field3指针。ctypes会自动处理这种赋值,使得field3指向inner_array的内存。
4. Python端接收与解析(纯Python struct方法)
对于从网络接收的序列化数据,如果不需要将数据回传给C库或者进行内存层面的直接操作,使用纯Python类结合struct模块进行解析通常更简单、更高效,且避免了ctypes指针的复杂性。
这种方法的核心思想是:定义普通的Python类来表示C结构体,并为这些类添加from_data或from_data_array等工厂方法,负责从原始字节流中解析数据并创建Python对象。
Python struct接收端代码:
import socket
import struct
# 定义内部结构体的纯Python类
class MyInnerStruct:
_format = '










