Protobuf通过定义.proto文件实现高效数据序列化,使用protoc生成C++代码,通过SerializeToOstream和ParseFromIstream完成序列化与反序列化,支持跨语言通信,需保持字段编号不变以确保兼容性。

在C++中使用Protobuf(Protocol Buffers)进行数据序列化,是实现高效结构化数据编码和跨语言通信的常用方案。Google开发的Protobuf以二进制格式存储数据,相比JSON或XML更小、更快,并天然支持多语言,非常适合服务端通信、配置文件、持久化等场景。
定义.proto文件描述数据结构
Protobuf的核心是通过.proto文件定义消息格式。以下是一个简单的例子,描述一个用户信息结构:
syntax = "proto3";
message User {
int32 id = 1;
string name = 2;
string email = 3;
}
保存为user.proto。注意字段后的数字是唯一标识(tag),用于二进制编码时识别字段。
生成C++代码
使用protoc编译器将.proto文件编译为C++头文件和源文件:
立即学习“C++免费学习笔记(深入)”;
protoc --cpp_out=. user.proto
会生成user.pb.h和user.pb.cc。这些文件包含User类的定义,提供序列化、反序列化方法以及访问字段的getter/setter。
在C++中序列化与反序列化
包含生成的头文件,创建对象并进行序列化:
#include "user.pb.h" #includeint main() { User user; user.set_id(1001); user.set_name("Alice"); user.set_email("alice@example.com"); // 序列化到文件 std::ofstream output("user.data", std::ios::binary); user.SerializeToOstream(&output); output.close(); // 从文件反序列化 User received_user; std::ifstream input("user.data", std::ios::binary); received_user.ParseFromIstream(&input); input.close(); std::cout << "ID: " << received_user.id() << std::endl; std::cout << "Name: " << received_user.name() << std::endl;
SerializeToOstream 和 ParseFromIstream 是常用方法,也可使用 SerializeToArray、ParseFromArray 操作内存缓冲区。
跨语言通信的关键点
Protobuf真正优势体现在跨语言场景。只要各语言使用同一份.proto文件生成对应代码,就能保证数据兼容。
- 不同服务(如C++后端与Python脚本)可通过相同的User消息交换数据
- 新增字段应使用optional并赋予默认值,确保向后兼容
- 不要更改已有字段的类型或编号,避免解析错误
例如,Java端用同一user.proto生成类,可直接读取C++写入的user.data文件。
基本上就这些。只要定义好协议,C++中使用Protobuf序列化非常直接,配合gRPC还能实现高性能远程调用。关键是维护好.proto文件,它是跨语言协作的数据契约。











