C++中通过不可变数据和结构共享实现持久化数据结构,利用std::shared_ptr支持版本共存与内存优化,适用于撤销机制、并发安全等场景。

在C++中实现持久化数据结构,核心是借鉴函数式编程思想——使用不可变(immutable)数据和共享结构来保留历史版本。虽然C++本身是命令式语言,但通过合理的设计,完全可以模拟出类似函数式语言中的持久化行为。
理解持久化与不可变性
持久化数据结构指的是每次“修改”操作后,旧版本的数据依然可用。这通常通过避免原地修改,转而创建新版本来实现。不可变性确保了数据一旦创建就不能更改,从而天然支持线程安全和版本回溯。
例如,一个持久化的列表,在添加元素后返回新列表,而原列表保持不变:
- 不可变操作不会破坏原有数据 - 每次变更生成新对象,旧对象仍可访问 - 结构共享可大幅减少内存开销用共享指针实现结构共享
C++中可以通过std::shared_ptr高效实现结构共享。以一个简单的持久化单链表为例:
立即学习“C++免费学习笔记(深入)”;
定义节点:
templatestruct PersistentList { T value; std::shared_ptr > next; // 构造空列表 PersistentList() : next(nullptr) {} // 构造带值的节点 PersistentList(T val, std::shared_ptr> tail) : value(val), next(std::move(tail)) {} };
插入操作返回新列表:
templatestd::shared_ptr > prepend( const T& val, const std::shared_ptr >& old_list ) { return std::make_shared >(val, old_list); } 这里新节点指向原列表头,实现了O(1)时间复杂度的插入,并自动共享后续结构。
递归操作与函数式风格
配合lambda或函数对象,可以写出接近函数式风格的代码。比如实现map操作:
templatestd::shared_ptr > map( const std::shared_ptr >& list, F func ) { if (!list || !list->next) return list; auto rest = map(list->next, func); return std::make_shared>(func(list->value), rest); }
这种递归加构造新节点的方式,保证了原结构不受影响,符合不可变原则。
优化与实际考虑
虽然上述链表简单直观,但真实场景可能需要更复杂的结构,如持久化数组(使用哈希数组映射试树 HAMT)或平衡树。不过基本思想一致:
- 修改操作返回新根节点 - 尽量复用未变化的子树 - 使用引用计数自动管理内存STL容器是可变的,不适合直接用于持久化。你需要自己封装或使用第三方库(如immer)。但理解其原理后,哪怕小范围使用不可变模式,也能提升代码的可预测性和安全性。
基本上就这些。C++虽非函数式语言,但通过智能指针和值语义,完全可以实践持久化与不可变思想,尤其适合配置管理、撤销机制、并发读写等场景。











