高性能Logger核心是异步写入+内存缓冲+零拷贝+无锁队列;采用SPSC环形缓冲、延迟格式化、批量写盘、原子等级过滤,避免阻塞、分配与锁开销。

高性能Logger的核心设计原则
高性能日志库不是靠“拼命刷磁盘”实现的,而是靠异步写入 + 内存缓冲 + 零拷贝 + 无锁队列组合达成。关键目标是:日志调用不阻塞业务线程、高并发下吞吐稳定、支持分级过滤、避免动态内存分配(尤其是日志热点路径)。
用无锁环形缓冲区做日志队列
主线程(或工作线程)只负责把日志消息快速塞进环形缓冲区,后台线程循环消费并落盘。推荐使用 SPSC(单生产者单消费者)无锁队列,比MPMC轻量得多,也足够满足绝大多数服务场景(一个日志写入点 + 一个日志线程)。
- 用
std::atomic管理读写指针,避免互斥锁开销 - 缓冲区元素预分配(如固定大小结构体),避免 new/delete
- 每个日志项包含时间戳、等级、模块名、格式化后的字符串视图(或原始参数+格式串)
延迟格式化 + 栈上缓冲
不要在日志调用点立刻格式化字符串(比如用 std::ostringstream 或 fmt::format)。这会触发堆分配、多次拷贝、且无法控制格式化时机。
- 记录日志时只保存参数(
int,const char*,std::string_view等)和格式字符串地址 - 在后台线程中统一格式化,用栈上 buffer(如
char buf[512])做快速格式化,超长再 fallback 到 heap - 推荐用
fmt::format_to_n或手写简易 int/float 转字符串函数,避开 iostream 的重量级开销
文件写入优化:批量 + 写缓存 + 直接 I/O
每次 write() 系统调用都有可观开销。应聚合多条日志后一次写入,并绕过 C stdio 缓冲(避免 double-buffering)。
立即学习“C++免费学习笔记(深入)”;
- 后台线程攒够 N 条(如 64 条)或达到缓冲阈值(如 4KB)再刷盘
- 用
open(..., O_WRONLY | O_APPEND | O_CLOEXEC)打开文件,避免fseek和锁 - 对高频日志可启用
O_DIRECT(需对齐内存与 offset),跳过内核 page cache,降低延迟抖动(注意兼容性) - 滚动策略用原子 rename(Linux)或硬链接切换,避免写时加锁或删除旧文件阻塞
线程安全与等级过滤前置
日志等级判断必须在最前端完成——如果当前全局日志级别是 WARNING,那所有 DEBUG 日志连参数构造都不该发生。
- 用
constexpr宏或模板定义等级,编译期裁剪(如#if LOG_LEVEL >= LOG_DEBUG) - 运行期等级用
std::atomic存储,读取无锁;但注意:等级变更需通知所有线程(可通过内存屏障或重载 operator - 模块级开关建议用位图(bitmask)+ 原子 or,开启/关闭毫秒级生效,无需锁
一个极简可运行骨架示意(C++20)
以下不是完整库,而是体现核心思路的最小闭环:
// 日志项(栈可存,无虚函数,无动态内存)
struct LogEntry {
uint64_t ts; // us since epoch
uint8_t level;
uint16_t module_id;
const char* fmt;
std::array args; // 支持最多4个参数(int/ptr/string_view)
};
// SPSC ring queue(省略细节,可用 boost::lockfree::spsc_queue 或自研)
SPSCQueue g_log_queue;
// 主线程调用(零分配、无锁、低延迟)
define LOG_INFO(fmt, ...) do { \
if (g_log_level.load(std::memory_order_relaxed) >= INFO) { \
LogEntry e{get_now_us(), INFO, MOD_NET, fmt, {__VA_ARGS__}}; \
g_log_queue.push(e); \
} \
} while(0)
// 后台线程:取、格式化、写文件(用 pre-allocated buffer + writev 或单次 write)
不复杂但容易忽略:真正压测时,瓶颈常在 gettimeofday、字符串转数字、小内存分配、以及日志文件 fsync 频率。逐项测量,针对性优化。











