perf是Linux内置性能分析工具,配合火焰图可直观定位CPU占用高、响应慢等问题。通过perf record采集调用栈数据,结合FlameGraph工具生成SVG可视化图表,横向宽度反映函数耗时,支持对运行中进程采样。建议编译时保留调试信息和帧指针,使用合理优化级别,并在物理机环境采样以避免失真,通过对比优化前后火焰图评估改进效果。

perf 是 Linux 下内置的性能分析工具,能帮助开发者快速定位程序中的性能瓶颈。配合火焰图(Flame Graph),可以直观地查看函数调用耗时分布。整个过程无需修改代码,也不依赖外部库,是排查 CPU 占用高、响应慢等问题的利器。
安装 perf 工具
perf 通常包含在 Linux 内核源码工具包中,主流发行版可通过包管理器安装:
# Ubuntu/Debiansudo apt install linux-tools-common linux-tools-generic
# CentOS/RHEL/Fedora
sudo yum install perf # CentOS/RHEL
sudo dnf install perf # Fedora
安装后可通过以下命令验证:
perf --version如果提示命令未找到,可能需要加载对应内核版本的 perf 模块,或手动指定路径如 /usr/lib/linux-tools/*/perf。
使用 perf record 收集性能数据
perf record 用于运行目标程序并记录其运行时的调用栈信息。基本语法如下:
perf record -g ./your_program常用参数说明:
- -g:开启调用栈采样(必须加,否则无法生成火焰图)
- -p PID:监控正在运行的进程
- -F freq:设置采样频率(默认 1000 Hz,可设为 997 或 499 避免与系统中断对齐干扰)
- --call-graph dwarf:使用 DWARF 调试信息获取更准确的调用栈(适合有调试符号的程序)
示例:监控一个运行中的 Web 服务进程:
perf record -g -p $(pgrep your_server) -F 997 sleep 30这表示对进程采样 30 秒。
生成火焰图
perf 自身不支持图形化输出,需借助 FlameGraph 工具将 perf.data 转为可视化火焰图。
第一步:克隆 FlameGraph 工具库:
git clone https://github.com/brendangregg/FlameGraph.git第二步:将 perf 数据转换为折叠栈格式:
perf script | FlameGraph/stackcollapse-perf.pl > out.perf-folded第三步:生成 SVG 火焰图:
FlameGraph/flamegraph.pl out.perf-folded > flamegraph.svg完成后,用浏览器打开 flamegraph.svg 文件即可查看。横向宽度代表 CPU 占用时间,越宽表示该函数消耗越多;上层函数覆盖下层调用关系,可点击展开细节。
优化建议与注意事项
为了让火焰图更准确,建议:
- 编译程序时加上 -g 和 -fno-omit-frame-pointer 参数,保留调试信息和调用栈结构
- 使用 Release 模式但保留调试符号(如 -O2 -g)以平衡性能与分析精度
- 避免在虚拟机或容器中采样时出现栈失真,尽量在物理机或支持 perf 的环境中运行
- 若看到大量 [unknown] 或 [kernel] 占比过高,检查是否缺少符号表或权限不足
通过反复采样和对比优化前后的火焰图,可以清晰看到性能改进效果。
基本上就这些。perf + FlameGraph 组合简单高效,是日常性能调优的标准流程之一。掌握它,能大幅缩短排查热点函数的时间。不复杂但容易忽略的是确保调试信息完整和采样方式合理。











