首页 > 后端开发 > C++ > 正文

如何使用Perf工具分析c++程序的性能瓶颈【Linux性能分析】

冰火之心
发布: 2025-12-19 15:46:02
原创
164人浏览过
c++kquote>Perf 是 Linux 下精准定位 C++ 程序 CPU 瓶颈、缓存失效及分支预测失败的核心工具;需带调试符号编译,用 perf record -g 采样后通过 perf report -g --no-children 查看 Self 占比高的函数,并结合 cache-misses/cache-references > 5% 等指标识别缓存问题。

如何使用perf工具分析c++程序的性能瓶颈【linux性能分析】

Perf 是 Linux 下最强大的性能分析工具之一,能直接对接内核事件,精准定位 C++ 程序的 CPU 热点、函数调用开销、缓存失效、分支预测失败等底层瓶颈。关键不是“跑 perf record”,而是选对事件、过滤干扰、结合符号信息读懂输出。

快速定位 CPU 瓶颈函数(最常用场景)

先确认程序已编译带调试符号(-g),且未过度优化(-O2 可接受,避免 -O3 内联过度导致函数名丢失)。运行:

perf record -g -p $(pidof your_program) sleep 10

或对单次运行采样:

perf record -g ./your_program arg1 arg2

然后生成火焰图或直接查看调用

立即学习C++免费学习笔记(深入)”;

perf report -g --no-children

重点关注 Self 列占比高的函数——这是该函数自身耗时(不含子调用),通常就是瓶颈源头。若某函数 Self 很低但 Children 很高,说明它只是“中转站”,真正耗时在它调用的下层函数里。

识别缓存与内存访问问题

C++ 性能常卡在 L1/L2 缓存未命中或内存带宽上。用以下命令捕获关键硬件事件:

eMart 网店系统
eMart 网店系统

功能列表:底层程序与前台页面分离的效果,对页面的修改无需改动任何程序代码。完善的标签系统,支持自定义标签,公用标签,快捷标签,动态标签,静态标签等等,支持标签内的vbs语法,原则上运用这些标签可以制作出任何想要的页面效果。兼容原来的栏目系统,可以很方便的插入一个栏目或者一个栏目组到页面的任何位置。底层模版解析程序具有非常高的效率,稳定性和容错性,即使模版中有错误的标签也不会影响页面的显示。所有的标

eMart 网店系统 0
查看详情 eMart 网店系统
  • perf record -e cycles,instructions,cache-references,cache-misses,mem-loads,mem-stores -g ./your_program
  • perf stat -e cycles,instructions,cache-misses,LLC-load-misses,branch-misses ./your_program

关注几个比值:cache-misses / cache-references > 5% 表示缓存局部性差;LLC-load-misses 高 说明频繁跨核访问或数据分散;instructions / cycles (如低于 0.8)意味着 CPU 常因等待内存而停顿。

分析锁竞争与调度延迟(多线程 C++ 程序)

若程序有明显线程阻塞或吞吐不升反降,检查:

  • perf record -e sched:sched_switch,sched:sched_stat_sleep,sched:sched_stat_blocked -g ./your_program
  • perf script | grep -E "(sleep|blocked)" | head -20

再配合 perf report -F comm,dso,symbol 查看哪些线程在哪段代码里长时间睡眠或被阻塞。常见原因包括:std::mutex 争抢、condition_variable 等待、IO 阻塞、或 std::this_thread::sleep_for 误用。

精简报告并聚焦 C++ 符号(避免汇编干扰)

默认 perf 可能显示大量汇编或模板实例(如 std::_Function_handler<...>),用这些方式提纯:

  • --demangle 自动还原 C++ 函数名(需安装 libstdc++-devel)
  • --no-children 关闭调用树折叠,避免模板膨胀掩盖主干逻辑
  • 过滤掉系统库:添加 -F +sym 并在 report 中输入 / 搜索你的命名空间(如 myapp::
  • 生成火焰图更直观:perf script | FlameGraph/stackcollapse-perf.pl | FlameGraph/flamegraph.pl > perf.svg

不复杂但容易忽略。

以上就是如何使用Perf#%#$#%@%@%$#%$#%#%#$%@_20dc++e2c6fa909a5cd62526615fe2788a分析c++程序的性能瓶颈【Linux性能分析】的详细内容,更多请关注php中文网其它相关文章!

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号