C++编译过程分为预处理、编译、汇编、链接四个阶段:预处理执行文本替换与文件拼接;编译进行语法语义分析并生成汇编代码;汇编将汇编代码转为目标文件;链接解析符号、重定位并合并库,生成可执行文件。

C++ 编译过程不是一步到位的,而是分四个明确阶段:预处理、编译、汇编、链接。每个阶段各司其职,缺一不可,理解它们能帮你快速定位报错位置(比如是宏写错了?还是函数没定义?),也能更好理解头文件、静态库、符号冲突等常见问题。
预处理(Preprocessing)
这一步干的是“文本替换”和“文件拼接”,不涉及语法检查,纯机械操作。编译器调用预处理器(如 cpp)处理以 # 开头的指令:
- #include:把头文件内容原样插入到对应位置(递归展开),形成一个巨大的“翻译单元”(translation unit)
- #define:做宏替换(包括带参宏),注意只是字符串替换,不检查类型或作用域
- #ifdef / #ifndef / #endif:根据宏是否已定义,决定保留或丢弃某段代码(用于条件编译,如跨平台适配)
- #pragma:向编译器传递特定指令(如对齐、告警控制),行为依赖编译器
你可以用 g++ -E main.cpp 查看预处理后的完整代码(通常很长,但能看清头文件展开结果和宏展开效果)。
编译(Compilation)
预处理输出的“.i”文件(纯C++文本)被送入编译器核心(如 cc1plus)。这步真正做语义分析和代码生成:
立即学习“C++免费学习笔记(深入)”;
- 词法分析 → 语法分析 → 语义分析(检查变量声明、类型匹配、模板推导、constexpr 计算等)
- 生成与机器无关的中间表示(如 GCC 的 GIMPLE),再优化(常量折叠、内联、死代码消除等)
- 最终输出汇编语言代码(“.s” 文件),例如 mov、call、jmp 等指令
出错信息如 “‘x’ was not declared in this scope” 或 “no matching function for call” 都发生在这步。用 g++ -S main.cpp 可直接得到汇编文件。
汇编(Assembly)
把人类可读的汇编代码(“.s”)翻译成机器能执行的二进制目标码(“.o” 或 “.obj”),即目标文件(object file):
- 包含机器指令、已解析的符号表(如函数名、全局变量名)、重定位信息(告诉链接器:“这个 call 指令的目标地址还没确定,后面填”)
- 不解决函数跨文件调用——比如 main.o 里调用了 printf,但 printf 实际在哪还不知道,只记下 “需要一个叫 printf 的符号”
- 目标文件还不是可执行文件,不能直接运行(缺少入口、未分配最终地址、未解析外部引用)
用 g++ -c main.cpp 就停在这步,生成 main.o;可用 objdump -d main.o 查看反汇编指令。
链接(Linking)
把一个或多个目标文件(.o)和库(.a/.so)合并,解决所有符号引用,产出可执行文件或共享库:
- 符号解析:把 “调用 printf” 和 libc.so 中真正的 printf 实现匹配上;若找不到,报 “undefined reference to ‘printf’”
- 重定位:给每个函数、变量分配最终内存地址(如 .text 段从 0x400500 开始),并修正所有跳转/取址指令中的地址
- 库处理:静态链接(.a)把代码直接拷进可执行文件;动态链接(.so)只存引用,运行时由 loader 加载
- 链接还会加入启动代码(_start)、C 运行时初始化(__libc_start_main)、全局构造函数调用等
用 g++ main.o util.o -lm -o program 就完成链接;若漏了 -lm,sqrt 就会链接失败。
整个流程串起来就是:main.cpp → main.i → main.s → main.o → program。每步出错都有典型特征:预处理错在宏或头文件路径,编译错在语法/语义,汇编错极少见(除非手写汇编有误),链接错集中在符号缺失或重复定义。掌握各阶段输入输出,调试效率能翻倍。











