如何用c++实现一个简单的词法分析器编译器入门【项目练手】

穿越時空

发布时间：2025-12-24 15:46:02

397人浏览过

来源于php中文网

原创

C++词法分析器通过逐字符扫描将源码切分为token，支持关键字、标识符、整数、运算符等类型；核心类Lexer含nextToken()方法，按空格跳过、字母/下划线启标识符、数字启整数、单字符匹配运算符等规则生成Token结构。

如何用c++实现一个简单的词法分析器编译器入门【项目练手】

用 C++ 实现一个简单的词法分析器，核心是把源代码字符串按规则切分成有意义的“记号”（token），比如关键字、标识符、数字、运算符等。不需要完整支持 C/C++ 语法，从识别 int a = 42; 这类基础语句开始最实用。

明确要识别的 token 类型

先定义有限但覆盖常见的 token 种类，例如：

关键字：如 int、return
标识符：以字母或下划线开头，后跟字母/数字/下划线（如 abc123、_x）
整数常量：纯数字序列（如 123、0），暂不支持负数或十六进制
运算符和分隔符：如 =、+、;、(、)
空白与换行：跳过，不生成 token

设计 Token 结构和词法器类骨架

每个 token 至少记录类型（枚举）、原始文本（string）、行号（可选）。词法器类通常包含输入字符串、当前位置索引、当前行号：

enum class TokenType {
    IDENTIFIER, INTEGER, INT_KW, RETURN_KW, ASSIGN, PLUS, SEMICOLON,
    LPAREN, RPAREN, EOF_TOKEN
};

struct Token {
    TokenType type;
    std::string lexeme;
    int line;
};

class Lexer {
    std::string input;
    size_t pos = 0;
    int line = 1;
public:
    Lexer(const std::string& src) : input(src) {}
    Token nextToken();
private:
    char peek() const { return (pos < input.size()) ? input[pos] : '\0'; }
    char advance() { return input[pos++]; }
    bool isAtEnd() const { return pos >= input.size(); }
    void skipWhitespace();
    Token scanIdentifierOrKeyword();
    Token scanNumber();
    Token scanOperator();
};

逐字符扫描 + 状态驱动识别

主函数 nextToken() 每次调用返回下一个 token，逻辑清晰：

Lifetoon

免费的AI漫画创作平台

下载

立即学习“C++免费学习笔记（深入）”；

先跳过空格、制表符、换行（更新 line）
根据当前字符决定分支：
  – 若是字母或下划线 → 调用 scanIdentifierOrKeyword()，查表判断是否为关键字
  – 若是数字 → 调用 scanNumber()，连续读取直到非数字
  – 若是 =、+、; 等 → 直接返回对应 token（可扩展支持 == 等双字符运算符）
  – 若是 ( 或 ) → 返回对应 token
  – 否则报错或返回未知 token
到达末尾时返回 EOF_TOKEN

测试与迭代建议

写个简单测试入口，输入字符串，循环调用 nextToken() 并打印结果：

int main() {
    std::string src = "int a = 42; return a;";
    Lexer lexer(src);
    Token tok;
    do {
        tok = lexer.nextToken();
        std::cout << tokenTypeToString(tok.type) << " '" << tok.lexeme << "'\n";
    } while (tok.type != TokenType::EOF_TOKEN);
}

先让 int a = 42; 正确输出 INT_KW、IDENTIFIER、ASSIGN、INTEGER、SEMICOLON；再逐步加 return、括号、多行支持。遇到错误时打印位置（pos 或 line）便于调试。

c++如何实现一个简单的神经网络推理框架_c++ ONNX Runtime集成【AI】

c++如何使用TensorRT进行模型部署优化_c++ NVIDIA推理引擎入门【AI】

如何用C++实现一个ECS（实体组件系统）？C++游戏引擎架构模式【游戏开发】

C++如何实现一个简单的A*寻路算法_C++游戏AI开发中的路径规划实战

C++如何实现一个简单的行为树_C++游戏AI中决策逻辑的行为树实现

c++速学教程(入门到精通)

c++怎么学习？c++怎么入门？c++在哪学？c++怎么学才快？不用担心，这里为大家提供了c++速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

word ai c++ String Integer 常量运算符 Token 标识符字符串 int 整数常量循环

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：c++如何实现桥接模式 c++设计模式之Bridge【实例】下一篇：C++的Module头文件单元是什么_C++20模块化编程之接口与实现文件

作者最新文章

MAC的“字典”怎么添加维基百科_MAC扩展词典应用的数据来源

2025-12-24 13:48

sublime如何一键编译并运行Java_sublime配置Java开发构建系统

2025-12-24 13:53

网易邮箱大师app怎么实名认证【教程】

2025-12-24 13:55

智慧团建密码初始密码是什么智慧团建密码忘记了怎么办【教程】

2025-12-24 13:57

王者V8要充多少?王者荣耀v8一共需要充值多少钱【价格表】

2025-12-24 13:58

Mac如何设置邮箱客户端_Mac自带邮件App配置指南【教程】

2025-12-24 13:59

七天课堂怎么查询学生的成绩七天课堂学生成绩查询方法分享【教程】

2025-12-24 14:01

拷贝漫画最新版官网入口拷贝漫画在线阅读免费版

2025-12-24 14:01

c++如何实现一个Lock-Free栈 c++无锁数据结构【并发】

2025-12-24 14:03

百家号怎么提高完读率_百家号完读率优化技巧

2025-12-24 14:08

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

311

2023.08.02

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1427

2023.10.24

java基础知识汇总

1427

2023.10.24

Go语言中的运算符有哪些

Go语言中的运算符有：1、加法运算符；2、减法运算符；3、乘法运算符；4、除法运算符；5、取余运算符；6、比较运算符；7、位运算符；8、按位与运算符；9、按位或运算符；10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

221

2024.02.23

php三元运算符用法

本专题整合了php三元运算符相关教程，阅读专题下面的文章了解更多详细内容。

2025.10.17

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6021

2023.09.14

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

777

2023.09.14