使用递归下降解析器正确解析后缀表达式

花韻仙語

发布时间：2025-07-29 16:32:01

785人浏览过

来源于php中文网

原创

使用递归下降解析器正确解析后缀表达式

本文旨在帮助读者理解并解决在使用递归下降解析器解析后缀表达式时可能遇到的问题。我们将通过分析一个具体的错误案例，深入探讨问题的原因，并提供详细的修改方案，确保解析器能够正确处理后缀表达式，并返回预期的结果。此外，我们还将介绍如何构建表达式树，以便更好地理解和操作解析后的表达式。

问题分析

提供的代码尝试使用递归下降解析器来解析后缀表达式。然而，在 parse_expression 函数中，运算符的处理顺序是错误的。对于后缀表达式，正确的处理顺序应该是先解析右操作数，再解析左操作数。当前的实现中，right 和 left 的解析顺序颠倒了，导致解析结果错误。此外，parse_expression 从 tokens 列表中弹出元素，这会改变列表本身，导致后续的解析出错。

解决方案

要解决这个问题，需要调整 parse_expression 函数中操作数的解析顺序，并确保不修改原始的 tokens 列表。以下是修改后的代码：

import re

token_patterns = [
    ('OPERATOR', r'[+\-*/]'),
    ('NUMBER', r'\d+'),
    ('WHITESPACE', r'\s+'),
]

def tokenize(source_code):
    tokens = []
    source_code = source_code.strip()

    while source_code:
        matched = False

        for token_type, pattern in token_patterns:
            match = re.match(pattern, source_code)
            if match:
                value = match.group(0)
                tokens.append((token_type, value))
                source_code = source_code[len(value):].lstrip()
                matched = True
                break

        if not matched:
            raise ValueError(f"Invalid character in source code: {source_code[0]}")

    return tokens

def parse_expression(tokens):
    def _parse(tokens, index):
        if index >= len(tokens):
            return None, index

        token_type, value = tokens[index]

        if token_type == 'NUMBER':
            return int(value), index + 1
        elif token_type == 'OPERATOR':
            if value in ('+', '-', '*', '/'):
                right, next_index = _parse(tokens, index + 1)
                if right is None:
                    return None, index
                left, next_index = _parse(tokens, next_index)
                if left is None:
                    return None, index
                return (value, left, right), next_index
            else:
                raise ValueError(f"Unexpected operator: {value}")
        else:
            raise ValueError(f"Unexpected token: {token_type}")

    parsed_expression, _ = _parse(tokens, 0)
    return parsed_expression


def evaluate_expression(expression):
    if isinstance(expression, int):
        return expression
    elif isinstance(expression, tuple):
        operator, left, right = expression
        if operator == '+':
            return evaluate_expression(left) + evaluate_expression(right)
        elif operator == '-':
            return evaluate_expression(left) - evaluate_expression(right)
        elif operator == '*':
            return evaluate_expression(left) * evaluate_expression(right)
        elif operator == '/':
            return evaluate_expression(left) / evaluate_expression(right)
    else:
        raise ValueError(f"Invalid expression: {expression}")

def main():
    source_code = "2 3 4 * +"
    tokens = tokenize(source_code)
    parsed_expression = parse_expression(tokens)

    print(f"Source code: {source_code}")
    print(f"Parsed expression: {parsed_expression}")

    result = evaluate_expression(parsed_expression)
    print(f"Result: {result}")

if __name__ == "__main__":
    main()

关键修改：

Article Forge

行业文案AI写作软件，可自动为特定主题或行业生成内容

下载

修改操作数解析顺序： 在 parse_expression 函数中，先解析 right，再解析 left。
使用索引而非pop： 使用递归函数_parse，它接受一个index参数，用于跟踪当前解析的位置，而不是直接修改tokens列表。
错误处理： 在_parse中，如果解析right或left失败（返回None），则立即返回None，避免继续解析。

表达式树构建

除了直接计算表达式的值，还可以构建表达式树来表示解析后的表达式。表达式树可以用于后续的优化、转换或其他操作。以下是如何修改 parse_expression 函数来构建表达式树的示例：

（上面代码已经实现了表达式树的构建，这里仅作强调）

注意事项

错误处理： 在实际应用中，需要添加更完善的错误处理机制，例如检查除数为零的情况。
性能优化： 对于复杂的表达式，递归下降解析器的性能可能成为瓶颈。可以考虑使用其他的解析算法，例如 LL 或 LR 解析器。
扩展性： 可以扩展词法分析器和语法分析器，以支持更多的运算符、函数和数据类型。

总结

通过调整操作数的解析顺序并使用索引而非pop操作，可以解决递归下降解析器在解析后缀表达式时遇到的问题。构建表达式树可以更好地表示和操作解析后的表达式。在实际应用中，需要根据具体需求进行错误处理、性能优化和扩展性设计。

如何用Python实现可解释AI_模型解释工具使用方法【技巧】

Python在大模型训练中的应用_从零开始构建AI模型【教程】

Python在人工智能项目中构建流水线训练体系的结构化方法【指导】

Python实现AI模型训练中异常检测的详细教程【教程】

Python构建毕业设计级AI项目的高质量实现方式【教程】

相关专题

数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

298

2023.10.31

php数据类型

本专题整合了php数据类型相关内容，阅读专题下面的文章了解更多详细内容。

216

2025.10.31

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1436

2023.10.24

Go语言中的运算符有哪些

Go语言中的运算符有：1、加法运算符；2、减法运算符；3、乘法运算符；4、除法运算符；5、取余运算符；6、比较运算符；7、位运算符；8、按位与运算符；9、按位或运算符；10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

226

2024.02.23

php三元运算符用法

本专题整合了php三元运算符相关教程，阅读专题下面的文章了解更多详细内容。

2025.10.17

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

389

2023.08.14

PHP 高并发与性能优化

本专题聚焦 PHP 在高并发场景下的性能优化与系统调优，内容涵盖 Nginx 与 PHP-FPM 优化、Opcode 缓存、Redis/Memcached 应用、异步任务队列、数据库优化、代码性能分析与瓶颈排查。通过实战案例（如高并发接口优化、缓存系统设计、秒杀活动实现），帮助学习者掌握构建高性能PHP后端系统的核心能力。

2025.10.16