
本文将介绍如何在 php 中安全地计算包含运算符优先级的数学表达式,避免使用 eval() 函数带来的安全风险。我们将通过实现 shunting-yard 算法将中缀表达式转换为逆波兰表达式(rpn),然后利用栈结构对 rpn 进行求值,从而实现一个自定义的表达式解析器和计算器。
在 PHP 开发中,我们有时需要计算动态生成的数学表达式。虽然 eval() 函数提供了一种直接执行字符串代码的便捷方式,例如 eval('return '.$expression.';'),但其固有的安全风险(如代码注入)和调试困难等问题,使得在生产环境中应尽量避免使用。因此,开发一个不依赖 eval() 的自定义表达式解析器和计算器成为一种更安全、更可控的选择。
1. 核心概念:中缀表达式与逆波兰表达式 (RPN)
为了理解如何手动解析和计算表达式,我们需要了解两种重要的表达式表示方法:
- 中缀表达式 (Infix Notation): 这是我们日常使用的标准数学表达式形式,运算符位于操作数之间,例如 2 + 3 * 4。它的缺点是需要括号来明确运算顺序,并且处理运算符优先级比较复杂。
- 逆波兰表达式 (Reverse Polish Notation - RPN / 后缀表达式): 在 RPN 中,运算符位于其操作数之后,例如 2 3 4 * +。RPN 的主要优点是它消除了对括号的需求,并且非常适合使用栈结构进行计算,能够自然地处理运算符优先级。
例如,中缀表达式 (3 + 2) * 4 转换为 RPN 后是 3 2 + 4 *。
2. Shunting-yard 算法:中缀转 RPN
Shunting-yard 算法(调度场算法)是 Dijkstra 在 1960 年代提出的一种用于将中缀表达式转换为逆波兰表达式的算法。其核心思想是使用两个栈:
立即学习“PHP免费学习笔记(深入)”;
- 输出栈 (Output Stack): 用于存储转换后的 RPN 序列。
- 运算符栈 (Operator Stack): 用于临时存储运算符和括号。
算法通过遍历中缀表达式的每个字符来工作,并遵循以下规则:
- 数字: 直接压入输出栈。
-
运算符:
- 如果运算符栈为空,或者栈顶是左括号,或者当前运算符优先级高于栈顶运算符,则将当前运算符压入运算符栈。
- 否则(当前运算符优先级小于等于栈顶运算符),将运算符栈顶的运算符弹出并压入输出栈,然后重复此步骤,直到满足上述条件,最后将当前运算符压入运算符栈。
- 左括号 (: 压入运算符栈。
- 右括号 ): 不断将运算符栈顶的运算符弹出并压入输出栈,直到遇到左括号。然后将左括号从运算符栈中弹出(但不压入输出栈)。如果未找到匹配的左括号,则表示括号不匹配。
- 表达式结束: 将运算符栈中剩余的所有运算符依次弹出并压入输出栈。
3. RPN 表达式求值
一旦将中缀表达式转换为 RPN,求值过程就变得相对简单,同样使用一个栈:
- 求值栈 (Evaluation Stack): 用于存储操作数和中间计算结果。
算法通过遍历 RPN 序列的每个元素来工作:
- 数字: 将数字压入求值栈。
- 运算符: 从求值栈中弹出两个操作数(注意顺序,先弹出的为右操作数),执行对应的运算,然后将运算结果压回求值栈。
- 表达式结束: 求值栈中唯一剩余的元素即为表达式的最终结果。
4. PHP 实现详解
下面我们将通过 PHP 代码实现上述算法。
4.1 辅助函数
这些函数用于识别表达式中的字符类型和提取数字。
= '0' && $char <= '9'));
}
/**
* 从字符串中读取一个完整的数字(支持浮点数)
* @param string $string 表达式字符串
* @param int $i 当前解析的索引,通过引用传递以便更新外部索引
* @return string 读取到的数字字符串
* @throws Exception 如果数字格式无效
*/
function readnumber($string, &$i) {
$number = '';
$start_i = $i;
$has_decimal = false;
while ($i < strlen($string) && is_number_char($string[$i])) {
if ($string[$i] == '.') {
if ($has_decimal) { // 避免多个小数点
throw new Exception("Invalid number format: multiple decimal points at position " . $i);
}
$has_decimal = true;
}
$number .= $string[$i];
$i++;
}
if ($number === '' && $start_i === $i) { // 没有读取到任何数字字符
throw new Exception("Expected number at position " . $i);
}
return $number;
}4.2 中缀转 RPN:mathexp_to_rpn($mathexp)
此函数实现了 Shunting-yard 算法,将中缀表达式字符串转换为 RPN 数组。
/**
* 将中缀表达式转换为逆波兰表达式 (RPN)
* @param string $mathexp 中缀表达式字符串
* @return array RPN 形式的数组
* @throws Exception 如果表达式中包含无效字符或括号不匹配
*/
function mathexp_to_rpn($mathexp) {
// 定义运算符优先级
$precedence = array(
'(' => 0, // 括号优先级最低,用于控制弹出
'+' => 3,
'-' => 3,
'*' => 6,
'/' => 6,
'%' => 6
);
$i = 0;
$final_stack = array(); // 存储 RPN 结果
$operator_stack = array(); // 存储运算符和括号
while ($i < strlen($mathexp)) {
$char = $mathexp[$i];
if (ctype_space($char)) { // 跳过空格
$i++;
continue;
}
if (is_number_char($char)) { // 如果是数字的一部分
$num = readnumber($mathexp, $i); // readnumber 会更新 $i
array_push($final_stack, $num);
continue;
}
if (is_operator($char)) { // 如果是运算符
// 当运算符栈不为空,且栈顶不是左括号,且当前运算符优先级小于等于栈顶运算符优先级时
// 将栈顶运算符弹出到最终栈
while (
!empty($operator_stack) &&
end($operator_stack) != '(' &&
$precedence[$char] <= $precedence[end











