0

0

标题:PEG.js 中正则字符类 [A-z] 的陷阱与变量名解析修复指南

花韻仙語

花韻仙語

发布时间:2026-01-02 17:39:08

|

336人浏览过

|

来源于php中文网

原创

标题:PEG.js 中正则字符类 [A-z] 的陷阱与变量名解析修复指南

本文揭示 peg.js 语法中 `[a-z]` 字符类的常见误解——它并非仅匹配字母,而是包含 ascii 表中 `'z'`(ascii 90)到 `'a'`(ascii 97)之间的所有字符(如 `[`, `\`, `]`, `^`, `_`, `` ` ``),导致变量名意外吞并左方括号,引发 `test[` 被误识别为非法变量名的错误;并提供安全、可维护的修复方案。

在 PEG.js 中,字符类(character class)如 [A-z] 并非等价于“大小写字母”,而是一个基于 ASCII 码值的连续区间匹配。'A' 的 ASCII 值为 65,'z' 为 122,但 'Z' 是 90,'a' 是 97 —— 因此 [A-z] 实际覆盖了 A–Z(65–90)、[–(91)、\–(92)、](93)、^(94)、_(95)、`(96)以及 a–z(97–122)。这正是问题根源:当输入为 test["foobar"] 时,Varname 规则中的 [A-z0-9]+ 会贪婪匹配 test[(因为 [ 属于该范围),导致后续的 '[' 无法被 Getvar 中的属性访问语法 '[', _, exp, _, ']' 捕获,最终抛出 Variable 'test[' does not exist. 错误。

✅ 正确做法是显式限定字母范围,使用 [A-Za-z] 或更推荐的 不区分大小写的内建修饰符 i 配合 [A-Z0-9]:

Varname "variable name"
  = [A-Za-z][A-Za-z0-9]* { return text(); }
  // 或更简洁、语义清晰的写法:
  // = [A-Z][A-Z0-9]*i { return text(); }

⚠️ 注意:i 修饰符必须作用于整个字符类(如 [A-Z0-9]i),而非单个字符;且首字符应确保为字母(避免数字开头的非法标识符),因此建议拆分为「首字母」+「字母数字续字符」结构:

Varname "variable name"
  = first:[A-Za-z] rest:[A-Za-z0-9]* {
      const name = first + rest.join('');
      if (!/[A-Za-z]/.test(first)) {
        error(`Variable name must start with a letter. (got '${name}')`);
      }
      return name;
    }

此外,原 Getvar 规则末尾缺少跳过空白的 _,易导致 test["foobar"] 中引号前空格解析失败。应修正为:

魔术橡皮擦
魔术橡皮擦

智能擦除、填补背景内容

下载
Getvar
  = name:Varname _ path:('[' _ exp:(String / Integer) _ ']' { return exp; })* {
      let rt = glob[name];
      if (rt === undefined && name !== 'undefined' && name !== 'null') {
        error(`Variable '${name}' does not exist.`);
      }
      for (const p of path) {
        rt = rt?.[p]; // 使用可选链增强健壮性
        if (rt === undefined) break;
      }
      return rt;
    }

? 总结关键修复点:

  • ❌ 删除 [A-z] —— 它是危险的 ASCII 区间陷阱;
  • ✅ 使用 [A-Za-z] 或 [A-Z]i 明确表达“字母”意图;
  • ✅ 为 Varname 添加首字符校验,禁止数字开头;
  • ✅ 在所有语法连接处(如 name 与 '[' 之间)插入 _ 消除空白干扰;
  • ✅ 在属性访问中加入 ?. 可选链,避免 undefined["prop"] 报错;
  • ✅ 优先用规则拆分(如 Vstart/Vtail)替代复杂字符类量化,提升可读性与回溯可控性。

遵循以上原则,你的 PEG.js 解析器将准确识别 test 和 test["foobar"],并稳定支持嵌套属性访问语法。

相关专题

更多
mysql标识符无效错误怎么解决
mysql标识符无效错误怎么解决

mysql标识符无效错误的解决办法:1、检查标识符是否被其他表或数据库使用;2、检查标识符是否包含特殊字符;3、使用引号包裹标识符;4、使用反引号包裹标识符;5、检查MySQL的配置文件等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

179

2023.12.04

Python标识符有哪些
Python标识符有哪些

Python标识符有变量标识符、函数标识符、类标识符、模块标识符、下划线开头的标识符、双下划线开头、双下划线结尾的标识符、整型标识符、浮点型标识符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

272

2024.02.23

java标识符合集
java标识符合集

本专题整合了java标识符相关内容,想了解更多详细内容,请阅读下面的文章。

251

2025.06.11

c++标识符介绍
c++标识符介绍

本专题整合了c++标识符相关内容,阅读专题下面的文章了解更多详细内容。

121

2025.08.07

class在c语言中的意思
class在c语言中的意思

在C语言中,"class" 是一个关键字,用于定义一个类。想了解更多class的相关内容,可以阅读本专题下面的文章。

459

2024.01.03

python中class的含义
python中class的含义

本专题整合了python中class的相关内容,阅读专题下面的文章了解更多详细内容。

7

2025.12.06

js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

508

2023.06.20

js获取当前时间
js获取当前时间

JS全称JavaScript,是一种具有函数优先的轻量级,解释型或即时编译型的编程语言;它是一种属于网络的高级脚本语言,主要用于Web,常用来为网页添加各式各样的动态功能。js怎么获取当前时间呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

241

2023.07.28

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

74

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
WEB前端教程【HTML5+CSS3+JS】
WEB前端教程【HTML5+CSS3+JS】

共101课时 | 8.1万人学习

JS进阶与BootStrap学习
JS进阶与BootStrap学习

共39课时 | 3.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号