首页 > php教程 > php手册 > 正文

PHP的词法解析器:re2c

php中文网
发布: 2016-06-06 19:54:06
原创
1967人浏览过

出处:http://www.phppan.com/2011/09/php-lexical-re2c/ 作者: 胖胖 re2c是一个扫描器制作工具,可以创建非常快速灵活的扫描器。它可以产生高效代码,基于C语言,可以支持C/C代码。 与其它类的扫描器不同,它偏重于为正则表达式产生高效代码(和他的名字一

出处:http://www.phppan.com/2011/09/php-lexical-re2c/

作者:胖胖


re2c是一个扫描器制作工具,可以创建非常快速灵活的扫描器。它可以产生高效代码,基于C语言,可以支持C/C++代码。 与其它类似的扫描器不同,它偏重于为正则表达式产生高效代码(和他的名字一样)。因此,这比传统的词法分析器有更广泛的应用范围。 你可以在sourceforge.net获取源码。

PHP在最开始的词法解析器是使用的是flex,后来PHP的改为使用re2c。 在源码目录下的Zend/zend_language_scanner.l 文件是re2c的规则文件, 如果需要修改该规则文件需要安装re2c才能重新编译。

re2c调用方式:

立即学习PHP免费学习笔记(深入)”;

re2c [-bdefFghisuvVw1] [-o output] [-c [-t header]] file
登录后复制

我们通过一个简单的例子来看下re2c。如下是一个简单的扫描器,它的作用是判断所给的字符串是数字/小写字母/大小字母。 当然,这里没有做一些输入错误判断等异常操作处理。示例如下:

提客AI提词器
提客AI提词器

「直播、录课」智能AI提词,搭配抖音直播伴侣、腾讯会议、钉钉、飞书、录课等软件等任意软件。

提客AI提词器 64
查看详情 提客AI提词器
<span>#include <stdio.h></span>

<span>char</span> <span>*</span>scan<span>(</span><span>char</span> <span>*</span>p<span>)</span><span>{</span>
<span>#define YYCTYPE char</span>
<span>#define YYCURSOR p</span>
<span>#define YYLIMIT p</span>
<span>#define YYMARKER q</span>
<span>#define YYFILL(n)</span>
    <span>/*!re2c
      [0-9]&#43; {return "number";}
      [a-z]&#43; {return "lower";}
      [A-Z]&#43; {return "upper";}
      [^] {return "unkown";}
     */</span>
<span>}</span>

<span>int</span> main<span>(</span><span>int</span> argc<span>,</span> <span>char</span><span>*</span> argv<span>[</span><span>]</span><span>)</span>
<span>{</span>
    <span>printf</span><span>(</span><span>"%s<span>\n</span>"</span><span>,</span> scan<span>(</span>argv<span>[</span><span>1</span><span>]</span><span>)</span><span>)</span><span>;</span>

    <span>return</span> <span>0</span><span>;</span>
<span>}</span>
登录后复制

如果你是在ubuntu环境下,可以执行下面的命令生成可执行文件。

re2c -o a.c a.l
gcc a.c -o a
chmod &#43;x a
./a 1000
登录后复制

此时程序会输出number。

我们解释一下我们用到的几个re2c约定的宏。

  • YYCTYPE 用于保存输入符号的类型,通常为char型和unsigned char型
  • YYCURSOR 指向当前输入标记, -当开始时,它指向当前标记的第一个字符,当结束时,它指向下一个标记的第一个字符
  • YYFILL(n) 当生成的代码需要重新加载缓存的标记时,则会调用YYFILL(n)。
  • YYLIMIT 缓存的最后一个字符,生成的代码会反复比较YYCURSOR和YYLIMIT,以确定是否需要重新填充缓冲区。

参照如上几个标识的说明,可以较清楚的理解生成的a.c文件,当然,re2c不会仅仅只有上面代码所显示的标记, 这只是一个简单示例,更多的标识说明和帮助信息请移步 re2c帮助文档:http://re2c.org/manual.html。

更多编译器相关算法: Compiler Algorithms



相关标签:
php
PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号