0

0

怎么给MySQL添加自定义语法

王林

王林

发布时间:2023-06-02 15:58:22

|

1149人浏览过

|

来源于亿速云

转载

1 背景

mysql语法解析器用的bison(即yacc)来实现的,而词法解析是自己来实现的,涉及到的token都在文件lex.h里面,然后通过lex_input_stream 里面相关的函数,解析client的sql字节流(其中会通过提前构造好的hash表帮助快速找到对应symbol,相关代码在sql_lex_hash.cc里面),转换为token,交给bison进行语法解析。

为了给MySQL添加一个新的语法,我们必须添加新的token(如果有新增),以及增加新的语法(sql_yacc.yy)里面。本文以给create table增加一个新的options为例,来演示如何给MySQL新增一个语法。最终的效果如下:

create table t1 (
  id int primary key,
  name varchar(100)
) global_partition by hash(id) partitions 10; //global_partition by为新增语法,global_partition为新增token

涉及到的修改文件如下:

sql/lex.h //token
sql/parse_tree_nodes.cc
sql/parse_tree_nodes.h
sql/parse_tree_partitions.cc
sql/parse_tree_partitions.h
sql/parser_yystype.h
sql/sql_yacc.yy

2 新增关键词(token)

文件:sql/lex.h

static const SYMBOL symbols[] = {
    /*
     Insert new SQL keywords after that commentary (by alphabetical order):
    */
    //省略部分代码
    {SYM("GLOBAL_PARTITION", GLOBAL_PARTITION_SYM)}, //注意按照字典序进行添加。
    //省略部分代码
};

按照上面的格式添加即可

3 新增语法

文件:sql/sql_yacc.yy

该文件为bison的语法,关于bison语法可以查看这里。下面凡是注释标有###为新增部分,没有标的注释是为了方便理解

%token GLOBAL_PARTITION_SYM 1309            /* seancheer */  //### 声明上一步添加的token,声明了才可以使用,编号1309选择一个未使用的就行
%type  global_partition_clause //### 声明新增加的数据结构,后面会介绍

create_table_stmt:
          CREATE opt_temporary TABLE_SYM opt_if_not_exists table_ident
          '(' table_element_list ')' opt_create_table_options_etc //最后一个标记在YYSTYPE中对应的是create_table_tail, 后面会介绍
          {
            $$= NEW_PTN PT_create_table_stmt(YYMEM_ROOT, $1, $2, $4, $5,
                                             $7,
                                             $9.opt_create_table_options,
                                             $9.opt_partitioning,
                                             $9.opt_global_partitioning, //### 赋值给对应参数,该构造函数需要新增,后面会介绍
                                             $9.on_duplicate,
                                             $9.opt_query_expression);
          }
        | CREATE opt_temporary TABLE_SYM opt_if_not_exists table_ident
          opt_create_table_options_etc
          {
            $$= NEW_PTN PT_create_table_stmt(YYMEM_ROOT, $1, $2, $4, $5,
                                             NULL,
                                             $6.opt_create_table_options,
                                             $6.opt_partitioning,
                                             $6.opt_global_partitioning, //### 赋值给对应参数,该构造函数需要新增,后面会介绍
                                             $6.on_duplicate,
                                             $6.opt_query_expression);
//partition相关的语法                                             
opt_create_partitioning_etc:
          partition_clause opt_duplicate_as_qe //这里是原生的partition表语法
          {
            $$= $2;
            $$.opt_partitioning= $1;
          }
        | global_partition_clause opt_duplicate_as_qe //### 此处是新增的global_partition语法,
          {
            $$= $2;
            $$.opt_global_partitioning= $1;
          }
        | opt_duplicate_as_qe
        ;

//### 下面为重点,新增的global_partition语法,可以看到,用到了新增的token
global_partition_clause:
          GLOBAL_PARTITION_SYM BY part_type_def opt_num_parts
          {
            $$= NEW_PTN PT_global_partition($3, @4, $4);
          }
        ;

4 类似于PT_partition添加对应的数据结构global_partition_clause

文件:parser_yystype.h:该文件是bison(yacc)运行的一环,代替bison内置的YYSTYPE的,当bison对相关语法解析后,需要构造相关的数据结构,通过对YYSTYPE的自定义,就可以实现构造自定义数据结构的目的了。添加我们自定义的数据结构代码如下:

Pic Copilot
Pic Copilot

AI时代的顶级电商设计师,轻松打造爆款产品图片

下载
union YYSTYPE {
  PT_sub_partition *opt_sub_part;
  PT_part_type_def *part_type_def;
  PT_partition *partition_clause;
  PT_global_partition *global_partition_clause; //新加数据结构
  
  struct {
    Mem_root_array *opt_create_table_options;
    PT_partition *opt_partitioning;
    PT_global_partition *opt_global_partitioning; //同时注意添加到create_table_tail里面,因为create table语法会有该操作
    On_duplicate on_duplicate;
    PT_query_primary *opt_query_expression;
  } create_table_tail;
};
static_assert(sizeof(YYSTYPE) <= 40, "YYSTYPE is too big"); //因为struct里面添加了一个成员变量,所以该union需要的空间也会变大,因此注意修改这一行

下面内容介绍PT_global_partition数据结构,为了保持和MySQL习惯一致,新增加的数据结构放在了

sql/parse_tree_nodes.cc sql/parse_tree_nodes.h sql/parse_tree_partitions.cc sql/parse_tree_partitions.h

四个文件里,理论上可以放在任何地方。可根据自身需求添加对应数据结构:

文件:sql/parse_tree_partitions.h sql/parse_tree_partitions.cc

/**
新增数据结构
*/
class PT_global_partition : public Parse_tree_node {
    typedef Parse_tree_node super;

    PT_part_type_def *const part_type_def;
    const POS part_defs_pos;
    uint num_parts;
public:
    partition_info part_info;
public:
    PT_global_partition(PT_part_type_def *part_type_def, const POS &part_defs_pos,
                        uint opt_num_parts)
            : part_type_def(part_type_def),
              part_defs_pos(part_defs_pos),
              num_parts(opt_num_parts) {}
    bool contextualize(Parse_context *pc) override;
};

//模仿其原生的实现方式即可
bool PT_global_partition::contextualize(Parse_context *pc) {
    if (super::contextualize(pc)) return true;

    Partition_parse_context part_pc(pc->thd, &part_info, false);
    if (part_type_def->contextualize(&part_pc)) return true;

    if (part_info.part_type != partition_type::HASH) {
        //only support hash partition for shard key
        my_error(ER_PARTITIONS_MUST_BE_DEFINED_ERROR, MYF(0), "NOT HASH");
        return true;
    }

    uint count_curr_parts = part_info.partitions.elements;

    if (part_info.num_parts != 0) {
        if (part_info.num_parts != count_curr_parts) {
            error(&part_pc, part_defs_pos,
                  ER_THD(pc->thd, ER_PARTITION_WRONG_NO_PART_ERROR));
            return true;
        }
    } else if (count_curr_parts > 0)
        part_info.num_parts = count_curr_parts;
    return false;
}

文件:sql/parse_tree_nodes.cc sql/parse_tree_nodes.h

接下来修改create table对应的数据结构,将新增的PT_global_partition添加到create table里面

class PT_create_table_stmt final : public PT_table_ddl_stmt_base {
  PT_partition *opt_partitioning;
  PT_global_partition *opt_global_partitioning; //添加成员变量
  PT_create_table_stmt(
    MEM_ROOT *mem_root, PT_hint_list *opt_hints, bool is_temporary,
    bool only_if_not_exists, Table_ident *table_name,
    const Mem_root_array *opt_table_element_list,
    const Mem_root_array *opt_create_table_options,
    PT_partition *opt_partitioning,
    PT_global_partition *opt_global_partitioning, On_duplicate on_duplicate,
    PT_query_primary *opt_query_expression)
    : PT_table_ddl_stmt_base(mem_root),
  m_opt_hints(opt_hints),
  is_temporary(is_temporary),
  only_if_not_exists(only_if_not_exists),
  table_name(table_name),
  opt_table_element_list(opt_table_element_list),
  opt_create_table_options(opt_create_table_options),
  opt_partitioning(opt_partitioning),
  opt_global_partitioning(opt_global_partitioning), //添加构造函数,主要是为了增加对PT_global_partition的赋值操作
  on_duplicate(on_duplicate),
  opt_query_expression(opt_query_expression),
  opt_like_clause(nullptr) {}
  
//在其对应的函数中增加相关逻辑,调用对应的初始化函数contextualize
Sql_cmd *PT_create_table_stmt::make_cmd(THD *thd) {
    if (opt_global_partitioning){
        if (opt_global_partitioning->contextualize(&pc)) return nullptr;
        lex->part_info = &opt_global_partitioning->part_info;
    }
}

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

676

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

320

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

346

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1095

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

357

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

675

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

572

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

414

2024.04.29

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

36

2026.01.14

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 1.7万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 791人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号