MySQL中字符串函数详解 字符串处理在数据清洗中的应用

下次还敢
发布: 2025-06-11 14:33:01
原创
245人浏览过

mysql中处理字符串的关键函数有trim、replace、substring和concat。1. trim用于清除字段两端空格,如update users set name = trim(name),还可指定清除左或右空格;2. replace用于替换错误内容,如替换电话号码中的分隔符或去掉html标签;3. substring截取特定位置内容,left/right提取前几位或后几位,适用于身份证号、url参数等信息提取;4. concat用于简单拼接,concat_ws可加分隔符合并多个字段,自动跳过null值。这些函数在数据清洗中非常实用,组合使用能解决大部分文本问题。

MySQL中字符串函数详解 字符串处理在数据清洗中的应用

在MySQL中处理字符串,尤其是做数据清洗时,掌握几个关键的字符串函数能让你事半功倍。这些函数不仅能帮你提取、替换、截取内容,还能有效清理脏数据,比如空格、非法字符或格式不统一的问题。

下面我挑几个最常用的字符串函数,并结合实际清洗场景说明它们怎么用。


1. TRIM:去掉多余空格,清理字段前后“隐形垃圾”

很多文本字段导入数据库后,前或后会带一些看不见的空格,影响查询和匹配。这时候用 TRIM() 函数就特别合适。

  • 基本用法:

    SELECT TRIM('  abc  '); -- 返回 'abc'
    登录后复制
  • 清洗应用:

    • 清除字段两端空格:
      UPDATE users SET name = TRIM(name);
      登录后复制
    • 还可以只清除左边或右边:
      SELECT TRIM(LEADING ' ' FROM '  abc');  -- 去掉左边空格
      SELECT TRIM(TRAILING ' ' FROM 'abc  '); -- 去掉右边空格
      登录后复制

这类操作对用户输入类的数据特别有用,比如注册表单中的用户名、邮箱等字段。


2. REPLACE:替换指定字符串,批量修复错误

当你发现某个字段里有错误内容,比如错别字、特殊符号或者多余的HTML标签,可以用 REPLACE() 批量替换。

  • 基本用法:

    SELECT REPLACE('hello world', 'world', 'MySQL'); -- 返回 'hello MySQL'
    登录后复制
  • 实际清洗例子:

    • 替换电话号码中的分隔符:
      SELECT REPLACE(phone, '-', '') FROM contacts;
      登录后复制
    • 去掉HTML标签(假设字段存了带标签的内容):
      UPDATE articles SET content = REPLACE(content, '<br>', '');
      登录后复制

注意:这个函数是全字段替换,不能正则匹配。如果需要更复杂的替换,得配合其他工具或函数。


3. SUBSTRING 和 LEFT/RIGHT:截取部分内容,提取关键信息

有时候我们需要从一段字符串中提取特定位置的内容,比如身份证号里的出生年份、URL中的参数等。

  • 截取中间部分用 SUBSTRING():

    SELECT SUBSTRING('abcdefg', 3, 2); -- 从第3位开始取2个字符,返回 'cd'
    登录后复制
  • 截取前几位或后几位可以用 LEFT() 或 RIGHT():

    SELECT LEFT('abcdefg', 3);  -- 返回 'abc'
    SELECT RIGHT('abcdefg', 3); -- 返回 'efg'
    登录后复制
  • 实际应用:

    • 提取日期字段中的年份(假设格式固定):
      SELECT SUBSTRING(birthday, 1, 4) AS year FROM users;
      登录后复制
    • 处理日志URL提取来源:
      SELECT SUBSTRING(url, 8) FROM logs; -- 去掉开头 http://
      登录后复制

使用时要注意字段长度是否一致,避免截断出错。


4. CONCAT 和 CONCAT_WS:拼接字符串,整理字段组合

有些时候我们需要把多个字段合并成一个,比如地址字段拆成了省市区,想拼成完整地址。

  • 简单拼接用 CONCAT():

    SELECT CONCAT(first_name, ' ', last_name) AS full_name FROM users;
    登录后复制
  • 加分隔符更方便的是 CONCAT_WS():

    SELECT CONCAT_WS(', ', 'Beijing', 'Shanghai', 'Guangzhou'); -- 返回 'Beijing, Shanghai, Guangzhou'
    登录后复制
  • 数据清洗用途:

    • 拼接地址字段:
      SELECT CONCAT_WS(' ', province, city, district, street) AS full_address FROM addresses;
      登录后复制

遇到空值也不怕,它会自动跳过NULL字段,不会影响整体拼接结果。


这些字符串函数在日常数据清洗中非常实用,很多时候只要简单组合一下,就能解决大部分文本问题。像 TRIM 去空格、REPLACE 替换错误、SUBSTRING 提取信息、CONCAT 合并字段,都是经常需要用到的操作。

基本上就这些,不复杂但容易忽略细节的地方还是得多练多试。

以上就是MySQL中字符串函数详解 字符串处理在数据清洗中的应用的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号