0
0
mysql 查询中文数据
我有张表数据量很大,name字段数据有中文的也有英文的,现在我想查出为中文的那些数据?
------解决方案--------------------
先规范一下说法:
这个"中文"虽然我们平时说意义很明确,不过到了电脑里就不那么清楚了....
utf8里中文汉字是和韩文日文汉字放一起的,统称cjk...其实还包括一些全角的符号...
utf8里汉字基本都在3字节区,有个别4字节的不过都是冷僻字,
同时,3字节区里还有印度字啊什么的...因为你不会用到,也就都不管它们...
所以我们简单化一点, 假设你是要找出所有带"3字节utf8字符"的记录
那么可以用这个
name regexp concat('[',char(0xE0),'-',char(0xEF),'][',char(0x80),'-',char(0xBF),'][',char(0x80),'-',char(0xBF),']')
注意\xXX这样的写法没法在mysql里的正则里直接用,所以要用char和concat....google一下没找到更方便的方法...
另外,不知道你数据里是否有2字节区的字符,(欧洲字符希腊字符拉丁字符等),
如果确定没有....确定!!!
就是说你数据里除了单字节的ascii字符,就是3字节的汉字....
那么可以用一个简单的方法:
char_length(name)!=length(name)
------解决方案--------------------
mysql 的 REGEXP不是很强大, 试试 [^[:alnum:][:cntrl:][:space:]]
我有张表数据量很大,name字段数据有中文的也有英文的,现在我想查出为中文的那些数据?
------解决方案--------------------
先规范一下说法:
这个"中文"虽然我们平时说意义很明确,不过到了电脑里就不那么清楚了....
utf8里中文汉字是和韩文日文汉字放一起的,统称cjk...其实还包括一些全角的符号...
utf8里汉字基本都在3字节区,有个别4字节的不过都是冷僻字,
同时,3字节区里还有印度字啊什么的...因为你不会用到,也就都不管它们...
所以我们简单化一点, 假设你是要找出所有带"3字节utf8字符"的记录
那么可以用这个
name regexp concat('[',char(0xE0),'-',char(0xEF),'][',char(0x80),'-',char(0xBF),'][',char(0x80),'-',char(0xBF),']')
注意\xXX这样的写法没法在mysql里的正则里直接用,所以要用char和concat....google一下没找到更方便的方法...
另外,不知道你数据里是否有2字节区的字符,(欧洲字符希腊字符拉丁字符等),
如果确定没有....确定!!!
就是说你数据里除了单字节的ascii字符,就是3字节的汉字....
那么可以用一个简单的方法:
char_length(name)!=length(name)
------解决方案--------------------
mysql 的 REGEXP不是很强大, 试试 [^[:alnum:][:cntrl:][:space:]]
相关文章
在PHP中读取文件的最后一行
在PHP中使用strchr()函数查找字符串
fgets()函数- 读取文件指向的行详解
strchr、str_replace、strpos函数使用详解
使用PHP和Chart.js创建多图表数据可视化应用程序
相关标签:
本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门AI工具
相关专题
C++ 单元测试与代码质量保障
本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法,包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程,以及常见代码质量问题的发现与修复。通过工程化示例,帮助开发者建立 可测试、可维护、高质量的 C++ 项目体系。
24
2026.01.16
热门下载
最新文章








