PHP提供五种字符串字符分类方法:一、正则匹配;二、逐字符ctype判断;三、mb_*多字节处理;四、规则映射批量匹配;五、array_reduce函数式归类。

如果您需要将字符串中的字符按类型分类并存入数组,例如区分字母、数字、中文、标点等,PHP 提供了多种灵活的处理方式。以下是实现此目标的具体方法:
该方法通过预定义的 Unicode 正则模式匹配不同字符类别,并将结果分别存入关联数组的对应键中。
1、定义待处理的字符串,例如 $str = "Hello世界123!@#";
2、初始化空数组 $result = ['letter' => [], 'digit' => [], 'chinese' => [], 'punct' => []];
立即学习“PHP免费学习笔记(深入)”;
3、使用 preg_match_all('/[a-zA-Z]/u', $str, $letters); 并将 $letters[0] 赋值给 $result['letter'];
4、使用 preg_match_all('/\d/u', $str, $digits); 并将 $digits[0] 赋值给 $result['digit'];
5、使用 preg_match_all('/[\x{4e00}-\x{9fff}]/u', $str, $chinese); 并将 $chinese[0] 赋值给 $result['chinese'];
6、使用 preg_match_all('/[^\p{L}\p{N}\s]/u', $str, $punct); 并将 $punct[0] 赋值给 $result['punct'];
该方法利用 PHP 内置函数对每个字符进行类型检测,适合需精确控制分类逻辑或扩展自定义类别的情形。
1、将字符串转换为字符数组:$chars = preg_split('//u', $str, -1, PREG_SPLIT_NO_EMPTY);
2、初始化 $result = ['upper' => [], 'lower' => [], 'digit' => [], 'space' => [], 'other' => []];
3、使用 foreach 循环遍历 $chars 中每个字符 $c;
4、判断 if (ctype_upper($c)),成立则将 $c 推入 $result['upper'];
5、判断 elseif (ctype_lower($c)),成立则将 $c 推入 $result['lower'];
6、判断 elseif (ctype_digit($c)),成立则将 $c 推入 $result['digit'];
7、判断 elseif ($c === ' '),成立则将 $c 推入 $result['space'];
8、否则将 $c 推入 $result['other'];
针对含中文、日文、韩文等 UTF-8 字符串,需使用 mb_ 系列函数确保正确识别单个字符而非字节序列。
1、获取字符串长度:$len = mb_strlen($str, 'UTF-8');
2、初始化 $result = ['han' => [], 'hiragana' => [], 'katakana' => [], 'latin' => []];
3、用 for ($i = 0; $i
4、提取当前字符:$c = mb_substr($str, $i, 1, 'UTF-8');
5、判断 if (mb_ereg_match('^[\x{4e00}-\x{9fff}]$', $c, 'u')),成立则推入 $result['han'];
6、判断 elseif (mb_ereg_match('^[\x{3040}-\x{309f}]$', $c, 'u')),成立则推入 $result['hiragana'];
7、判断 elseif (mb_ereg_match('^[\x{30a0}-\x{30ff}]$', $c, 'u')),成立则推入 $result['katakana'];
8、判断 else if (preg_match('/^[a-zA-Z]$/u', $c)),成立则推入 $result['latin'];
将分类逻辑抽象为函数,允许传入字符映射规则数组,提升代码复用性与可维护性。
1、定义函数 function classify_chars($str, $rules = []) { ... };
2、若 $rules 为空,则设置默认规则:$rules = ['alpha' => '/[a-zA-Z]/u', 'num' => '/\d/u', 'zh' => '/[\x{4e00}-\x{9fff}]/u'];
3、初始化 $result = []; 遍历 $rules 中每组 $key => $pattern;
4、执行 preg_match_all($pattern, $str, $matches);
5、将 $matches[0] 赋值给 $result[$key];
6、对未被任何规则捕获的字符,可额外调用 $others = preg_replace(array_keys($rules), '', $str); 并拆分存入 $result['unmatched'];
借助 array_reduce 将字符数组逐步累积到分类结果中,体现函数式编程思路,避免显式循环。
1、将字符串转为字符数组:$chars = preg_split('//u', $str, -1, PREG_SPLIT_NO_EMPTY);
2、定义初始分类结构:$initial = ['letters' => [], 'symbols' => [], 'whitespace' => []];
3、调用 $result = array_reduce($chars, function($carry, $char) { ... }, $initial);
4、在闭包中判断 if (ctype_alpha($char)),则 $carry['letters'][] = $char;
5、elseif (ctype_punct($char) || ctype_cntrl($char)),则 $carry['symbols'][] = $char;
6、elseif (ctype_space($char)),则 $carry['whitespace'][] = $char;
7、最后返回 $carry;
以上就是php怎么把字分类放到一个数组_php字分类入数组技巧【教程】的详细内容,更多请关注php中文网其它相关文章!
PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号