推荐使用mb_substr()处理中文字符截取,如mb_substr("你好世界", 0, 2, 'UTF-8')输出“你好”;2. 单字节字符可用substr(),如substr("Hello World", 0, 5)输出“Hello”;3. 复杂场景可用正则preg_match('/^.{1,4}/u', "今天天气真好啊", $m)提取“今天天气”;4. 可封装兼容函数优先调用mb_substr(),无mbstring时降级使用substr(),确保环境兼容。

PHP中截取字符串有多种方式,主要根据字符编码和具体需求选择合适的方法。以下是几种常用且实用的字符串截取方式。
1. substr() 函数(适用于单字节字符)
substr() 是 PHP 内置函数,用于按字节位置截取字符串。它适合处理英文或 ASCII 字符,但在处理中文等多字节字符时容易出现乱码。
语法:substr(string $string, int $start, ?int $length = null)
示例:
$str = "Hello World";
echo substr($str, 0, 5); // 输出:Hello
如果字符串包含中文,使用 substr() 可能会截断汉字导致乱码,比如:
立即学习“PHP免费学习笔记(深入)”;
$str = "你好世界";
echo substr($str, 0, 3); // 可能输出乱码,因为一个中文通常占3字节
2. mb_substr() 函数(推荐用于多字节字符)
处理中文、日文等多字节字符时,应使用 mb_substr(),它是多字节安全的函数,能正确按“字符”截取。
前提:确保服务器启用了 mbstring 扩展。
XYCMS(PHP版)企业建站系统是XYCMS工作室推出的一套通用的企业建站软件系统。XYCMS企业建站系统是专业从事企业网站制作与设计服务,已有四年工作经验,网站系统方便、简洁、容易上手。所设计的版本分为动态版和静态版,比起市场上同类系统,性价比还是很高的,在企业网站建设行业里拥有丰富的经验,并在业界取得好评。 更新日志:1.后台简单特殊字符替换XYCMS(PHP版) 软件的安装:1. 上传 u
mb_substr(string $str, int $start, ?int $length = null, ?string $encoding = null)
示例:
$str = "你好世界";
echo mb_substr($str, 0, 2, 'UTF-8'); // 输出:你好
- 第四个参数指定编码,常用 'UTF-8'
- 如果不写编码,依赖 php.ini 的设置,建议显式指定
3. 使用正则表达式截取(灵活匹配)
当需要根据特定模式提取内容时,可用 preg_match() 或 preg_replace() 配合正则表达式。
示例:提取前4个中文字符
$str = "今天天气真好啊";
preg_match('/^.{1,4}/u', $str, $matches);
echo $matches[0]; // 输出:今天天气
- 'u' 修饰符表示启用 UTF-8 模式
- 适合复杂场景,如按词、标点或规则截取
4. 自定义函数实现安全截取
为避免不同环境下的编码问题,可以封装一个通用截取函数。
示例:
function cutStr($str, $start, $length) {
if (function_exists('mb_substr')) {
return mb_substr($str, $start, $length, 'UTF-8');
} else {
return substr($str, $start, $length);
}
}
兼容性好,在没有 mbstring 扩展时降级使用 substr。
基本上就这些。日常开发中,只要涉及中文,优先使用 mb_substr(),并明确指定编码,可避免绝大多数问题。简单英文场景用 substr 也没问题。关键是根据项目编码环境选择合适方法。不复杂但容易忽略。










