
本文详细介绍了如何利用apache的`.htaccess`文件,为多语言网站实现浏览器语言检测及高级url重写。教程涵盖了将带有语言和动作参数的实际url重定向为美观的url结构,根据用户浏览器`accept-language`头部自动添加语言前缀,以及将美观url内部转发回应用程序可处理的参数形式,从而优化用户体验和seo表现。
在构建多语言网站时,提供用户友好的URL结构和根据用户偏好自动导向其语言版本是提升用户体验和搜索引擎优化(SEO)的关键。Apache的mod_rewrite模块通过.htaccess文件提供了强大的URL重写能力,可以帮助我们实现这些复杂的需求。本文将深入讲解如何配置.htaccess来实现浏览器语言检测和多语言URL重写。
核心概念与mod_rewrite基础
在深入配置之前,了解mod_rewrite的一些核心指令至关重要:
- RewriteEngine On: 启用重写引擎。这是所有重写规则生效的前提。
-
RewriteCond: 定义重写规则的条件。只有当RewriteCond的条件满足时,其后的RewriteRule才会执行。
- %{VARIABLE}: 用于访问服务器变量,如%{THE_REQUEST}(原始HTTP请求行)、%{HTTP:Accept-Language}(浏览器发送的语言偏好)。
- !:表示非,即条件不满足时为真。
-
RewriteRule: 定义实际的重写规则。
- Pattern: 用于匹配请求URL的正则表达式。
- Substitution: 匹配成功后,URL将被重写成的目标。
- [Flags]: 控制重写行为的标志。
- R=301: 执行一个永久性(301)外部重定向。浏览器地址栏会显示新的URL。
- L (Last): 停止处理后续的重写规则。
- NE (No Escape): 不对输出URL中的特殊字符进行转义。
- QSA (Query String Append): 将原始请求的查询字符串附加到重写后的URL。
- NC (No Case): 使匹配模式不区分大小写。
实现多语言URL重写策略
我们将分三步实现多语言URL重写,每一步都对应.htaccess中的一组规则。这些规则应放置在网站根目录的.htaccess文件中。
RewriteEngine On
# 1. 外部重定向:将带有lang和action参数的实际URL转换为美观URL
RewriteCond %{THE_REQUEST} /(?:index\.php)?\?lang=([^\s&]+)&action=([^\s&]+)\s [NC]
RewriteRule ^ /%1/%2? [R=301,L,NE]
# 2. 自动添加默认语言前缀:根据浏览器语言检测
RewriteCond %{HTTP:Accept-Language} ^([a-z]{2})- [NC]
RewriteRule ^(?![a-z]{2}/)[^/]*/?$ /%1%{REQUEST_URI} [L,R=301,NE]
# 3. 内部转发:将美观URL映射回应用程序可处理的实际URL
RewriteRule ^([a-z]+)/([\w-]+)/?$ index.php?lang=$1&action=$2 [L,QSA,NC]1. 外部重定向:将实际URL转换为美观URL
这条规则的目的是将用户或应用程序内部生成的,带有lang和action查询参数的原始URL(例如 http://example.com/index.php?lang=en&action=subpage)永久重定向到更美观的URL格式(例如 http://example.com/en/subpage)。
RewriteCond %{THE_REQUEST} /(?:index\.php)?\?lang=([^\s&]+)&action=([^\s&]+)\s [NC]
RewriteRule ^ /%1/%2? [R=301,L,NE]-
RewriteCond %{THE_REQUEST} /(?:index\.php)?\?lang=([^\s&]+)&action=([^\s&]+)\s [NC]:
- %{THE_REQUEST} 变量包含了完整的原始HTTP请求行,例如 "GET /index.php?lang=en&action=subpage HTTP/1.1"。
- /(?:index\.php)?\?lang=([^\s&]+)&action=([^\s&]+)\s: 这是一个正则表达式,用于匹配请求行中的URL部分。
- (?:index\.php)?: 非捕获组,匹配可选的 index.php。
- \?lang=([^\s&]+): 匹配 ?lang= 后面的语言代码,并将其捕获到 RewriteRule 的 %1 中(例如 en)。[^\s&]+ 表示匹配一个或多个非空白和非 & 字符。
- &action=([^\s&]+): 匹配 &action= 后面的动作名称,并将其捕获到 RewriteRule 的 %2 中(例如 subpage)。
- \s: 匹配请求行末尾的空格。
- [NC]: 不区分大小写匹配。
-
RewriteRule ^ /%1/%2? [R=301,L,NE]:
- ^: 匹配请求URL的开头(这里不关心原始URL的路径部分,因为我们是从%{THE_REQUEST}中提取信息)。
- /%1/%2?: 将URL重写为 /语言代码/动作名称。%1 和 %2 分别对应RewriteCond中捕获的语言和动作。? 符号在重写目标后表示移除原始查询字符串。
- [R=301,L,NE]:
- R=301: 执行一个永久性重定向,通知浏览器更新其书签和搜索引擎索引。
- L: 这是一个“最后”规则,如果匹配成功,将停止处理后续的重写规则。
- NE: 不对重写后的URL中的特殊字符进行URL编码。
2. 自动添加默认语言前缀:根据浏览器语言检测
此规则旨在检测用户的










