短链接还原本质是HTTP重定向链路追踪,需用get_headers()逐层解析Location头,校验URL、防环形跳转、设深度上限,并模拟真实UA/Referer。

短链接还原的本质是 HTTP 重定向链路追踪
PHP 本身不“还原”短链接,而是模拟浏览器行为,顺着 Location 响应头一层层跳转,直到拿到最终 URL。关键不是递归写法,而是正确处理重定向、避免死循环、识别中间跳转是否可信。
用 get_headers() + 手动跳转比 file_get_contents() 更可控
file_get_contents() 默认跟随重定向(max_redirects 有限制),但无法获取每跳的 URL 和状态码;而 get_headers() 能拿到原始响应头,适合逐层解析。注意:必须启用 user_agent,否则很多短链服务(如微博、微信)直接返回 403 或空白页。
- 设置
stream_context_create(),开启follow_location => false - 检查响应头中是否存在
Location:,且状态码为301、302、307、308 - 对
Location值做filter_var($url, FILTER_VALIDATE_URL)校验,防止注入或相对路径拼错 - 记录已访问 URL,避免环形跳转(比如 A → B → A)
递归函数要带深度限制和跳转计数器
真实场景中,短链可能嵌套 5–10 层(尤其营销裂变链),但超过 15 层基本可判定异常。不设上限容易栈溢出或卡死;不校验跳转来源可能落入恶意重定向陷阱。
function resolveShortUrl($url, $depth = 0, $maxDepth = 10, $visited = []) {
if ($depth > $maxDepth) return ['error' => 'max depth exceeded', 'url' => $url];
if (in_array($url, $visited)) return ['error' => 'redirect loop', 'url' => $url];
$context = stream_context_create([
'http' => [
'method' => 'HEAD',
'header' => "User-Agent: Mozilla/5.0 (X11; Linux x86_64)\r\n",
'ignore_errors' => true,
'max_redirects' => 0,
'timeout' => 5
]
]);
$headers = @get_headers($url, 1, $context);
if (!$headers || !is_array($headers)) {
return ['error' => 'failed to fetch headers', 'url' => $url];
}
$status = $headers[0] ?? '';
if (preg_match('/^HTTP\/\d\.\d\s+(30[1278])/', $status, $m)) {
$next = $headers['Location'] ?? null;
if (!$next) return ['error' => 'no Location header', 'url' => $url];
$next = filter_var($next, FILTER_VALIDATE_URL) ?: (parse_url($url, PHP_URL_SCHEME) ? rtrim($url, '/') . '/' . ltrim($next, '/') : null);
if (!$next) return ['error' => 'invalid redirect target', 'url' => $url];
return resolveShortUrl($next, $depth + 1, $maxDepth, array_merge($visited, [$url]));
}
return ['final_url' => $url, 'status' => $status, 'depth' => $depth];
}
微信、微博等平台短链需额外处理 Referer 和 UA
这类平台会校验 Referer 和 User-Agent,甚至检查请求是否来自微信内置浏览器(含 MicroMessenger 字符串)。纯命令行或 curl 默认 UA 会被拦截,返回 403 或跳转到下载页。
立即学习“PHP免费学习笔记(深入)”;
- UA 必须包含
MicroMessenger或模仿常见移动端 UA(如Mozilla/5.0 (iPhone; CPU iPhone OS 16_6 like Mac OS X)) - 部分接口要求
Referer为合法域名(如https://weibo.com/),否则拒绝响应 - 若目标 URL 是微信公众号文章,还可能触发
__biz+mid+idx参数混淆,此时需配合 JS 渲染或逆向分析(PHP 无法直接解密)
https 跳到 http 后被浏览器拦截)、中间页返回 200 却内嵌 JS 跳转(get_headers() 捕获不到),这种就得切到 headless 浏览器方案了。











