用cURL获取远程文件需正确设置CURLOPT_HTTPHEADER为字符串数组(如'Key: Value'),二进制文件须启用CURLOPT_BINARYTRANSFER和CURLOPT_ENCODING='',并以二进制模式保存;空响应常见于重定向未处理、Host头缺失或超时过短。

PHP 用 cURL 获取远程文件内容时怎么设置 Header
直接用 curl_setopt() 设置 CURLOPT_HTTPHEADER 即可,但必须注意数组格式和 header 字符串的书写规范。常见错误是把 key-value 拆成两个元素、漏掉冒号空格、或用了中文标点。
比如要加 User-Agent 和 Accept,正确写法是:
$headers = [
'User-Agent: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36',
'Accept: application/json',
'Authorization: Bearer abc123'
];
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
- 每项必须是完整字符串,形如
'Key: Value',冒号后需有一个空格 - 不要用
array('User-Agent' => 'xxx')—— cURL 不认这种关联数组 - 如果 header 值含特殊字符(如 token 中的
+或/),建议先rawurlencode()再拼接 - 某些 API(如 GitHub)要求
Accept: application/vnd.github.v3+json,漏掉+json会返回 406
远程文件是图片/PDF/二进制怎么办?别用 file_get_contents()
file_get_contents() 默认以文本方式读取,遇到二进制内容(如 JPG、PDF)可能被截断或乱码,尤其在开启 mbstring.func_overload 的环境中更危险。必须用 cURL 并显式关闭输出解码。
- 设置
CURLOPT_BINARYTRANSFER => true(PHP 5.1.3+) - 禁用自动编码转换:
CURLOPT_ENCODING => '' - 用
curl_exec()返回原始字节流,再写入本地文件或 base64 编码 - 若需保存到磁盘,别用
file_put_contents($data)直接写,应打开fopen(..., 'wb')以二进制模式写入
示例下载图片:
$ch = curl_init('https://example.com/photo.jpg');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_BINARYTRANSFER, true);
curl_setopt($ch, CURLOPT_ENCODING, '');
$data = curl_exec($ch);
if ($data !== false && curl_getinfo($ch, CURLINFO_HTTP_CODE) === 200) {
file_put_contents('/tmp/photo.jpg', $data); // 注意:file_put_contents 默认 binary-safe
}
curl_close($ch);
为什么 cURL 返回空或 0 字节?检查这几个关键点
不是代码写错,而是网络层或服务端策略导致的静默失败。常见原因有:
-
CURLOPT_FOLLOWLOCATION关闭时,302 重定向不自动跳转,curl_exec()返回空但curl_getinfo($ch, CURLINFO_HTTP_CODE)是 302 - 目标服务器校验
Host头,而你没设 —— 加上'Host: example.com'到CURLOPT_HTTPHEADER - 开启了
open_basedir或allow_url_fopen=Off,但 cURL 本身不受allow_url_fopen影响,所以这通常不是原因;真正拦住的是 SELinux 或防火墙出向规则 - 超时太短:
CURLOPT_TIMEOUT默认 0(无限),但生产环境建议设为30,并配合CURLOPT_CONNECTTIMEOUT防卡死
要不要用 stream_context_create() 替代 cURL?
可以,但限制明显:不支持自定义 header 的部分字段(如 Authorization 在 PHP
若真要用,header 必须写成一维索引数组,且 key 固定为 http:
$opts = [
'http' => [
'method' => 'GET',
'header' => "User-Agent: test\r\nAccept: */*\r\n",
'timeout' => 10,
]
];
$context = stream_context_create($opts);
$content = file_get_contents('https://api.example.com/data', false, $context);
注意:\r\n 是必须的换行符,不能用 \n;header 值是单个字符串,不是数组。
header 里带认证时,Authorization: Bearer xxx 在旧版 PHP 中可能被忽略,cURL 更可靠。










