PHP不能直接解析远程RTF,需先下载再解析;可用file_get_contents(需allow_url_fopen开启)或更可靠的cURL;获取内容后须用正则、外部工具(如unrtf)或第三方库(如mtibben/rtf)提取文本,并注意编码、安全与性能。

PHP 本身不直接支持读取远程 RTF 文件(比如通过 HTTP URL),但可以通过组合方式实现:先获取远程文件内容,再解析 RTF 格式。关键在于两步分离——下载 + 解析,不能跳过下载直接“打开”远程 URL。
PHP 能否用 file_get_contents 直接读远程 RTF?
可以,但有前提:
- 服务器需开启 allow_url_fopen = On(默认部分主机已禁用)
- RTF 文件 URL 可公开访问,无重定向、登录校验或防盗链限制
- 文件不宜过大,否则可能超时或内存溢出
示例代码:
php$rtf_url = 'https://example.com/doc.rtf';
$rtf_content = file_get_contents($rtf_url);
if ($rtf_content === false) {
die('无法获取远程 RTF');
}
// 后续解析 $rtf_content...
?>
更可靠的方式:用 cURL 替代 file_get_contents
cURL 更灵活,能处理重定向、设置超时、添加请求头,兼容性更好:
立即学习“PHP免费学习笔记(深入)”;
$ch = curl_init();curl_setopt($ch, CURLOPT_URL, 'https://example.com/doc.rtf');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($ch, CURLOPT_TIMEOUT, 10);
$rtf_content = curl_exec($ch);
curl_close($ch);
if ($rtf_content === false) {
die('cURL 获取失败:' . curl_error($ch));
}
?>
拿到 RTF 内容后,怎么提取文字?
RTF 是带控制符的格式,PHP 没有内置解析器。常用方法:
- 简单清洗:正则去除 \{、\}、\\[a-z]+\d* 等控制指令,保留纯文本(适合结构简单、无嵌套的 RTF)
-
调用外部工具:如
unrtf命令行工具(Linux),用exec()转成 txt 或 HTML 再读取 - 使用第三方库:如 mtibben/rtf(轻量,专注解码文本)或 虽非专为 RTF,但可配合预处理使用
注意:RTF 编码(如 ANSI、UTF-8、Unicode)会影响中文解析,建议在解析前检测或强制转码。
安全与性能提醒
远程 RTF 不可盲目信任:











