PHP调用语音合成接口需先确认服务商是否提供HTTP API,再按鉴权、参数、格式等规范调用;百度TTS须先获取access_token,用cURL发送GET请求并校验MP3魔数;音频应存文件返回URL,避免直接输出;需缓存token和音频,且缓存key须包含全部参数。

PHP 调用语音合成接口前,先确认服务商是否提供 HTTP API
绝大多数听书类插件(如「讯飞听见」「百度语音合成 TTS」「阿里云智能语音交互」)不直接提供 PHP 插件,而是暴露标准 RESTful 接口。所谓“对接听书插件”,本质是 PHP 后端调用其 TTS 服务的 /v1/tts 或类似路径的 HTTPS 接口。如果插件文档里没写明 API 地址、鉴权方式、参数格式,基本可以判定它不支持外部调用——别硬连。
常见错误现象:curl_exec() returns false、401 Unauthorized、400 Invalid parameter,八成是因为没读清服务商的签名规则或 token 过期。
- 必须检查服务商是否要求
Authorization请求头(如Bearer xxx或APPCODE xxx) - 注意请求方法:百度用
POST,讯飞 WebAPI 用POST+ WebSocket 长连接,阿里云部分接口需GET签名后拼 URL - 音频格式(
audio_format)务必与后端接收逻辑匹配,比如传mp3却用file_get_contents()直接 echo,浏览器可能无法播放
用 cURL 发起带鉴权的 TTS 请求(以百度语音合成为例)
百度 TTS 需要 access_token,得先用 client_id 和 client_secret 换取,再调用合成接口。不能跳过 token 获取这步——很多开发者卡在这里。
function baiduTts($text, $token) {
$url = 'https://tsn.baidu.com/text2audio';
$data = [
'tex' => urlencode($text),
'tok' => $token,
'cuid' => 'php-server-123',
'ctp' => 1,
'lan' => 'zh',
'per' => 1, // 普通女声
'aue' => 6, // mp3 格式
];
$query = http_build_query($data);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url . '?' . $query);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_BINARYTRANSFER, true);
$response = curl_exec($ch);
$httpCode = curl_getinfo($ch, CURLINFO_HTTP_CODE);
curl_close($ch);
if ($httpCode === 200 && substr($response, 0, 2) === 'PK') {
return $response; // 返回的是 MP3 二进制流
}
throw new Exception("TTS failed: HTTP {$httpCode}, response: " . substr($response, 0, 200));
}
关键点:curl_setopt($ch, CURLOPT_BINARYTRANSFER, true) 必须设,否则 MP3 流会被截断或乱码;substr($response, 0, 2) === 'PK' 是快速校验是否返回了合法 ZIP/MP3(百度响应头有时不规范,靠文件魔数比靠 Content-Type 更稳)。
立即学习“PHP免费学习笔记(深入)”;
把合成结果存为文件并返回前端播放地址
别在接口里直接 echo $audioData 给前端——这样没法控制缓存、不支持断点续传、CDN 也无法加速。应该保存到可公开访问的目录,返回 URL。
- 生成唯一文件名:用
md5($text . $voice . time()),避免中文文本导致路径问题 - 存储路径必须在 Web 根目录下(如
/var/www/html/audio/),且 PHP 有写权限 - 返回前检查
file_put_contents()是否成功,失败时抛异常而不是静默忽略 - 前端用
,不要用 base64 嵌入(大段文本转语音后 MP3 往往 >500KB)
示例保存逻辑:
$filename = '/var/www/html/audio/' . md5($text . 'baidu_female') . '.mp3';
if (file_put_contents($filename, $audioData) === false) {
throw new Exception("Failed to write audio file: {$filename}");
}
echo json_encode(['url' => 'https://yoursite.com/audio/' . basename($filename)]);
并发高时要注意 token 复用和音频缓存
百度的 access_token 有效期 30 分钟,但每秒调用量有限(免费版约 5 QPS)。如果每次请求都重新获取 token,很快触发限流;如果完全不缓存音频,同一段文字反复合成浪费资源又拖慢响应。
- 用
apcu_store()或 Redis 缓存 token,键名为baidu_access_token,过期时间设为 1800 秒 - 对相同
$text + $voice + $speed组合做音频文件级缓存,先查文件是否存在再合成 - 注意清理:定期用
find /var/www/html/audio -name "*.mp3" -mmin +1440 -delete清理 24 小时前的文件(加到 crontab)
最易被忽略的一点:不同用户提交相同文字,但用了不同语速/音色参数,却共用一个缓存 key——结果张三选了男声,李四听到却是女声。参数必须完整参与哈希计算。











