商汤image_captioning模型不直接开放公网HTTP接口,PHP调用需先申请白名单权限、获取client_id/client_secret换取access_token,再通过/v1/chat/completions提交base64图片请求。

商汤日日新(SenseNova)的视觉描述模型(如 image_captioning)目前**不直接开放公网 HTTP 接口供 PHP 任意调用**,官方 SDK 和文档主要面向 Python,且生产环境需通过「商汤 AI 开放平台」申请模型权限、获取 access_token,再走统一网关 https://api.sensenova.cn/v1/。PHP 接入本质是模拟标准 OpenAI 兼容接口(部分模型支持),但必须注意:不是所有视觉模型都已开放,image_captioning 当前仅限白名单客户调用,普通注册账号默认不可用。
确认你有权限调用 image_captioning 模型
这是最关键的前置条件,跳过会导致 403 或 “model not found” 错误:
- 登录 商汤 AI 开放平台,进入「我的应用」→「模型服务」,检查是否已开通
image_captioning(或类似名称如sensechat-vl-caption)的调用权限 - 若未显示,需提交工单申请,注明用途、QPS 预估、测试环境信息;个人开发者通常会被拒绝
- 确认后,在「API 密钥」页拿到有效的
client_id和client_secret,用于换取access_token
用 PHP 获取 access_token 并构造请求
商汤使用 OAuth2.0 流程,access_token 有效期 2 小时,需缓存复用,不可每次请求都刷新:
curl -X POST "https://api.sensenova.cn/v1/oauth/token" \ -H "Content-Type: application/x-www-form-urlencoded" \ -d "grant_type=client_credentials" \ -d "client_id=your_client_id_here" \ -d "client_secret=your_client_secret_here"
PHP 中建议用 curl_init() 或 file_get_contents() + stream_context_create() 实现,注意捕获 http_code 和响应体中的 access_token 字段。常见错误包括:invalid_client(密钥错)、unsupported_grant_type(POST body 未设为 application/x-www-form-urlencoded)。
发送 Base64 图片到 /v1/chat/completions(OpenAI 兼容模式)
目前视觉描述走的是多模态 chat 接口,不是独立 endpoint。请求体必须包含 base64 编码的图片(JPEG/PNG),且 model 名称需与你开通的严格一致(如 sensechat-vl-caption):
$data = [
'model' => 'sensechat-vl-caption',
'messages' => [
[
'role' => 'user',
'content' => [
['type' => 'text', 'text' => '请用中文描述这张图片'],
['type' => 'image_url', 'image_url' => ['url' => 'data:image/jpeg;base64,' . $base64_string]]
]
]
]
];
$ch = curl_init('https://api.sensenova.cn/v1/chat/completions');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_POST, true);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($data));
curl_setopt($ch, CURLOPT_HTTPHEADER, [
'Authorization: Bearer ' . $access_token,
'Content-Type: application/json'
]);
$response = curl_exec($ch);
$httpCode = curl_getinfo($ch, CURLINFO_HTTP_CODE);
curl_close($ch);
关键细节:
-
$base64_string必须是原始二进制经base64_encode()得到,不能带换行或空格 - 图片尺寸建议 ≤ 1024×1024,过大可能被截断或超时;格式必须匹配
data:image/xxx;base64中的类型 - 返回字段在
$response['choices'][0]['message']['content'],不是text - 不要尝试传本地路径(如
/tmp/img.jpg)或公网 URL——商汤不支持远程拉图
调试失败时优先查这三项
90% 的 PHP 接入问题集中在这三个点:
-
access_token过期或为空:打印var_dump($access_token)确认非空,且未被意外 trim - Base64 字符串损坏:用
base64_decode($base64_string, true) === false校验合法性 - HTTP 状态码非 200:
curl_getinfo($ch, CURLINFO_HTTP_CODE)必须检查,401 表示 token 无效,400 多因 JSON 格式错(如中文未 UTF-8 编码、缺逗号),503 说明模型当前不可用
商汤的视觉模型实际可用性波动较大,即使参数全对,也可能返回空结果或通用回复(如“这是一张图片”),上线前务必用真实业务图片压测多个样本。










