图像理解
使用返回的任务 ID 进行查询 获取最终结果。
授权
所有接口均需要使用 Bearer Token 进行认证。在请求头中添加:
Authorization: Bearer YOUR_API_KEY
YOUR_API_KEY 为 API Token(sk-... 格式)。
请求体
用户提示词,最多 100,000 字符。
100000"Describe this image in one sentence."
图片源数组(1–10 张)。每个元素接受以下两种形式:
- 公网 HTTP/HTTPS URL
data:image/<type>;base64,<payload>data URI(base64 内联)
模型限制:上限张数由所选模型对应上游决定;当某模型仅支持单图而请求传入多张时,路由层返回 422 model_rule_violation(具体规则维护在 app/relays/llm_router/model_rules.py,覆盖渠道配置以外的「模型固有」约束)。
base64 数据不做体积校验,过大可能触发 422。
1 - 10 elements[
"https://fal.media/files/lion/AOtzfcyHpx-MOITAUeMrK.jpeg"
]同步模式(参见 llm-text schema)。
false
是否流式(参见 llm-text schema)。
false
生成 token 上限。可选。
x >= 164
采样温度,区间 [0, 2]。可选。
0 <= x <= 20.3
系统指令。可选。
10000"You are a vision assistant."
是否包含 reasoning tokens。部分思考模型需设为 true。
响应
任务已创建(async 模式)/ 完整响应(sync 模式)
Submit 响应,对齐统一任务标准形状。results / error 在 submit 阶段固定为 null,任务完成/失败后通过 GET /v1/tasks/{task_id} 返回。sync=true, stream=false 模式下端点直接返回完整 OpenAI ChatCompletion JSON。
任务 ID,格式 task-llmrouter-{timestamp}-{8random}。
"task-llmrouter-1776874565-yq3szvcu"
llm.generation.task "llm.generation.task"
llm "llm"
客户端提交的模型名(原样回显)
"claude-opus-4-7"
pending "pending"
0
1776874565
stream=true 时返回 {url: ...};stream=false 时为 null。
submit 阶段固定 null;任务完成后通过 GET /v1/tasks/{task_id} 返回,results[0] 为完整 OpenAI ChatCompletion 响应。
null
submit 阶段固定 null;任务失败时通过 GET /v1/tasks/{task_id} 返回。
null