- 团队仪表板:https://vercel.com/d?to=%2F%5Bteam%5D%2F%7E%2Fai
- 模型目录:https://vercel.com/ai-gateway/models
- 文档:https://vercel.com/docs/ai-gateway
您能获得什么
- 一个端点访问 100 多个模型,使用单个密钥
- 在仪表板上配置的自动重试和回退
- 支出监控,包括按模型请求、token 计数、缓存使用、延迟百分位数和成本
- OpenAI 兼容的界面,现有客户端可以正常工作
获取 API 密钥
- 在 https://vercel.com 登录
- 仪表板 → AI Gateway → API Keys → 创建密钥
- 复制密钥
在 Cline 中配置
- 打开 Cline 设置
- 选择 Vercel AI Gateway 作为 API 提供商
- 粘贴您的 Gateway API 密钥
- 从列表中选择模型。Cline 会自动获取目录。您也可以粘贴确切的 ID
- 模型 ID 通常遵循
provider/model格式。从目录中复制确切的 ID
示例:openai/gpt-5anthropic/claude-sonnet-4google/gemini-2.5-progroq/llama-3.1-70bdeepseek/deepseek-v3
可操作的可观察性
- 按模型请求 - 确认路由和采用情况
- Token - 输入与输出,包括推理(如果公开)
- 缓存 - 缓存输入和缓存创建 token
- 延迟 - p75 持续时间和 p75 首 token 时间
- 成本 - 按项目和按模型
- 比较模型更改前后每个请求的输出 token
- 通过跟踪缓存读取和写入创建来验证缓存策略
- 在实验期间捕获 TTFT 回归
- 将预算与实际使用情况对齐
支持的模型
Gateway 支持大量且不断变化的模型集。Cline 从 Gateway API 拉取列表并在本地缓存。有关当前目录,请参阅 https://vercel.com/ai-gateway/models提示
定价是按提供商列表价格直通的。自带密钥没有加价。您仍然需要支付提供商和处理费用。
Vercel 不添加速率限制。上游提供商可能会。新账户每 30 天收到 5 美元积分,直到首次付款。
故障排除
- 401 - 将 Gateway 密钥发送到 Gateway 端点,而不是上游 URL
- 404 模型 - 从 Vercel 目录复制确切的 ID
- 首 token 慢 - 在仪表板中检查 p75 TTFT,并尝试为流式传输优化的模型
- 成本激增 - 在仪表板中按模型分解,并限制或路由流量
灵感
- 多模型评估 - 仅在 Cline 中交换模型 ID 并比较延迟和输出 token
- 渐进式推出 - 在仪表板中将小百分比路由到新模型,并根据指标增加
- 预算执行 - 设置每个项目的限制,无需代码更改
交叉链接
- OpenAI 兼容设置:/provider-config/openai-compatible
- 模型选择指南:/getting-started/model-selection-guide
- 理解上下文管理:/getting-started/understanding-context-management

