使用指南(Guide)
报错与排查
按现象快速定位常见错误:空回复、网络错误、401、403、413、503 等。
先按现象找对应项。反馈问题时,请尽量带上客户端名称、配置截图和完整报错。
先做三件事
换网络或重试
先排除临时网络抖动、节点拥塞或上游短暂异常。
新建对话再试
如果某个会话持续异常,先新建一个全新会话,避免旧上下文污染。
检查配置
重点看 Base URL、API Key、模型名、是否流式、最大输出 Token。
常见问题速查
空回复 / no candidates
通常和输出 Token、审查、旧客户端字段有关。
524 / 530 / 502 / 504
通常是网络或网关链路异常。
maxOutputTokens 过大
把最大输出 Token 调到 65536 以下。
401 / 403
通常是密钥错误、权限问题或余额不足。
空回复 / no candidates returned
常见原因:
- 最大输出 Token 设置过小,模型思考过程占满额度。
- 对话内容触发审查或异常状态。
- 老客户端仍在使用
maxtokens等旧字段。
建议:
- 最大输出 Token 设置在 10000-30000 区间。
- 新建对话重试。
- 换一组提示词,或尝试关闭流式输出。
- 更新客户端到最新版。
524 / 530 / 502 / 504
这类通常是网络或网关链路异常。
建议:
- 优先使用流式传输。
- 重试一次,或换一个网络。
- 如果走 CDN 链路超时,可以切换到直连端点
https://api.12ai.org。
maxOutputTokens 过大
报错类似:
Unable to submit request because it has a maxOutputTokens value of 65537...解决方法:
- 将最大输出 Token 调到 小于 65537。
- 推荐先设置在 10000-30000 区间。
413
请求体太大,通常是文本过长、图片过多或单张图片过大。
建议:
- 减少图片数量。
- 压缩图片后再上传。
- 长文本分批发送。
503
通常表示当前无可用渠道或上游暂时不可用。
建议:
- 等待一段时间后重试。
- 多次重试仍然失败时,带上报错截图反馈。
401 / 403
401 通常是密钥无效、删除、粘贴不完整,或填错了 Key。
403 通常是余额不足或权限不足。
建议:
- 重新创建一个新的
sk-密钥。 - 确认客户端里完整粘贴了密钥。
- 余额不足时,前往 钱包页面 自助充值。
反馈时请提供
一次性发全,排查最快
- 客户端名称和设备,例如 Cherry Studio on macOS
- Base URL、模型名、是否流式的配置截图
- 完整报错文本或截图
- 大致说明任务类型,例如纯文本、带图片、长上下文
