LLM 与凭据
一句话总结:用「LLM Connection」承载 Provider + API Key + 上下文窗口;为 Claude Code / Codex 工具单独指定凭据;自定义快速模型用于标题生成等系统任务。
什么时候要多配几个 Connection
- 同时使用多家 LLM Provider,按任务挑模型。
- Claude Code / Codex 子代理需要独立凭据,避免和主对话凭据冲突。
- 希望低成本完成标题生成等系统任务。
新建一个 Connection 的最少字段
- 设置 → LLM Connection → 添加 Connection。
- 选 Provider(Anthropic / OpenAI / Google / OpenRouter / Custom)。
- 填 API Key、Base URL(如适用)。
- 设置默认 / 快速 / 记忆 模型角色。
- 保存后在对话页可即时切换。
Provider 选项对照
- Anthropic:可选「Anthropic API」或「Claude Code」连接类型。后者会自动附加 Claude Code 仿真信号,适合接入要求 Claude Code 风格鉴权的兼容网关。
- OpenAI:标准 ChatCompletions / Responses 兼容端点。
- OpenRouter:在 Base URL 填 OpenRouter 路由域名即可。
- Google:Gemini 系列。
- Custom:任何 OpenAI 兼容端点。
默认 / 快速 / 记忆模型角色
每个 Connection 可以同时承担多种角色:
- 默认模型:用户对话默认选用。
- 快速模型(
isFast):标题生成等系统任务专用。 - 记忆模型:MemoryAgent 用。
未显式指定记忆模型时,系统按「记忆模型 → 快速模型 → 默认模型」顺序回退。
Claude Code 与 Codex 工具的专属凭据
Claude Code 与 Codex 工具可分别指定专用 Connection;调用时自动继承凭据:
- Claude Code:可选 API Key / OAuth / 本机
reclaude。 - Codex:API Key 或 OAuth。
reclaude 是一种本机伪连接,复用当前主机已登录的 Claude Code 会话凭据,无需重新输入。
上下文窗口与自动压缩阈值
每个 Connection 可独立配置上下文窗口大小,系统据此计算 token 预算并触发自动压缩。
压缩阈值(如 80%)触发后会在输入区上方提示,并支持手动 /compact。
多模态读取与 Web Search 凭据
部分多模态模型(Claude 3.5 / GPT-4o / Gemini)允许 Agent 通过 read 工具直接读取图片或 PDF 内容。无需额外配置,模型会自动按其能力解析。
Web Search 工具可由用户独立配置 Serper / Google / Brave / Bing 凭据。未配置时回退到 DuckDuckGo 免费搜索。
常见鉴权坑
不要把 OAuth 与 API Key 混用
多种鉴权同时存在容易触发 403 Request not allowed。若使用 OAuth,请清空对应环境变量中的 ANTHROPIC_API_KEY。
reclaude 仅在桌面端可用
它依赖宿主机当前已登录的 Claude Code;服务器/容器场景请改用 API Key 或 OAuth。
Connection 删除会断开所有依赖它的 Agent
删除前先在 Agent 列表反查依赖关系,避免会话中断。