跳到主要内容

提供者运行时解析

Hermes 使用一个跨以下组件共享的提供者运行时解析器:

  • CLI
  • 网关
  • 定时任务
  • ACP
  • 辅助模型调用

主要实现:

  • hermes_cli/runtime_provider.py — 凭据解析,_resolve_custom_runtime()
  • hermes_cli/auth.py — 提供者注册表,resolve_provider()
  • hermes_cli/model_switch.py — 共享的 /model 切换流程(CLI + 网关)
  • agent/auxiliary_client.py — 辅助模型路由

如果你正在尝试添加一个新的第一类推理提供者,请同时阅读本页和 添加提供者

解析优先级

从整体上看,提供者解析遵循以下顺序:

  1. 显式 CLI/运行时请求
  2. config.yaml 中的模型/提供者配置
  3. 环境变量
  4. 提供者特定的默认值或自动解析

这一顺序至关重要,因为 Hermes 将保存的模型/提供者选择视为正常运行的“真理来源”。这可以防止旧的 shell 环境变量导出静默覆盖用户在 hermes model 中最后选择的端点。

提供者

当前支持的提供者类别包括:

  • AI Gateway(Vercel)
  • OpenRouter
  • Nous Portal
  • OpenAI Codex
  • Copilot / Copilot ACP
  • Anthropic(原生)
  • Google / Gemini
  • 阿里巴巴 / DashScope
  • DeepSeek
  • Z.AI
  • Kimi / Moonshot
  • MiniMax
  • MiniMax 中国
  • Kilo Code
  • Hugging Face
  • OpenCode Zen / OpenCode Go
  • 自定义(provider: custom)—— 用于任何 OpenAI 兼容端点的第一类提供者
  • 命名自定义提供者(config.yaml 中的 custom_providers 列表)

运行时解析的输出

运行时解析器返回如下数据:

  • provider
  • api_mode
  • base_url
  • api_key
  • source
  • 提供者特定的元数据,如过期/刷新信息

为何如此重要

该解析器是 Hermes 能够在以下场景间共享认证/运行时逻辑的主要原因:

  • hermes chat
  • 网关消息处理
  • 在全新会话中运行的定时任务
  • ACP 编辑器会话
  • 辅助模型任务

AI Gateway

~/.hermes/.env 中设置 AI_GATEWAY_API_KEY,并使用 --provider ai-gateway 运行。Hermes 会从网关的 /models 端点获取可用模型,并筛选出支持工具使用的语言模型。

OpenRouter、AI Gateway 与自定义 OpenAI 兼容基础 URL

Hermes 包含逻辑,以避免在存在多个提供者密钥时(例如 OPENROUTER_API_KEYAI_GATEWAY_API_KEYOPENAI_API_KEY)将错误的 API 密钥泄露给自定义端点。

每个提供者的 API 密钥都限定于其自身的基础 URL:

  • OPENROUTER_API_KEY 仅发送至 openrouter.ai 端点
  • AI_GATEWAY_API_KEY 仅发送至 ai-gateway.vercel.sh 端点
  • OPENAI_API_KEY 用于自定义端点,并作为回退

Hermes 还区分:

  • 用户明确选择的真实自定义端点
  • 当未配置自定义端点时使用的 OpenRouter 回退路径

这种区分在以下场景中尤为重要:

  • 本地模型服务器
  • 非 OpenRouter / 非 AI Gateway 的 OpenAI 兼容 API
  • 切换提供者而无需重新运行设置
  • 保存在配置中的自定义端点,即使当前 shell 中未导出 OPENAI_BASE_URL 也能继续工作

原生 Anthropic 路径

Anthropic 已不再仅通过 OpenRouter 实现。

当提供者解析选择 anthropic 时,Hermes 使用:

  • api_mode = anthropic_messages
  • 原生 Anthropic Messages API
  • agent/anthropic_adapter.py 进行转换

原生 Anthropic 的凭据解析现在优先使用可刷新的 Claude Code 凭据,而非复制的环境变量令牌(当两者都存在时)。实际上这意味着:

  • 当 Claude Code 凭据文件包含可刷新认证时,被视为首选来源
  • 手动设置的 ANTHROPIC_TOKEN / CLAUDE_CODE_OAUTH_TOKEN 值仍可作为显式覆盖
  • Hermes 在调用原生 Messages API 前会预先刷新 Anthropic 凭据
  • Hermes 在重建 Anthropic 客户端后,若遇到 401 错误仍会重试一次,作为回退路径

OpenAI Codex 路径

Codex 使用独立的 Responses API 路径:

  • api_mode = codex_responses
  • 专用的凭据解析与认证存储支持

辅助模型路由

以下辅助任务可使用其自身的提供者/模型路由,而非主对话模型:

  • 视觉处理
  • 网页提取摘要
  • 上下文压缩摘要
  • 会话搜索摘要
  • 技能中心操作
  • MCP 帮助器操作
  • 内存清除

当辅助任务配置提供者为 main 时,Hermes 通过与正常聊天相同的共享运行时路径进行解析。实际上这意味着:

  • 基于环境变量的自定义端点仍可工作
  • 通过 hermes model / config.yaml 保存的自定义端点也可工作
  • 辅助路由能够区分真实保存的自定义端点与 OpenRouter 回退路径

回退模型

Hermes 支持配置的回退模型/提供者对,允许在主模型遇到错误时进行运行时故障转移。

内部工作原理

  1. 存储AIAgent.__init__fallback_model 字典存储,并设置 _fallback_activated = False

  2. 触发点_try_activate_fallback()run_agent.py 的主重试循环中被调用三次:

    • 在无效 API 响应(None choices、缺少内容)达到最大重试次数后
    • 在非可重试的客户端错误(HTTP 401、403、404)发生时
    • 在瞬态错误(HTTP 429、500、502、503)达到最大重试次数后
  3. 激活流程_try_activate_fallback):

    • 如果已激活或未配置,立即返回 False
    • 调用 auxiliary_client.py 中的 resolve_provider_client() 构建带有正确认证的新客户端
    • 确定 api_modecodex_responses 用于 openai-codex,anthropic_messages 用于 anthropic,其余情况为 chat_completions
    • 就地替换:self.modelself.providerself.base_urlself.api_modeself.clientself._client_kwargs
    • 对 anthropic 回退:构建原生 Anthropic 客户端,而非 OpenAI 兼容客户端
    • 重新评估提示缓存(在 OpenRouter 上,Claude 模型启用提示缓存)
    • 设置 _fallback_activated = True —— 防止再次触发
    • 重置重试计数为 0,并继续循环
  4. 配置流程

    • CLI:cli.py 读取 CLI_CONFIG["fallback_model"] → 传递给 AIAgent(fallback_model=...)
    • 网关:gateway/run.py._load_fallback_model() 读取 config.yaml → 传递给 AIAgent
    • 验证:providermodel 键都必须非空,否则回退功能被禁用

不支持回退的功能

  • 子代理委派tools/delegate_tool.py):子代理继承父代理的提供者,但不继承回退配置
  • 定时任务cron/):使用固定提供者运行,无回退机制
  • 辅助任务:使用其自身独立的提供者自动检测链(参见上方“辅助模型路由”)

测试覆盖

详见 tests/test_fallback_model.py,涵盖所有支持的提供者、单次调用语义以及边缘情况的全面测试。