Skip to main content

配置模型

Hermes 使用两类模型槽位。理解这一点,配置就会简单很多。

  • 主模型负责“思考”。用户消息、工具调用循环和流式回复都走主模型。
  • 辅助模型负责“小任务”。例如上下文压缩、图片理解、网页摘要、审批评分、MCP 工具路由、会话标题生成和技能搜索,都可以单独指定更便宜或更擅长的小模型。

可以把主模型理解为驾驶员,把辅助模型理解为随车工具箱。驾驶员负责决策,工具箱负责把重复的小活做快、做便宜。

最快路径:Nous Portal

如果你想少配 API Key,官方推荐先使用 Nous Portal。新装环境可以直接运行:

hermes setup --portal

这个命令会完成 Portal OAuth 登录,把 Nous 写成默认 provider,并启用 Tool Gateway。之后可以用下面的命令检查状态:

hermes portal status

Portal 适合想把模型、搜索、图像、浏览器等能力统一走一个订阅入口的用户。

在 Dashboard 中配置

Dashboard 是最适合新手的配置入口。启动 Dashboard 后,进入模型或 provider 设置页,可以分别选择主模型和辅助模型。

常见做法是:

  1. 主模型选择能力更强的模型,例如长上下文、强工具调用或强代码模型。
  2. 辅助模型选择便宜快速的模型,用来做标题、摘要、搜索路由和压缩。
  3. 图片理解单独选择 vision 能力稳定的模型。
  4. Web 摘要单独选择适合长文本压缩的模型。

注意:不要把所有辅助槽都无脑设成最贵模型。Hermes 的辅助任务很多,选对小模型通常能省下大量成本。

在配置文件中设置

如果你更喜欢可复现配置,可以编辑 ~/.hermes/config.yaml。实际字段会随着 provider 演进而变化,但思路是一样的:先配置 provider,再把不同槽位指向具体模型。

示意结构如下:

providers:
openrouter:
api_key_env: OPENROUTER_API_KEY

model:
provider: openrouter
name: anthropic/claude-sonnet-4.5

auxiliary:
summarization:
provider: openrouter
name: openai/gpt-4.1-mini
vision:
provider: openrouter
name: google/gemini-2.5-flash

真实配置请以当前版本的 hermes config、Dashboard 和 环境变量参考 为准。

OpenRouter、OpenAI-compatible 与自定义 provider

Hermes 支持多种 provider。常见选择包括 Nous Portal、OpenRouter、OpenAI、Anthropic、xAI,以及 OpenAI-compatible 端点。

如果你的公司或本地服务暴露了 OpenAI-compatible API,通常需要配置 base URL、API Key 和模型名。关键是先确认三件事:

  • 端点是否兼容 Chat Completions 或 Responses;
  • 模型是否支持工具调用;
  • 视觉、搜索、图像生成等能力是否需要单独 provider。

新手最容易犯的错误,是把“聊天模型可用”误认为“所有工具能力都可用”。实际上,工具调用、视觉、网页搜索、图像生成和 TTS 往往是不同能力面,需要分别检查。

什么时候要单独配置辅助模型?

建议在以下场景单独配置辅助模型:

  • 对话很长,经常触发上下文压缩;
  • 经常让 Hermes 阅读网页或文档;
  • 经常使用图片理解;
  • 需要大量会话搜索、技能搜索或标题生成;
  • 主模型很贵,但辅助任务不需要同等能力。

一个实用原则是:主模型追求可靠,辅助模型追求性价比

验证配置是否生效

配置完成后,可以用下面几种方式验证:

hermes chat
hermes portal status
hermes doctor

如果 Dashboard 中模型选择正确,但 CLI 行为不一致,优先检查当前 profile、环境变量和 ~/.hermes/config.yaml 的覆盖关系。

参考链接