跳到主要內容

配置模型

Hermes 使用兩類模型槽位。理解這一點,配置就會簡單很多。

  • 主模型負責“思考”。用戶消息、工具調用循環和流式回覆都走主模型。
  • 輔助模型負責“小任務”。例如上下文壓縮、圖片理解、網頁摘要、審批評分、MCP 工具路由、會話標題生成和技能搜索,都可以單獨指定更便宜或更擅長的小模型。

可以把主模型理解為駕駛員,把輔助模型理解為隨車工具箱。駕駛員負責決策,工具箱負責把重複的小活做快、做便宜。

最快路徑:Nous Portal

如果你想少配 API Key,官方推薦先使用 Nous Portal。新裝環境可以直接運行:

hermes setup --portal

這個命令會完成 Portal OAuth 登錄,把 Nous 寫成默認 provider,並啟用 Tool Gateway。之後可以用下面的命令檢查狀態:

hermes portal status

Portal 適合想把模型、搜索、圖像、瀏覽器等能力統一走一個訂閱入口的用戶。

在 Dashboard 中配置

Dashboard 是最適合新手的配置入口。啟動 Dashboard 後,進入模型或 provider 設置頁,可以分別選擇主模型和輔助模型。

常見做法是:

  1. 主模型選擇能力更強的模型,例如長上下文、強工具調用或強代碼模型。
  2. 輔助模型選擇便宜快速的模型,用來做標題、摘要、搜索路由和壓縮。
  3. 圖片理解單獨選擇 vision 能力穩定的模型。
  4. Web 摘要單獨選擇適合長文本壓縮的模型。

注意:不要把所有輔助槽都無腦設成最貴模型。Hermes 的輔助任務很多,選對小模型通常能省下大量成本。

在配置文件中設置

如果你更喜歡可復現配置,可以編輯 ~/.hermes/config.yaml。實際字段會隨著 provider 演進而變化,但思路是一樣的:先配置 provider,再把不同槽位指向具體模型。

示意結構如下:

providers:
openrouter:
api_key_env: OPENROUTER_API_KEY

model:
provider: openrouter
name: anthropic/claude-sonnet-4.5

auxiliary:
summarization:
provider: openrouter
name: openai/gpt-4.1-mini
vision:
provider: openrouter
name: google/gemini-2.5-flash

真實配置請以當前版本的 hermes config、Dashboard 和 環境變量參考 為準。

OpenRouter、OpenAI-compatible 與自定義 provider

Hermes 支持多種 provider。常見選擇包括 Nous Portal、OpenRouter、OpenAI、Anthropic、xAI,以及 OpenAI-compatible 端點。

如果你的公司或本地服務暴露了 OpenAI-compatible API,通常需要配置 base URL、API Key 和模型名。關鍵是先確認三件事:

  • 端點是否兼容 Chat Completions 或 Responses;
  • 模型是否支持工具調用;
  • 視覺、搜索、圖像生成等能力是否需要單獨 provider。

新手最容易犯的錯誤,是把“聊天模型可用”誤認為“所有工具能力都可用”。實際上,工具調用、視覺、網頁搜索、圖像生成和 TTS 往往是不同能力面,需要分別檢查。

什麼時候要單獨配置輔助模型?

建議在以下場景單獨配置輔助模型:

  • 對話很長,經常觸發上下文壓縮;
  • 經常讓 Hermes 閱讀網頁或文檔;
  • 經常使用圖片理解;
  • 需要大量會話搜索、技能搜索或標題生成;
  • 主模型很貴,但輔助任務不需要同等能力。

一個實用原則是:主模型追求可靠,輔助模型追求性價比

驗證配置是否生效

配置完成後,可以用下面幾種方式驗證:

hermes chat
hermes portal status
hermes doctor

如果 Dashboard 中模型選擇正確,但 CLI 行為不一致,優先檢查當前 profile、環境變量和 ~/.hermes/config.yaml 的覆蓋關係。

參考鏈接