配置模型

Hermes 使用兩類模型槽位。理解這一點，配置就會簡單很多。

主模型負責“思考”。用戶消息、工具調用循環和流式回覆都走主模型。
輔助模型負責“小任務”。例如上下文壓縮、圖片理解、網頁摘要、審批評分、MCP 工具路由、會話標題生成和技能搜索，都可以單獨指定更便宜或更擅長的小模型。

可以把主模型理解為駕駛員，把輔助模型理解為隨車工具箱。駕駛員負責決策，工具箱負責把重複的小活做快、做便宜。

最快路徑：Nous Portal

如果你想少配 API Key，官方推薦先使用 Nous Portal。新裝環境可以直接運行：

hermes setup --portal

這個命令會完成 Portal OAuth 登錄，把 Nous 寫成默認 provider，並啟用 Tool Gateway。之後可以用下面的命令檢查狀態：

hermes portal status

Portal 適合想把模型、搜索、圖像、瀏覽器等能力統一走一個訂閱入口的用戶。

在 Dashboard 中配置

Dashboard 是最適合新手的配置入口。啟動 Dashboard 後，進入模型或 provider 設置頁，可以分別選擇主模型和輔助模型。

常見做法是：

主模型選擇能力更強的模型，例如長上下文、強工具調用或強代碼模型。
輔助模型選擇便宜快速的模型，用來做標題、摘要、搜索路由和壓縮。
圖片理解單獨選擇 vision 能力穩定的模型。
Web 摘要單獨選擇適合長文本壓縮的模型。

注意：不要把所有輔助槽都無腦設成最貴模型。Hermes 的輔助任務很多，選對小模型通常能省下大量成本。

在配置文件中設置

如果你更喜歡可復現配置，可以編輯 ~/.hermes/config.yaml。實際字段會隨著 provider 演進而變化，但思路是一樣的：先配置 provider，再把不同槽位指向具體模型。

示意結構如下：

providers:
  openrouter:
    api_key_env: OPENROUTER_API_KEY

model:
  provider: openrouter
  name: anthropic/claude-sonnet-4.5

auxiliary:
  summarization:
    provider: openrouter
    name: openai/gpt-4.1-mini
  vision:
    provider: openrouter
    name: google/gemini-2.5-flash

真實配置請以當前版本的 hermes config、Dashboard 和環境變量參考為準。

OpenRouter、OpenAI-compatible 與自定義 provider

Hermes 支持多種 provider。常見選擇包括 Nous Portal、OpenRouter、OpenAI、Anthropic、xAI，以及 OpenAI-compatible 端點。

如果你的公司或本地服務暴露了 OpenAI-compatible API，通常需要配置 base URL、API Key 和模型名。關鍵是先確認三件事：

端點是否兼容 Chat Completions 或 Responses；
模型是否支持工具調用；
視覺、搜索、圖像生成等能力是否需要單獨 provider。

新手最容易犯的錯誤，是把“聊天模型可用”誤認為“所有工具能力都可用”。實際上，工具調用、視覺、網頁搜索、圖像生成和 TTS 往往是不同能力面，需要分別檢查。

什麼時候要單獨配置輔助模型？

建議在以下場景單獨配置輔助模型：

對話很長，經常觸發上下文壓縮；
經常讓 Hermes 閱讀網頁或文檔；
經常使用圖片理解；
需要大量會話搜索、技能搜索或標題生成；
主模型很貴，但輔助任務不需要同等能力。

一個實用原則是：主模型追求可靠，輔助模型追求性價比。

驗證配置是否生效

配置完成後，可以用下面幾種方式驗證：

hermes chat
hermes portal status
hermes doctor

如果 Dashboard 中模型選擇正確，但 CLI 行為不一致，優先檢查當前 profile、環境變量和 ~/.hermes/config.yaml 的覆蓋關係。

最快路徑：Nous Portal​

在 Dashboard 中配置​

在配置文件中設置​

OpenRouter、OpenAI-compatible 與自定義 provider​

什麼時候要單獨配置輔助模型？​

驗證配置是否生效​

參考鏈接​