配置模型
Hermes 使用兩類模型槽位。理解這一點,配置就會簡單很多。
- 主模型負責“思考”。用戶消息、工具調用循環和流式回覆都走主模型。
- 輔助模型負責“小任務”。例如上下文壓縮、圖片理解、網頁摘要、審批評分、MCP 工具路由、會話標題生成和技能搜索,都可以單獨指定更便宜或更擅長的小模型。
可以把主模型理解為駕駛員,把輔助模型理解為隨車工具箱。駕駛員負責決策,工具箱負責把重複的小活做快、做便宜。
最快路徑:Nous Portal
如果你想少配 API Key,官方推薦先使用 Nous Portal。新裝環境可以直接運行:
hermes setup --portal
這個命令會完成 Portal OAuth 登錄,把 Nous 寫成默認 provider,並啟用 Tool Gateway。之後可以用下面的命令檢查狀態:
hermes portal status
Portal 適合想把模型、搜索、圖像、瀏覽器等能力統一走一個訂閱入口的用戶。
在 Dashboard 中配置
Dashboard 是最適合新手的配置入口。啟動 Dashboard 後,進入模型或 provider 設置頁,可以分別選擇主模型和輔助模型。
常見做法是:
- 主模型選擇能力更強的模型,例如長上下文、強工具調用或強代碼模型。
- 輔助模型選擇便宜快速的模型,用來做標題、摘要、搜索路由和壓縮。
- 圖片理解單獨選擇 vision 能力穩定的模型。
- Web 摘要單獨選擇適合長文本壓縮的模型。
注意:不要把所有輔助槽都無腦設成最貴模型。Hermes 的輔助任務很多,選對小模型通常能省下大量成本。
在配置文件中設置
如果你更喜歡可復現配置,可以編輯 ~/.hermes/config.yaml。實際字段會隨著 provider 演進而變化,但思路是一樣的:先配置 provider,再把不同槽位指向具體模型。
示意結構如下:
providers:
openrouter:
api_key_env: OPENROUTER_API_KEY
model:
provider: openrouter
name: anthropic/claude-sonnet-4.5
auxiliary:
summarization:
provider: openrouter
name: openai/gpt-4.1-mini
vision:
provider: openrouter
name: google/gemini-2.5-flash
真實配置請以當前版本的 hermes config、Dashboard 和 環境變量參考 為準。
OpenRouter、OpenAI-compatible 與自定義 provider
Hermes 支持多種 provider。常見選擇包括 Nous Portal、OpenRouter、OpenAI、Anthropic、xAI,以及 OpenAI-compatible 端點。
如果你的公司或本地服務暴露了 OpenAI-compatible API,通常需要配置 base URL、API Key 和模型名。關鍵是先確認三件事:
- 端點是否兼容 Chat Completions 或 Responses;
- 模型是否支持工具調用;
- 視覺、搜索、圖像生成等能力是否需要單獨 provider。
新手最容易犯的錯誤,是把“聊天模型可用”誤認為“所有工具能力都可用”。實際上,工具調用、視覺、網頁搜索、圖像生成和 TTS 往往是不同能力面,需要分別檢查。
什麼時候要單獨配置輔助模型?
建議在以下場景單獨配置輔助模型:
- 對話很長,經常觸發上下文壓縮;
- 經常讓 Hermes 閱讀網頁或文檔;
- 經常使用圖片理解;
- 需要大量會話搜索、技能搜索或標題生成;
- 主模型很貴,但輔助任務不需要同等能力。
一個實用原則是:主模型追求可靠,輔助模型追求性價比。
驗證配置是否生效
配置完成後,可以用下面幾種方式驗證:
hermes chat
hermes portal status
hermes doctor
如果 Dashboard 中模型選擇正確,但 CLI 行為不一致,優先檢查當前 profile、環境變量和 ~/.hermes/config.yaml 的覆蓋關係。