跳到主要內容

功能概覽

Hermes Agent 擁有一系列豐富的功能,遠超基礎聊天能力。從持久化記憶和文件感知上下文,到瀏覽器自動化和語音對話,這些功能協同工作,使 Hermes 成為一個強大的自主助手。

核心功能

  • 工具與工具集 — 工具是擴展 Agent 能力的函數。它們被組織成邏輯上的工具集,可按平臺啟用或禁用,涵蓋網絡搜索、終端執行、文件編輯、記憶管理、任務委派等。
  • 技能系統 — 按需加載的知識文檔,Agent 在需要時可調用。技能遵循漸進式披露模式,以最小化 token 使用量,併兼容 agentskills.io 開放標準。
  • 持久化記憶 — 有界且經過篩選的記憶,可在會話間持久保留。Hermes 會記住你的偏好、項目、環境以及通過 MEMORY.mdUSER.md 學習到的內容。
  • 上下文文件 — Hermes 會自動發現並加載項目上下文文件(.hermes.mdAGENTS.mdCLAUDE.mdSOUL.md.cursorrules),以定義其在項目中的行為方式。
  • 上下文引用 — 輸入 @ 後跟引用,可將文件、文件夾、git 差異和 URL 直接注入消息中。Hermes 會內聯展開引用並自動附加內容。
  • 檢查點 — Hermes 在修改文件前會自動對工作目錄進行快照,若出現問題,可通過 /rollback 命令安全回滾。

自動化功能

  • 定時任務(Cron) — 使用自然語言或 Cron 表達式安排任務自動運行。任務可附加技能,將結果發送至任意平臺,並支持暫停、恢復和編輯操作。
  • 子 Agent 委派delegate_task 工具會生成具有隔離上下文、受限工具集和獨立終端會話的子 Agent 實例。最多可並行運行 3 個子 Agent,處理多個並行工作流。
  • 代碼執行execute_code 工具允許 Agent 編寫 Python 腳本,以程序化方式調用 Hermes 工具,通過沙箱化的 RPC 執行,將多步驟工作流壓縮為單次 LLM 調用。
  • 事件鉤子 — 在關鍵生命週期節點運行自定義代碼。網關鉤子處理日誌記錄、告警和 Webhook;插件鉤子處理工具攔截、指標統計和安全防護。
  • 批量處理 — 在數百甚至數千個提示上並行運行 Hermes Agent,生成結構化的 ShareGPT 格式軌跡數據,用於訓練數據生成或評估。

媒體與網絡功能

  • 語音模式 — 支持 CLI 和消息平臺的完整語音交互。通過麥克風與 Agent 對話,聽取語音回覆,並在 Discord 語音頻道中進行實時語音交流。

  • 瀏覽器自動化 — 支持多種後端的完整瀏覽器自動化:Browserbase 雲服務、Browser Use 雲服務、本地 Chrome(通過 CDP)或本地 Chromium。可導航網站、填寫表單並提取信息。

  • 視覺與圖像粘貼 — 多模態視覺支持。可將剪貼板中的圖像粘貼到 CLI 中,讓 Agent 使用任何具備視覺能力的模型對其進行分析、描述或處理。

  • 圖像生成 — 使用 FAL.ai 的 FLUX 2 Pro 模型,根據文本提示生成圖像,並通過 Clarity Upscaler 實現自動 2 倍超分辨率。

  • 語音與 TTS — 所有消息平臺均支持文本轉語音輸出和語音消息轉錄,提供五種服務提供商選擇:Edge TTS(免費)、ElevenLabs、OpenAI TTS、MiniMax 和 NeuTTS。

  • MCP 集成 — 通過標準輸入/輸出或 HTTP 傳輸連接任意 MCP 服務器。無需編寫原生 Hermes 工具,即可訪問來自 GitHub、數據庫、文件系統和內部 API 的外部工具。支持按服務器的工具過濾和採樣功能。

  • 提供者路由 — 對哪些 AI 提供者處理您的請求實現細粒度控制。通過排序、白名單、黑名單和優先級排序,優化成本、速度或質量。

  • 備用提供者 — 當主模型出現錯誤時,自動切換到備用的大語言模型提供者,包括對視覺、壓縮等輔助任務的獨立故障轉移。

  • 憑證池 — 將同一提供者的 API 調用分發到多個密鑰上。在遇到速率限制或失敗時自動輪換密鑰。

  • 記憶提供者 — 集成外部記憶後端(Honcho、OpenViking、Mem0、Hindsight、Holographic、RetainDB、ByteRover),實現跨會話的用戶建模與個性化,超越內置的記憶系統。

  • API 服務器 — 將 Hermes 暴露為兼容 OpenAI 的 HTTP 端點。可連接任何支持 OpenAI 格式的前端工具——Open WebUI、LobeChat、LibreChat 等。

  • IDE 集成(ACP) — 在支持 ACP 的編輯器(如 VS Code、Zed 和 JetBrains)中使用 Hermes。聊天、工具活動、文件差異和終端命令將直接渲染在您的編輯器內。

  • 強化學習訓練 — 從 Agent 會話中生成軌跡數據,用於強化學習和模型微調。

自定義功能

  • 個性與 SOUL.md — 完全可自定義的 Agent 個性。SOUL.md 是主要身份文件——系統提示中的第一部分——您可以在每個會話中切換內置或自定義的 /personality 預設。
  • 皮膚與主題 — 自定義 CLI 的視覺呈現:橫幅顏色、進度條表情和動詞、響應框標籤、品牌文本以及工具活動前綴。
  • 插件 — 無需修改核心代碼即可添加自定義工具、鉤子和集成。三種插件類型:通用插件(工具/鉤子)、記憶提供者(跨會話知識)和上下文引擎(替代上下文管理)。通過統一的 hermes plugins 交互式 UI 進行管理。