功能概覽

Hermes Agent 擁有一系列豐富的功能，遠超基礎聊天能力。從持久化記憶和文件感知上下文，到瀏覽器自動化和語音對話，這些功能協同工作，使 Hermes 成為一個強大的自主助手。

核心功能

工具與工具集 — 工具是擴展 Agent 能力的函數。它們被組織成邏輯上的工具集，可按平臺啟用或禁用，涵蓋網絡搜索、終端執行、文件編輯、記憶管理、任務委派等。
技能系統 — 按需加載的知識文檔，Agent 在需要時可調用。技能遵循漸進式披露模式，以最小化 token 使用量，併兼容 agentskills.io 開放標準。
持久化記憶 — 有界且經過篩選的記憶，可在會話間持久保留。Hermes 會記住你的偏好、項目、環境以及通過 MEMORY.md 和 USER.md 學習到的內容。
上下文文件 — Hermes 會自動發現並加載項目上下文文件（.hermes.md、AGENTS.md、CLAUDE.md、SOUL.md、.cursorrules），以定義其在項目中的行為方式。
上下文引用 — 輸入 @ 後跟引用，可將文件、文件夾、git 差異和 URL 直接注入消息中。Hermes 會內聯展開引用並自動附加內容。
檢查點 — Hermes 在修改文件前會自動對工作目錄進行快照，若出現問題，可通過 /rollback 命令安全回滾。

自動化功能

定時任務（Cron） — 使用自然語言或 Cron 表達式安排任務自動運行。任務可附加技能，將結果發送至任意平臺，並支持暫停、恢復和編輯操作。
子 Agent 委派 — delegate_task 工具會生成具有隔離上下文、受限工具集和獨立終端會話的子 Agent 實例。最多可並行運行 3 個子 Agent，處理多個並行工作流。
代碼執行 — execute_code 工具允許 Agent 編寫 Python 腳本，以程序化方式調用 Hermes 工具，通過沙箱化的 RPC 執行，將多步驟工作流壓縮為單次 LLM 調用。
事件鉤子 — 在關鍵生命週期節點運行自定義代碼。網關鉤子處理日誌記錄、告警和 Webhook；插件鉤子處理工具攔截、指標統計和安全防護。
批量處理 — 在數百甚至數千個提示上並行運行 Hermes Agent，生成結構化的 ShareGPT 格式軌跡數據，用於訓練數據生成或評估。

媒體與網絡功能

語音模式 — 支持 CLI 和消息平臺的完整語音交互。通過麥克風與 Agent 對話，聽取語音回覆，並在 Discord 語音頻道中進行實時語音交流。
瀏覽器自動化 — 支持多種後端的完整瀏覽器自動化：Browserbase 雲服務、Browser Use 雲服務、本地 Chrome（通過 CDP）或本地 Chromium。可導航網站、填寫表單並提取信息。
視覺與圖像粘貼 — 多模態視覺支持。可將剪貼板中的圖像粘貼到 CLI 中，讓 Agent 使用任何具備視覺能力的模型對其進行分析、描述或處理。
圖像生成 — 使用 FAL.ai 的 FLUX 2 Pro 模型，根據文本提示生成圖像，並通過 Clarity Upscaler 實現自動 2 倍超分辨率。
語音與 TTS — 所有消息平臺均支持文本轉語音輸出和語音消息轉錄，提供五種服務提供商選擇：Edge TTS（免費）、ElevenLabs、OpenAI TTS、MiniMax 和 NeuTTS。
MCP 集成 — 通過標準輸入/輸出或 HTTP 傳輸連接任意 MCP 服務器。無需編寫原生 Hermes 工具，即可訪問來自 GitHub、數據庫、文件系統和內部 API 的外部工具。支持按服務器的工具過濾和採樣功能。
提供者路由 — 對哪些 AI 提供者處理您的請求實現細粒度控制。通過排序、白名單、黑名單和優先級排序，優化成本、速度或質量。
備用提供者 — 當主模型出現錯誤時，自動切換到備用的大語言模型提供者，包括對視覺、壓縮等輔助任務的獨立故障轉移。
憑證池 — 將同一提供者的 API 調用分發到多個密鑰上。在遇到速率限制或失敗時自動輪換密鑰。
記憶提供者 — 集成外部記憶後端（Honcho、OpenViking、Mem0、Hindsight、Holographic、RetainDB、ByteRover），實現跨會話的用戶建模與個性化，超越內置的記憶系統。
API 服務器 — 將 Hermes 暴露為兼容 OpenAI 的 HTTP 端點。可連接任何支持 OpenAI 格式的前端工具——Open WebUI、LobeChat、LibreChat 等。
IDE 集成（ACP） — 在支持 ACP 的編輯器（如 VS Code、Zed 和 JetBrains）中使用 Hermes。聊天、工具活動、文件差異和終端命令將直接渲染在您的編輯器內。
強化學習訓練 — 從 Agent 會話中生成軌跡數據，用於強化學習和模型微調。

自定義功能

個性與 SOUL.md — 完全可自定義的 Agent 個性。SOUL.md 是主要身份文件——系統提示中的第一部分——您可以在每個會話中切換內置或自定義的 /personality 預設。
皮膚與主題 — 自定義 CLI 的視覺呈現：橫幅顏色、進度條表情和動詞、響應框標籤、品牌文本以及工具活動前綴。
插件 — 無需修改核心代碼即可添加自定義工具、鉤子和集成。三種插件類型：通用插件（工具/鉤子）、記憶提供者（跨會話知識）和上下文引擎（替代上下文管理）。通過統一的 hermes plugins 交互式 UI 進行管理。

核心功能​

自動化功能​

媒體與網絡功能​

自定義功能​

核心功能

自動化功能

媒體與網絡功能

自定義功能