跳到主要內容

Hermes Agent v0.14.0 發佈說明

發佈日期:2026 年 5 月 16 日 官方標籤:v2026.5.16 與上一版對比:v2026.5.7...v2026.5.16

本頁基於官方 GitHub 發佈說明做了結構化中文整理,便於快速瀏覽。

一句話概覽

官方將本次更新命名為 「The Foundation Release(基石版本)」,核心主題是:

Hermes Agent 開始把安裝、運行、擴展和跨平臺使用這些基礎問題一次性補齊。

重點變化:

  • pip install hermes-agent 正式可用,輪子內置 Ink TUI bundle 與 shell launcher,不再必須克隆倉庫或跑 shell installer。
  • 安裝體積大幅瘦身:Slack / Matrix / 飛書 / 釘釘、圖像生成、語音、Camofox、Codex app-server 等重型後端改為首次使用時懶安裝,[all] extras 刪除已被 lazy-deps 覆蓋的依賴。
  • 原生 Windows 進入早期 Beta:PowerShell 安裝器、MinGit 自動安裝、Microsoft Store Python stub 檢測、Ctrl+C 前臺處理等基礎鏈路落地。
  • xAI Grok 通過 SuperGrok OAuth 接入grok-4.3 升級到 1M token 上下文窗口
  • hermes proxy 本地 OpenAI-compatible 代理:把 Claude Pro、ChatGPT Pro、SuperGrok 等 OAuth provider 暴露為 OpenAI API endpoint,Codex / Aider / Cline / Continue 可直接接入。
  • x_search 成為一等 X(Twitter)搜索工具,支持 OAuth 或 API Key。
  • Microsoft Teams 端到端接通:Graph 鑑權、webhook listener、pipeline runtime 與 outbound delivery 一起落地。
  • 性能大幅改善hermes 啟動少約 19 秒;browser_console 評估改走持久 CDP 連接,官方稱提升 180 倍。
  • LINE + SimpleX Chat 新增為消息平臺,總平臺數來到 22。
  • 跨會話 1 小時 Claude prompt cache/handoff 實時遷移會話、Telegram / Discord 的 clarify 原生按鈕、Discord 歷史消息回填。
  • 寫入診斷升級:每輪文件變更摘要 + LSP 語義診斷,明顯強於 v0.13.0 的語法級 post-write lint。
  • vision_analyze 直接把像素交給視覺模型,新增統一可插拔 video_generatecomputer_use 的 cua-driver 現在可用於非 Anthropic provider。
  • 插件系統繼續擴展:插件可通過 ctx.llm 調用當前模型、用 tool_override 替換內置工具。
  • Skills Hub 默認接入 huggingface/skills trusted tap,新增 9 個 optional skill。
  • 12 個 P0 + 50 個 P1 問題關閉,安全側包括 sudo bypass、SSRF、dashboard auth、供應鏈 advisory checker 等。

規模數據(自 v0.13.0 起):808 次提交 · 633 個合併 PR · 1,393 個文件變更 · 165,061 行新增 · 545 個 issue 關閉(含 12 個 P0、50 個 P1) · 215 位社區貢獻者

我應該升級嗎?

如果你屬於以下任一場景,建議優先升級 v0.14.0

  1. 新裝 Hermes 或給團隊鋪環境 —— PyPI 包 + 依賴懶安裝 + 分層 fallback,讓安裝流程更接近普通 Python CLI。
  2. Windows 用戶 —— 原生 Windows 已進入 early beta,不再必須依賴 WSL 才能跑基本 loop。
  3. 有 Claude Pro / ChatGPT Pro / SuperGrok 訂閱 —— hermes proxy 可把 OAuth 訂閱變成 OpenAI-compatible endpoint,複用到 Codex、Aider、Cline、Continue 等工具。
  4. 需要 Grok 大上下文 —— SuperGrok OAuth + grok-4.3 1M context 適合整倉庫、長文檔、研究資料集輸入。
  5. 經常做網頁 / 瀏覽器自動化 —— 持久 CDP 連接讓 browser_console 從秒級變成毫秒級調用。
  6. 長時間使用 Claude —— 1 小時跨會話 prompt cache 會讓 /new 後的系統提示、skills、memory 前綴繼續複用緩存。
  7. 用 Teams / LINE / SimpleX Chat 做消息入口 —— Teams 已補齊端到端鏈路,LINE 與 SimpleX Chat 新增為原生平臺。
  8. 依賴 Agent 寫代碼或改文件 —— LSP 語義診斷 + 每輪文件變更 footer 能更早暴露寫入失敗、類型錯誤、缺失 import 等問題。
  9. 做插件或內部擴展 —— ctx.llmtool_override 讓插件可以複用當前 provider / credentials,並可替換核心工具實現。
  10. 關注安全和企業部署 —— 本次關閉 12 個 P0 與 50 個 P1,重點覆蓋 sudo、SSRF、dashboard auth、供應鏈掃描、quick command 輸出淨化等路徑。

所有用戶 都建議測試後升級:本次既有安裝與性能基礎設施,也有安全修復;尤其是網關、插件、瀏覽器、文件寫入、Codex runtime 和多平臺消息通道用戶,升級收益更明顯。

重點亮點

PyPI 安裝 + 依賴瘦身

Hermes Agent 現在可以直接:

pip install hermes-agent
hermes

官方 wheel 內置 Ink TUI bundle 和 shell launcher。更重要的是,過去 pip install hermes-agent 會把很多你不一定會用到的適配器和 SDK 一起裝上;v0.14.0 改為重型後端首次使用時再安裝

懶安裝覆蓋的典型組件包括 Slack / Matrix / 飛書 / 釘釘 adapter、hindsight client、Codex app-server、Pixverse / Camofox / image-gen SDK、voice / TTS provider 等。[all] extras 也同步刪除了 lazy-deps 已覆蓋的依賴。 主要 PR:#24220#24515#25014#25038#25766#21818#26593#26148

原生 Windows 支持進入早期 Beta

v0.14.0 開始,Hermes 可以在 cmd.exe 與 PowerShell 下原生運行。官方同時補了完整 PowerShell 安裝器、MinGit 自動安裝、Microsoft Store Python stub 檢測、前臺 Ctrl+C 處理等基礎能力。

這仍是 early beta:官方明確還有邊角問題,但在乾淨 Windows 機器上的基本 loop 已經能跑通。 主要 PR:#21561

SuperGrok OAuth + Grok 1M 上下文

如果你有 SuperGrok 訂閱,現在可以通過 xAI 賬號登錄,在 Hermes 內直接使用 Grok,無需單獨 API Key。grok-4.3 同時升級到 1M token context window,適合整倉庫、長篇資料、研究語料等一次性輸入。

本次還補了 entitlement error 處理,以及 SSH 到遠程機器時如何完成 OAuth 的 tunnel 文檔。 主要 PR:#26534#26664#26644#26592

hermes proxy:OAuth 訂閱變成 OpenAI-compatible endpoint

新增 hermes proxy。它會在本機啟動一個 OpenAI API 兼容 endpoint,背後實際走你已登錄的 OAuth provider,例如 Claude Pro、ChatGPT Pro、SuperGrok。

這意味著 Codex CLI、Aider、Cline、Continue 或自寫腳本,只要支持 OpenAI-compatible endpoint,就可以複用現有訂閱,不需要額外 API Key。 主要 PR:#25969

x_search 成為 Hermes 的一等工具,不再需要安裝 skill 或手寫集成。Agent 可以直接搜索 X 時間線、查找 thread、定位具體帖子。鑑權支持 X OAuth 或 API Key。 主要 PR:#26763

Microsoft Teams 端到端接通

Teams 在 v0.12.0 已作為插件平臺出現,這次補齊了真正可用的端到端鏈路:Microsoft Graph auth、client foundation、接收 Teams 事件的 webhook listener、pipeline plugin runtime,以及 outbound delivery。

配置好 bot 後,可以在 Teams channel、DM 或群聊中直接和 Hermes 對話。 主要 PR:#21922#21969#22007#22024

性能:冷啟動少約 19 秒,瀏覽器調用 180 倍加速

本次性能優化有兩條主線:

  • 冷啟動:重型 adapter 延遲加載,模型 catalog 優先讀磁盤緩存,doctor 檢查並行,chat -q 可跳過歡迎 banner。官方稱 hermes 啟動少約 19 秒,hermes tools 的 All-Platforms 頁面從 14 秒降到 1.5 秒以內。
  • 瀏覽器工具browser_console 評估複用同一個 Chrome DevTools 持久連接,不再每次開新 DevTools session;官方稱提升 180 倍。

主要 PR:#22138#22120#22681#22790#22808#22831#22859#22904#22766#25341#23226

Claude 跨會話 1 小時 prompt cache

使用 Claude(Anthropic / OpenRouter / Nous Portal)時,system prompt、skills、memory 等 prompt 前綴現在可以跨會話緩存 1 小時。

實際收益是:剛開 /new 會話也能複用上一輪還熱著的緩存,首輪響應更快、成本更低;後臺 memory review 也能命中這份緩存。 主要 PR:#23828#25434#24778

LINE + SimpleX Chat:平臺數到 22

新增兩個消息平臺:

  • LINE:面向日本、韓國、臺灣等地區的 LINE Messaging API。
  • SimpleX Chat:無用戶 ID 的隱私導向去中心化聊天平臺。

加上它們後,Hermes 支持的消息平臺總數達到 22。 主要 PR:#23197#26232

/handoff:會話可以實時轉交

/handoff 現在會把當前活躍會話完整遷移到目標 model、persona 或 profile:消息、工具調用、上下文全部保留。

這適合在調試中途把會話從快模型交給深度推理模型,或在不同 profile 之間交接任務分工。 主要 PR:#23395

clarify 原生按鈕 + Discord 歷史回填

  • Telegram 和 Discord 上,clarify 多選題現在會顯示平臺原生按鈕,不再要求用戶手打選項編號。
  • Hermes 首次加入 Discord channel 或 thread 時,會默認讀取近期消息歷史,再決定如何回覆。

主要 PR:#24199#25485#25984

寫入診斷:從語法 lint 升級到 LSP 語義診斷

v0.13.0 的 post-write lint 主要檢查 Python / JSON / YAML / TOML 語法。v0.14.0 又往前走了一步:

  • 每輪文件變更 footer:Agent 在每個修改文件的 turn 後都會看到簡短的磁盤變更摘要,包括文件路徑、行數、真實 delta。
  • LSP 語義診斷write_file / patch 後運行真實 language server,把新增錯誤反饋給 Agent。類型錯誤、未定義符號、缺失 import 這類問題可以更早暴露。

主要 PR:#24498#24168#25978

視覺、視頻與桌面控制

  • vision_analyze 直接傳像素:如果當前模型具備視覺能力,圖片不再先轉成文字描述,而是把原始像素交給 GPT-5、Claude、Gemini、Grok-vision 等視覺模型。
  • 統一 video_generate:視頻生成改為一個可插拔工具,後端 provider 可以通過插件添加。
  • computer_use cua-driver 後端:現在不再綁定 Anthropic SDK,非 Anthropic provider 也能驅動 GUI,且補了 focus-safe 操作與 hermes update 後刷新機制。

主要 PR:#22955#25126#21967#24063

終端與 ACP:鏈接可點擊,Zed 一鍵安裝

  • 任何支持 OSC8 的終端中,Agent 輸出裡的 URL 現在是可點擊鏈接,減少複製長鏈接的摩擦。
  • Zed ACP Registry 集成:Hermes 進入 Zed Agent Client Protocol registry,安裝路徑走 uvx,不依賴 npm;hermes acp --setup-browser 可為 registry 安裝補齊瀏覽器工具。

主要 PR:#25071#24013#26079#26120#26234

Provider 與模型:Pareto Code、NovitaAI、Qwen Cloud

  • OpenRouter Pareto Code router 新增 min_coding_score 配置項,可按編碼質量下限選擇更便宜的模型。
  • NovitaAI 成為新 provider,補充開源模型託管路徑。
  • Alibaba Cloud provider 在 UI 中改名為 Qwen Cloud,舊配置鍵繼續兼容。
  • Codex app-server runtime 為 OpenAI / Codex 路徑提供可選 runtime,支持 session reuse、wedged session 退休、OAuth refresh 分類等。

主要 PR:#22838#25507#24835#24182#25769

插件系統:ctx.llmtool_override

插件作者現在可以:

  • 通過 ctx.llm 直接調用當前 provider / model / credentials,不需要自己接 client。
  • 通過 tool_override 替換內置工具實現。
  • 使用 standalone_sender_fn 做 out-of-process cron delivery。
  • 打開 HERMES_PLUGINS_DEBUG=1 查看插件發現日誌。

主要 PR:#23194#26759#22461#22684

Skills Hub 默認接入 Hugging Face tap + 9 個新 optional skill

Skills Hub 默認接入 hermes-skills/huggingface trusted tap。新技能發佈到 Hugging Face 後,用戶可以從自己的 hermes skills 瀏覽器裡直接安裝。

新增 9 個 optional skill:

  • Hyperliquid:perp / spot trading,走 SDK + REST。
  • Yahoo Finance:市場數據、基本面、歷史數據。
  • api-testing:REST / GraphQL 調試配方。
  • Unified EVM multi-chain:統一覆蓋 Ethereum、L2、Base 等鏈。
  • darwinian-evolver:進化式 prompt / skill 調優。
  • osint-investigation:人物、域名、組織 OSINT 調查配方。
  • pinggy-tunnel:把本地服務暴露到公網。
  • watchers:通過 cron no_agent 輪詢 RSS / HTTP JSON / GitHub 做變更檢測。
  • Notion overhaul:適配 2026 年 5 月 Developer Platform。

主要 PR:#26219#23582#23583#23590#25299#26760#26729#26765#21881#26612

搜索與 Web 工具

  • Brave Search 免費層DDGS / DuckDuckGo 加入 web-search provider。
  • Tavily /crawl 支持 Bearer auth header。
  • x_search 單獨成為 X / Twitter 搜索工具。

主要 PR:#21337#24658#26763

Kanban 繼續補強

v0.14.0 不是 Kanban 的首發版本,但繼續補了不少實用能力:

  • specify:用輔助 LLM 展開 triage task。
  • orchestrator board tools:新增 kanban_listkanban_unblock
  • stranded_in_ready:診斷無人認領的 ready 任務。
  • Dashboard batch QOL、全局 tooltip / docs link、notifier delivery 去重與失敗回滾。
  • 移除 kanban_comment 中 caller-controlled author override,並清理 comment author 渲染。

主要 PR:#21435#23012#23578#23550#21541#23401#23423#22435#22769

Cron 與 API Server

  • Cron 支持 deliver=all,可向所有已連接 channel 廣播。
  • job 操作支持按名稱查找。
  • 修復空 Cron dashboard tab 與 partial-record crash。
  • cron origin 不再注入 HERMES_SESSION_* contextvars。
  • API server 暴露 run approval events,避免程序化調用時因為審批請求靜默掛住。

主要 PR:#21495#26231#22389#22382#21899

CLI / TUI / Dashboard

CLI:

  • banner 與狀態欄顯示 YOLO 模式警告。
  • destructive slash command 增加確認提示。
  • 新增 docker_extra_argsdisplay.timestamps
  • delegate 工具描述展示真實併發與 spawn-depth 限制。

TUI:

  • 新增 /sessions,可瀏覽和恢復歷史會話。
  • 支持 attach 到已有 gateway。
  • markdown link 解析為可讀標題。
  • markdown table 支持寬度感知渲染,窄屏可縱向 fallback。
  • 審批 / clarify / confirm prompt 期間允許滾動 transcript 與按 Esc。
  • 切換 personality 時保留當前 session。

Dashboard / GUI:

  • embedded TUI 走 dashboard gateway。
  • token / cost analytics 默認隱藏在配置項後。
  • Langfuse observability 修復。
  • Cron modal 與 analytics 繼續打磨。

主要 PR:#26238#22687#23599#22694#20805#21846#21978#24013#26195#26717#26414#20942#21979#25438#26320

安全加固:12 個 P0 + 50 個 P1 關閉

本次安全與可靠性修復規模很大,重點包括:

  • sudo brute-force block、sudo-stdin / askpass 變體標記為 DANGEROUS。
  • 關閉多個 dangerous-command detection bypass,並淨化 tool error 再注入模型上下文的路徑。
  • 修復 Skills Hub 剩餘 SSRF fetch path。
  • Dashboard plugin API routes 要求 auth。
  • quick commands 中淨化 env 並脫敏輸出。
  • 減少 subprocess 調用中的不必要 shell=True
  • Google Chat relay 的 sender_type 淨化。
  • 安裝時加入 supply-chain advisory checker。
  • 安全策略改為明確 OS-level isolation 是邊界。

主要 PR:#23736#26829#26823#22843#23220#23584#25149#22432#24220#20317

可靠性修復

  • SQLite 在 NFS / SMB / FUSE 上自動回退到 journal_mode=DELETE,修復網絡掛載上的 /resume
  • Codex runtime 退休 wedged sessions,加入 post-tool watchdog 與 OAuth refresh 分類。
  • MCP 初始鑑權失敗不再反覆重試。
  • Gateway 在平臺失敗時保持運行,引入 per-platform circuit breaker 與 /platform
  • ACP 支持 inline file attachment resources。
  • CI shared PR checks unblock 與狀態穩定化。

主要 PR:#22043#25769#26260#25776#25778#26600#21407#21012#25957

i18n:16 個語言環境

Gateway commands 與 Web Dashboard 完成更完整的本地化,本次新增 8 個 locale,總數來到 16 個。 主要 PR:#22914

文檔、測試與已回滾內容

文檔:

  • 修復 Voice & TTS provider 表。
  • Skills Hub 左側欄顯示 per-skill 頁面。
  • Gateway help 與 docstring 提及微信。
  • Skills Hub 信息面板更豐富。
  • 大量 provider、platform、skill、Windows 安裝路徑、dashboard 文檔打磨。

測試與 CI:

  • 共享 PR 檢查解鎖與 shared test state 穩定。
  • 平臺、provider、plugin、邊界情況新增大量回歸覆蓋。

已回滾 / 調整:

  • /goal checklist + /subgoal feature stack 被回滾;/subgoal 後來以更簡單形式迴歸。
  • Scrollback box width clamp 回滾,以恢復全寬邊框。
  • fix(cli): tolerate unreadable dirs when building systemd PATH 被回滾。

貢獻者

核心

  • @teknium1:release lead、architecture,本窗口約 406 個 PR 合入。

主要社區貢獻者

  • @kshitijk4poor38 個 PR · Telegram cadence / streaming / topic routing、安全加固(sudo、SSRF、kanban_comment、dashboard auth)、Codex runtime hygiene、NovitaAI provider、profile / banner 修復、飛書 update card、gateway QOL。
  • @alt-glitch13 個 PR · Markdown table TUI rendering、HERMES_SESSION_ID 環境變量、hindsight-client optional dependency、Nix extraDependencyGroups
  • @OutThisLife(Brooklyn Nicholson)12 個 PR · TUI turn segmentation、attach-to-gateway、markdown link titles、dashboard gateway embedded TUI、Ink cursor sync、prompts 期間滾動 / Esc。
  • @austinpickett8 個 PR · /sessions slash command、personality 切換保留 session、cron modals、dashboard analytics。
  • @helix4u5 個 PR · Google Chat setup、system Chromium 下跳過 browser install、Windows Ctrl+C preservation。
  • @rob-maron4 個 PR · Nous Portal 作為 model metadata authority、provider polish。
  • @stephenschoettler3 個 PR · CI stabilization。
  • @ethernet80233 個 PR · platform / gateway work。

其他貢獻

完整貢獻者列表非常長,包含 215 位社區貢獻者(含 co-author)。請參閱官方發佈頁