跳到主要內容

Hermes Agent v0.11.0 發佈說明

發佈日期:2026 年 4 月 23 日
官方標籤:v2026.4.23
與上一版對比:v2026.4.13...v2026.4.23(注:官方本次將 v0.10.0 遺留項一併納入,因此對比基線回到 v0.9.0)。

本頁基於官方 GitHub 發佈說明做了結構化中文整理,方便站內快速閱讀。

一句話概覽

這是一次被官方稱為 「The Interface release」 的重磅更新:交互式 CLI 被徹底用 React/Ink 重寫每個 provider 背後都換上可插拔的傳輸層原生接入 AWS Bedrock新增 5 條推理路徑新支持 QQBot(第 17 個消息平臺)插件表面大幅擴展,並且通過 Codex OAuth 直接用上 GPT-5.5。由於 v0.10.0 只發布了 Nous Tool Gateway,這次一併把此前兩週裡積壓的所有重點一次性放出。

規模數據(自 v0.9.0 起):1,556 commits · 761 合併 PR · 1,314 文件變更 · 224,174 行新增 · 29 位社區貢獻者(含 co-author 共 290 位)

重點亮點

全新 Ink 版 TUI

  • 徹底重寫的交互界面hermes --tui 現在是用 React/Ink 寫的新版 TUI,後端由 Python JSON-RPC 網關(tui_gateway)驅動。ui-tui/tui_gateway/ 合計 ~310 commit。
  • 體驗升級:常駐輸入框(sticky composer)滾動時不被沖走、流式輸出配合 OSC-52 剪貼板、穩定的選擇器快捷鍵、狀態欄顯示每輪計時git 分支/clear 加確認、內置 light 主題預設
  • 子代理可視化:新增 subagent spawn 觀察層,代理派生子任務時可直接看到。
  • 主要貢獻者:@OutThisLife + Teknium。

傳輸層抽象 + 原生 AWS Bedrock

  • agent/transports/ 可插拔層:格式轉換與 HTTP 通信從 run_agent.py 抽出,每個 provider 走自己的實現。
    • AnthropicTransport(Anthropic Messages API)
    • ChatCompletionsTransport(OpenAI 兼容 provider 的默認路徑)
    • ResponsesApiTransport(OpenAI Responses API + Codex build_kwargs)
    • BedrockTransport(AWS Bedrock Converse API)
  • 原生 AWS Bedrock:基於 Converse API 在新抽象之上直接落地,不再需要繞轉換層。
  • 主要 PR:#13347#13366#13430#13805#13814#10549(@kshitijk4poor + Teknium)。

新增 5 條推理路徑

路徑類型PR
NVIDIA NIM原生 provider#11774
Arcee AI直連 provider#9276
Step Planprovider#13893
Google Gemini CLI OAuthOAuth provider#11270
Vercel ai-gateway含定價信息 + 動態發現#13223(@jerilynzheng)
  • 此外,Gemini 改走原生 AI Studio API,性能更好(#12674)。

Codex OAuth 直連 GPT-5.5

  • OpenAI 最新的 GPT-5.5 推理模型,現在可以通過 ChatGPT Codex OAuth 直接使用。
  • model picker 接入了 實時模型發現,新模型上線後不必等官方 catalog 更新即可出現。
  • PR:#14720

QQBot 上線,成為第 17 個平臺

  • 基於 QQ 官方 API v2 的原生 QQBot adapter。
  • 配套 掃碼配置嚮導流式光標emoji 反應,並與 WeCom/微信一致的 DM/群聊策略門控
  • PR:#9364#11831

插件表面大幅擴張

插件現在可以做得更深:

  • register_command() — 註冊新的 slash 命令(#10626
  • dispatch_tool() — 從插件代碼直接調用工具(#10763
  • pre_tool_call否決工具執行#9377
  • transform_tool_result — 通用改寫工具返回值(#12972
  • transform_terminal_output — 改寫終端輸出(#12929
  • 可插拔 image_gen 後端 + OpenAI 出圖(#13799
  • Dashboard 自定義 tab 支持(#14175
  • 默認附帶的 disk-cleanup 插件 改為 opt-in,作為參考實現(#12944

/steer 中途干預

  • /steer <提示> 把一段筆記注入正在運行的代理,它會在下一次工具調用後看到
  • 不打斷當前 turn、不破壞 prompt cache,適合讓跑偏的代理立刻糾偏。
  • PR:#12116

Shell hooks

  • 任何 shell 腳本都可以直接註冊為 Hermes 生命週期鉤子(pre_tool_call / post_tool_call / on_session_start 等),不必再寫 Python 插件(#13296)。

Webhook 直投模式

  • webhook 訂閱可直接把 payload 轉發到平臺聊天完全不經過代理
  • 非常適合告警、可用性監測、事件流這類「不需要 LLM 再加工一遍」的推送場景(#12473)。

更聰明的任務委派

  • 子代理新增 orchestrator 角色,可以再派生自己的子任務,並支持 max_spawn_depth 配置(默認 flat,即不允許再往下派)(#13691)。
  • 併發兄弟子代理共享文件協調層,互相不會覆蓋對方編輯(#13718)。

副模型 UI + 默認走主模型

  • hermes model 新增 「配置副模型」 專用界面,可按任務類型逐項覆蓋(壓縮、視覺、會話檢索、標題生成)(#11891)。
  • auto 路由默認走主模型:此前 aggregator 用戶會被悄悄路由到 provider 端的廉價默認模型,現在統一走主模型(#11900)。

Dashboard 插件系統 + 實時主題切換

  • Web Dashboard 現在可插件化擴展:第三方插件可添加 tab、widget、視圖,不用 fork。
  • 配合 實時切換的主題系統:顏色、字體、佈局、密度都可熱切換,無需刷新。CLI 的主題規範現在完整延伸到 Web(#10951#10687#14725)。

Dashboard 打磨

  • 中英 i18n 語言切換器(#9453
  • react-router 側邊欄佈局、sticky header、下拉組件#9370 @austinpickett)
  • 移動端響應式#9228 @DeployFaith)
  • Vercel 部署#10686#11061
  • 按會話真實 API 調用統計#14004
  • 一鍵更新 + 重啟網關按鈕#13526

核心代理與架構

Transport 層(新)

  • Transport ABC 把格式轉換與 HTTP 傳輸從 run_agent.py 抽到 agent/transports/
  • AnthropicTransport / ChatCompletionsTransport / ResponsesApiTransport / BedrockTransport 四個實現各自獨立

Provider 與模型擴展

除了上文 5 條新路徑,本次還帶來:

  • xAI Grok 升級到 Responses API#10783),同時帶上 xAI TTS
  • Ollama 改進:Cloud provider、GLM 續寫、think=false、surrogate 清洗、/v1 提示(#10782
  • Kimi K2.6 覆蓋 OpenRouter / Nous Portal / 原生 Kimi / HuggingFace(#13148#13152#13169
  • Kimi K2.5 在所有推薦列表裡被頂到首位(#11745
  • 小米 MiMo v2.5-pro + v2.5 在 OpenRouter / Nous Portal / 原生(#14184#14635
  • GLM-5V-Turbo 進入 coding 計劃(#9907
  • Claude Opus 4.7 進入 Nous Portal catalog(#11398
  • OpenRouter elephant-alpha 進入精選(#9378
  • OpenCode-Go:Kimi K2.6 + Qwen3.5/3.6 Plus(#13429
  • minimax/minimax-m2.5:free 加入 OpenRouter 精選(#13836
  • /model 自動合併 models.dev 條目,照顧冷門 provider(#14221
  • 每 provider / 每 model 的 request_timeout_seconds 可配(#12652
  • agent.api_max_retries 可配置 API 重試次數(#14730

代理循環與會話

  • 壓縮器增強:智能摺疊、去重、防抖動、模板升級(#10088
  • 壓縮摘要遵循對話語言#12556
  • 壓縮模型遇到永久 503/404 自動回退到主模型#10093
  • 網關重啟後自動接續被打斷的代理工作#9934
  • 活動心跳 防止網關誤判為不活躍(#10501
  • PLATFORM_HINTS 增加 Matrix / Mattermost / 飛書(#14428 @alt-glitch)

會話與記憶

  • 啟動時自動清理舊會話 + VACUUM state.db#13861
  • Honcho 重寫:上下文注入、5 個工具、成本安全、會話隔離(#10619
  • Hindsight 更豐富的會話級留存元數據(#13987
  • Fix:記憶 provider 工具去重,防止嚴格 provider 返回 400(#10511
  • Fix:從 $HERMES_HOME/plugins/ 發現用戶自安裝的記憶 provider(#10529

消息平臺(Gateway)

Telegram

  • TELEGRAM_PROXY 環境變量 + config.yaml 代理支持#10681
  • ignored_threads 配置#9530
  • 鏈接預覽開關#10610
  • Markdown 表格自動包裹代碼塊#11794
  • Fix:流式光標 (▉) 不再作為獨立消息出現(#9538

Discord

  • 論壇頻道支持#11920
  • DISCORD_ALLOWED_ROLES 基於角色的訪問控制(#11608
  • slash 命令可關閉#14315
  • 原生 send_animation 內聯 GIF 播放(#10283
  • send_message 支持 Discord 媒體附件#10246
  • /skill 命令組 + 分類子命令#9909

飛書

  • 文檔評論智能回覆(三級訪問控制)(#11898
  • 表情反應顯示處理狀態#12927
  • 保留 @ 提及上下文供代理消費#14167

釘釘

  • require_mention + allowed_users 門控(對齊 Slack/Telegram/Discord)(#11564
  • 掃碼 device-flow 授權 設置嚮導(#11574
  • AI Cards 流式、emoji 反應、媒體處理#11910

WhatsApp

  • send_voice 原生語音消息(#13002
  • dm_policy / group_policy 對齊 WeCom / 微信 / QQ(#13151

企業微信 / 微信

  • 企業微信掃碼建號 + 交互式配置嚮導#13961

Signal

  • send_message 支持媒體投遞#13178

Slack

  • DM 默認按 thread 建會話#10987

Gateway 核心

  • Gateway 代理模式 — 把消息轉發到遠程 API server(#9787
  • 按頻道臨時 prompt(Discord/Telegram/Slack/Mattermost)(#10564
  • 所有平臺原生暴露插件 slash 命令#14175
  • MEDIA: 標籤支持文檔 / 壓縮包擴展名#14307
  • gateway start/restart --all 標誌#10043
  • 關閉網關時通知活躍會話#9850
  • 阻止代理通過終端自毀網關#9895

工具系統

瀏覽器

  • browser_cdp 原生 DevTools Protocol 直通#12369
  • Camofox 連接穩定性提升

代碼執行

  • project / strict 執行模式(默認 project)(#11971

圖像生成

  • FAL 多模型選擇器#11265
  • Recraft V3 → V4 Pro,Nano Banana → Pro#11406
  • GPT Image 2 進 FAL catalog(#13677
  • xAI 出圖 provider(grok-imagine-image)(#14765

語音 / TTS / STT

  • Google Gemini TTS provider#11229
  • xAI Grok STT provider#14473
  • xAI TTS(隨 Responses API 升級一起)(#10783
  • KittenTTS 本地 provider#13395

Webhook / Cron

  • Webhook 直投模式(零 LLM 推送)(#12473
  • Cron wakeAgent 開關 — 腳本可完全跳過代理(#12373
  • Cron 按 job 的 enabled_toolsets — 按任務限定工具集,節省 token 與成本(#14767

文件 / Patch

  • patch 工具「你是不是想用 X」反饋 失配時給出建議(#13435

API Server

  • /v1/responses SSE 流式工具事件#10049
  • /v1/chat/completions/v1/responses 支持內聯圖片輸入#12969

Docker / Podman

  • Podman 入門級支持#10066
  • Docker 鏡像帶上 docker-cli#14232
  • 拆容器時文件同步回宿主#11291

MCP

  • 窗口內共 12 項 MCP 改進(狀態、超時處理、工具調用轉發等)

Skills 生態

Skill 系統改進

  • 命名空間化 skill 註冊,支持插件 skill 打包(#9786
  • hermes skills reset 解除卡住的內置 skill(#11468
  • Skills 守衛可選開啟config.skills.guard_agent_created(默認關閉)(#14557
  • 打包的 skill 腳本開箱即用#13384
  • xitter 替換為 xurl(X 官方 API CLI)(#12303
  • MiniMax-AI/cli 作為默認 skill#14493
  • @ 文件補全支持模糊匹配 + mtime 排序#9467

新 skill

  • concept-diagrams 概念圖(#11363
  • architecture-diagram 架構圖(#9906
  • pixel-art 像素畫 + 硬件調色板 + 視頻動畫(#12663#12725
  • baoyu-comic 寶玉漫畫(#13257 @JimLiu)
  • baoyu-infographic 信息圖 — 21 佈局 × 21 風格#12254
  • page-agent — 在自家 Web 應用裡嵌入阿里 in-page GUI agent(#13976
  • fitness-nutrition 健身營養(#9355
  • drug-discovery — ChEMBL / PubChem / OpenFDA / ADMET(#9443
  • touchdesigner-mcp#12298
  • adversarial-ux-test#13425
  • maps 新增 guest_house / camp_site,雙 key 麵包店查詢(#13398
  • llm-wiki 源信息標註、來源哈希、質量信號(#13700

CLI 與用戶體驗

  • bash / zsh / fish 動態 shell 補全#9785
  • 亮色皮膚 + 皮膚感知補全菜單#9461
  • 審批與澄清提示用數字快捷鍵#13416
  • 多行輸入預覽緊湊 + 外部編輯器#12934
  • --ignore-user-config / --ignore-rules 標誌#14277
  • /usage 展示賬戶限額#13428
  • Doctor 新增「命令安裝檢查」#10112
  • ESC 取消密鑰 / sudo 提示#9902
  • Fix:代理看到的文本用 display_hermes_home(),不再硬編碼 ~/.hermes#10285
  • Fix:強制以 config.yaml 為 CWD 唯一來源,廢棄 .env 中 CWD 變量,新增 hermes memory reset#11029

安全與穩定性

  • 私有 / 內網 URL 解析全局開關#14166
  • 阻止代理通過終端自毀網關#9895
  • Telegram 回調按更新提示做授權#10536
  • 新增 SECURITY.md#10532
  • hermes update 時提醒舊 hermes.service unit#11918
  • ASCII locale 下 api_messages / reasoning_content 編碼錯誤完整恢復#10537
  • clear_session_vars 後防止 os.environ 殘留#10527
  • 終端工具後臺化進程後不再讓代理掛住#10584

Bug 修復與改進

本次窗口內 fix: 分類共 482 個 PR,挑幾條比較有代表性的:

  • 多端流式光標偽影清理(Matrix / Telegram / WhatsApp / Discord)
  • 從網關流消費者側過濾 <think> / <thought> 塊(#9408
  • 網關 display.streaming 根配置被覆蓋的迴歸修復(#9799
  • session_search 的 limit 強轉 int,避免 TypeError(#10522
  • Windows 無 fcntl 時記憶工具仍可用(#9783
  • 軌跡壓縮器憑證從 HERMES_HOME/.env 讀取(#9632
  • @_context_completions@ 提及時不再崩潰(#9683
  • Telegram 連續快發消息不再被截斷

貢獻者

核心

  • @teknium1(Teknium)

Top 社區貢獻者(按合併 PR 數)

  • @kshitijk4poor49 PR · 傳輸層重構(AnthropicTransport / ResponsesApiTransport)、Step Plan provider、小米 MiMo v2.5、大量 gateway 修復、Kimi K2.5 推薦置頂、@提及崩潰修復
  • @OutThisLife(Brooklyn)31 PR · TUI 打磨、狀態欄 git 分支、每輪計時、穩定的選擇器快捷鍵、/clear 確認、light 主題預設、子代理 spawn 觀察層
  • @helix4u — 11 PR · 錄音提示音、MCP 工具打斷、一系列穩定性修復
  • @austinpickett — 8 PR · Dashboard react-router + 側邊欄 + sticky header + 下拉組件、Vercel 部署、更新 / 重啟按鈕
  • @alt-glitch — 8 PR · Matrix / Mattermost / 飛書的 PLATFORM_HINTS,Matrix 修復
  • @ethernet8023@benbarclay — 各 3 PR
  • @Aslaaen — 2 PR

其他貢獻

@jerilynzheng(ai-gateway 定價)、@JimLiu(baoyu-comic)、@Dusk1e(軌跡壓縮器憑證)、@DeployFaith(Dashboard 移動端)、@v1k22(concept-diagrams)、@omnissiah-comelse(adversarial-ux-test)、@coekfung(Telegram MarkdownV2 可展開引用塊)、@liftaris(TUI provider 解析)、@arihantsethia(skill 分析 Dashboard)、@topcheer + @xing8star(QQBot 基礎)、@I3eg1nner(SECURITY.md),@jquesnelle(原 Tool Gateway 工作)等。

自 v0.9.0 起共 29 位社區貢獻者(含 co-author 共 290 位)。完整名單見官方發佈說明。

升級建議

如果你屬於下面任一情況,建議優先關注 v0.11.0

  1. 想用新版 TUI:交互體驗徹底換代,sticky 輸入框、狀態欄計時、子代理可視化體感差別很大;
  2. 要接 AWS Bedrock / NVIDIA NIM / Arcee / Step Plan / Gemini CLI OAuth / ai-gateway:這次都走原生路徑,配置成本低於繞轉換層;
  3. 想用 GPT-5.5:通過 ChatGPT Codex OAuth 直連,無需單獨 API Key;
  4. 要做 QQBot,或者在做飛書 / 釘釘 / 企業微信 / Telegram / Discord 的深度整合:每個平臺都帶了不少能力補齊;
  5. 想自定義 Dashboard 或寫工具插件register_command / dispatch_tool / transform_tool_result / Dashboard tab 這幾個新點位能覆蓋很多此前做不到的場景;
  6. 關心代理可控性/steer 允許中途糾偏、orchestrator + max_spawn_depth 讓多代理委派更安全。

所有用戶 都建議測試後升級:本次一併帶進了 v0.10.0 之後積累的 482 個 fix: PR,涵蓋流式、會話、記憶、編碼、進程清理、網關重連等關鍵路徑。