跳到主要内容

Hermes Agent v0.11.0 发布说明

发布日期:2026 年 4 月 23 日
官方标签:v2026.4.23
与上一版对比:v2026.4.13...v2026.4.23(注:官方本次将 v0.10.0 遗留项一并纳入,因此对比基线回到 v0.9.0)。

本页基于官方 GitHub 发布说明做了结构化中文整理,方便站内快速阅读。

一句话概览

这是一次被官方称为 「The Interface release」 的重磅更新:交互式 CLI 被彻底用 React/Ink 重写每个 provider 背后都换上可插拔的传输层原生接入 AWS Bedrock新增 5 条推理路径新支持 QQBot(第 17 个消息平台)插件表面大幅扩展,并且通过 Codex OAuth 直接用上 GPT-5.5。由于 v0.10.0 只发布了 Nous Tool Gateway,这次一并把此前两周里积压的所有重点一次性放出。

规模数据(自 v0.9.0 起):1,556 commits · 761 合并 PR · 1,314 文件变更 · 224,174 行新增 · 29 位社区贡献者(含 co-author 共 290 位)

重点亮点

全新 Ink 版 TUI

  • 彻底重写的交互界面hermes --tui 现在是用 React/Ink 写的新版 TUI,后端由 Python JSON-RPC 网关(tui_gateway)驱动。ui-tui/tui_gateway/ 合计 ~310 commit。
  • 体验升级:常驻输入框(sticky composer)滚动时不被冲走、流式输出配合 OSC-52 剪贴板、稳定的选择器快捷键、状态栏显示每轮计时git 分支/clear 加确认、内置 light 主题预设
  • 子代理可视化:新增 subagent spawn 观察层,代理派生子任务时可直接看到。
  • 主要贡献者:@OutThisLife + Teknium。

传输层抽象 + 原生 AWS Bedrock

  • agent/transports/ 可插拔层:格式转换与 HTTP 通信从 run_agent.py 抽出,每个 provider 走自己的实现。
    • AnthropicTransport(Anthropic Messages API)
    • ChatCompletionsTransport(OpenAI 兼容 provider 的默认路径)
    • ResponsesApiTransport(OpenAI Responses API + Codex build_kwargs)
    • BedrockTransport(AWS Bedrock Converse API)
  • 原生 AWS Bedrock:基于 Converse API 在新抽象之上直接落地,不再需要绕转换层。
  • 主要 PR:#13347#13366#13430#13805#13814#10549(@kshitijk4poor + Teknium)。

新增 5 条推理路径

路径类型PR
NVIDIA NIM原生 provider#11774
Arcee AI直连 provider#9276
Step Planprovider#13893
Google Gemini CLI OAuthOAuth provider#11270
Vercel ai-gateway含定价信息 + 动态发现#13223(@jerilynzheng)
  • 此外,Gemini 改走原生 AI Studio API,性能更好(#12674)。

Codex OAuth 直连 GPT-5.5

  • OpenAI 最新的 GPT-5.5 推理模型,现在可以通过 ChatGPT Codex OAuth 直接使用。
  • model picker 接入了 实时模型发现,新模型上线后不必等官方 catalog 更新即可出现。
  • PR:#14720

QQBot 上线,成为第 17 个平台

  • 基于 QQ 官方 API v2 的原生 QQBot adapter。
  • 配套 扫码配置向导流式光标emoji 反应,并与 WeCom/微信一致的 DM/群聊策略门控
  • PR:#9364#11831

插件表面大幅扩张

插件现在可以做得更深:

  • register_command() — 注册新的 slash 命令(#10626
  • dispatch_tool() — 从插件代码直接调用工具(#10763
  • pre_tool_call否决工具执行#9377
  • transform_tool_result — 通用改写工具返回值(#12972
  • transform_terminal_output — 改写终端输出(#12929
  • 可插拔 image_gen 后端 + OpenAI 出图(#13799
  • Dashboard 自定义 tab 支持(#14175
  • 默认附带的 disk-cleanup 插件 改为 opt-in,作为参考实现(#12944

/steer 中途干预

  • /steer <提示> 把一段笔记注入正在运行的代理,它会在下一次工具调用后看到
  • 不打断当前 turn、不破坏 prompt cache,适合让跑偏的代理立刻纠偏。
  • PR:#12116

Shell hooks

  • 任何 shell 脚本都可以直接注册为 Hermes 生命周期钩子(pre_tool_call / post_tool_call / on_session_start 等),不必再写 Python 插件(#13296)。

Webhook 直投模式

  • webhook 订阅可直接把 payload 转发到平台聊天完全不经过代理
  • 非常适合告警、可用性监测、事件流这类「不需要 LLM 再加工一遍」的推送场景(#12473)。

更聪明的任务委派

  • 子代理新增 orchestrator 角色,可以再派生自己的子任务,并支持 max_spawn_depth 配置(默认 flat,即不允许再往下派)(#13691)。
  • 并发兄弟子代理共享文件协调层,互相不会覆盖对方编辑(#13718)。

副模型 UI + 默认走主模型

  • hermes model 新增 「配置副模型」 专用界面,可按任务类型逐项覆盖(压缩、视觉、会话检索、标题生成)(#11891)。
  • auto 路由默认走主模型:此前 aggregator 用户会被悄悄路由到 provider 端的廉价默认模型,现在统一走主模型(#11900)。

Dashboard 插件系统 + 实时主题切换

  • Web Dashboard 现在可插件化扩展:第三方插件可添加 tab、widget、视图,不用 fork。
  • 配合 实时切换的主题系统:颜色、字体、布局、密度都可热切换,无需刷新。CLI 的主题规范现在完整延伸到 Web(#10951#10687#14725)。

Dashboard 打磨

  • 中英 i18n 语言切换器(#9453
  • react-router 侧边栏布局、sticky header、下拉组件#9370 @austinpickett)
  • 移动端响应式#9228 @DeployFaith)
  • Vercel 部署#10686#11061
  • 按会话真实 API 调用统计#14004
  • 一键更新 + 重启网关按钮#13526

核心代理与架构

Transport 层(新)

  • Transport ABC 把格式转换与 HTTP 传输从 run_agent.py 抽到 agent/transports/
  • AnthropicTransport / ChatCompletionsTransport / ResponsesApiTransport / BedrockTransport 四个实现各自独立

Provider 与模型扩展

除了上文 5 条新路径,本次还带来:

  • xAI Grok 升级到 Responses API#10783),同时带上 xAI TTS
  • Ollama 改进:Cloud provider、GLM 续写、think=false、surrogate 清洗、/v1 提示(#10782
  • Kimi K2.6 覆盖 OpenRouter / Nous Portal / 原生 Kimi / HuggingFace(#13148#13152#13169
  • Kimi K2.5 在所有推荐列表里被顶到首位(#11745
  • 小米 MiMo v2.5-pro + v2.5 在 OpenRouter / Nous Portal / 原生(#14184#14635
  • GLM-5V-Turbo 进入 coding 计划(#9907
  • Claude Opus 4.7 进入 Nous Portal catalog(#11398
  • OpenRouter elephant-alpha 进入精选(#9378
  • OpenCode-Go:Kimi K2.6 + Qwen3.5/3.6 Plus(#13429
  • minimax/minimax-m2.5:free 加入 OpenRouter 精选(#13836
  • /model 自动合并 models.dev 条目,照顾冷门 provider(#14221
  • 每 provider / 每 model 的 request_timeout_seconds 可配(#12652
  • agent.api_max_retries 可配置 API 重试次数(#14730

代理循环与会话

  • 压缩器增强:智能折叠、去重、防抖动、模板升级(#10088
  • 压缩摘要遵循对话语言#12556
  • 压缩模型遇到永久 503/404 自动回退到主模型#10093
  • 网关重启后自动接续被打断的代理工作#9934
  • 活动心跳 防止网关误判为不活跃(#10501
  • PLATFORM_HINTS 增加 Matrix / Mattermost / 飞书(#14428 @alt-glitch)

会话与记忆

  • 启动时自动清理旧会话 + VACUUM state.db#13861
  • Honcho 重写:上下文注入、5 个工具、成本安全、会话隔离(#10619
  • Hindsight 更丰富的会话级留存元数据(#13987
  • Fix:记忆 provider 工具去重,防止严格 provider 返回 400(#10511
  • Fix:从 $HERMES_HOME/plugins/ 发现用户自安装的记忆 provider(#10529

消息平台(Gateway)

Telegram

  • TELEGRAM_PROXY 环境变量 + config.yaml 代理支持#10681
  • ignored_threads 配置#9530
  • 链接预览开关#10610
  • Markdown 表格自动包裹代码块#11794
  • Fix:流式光标 (▉) 不再作为独立消息出现(#9538

Discord

  • 论坛频道支持#11920
  • DISCORD_ALLOWED_ROLES 基于角色的访问控制(#11608
  • slash 命令可关闭#14315
  • 原生 send_animation 内联 GIF 播放(#10283
  • send_message 支持 Discord 媒体附件#10246
  • /skill 命令组 + 分类子命令#9909

飞书

  • 文档评论智能回复(三级访问控制)(#11898
  • 表情反应显示处理状态#12927
  • 保留 @ 提及上下文供代理消费#14167

钉钉

  • require_mention + allowed_users 门控(对齐 Slack/Telegram/Discord)(#11564
  • 扫码 device-flow 授权 设置向导(#11574
  • AI Cards 流式、emoji 反应、媒体处理#11910

WhatsApp

  • send_voice 原生语音消息(#13002
  • dm_policy / group_policy 对齐 WeCom / 微信 / QQ(#13151

企业微信 / 微信

  • 企业微信扫码建号 + 交互式配置向导#13961

Signal

  • send_message 支持媒体投递#13178

Slack

  • DM 默认按 thread 建会话#10987

Gateway 核心

  • Gateway 代理模式 — 把消息转发到远程 API server(#9787
  • 按频道临时 prompt(Discord/Telegram/Slack/Mattermost)(#10564
  • 所有平台原生暴露插件 slash 命令#14175
  • MEDIA: 标签支持文档 / 压缩包扩展名#14307
  • gateway start/restart --all 标志#10043
  • 关闭网关时通知活跃会话#9850
  • 阻止代理通过终端自毁网关#9895

工具系统

浏览器

  • browser_cdp 原生 DevTools Protocol 直通#12369
  • Camofox 连接稳定性提升

代码执行

  • project / strict 执行模式(默认 project)(#11971

图像生成

  • FAL 多模型选择器#11265
  • Recraft V3 → V4 Pro,Nano Banana → Pro#11406
  • GPT Image 2 进 FAL catalog(#13677
  • xAI 出图 provider(grok-imagine-image)(#14765

语音 / TTS / STT

  • Google Gemini TTS provider#11229
  • xAI Grok STT provider#14473
  • xAI TTS(随 Responses API 升级一起)(#10783
  • KittenTTS 本地 provider#13395

Webhook / Cron

  • Webhook 直投模式(零 LLM 推送)(#12473
  • Cron wakeAgent 开关 — 脚本可完全跳过代理(#12373
  • Cron 按 job 的 enabled_toolsets — 按任务限定工具集,节省 token 与成本(#14767

文件 / Patch

  • patch 工具「你是不是想用 X」反馈 失配时给出建议(#13435

API Server

  • /v1/responses SSE 流式工具事件#10049
  • /v1/chat/completions/v1/responses 支持内联图片输入#12969

Docker / Podman

  • Podman 入门级支持#10066
  • Docker 镜像带上 docker-cli#14232
  • 拆容器时文件同步回宿主#11291

MCP

  • 窗口内共 12 项 MCP 改进(状态、超时处理、工具调用转发等)

Skills 生态

Skill 系统改进

  • 命名空间化 skill 注册,支持插件 skill 打包(#9786
  • hermes skills reset 解除卡住的内置 skill(#11468
  • Skills 守卫可选开启config.skills.guard_agent_created(默认关闭)(#14557
  • 打包的 skill 脚本开箱即用#13384
  • xitter 替换为 xurl(X 官方 API CLI)(#12303
  • MiniMax-AI/cli 作为默认 skill#14493
  • @ 文件补全支持模糊匹配 + mtime 排序#9467

新 skill

  • concept-diagrams 概念图(#11363
  • architecture-diagram 架构图(#9906
  • pixel-art 像素画 + 硬件调色板 + 视频动画(#12663#12725
  • baoyu-comic 宝玉漫画(#13257 @JimLiu)
  • baoyu-infographic 信息图 — 21 布局 × 21 风格#12254
  • page-agent — 在自家 Web 应用里嵌入阿里 in-page GUI agent(#13976
  • fitness-nutrition 健身营养(#9355
  • drug-discovery — ChEMBL / PubChem / OpenFDA / ADMET(#9443
  • touchdesigner-mcp#12298
  • adversarial-ux-test#13425
  • maps 新增 guest_house / camp_site,双 key 面包店查询(#13398
  • llm-wiki 源信息标注、来源哈希、质量信号(#13700

CLI 与用户体验

  • bash / zsh / fish 动态 shell 补全#9785
  • 亮色皮肤 + 皮肤感知补全菜单#9461
  • 审批与澄清提示用数字快捷键#13416
  • 多行输入预览紧凑 + 外部编辑器#12934
  • --ignore-user-config / --ignore-rules 标志#14277
  • /usage 展示账户限额#13428
  • Doctor 新增「命令安装检查」#10112
  • ESC 取消密钥 / sudo 提示#9902
  • Fix:代理看到的文本用 display_hermes_home(),不再硬编码 ~/.hermes#10285
  • Fix:强制以 config.yaml 为 CWD 唯一来源,废弃 .env 中 CWD 变量,新增 hermes memory reset#11029

安全与稳定性

  • 私有 / 内网 URL 解析全局开关#14166
  • 阻止代理通过终端自毁网关#9895
  • Telegram 回调按更新提示做授权#10536
  • 新增 SECURITY.md#10532
  • hermes update 时提醒旧 hermes.service unit#11918
  • ASCII locale 下 api_messages / reasoning_content 编码错误完整恢复#10537
  • clear_session_vars 后防止 os.environ 残留#10527
  • 终端工具后台化进程后不再让代理挂住#10584

Bug 修复与改进

本次窗口内 fix: 分类共 482 个 PR,挑几条比较有代表性的:

  • 多端流式光标伪影清理(Matrix / Telegram / WhatsApp / Discord)
  • 从网关流消费者侧过滤 <think> / <thought> 块(#9408
  • 网关 display.streaming 根配置被覆盖的回归修复(#9799
  • session_search 的 limit 强转 int,避免 TypeError(#10522
  • Windows 无 fcntl 时记忆工具仍可用(#9783
  • 轨迹压缩器凭证从 HERMES_HOME/.env 读取(#9632
  • @_context_completions@ 提及时不再崩溃(#9683
  • Telegram 连续快发消息不再被截断

贡献者

核心

  • @teknium1(Teknium)

Top 社区贡献者(按合并 PR 数)

  • @kshitijk4poor49 PR · 传输层重构(AnthropicTransport / ResponsesApiTransport)、Step Plan provider、小米 MiMo v2.5、大量 gateway 修复、Kimi K2.5 推荐置顶、@提及崩溃修复
  • @OutThisLife(Brooklyn)31 PR · TUI 打磨、状态栏 git 分支、每轮计时、稳定的选择器快捷键、/clear 确认、light 主题预设、子代理 spawn 观察层
  • @helix4u — 11 PR · 录音提示音、MCP 工具打断、一系列稳定性修复
  • @austinpickett — 8 PR · Dashboard react-router + 侧边栏 + sticky header + 下拉组件、Vercel 部署、更新 / 重启按钮
  • @alt-glitch — 8 PR · Matrix / Mattermost / 飞书的 PLATFORM_HINTS,Matrix 修复
  • @ethernet8023@benbarclay — 各 3 PR
  • @Aslaaen — 2 PR

其他贡献

@jerilynzheng(ai-gateway 定价)、@JimLiu(baoyu-comic)、@Dusk1e(轨迹压缩器凭证)、@DeployFaith(Dashboard 移动端)、@v1k22(concept-diagrams)、@omnissiah-comelse(adversarial-ux-test)、@coekfung(Telegram MarkdownV2 可展开引用块)、@liftaris(TUI provider 解析)、@arihantsethia(skill 分析 Dashboard)、@topcheer + @xing8star(QQBot 基础)、@I3eg1nner(SECURITY.md),@jquesnelle(原 Tool Gateway 工作)等。

自 v0.9.0 起共 29 位社区贡献者(含 co-author 共 290 位)。完整名单见官方发布说明。

升级建议

如果你属于下面任一情况,建议优先关注 v0.11.0

  1. 想用新版 TUI:交互体验彻底换代,sticky 输入框、状态栏计时、子代理可视化体感差别很大;
  2. 要接 AWS Bedrock / NVIDIA NIM / Arcee / Step Plan / Gemini CLI OAuth / ai-gateway:这次都走原生路径,配置成本低于绕转换层;
  3. 想用 GPT-5.5:通过 ChatGPT Codex OAuth 直连,无需单独 API Key;
  4. 要做 QQBot,或者在做飞书 / 钉钉 / 企业微信 / Telegram / Discord 的深度整合:每个平台都带了不少能力补齐;
  5. 想自定义 Dashboard 或写工具插件register_command / dispatch_tool / transform_tool_result / Dashboard tab 这几个新点位能覆盖很多此前做不到的场景;
  6. 关心代理可控性/steer 允许中途纠偏、orchestrator + max_spawn_depth 让多代理委派更安全。

所有用户 都建议测试后升级:本次一并带进了 v0.10.0 之后积累的 482 个 fix: PR,涵盖流式、会话、记忆、编码、进程清理、网关重连等关键路径。