Hermes Agent v0.11.0 发布说明
发布日期:2026 年 4 月 23 日
官方标签:v2026.4.23
与上一版对比:v2026.4.13...v2026.4.23(注:官方本次将 v0.10.0 遗留项一并纳入,因此对比基线回到 v0.9.0)。
本页基于官方 GitHub 发布说明做了结构化中文整理,方便站内快速阅读。
一句话概览
这是一次被官方称为 「The Interface release」 的重磅更新:交互式 CLI 被彻底用 React/Ink 重写、每个 provider 背后都换上可插拔的传输层、原生接入 AWS Bedrock、新增 5 条推理路径、新支持 QQBot(第 17 个消息平台)、插件表面大幅扩展,并且通过 Codex OAuth 直接用上 GPT-5.5。由于 v0.10.0 只发布了 Nous Tool Gateway,这次一并把此前两周里积压的所有重点一次性放出。
规模数据(自 v0.9.0 起):1,556 commits · 761 合并 PR · 1,314 文件变更 · 224,174 行新增 · 29 位社区贡献者(含 co-author 共 290 位)。
重点亮点
全新 Ink 版 TUI
- 彻底重写的交互界面:
hermes --tui现在是用 React/Ink 写的新版 TUI,后端由 Python JSON-RPC 网关(tui_gateway)驱动。ui-tui/与tui_gateway/合计 ~310 commit。 - 体验升级:常驻输入框(sticky composer)滚动时不被冲走、流式输出配合 OSC-52 剪贴板、稳定的选择器快捷键、状态栏显示每轮计时与 git 分支、
/clear加确认、内置 light 主题预设。 - 子代理可视化:新增 subagent spawn 观察层,代理派生子任务时可直接看到。
- 主要贡献者:@OutThisLife + Teknium。
传输层抽象 + 原生 AWS Bedrock
agent/transports/可插拔层:格式转换与 HTTP 通信从run_agent.py抽出,每个 provider 走自己的实现。AnthropicTransport(Anthropic Messages API)ChatCompletionsTransport(OpenAI 兼容 provider 的默认路径)ResponsesApiTransport(OpenAI Responses API + Codex build_kwargs)BedrockTransport(AWS Bedrock Converse API)
- 原生 AWS Bedrock:基于 Converse API 在新抽象之上直接落地,不再需要绕转换层。
- 主要 PR:#13347、#13366、#13430、#13805、#13814、#10549(@kshitijk4poor + Teknium)。
新增 5 条推理路径
| 路径 | 类型 | PR |
|---|---|---|
| NVIDIA NIM | 原生 provider | #11774 |
| Arcee AI | 直连 provider | #9276 |
| Step Plan | provider | #13893 |
| Google Gemini CLI OAuth | OAuth provider | #11270 |
| Vercel ai-gateway | 含定价信息 + 动态发现 | #13223(@jerilynzheng) |
- 此外,Gemini 改走原生 AI Studio API,性能更好(#12674)。
Codex OAuth 直连 GPT-5.5
- OpenAI 最新的 GPT-5.5 推理模型,现在可以通过 ChatGPT Codex OAuth 直接使用。
- model picker 接入了 实时模型发现,新模型上线后不必等官方 catalog 更新即可出现。
- PR:#14720。
QQBot 上线,成为第 17 个平台
- 基于 QQ 官方 API v2 的原生 QQBot adapter。
- 配套 扫码配置向导、流式光标、emoji 反应,并与 WeCom/微信一致的 DM/群聊策略门控。
- PR:#9364、#11831。
插件表面大幅扩张
插件现在可以做得更深:
register_command()— 注册新的 slash 命令(#10626)dispatch_tool()— 从插件代码直接调用工具(#10763)pre_tool_call可 否决工具执行(#9377)transform_tool_result— 通用改写工具返回值(#12972)transform_terminal_output— 改写终端输出(#12929)- 可插拔
image_gen后端 + OpenAI 出图(#13799) - Dashboard 自定义 tab 支持(#14175)
- 默认附带的 disk-cleanup 插件 改为 opt-in,作为参考实现(#12944)
/steer 中途干预
/steer <提示>把一段笔记注入正在运行的代理,它会在下一次工具调用后看到。- 不打断当前 turn、不破坏 prompt cache,适合让跑偏的代理立刻纠偏。
- PR:#12116。
Shell hooks
- 任何 shell 脚本都可以直接注册为 Hermes 生命周期钩子(
pre_tool_call/post_tool_call/on_session_start等),不必再写 Python 插件(#13296)。
Webhook 直投模式
- webhook 订阅可直接把 payload 转发到平台聊天,完全不经过代理。
- 非常适合告警、可用性监测、事件流这类「不需要 LLM 再加工一遍」的推送场景(#12473)。
更聪明的任务委派
- 子代理新增
orchestrator角色,可以再派生自己的子任务,并支持max_spawn_depth配置(默认 flat,即不允许再往下派)(#13691)。 - 并发兄弟子代理共享文件协调层,互相不会覆盖对方编辑(#13718)。
副模型 UI + 默认走主模型
hermes model新增 「配置副模型」 专用界面,可按任务类型逐项覆盖(压缩、视觉、会话检索、标题生成)(#11891)。auto路由默认走主模型:此前 aggregator 用户会被悄悄路由到 provider 端的廉价默认模型,现在统一走主模型(#11900)。
Dashboard 插件系统 + 实时主题切换
- Web Dashboard 现在可插件化扩展:第三方插件可添加 tab、widget、视图,不用 fork。
- 配合 实时切换的主题系统:颜色、字体、布局、密度都可热切换,无需刷新。CLI 的主题规范现在完整延伸到 Web(#10951、#10687、#14725)。
Dashboard 打磨
- 中英 i18n 语言切换器(#9453)
- react-router 侧边栏布局、sticky header、下拉组件(#9370 @austinpickett)
- 移动端响应式(#9228 @DeployFaith)
- Vercel 部署(#10686、#11061)
- 按会话真实 API 调用统计(#14004)
- 一键更新 + 重启网关按钮(#13526)
核心代理与架构
Transport 层(新)
- Transport ABC 把格式转换与 HTTP 传输从
run_agent.py抽到agent/transports/ AnthropicTransport/ChatCompletionsTransport/ResponsesApiTransport/BedrockTransport四个实现各自独立
Provider 与模型扩展
除了上文 5 条新路径,本次还带来:
- xAI Grok 升级到 Responses API(#10783),同时带上 xAI TTS
- Ollama 改进:Cloud provider、GLM 续写、
think=false、surrogate 清洗、/v1提示(#10782) - Kimi K2.6 覆盖 OpenRouter / Nous Portal / 原生 Kimi / HuggingFace(#13148、#13152、#13169)
- Kimi K2.5 在所有推荐列表里被顶到首位(#11745)
- 小米 MiMo v2.5-pro + v2.5 在 OpenRouter / Nous Portal / 原生(#14184、#14635)
- GLM-5V-Turbo 进入 coding 计划(#9907)
- Claude Opus 4.7 进入 Nous Portal catalog(#11398)
- OpenRouter elephant-alpha 进入精选(#9378)
- OpenCode-Go:Kimi K2.6 + Qwen3.5/3.6 Plus(#13429)
minimax/minimax-m2.5:free加入 OpenRouter 精选(#13836)/model自动合并 models.dev 条目,照顾冷门 provider(#14221)- 每 provider / 每 model 的
request_timeout_seconds可配(#12652) agent.api_max_retries可配置 API 重试次数(#14730)
代理循环与会话
- 压缩器增强:智能折叠、去重、防抖动、模板升级(#10088)
- 压缩摘要遵循对话语言(#12556)
- 压缩模型遇到永久 503/404 自动回退到主模型(#10093)
- 网关重启后自动接续被打断的代理工作(#9934)
- 活动心跳 防止网关误判为不活跃(#10501)
- PLATFORM_HINTS 增加 Matrix / Mattermost / 飞书(#14428 @alt-glitch)
会话与记忆
- 启动时自动清理旧会话 + VACUUM state.db(#13861)
- Honcho 重写:上下文注入、5 个工具、成本安全、会话隔离(#10619)
- Hindsight 更丰富的会话级留存元数据(#13987)
- Fix:记忆 provider 工具去重,防止严格 provider 返回 400(#10511)
- Fix:从
$HERMES_HOME/plugins/发现用户自安装的记忆 provider(#10529)
消息平台(Gateway)
Telegram
TELEGRAM_PROXY环境变量 +config.yaml代理支持(#10681)ignored_threads配置(#9530)- 链接预览开关(#10610)
- Markdown 表格自动包裹代码块(#11794)
- Fix:流式光标 (▉) 不再作为独立消息出现(#9538)
Discord
- 论坛频道支持(#11920)
DISCORD_ALLOWED_ROLES基于角色的访问控制(#11608)- slash 命令可关闭(#14315)
- 原生
send_animation内联 GIF 播放(#10283) send_message支持 Discord 媒体附件(#10246)/skill命令组 + 分类子命令(#9909)
飞书
钉钉
require_mention+allowed_users门控(对齐 Slack/Telegram/Discord)(#11564)- 扫码 device-flow 授权 设置向导(#11574)
- AI Cards 流式、emoji 反应、媒体处理(#11910)
WhatsApp
企业微信 / 微信
- 企业微信扫码建号 + 交互式配置向导(#13961)
Signal
send_message支持媒体投递(#13178)
Slack
- DM 默认按 thread 建会话(#10987)
Gateway 核心
- Gateway 代理模式 — 把消息转发到远程 API server(#9787)
- 按频道临时 prompt(Discord/Telegram/Slack/Mattermost)(#10564)
- 所有平台原生暴露插件 slash 命令(#14175)
- MEDIA: 标签支持文档 / 压缩包扩展名(#14307)
gateway start/restart --all标志(#10043)- 关闭网关时通知活跃会话(#9850)
- 阻止代理通过终端自毁网关(#9895)
工具系统
浏览器
browser_cdp原生 DevTools Protocol 直通(#12369)- Camofox 连接稳定性提升
代码执行
- project / strict 执行模式(默认 project)(#11971)
图像生成
- FAL 多模型选择器(#11265)
- Recraft V3 → V4 Pro,Nano Banana → Pro(#11406)
- GPT Image 2 进 FAL catalog(#13677)
- xAI 出图 provider(grok-imagine-image)(#14765)
语音 / TTS / STT
- Google Gemini TTS provider(#11229)
- xAI Grok STT provider(#14473)
- xAI TTS(随 Responses API 升级一起)(#10783)
- KittenTTS 本地 provider(#13395)
Webhook / Cron
- Webhook 直投模式(零 LLM 推送)(#12473)
- Cron
wakeAgent开关 — 脚本可完全跳过代理(#12373) - Cron 按 job 的
enabled_toolsets— 按任务限定工具集,节省 token 与成本(#14767)
文件 / Patch
patch工具「你是不是想用 X」反馈 失配时给出建议(#13435)
API Server
Docker / Podman
MCP
- 窗口内共 12 项 MCP 改进(状态、超时处理、工具调用转发等)
Skills 生态
Skill 系统改进
- 命名空间化 skill 注册,支持插件 skill 打包(#9786)
hermes skills reset解除卡住的内置 skill(#11468)- Skills 守卫可选开启 —
config.skills.guard_agent_created(默认关闭)(#14557) - 打包的 skill 脚本开箱即用(#13384)
xitter替换为xurl(X 官方 API CLI)(#12303)- MiniMax-AI/cli 作为默认 skill(#14493)
@文件补全支持模糊匹配 + mtime 排序(#9467)
新 skill
- concept-diagrams 概念图(#11363)
- architecture-diagram 架构图(#9906)
- pixel-art 像素画 + 硬件调色板 + 视频动画(#12663、#12725)
- baoyu-comic 宝玉漫画(#13257 @JimLiu)
- baoyu-infographic 信息图 — 21 布局 × 21 风格(#12254)
- page-agent — 在自家 Web 应用里嵌入阿里 in-page GUI agent(#13976)
- fitness-nutrition 健身营养(#9355)
- drug-discovery — ChEMBL / PubChem / OpenFDA / ADMET(#9443)
- touchdesigner-mcp(#12298)
- adversarial-ux-test(#13425)
- maps 新增
guest_house/camp_site,双 key 面包店查询(#13398) - llm-wiki 源信息标注、来源哈希、质量信号(#13700)
CLI 与用户体验
- bash / zsh / fish 动态 shell 补全(#9785)
- 亮色皮肤 + 皮肤感知补全菜单(#9461)
- 审批与澄清提示用数字快捷键(#13416)
- 多行输入预览紧凑 + 外部编辑器(#12934)
--ignore-user-config/--ignore-rules标志(#14277)/usage展示账户限额(#13428)- Doctor 新增「命令安装检查」(#10112)
- ESC 取消密钥 / sudo 提示(#9902)
- Fix:代理看到的文本用
display_hermes_home(),不再硬编码~/.hermes(#10285) - Fix:强制以
config.yaml为 CWD 唯一来源,废弃.env中 CWD 变量,新增hermes memory reset(#11029)
安全与稳定性
- 私有 / 内网 URL 解析全局开关(#14166)
- 阻止代理通过终端自毁网关(#9895)
- Telegram 回调按更新提示做授权(#10536)
- 新增
SECURITY.md(#10532) hermes update时提醒旧hermes.serviceunit(#11918)- ASCII locale 下
api_messages/reasoning_content编码错误完整恢复(#10537) clear_session_vars后防止os.environ残留(#10527)- 终端工具后台化进程后不再让代理挂住(#10584)
Bug 修复与改进
本次窗口内 fix: 分类共 482 个 PR,挑几条比较有代表性的:
- 多端流式光标伪影清理(Matrix / Telegram / WhatsApp / Discord)
- 从网关流消费者侧过滤
<think>/<thought>块(#9408) - 网关
display.streaming根配置被覆盖的回归修复(#9799) session_search的 limit 强转 int,避免 TypeError(#10522)- Windows 无
fcntl时记忆工具仍可用(#9783) - 轨迹压缩器凭证从
HERMES_HOME/.env读取(#9632) @_context_completions在@提及时不再崩溃(#9683)- Telegram 连续快发消息不再被截断
贡献者
核心
- @teknium1(Teknium)
Top 社区贡献者(按合并 PR 数)
- @kshitijk4poor — 49 PR · 传输层重构(AnthropicTransport / ResponsesApiTransport)、Step Plan provider、小米 MiMo v2.5、大量 gateway 修复、Kimi K2.5 推荐置顶、@提及崩溃修复
- @OutThisLife(Brooklyn) — 31 PR · TUI 打磨、状态栏 git 分支、每轮计时、稳定的选择器快捷键、
/clear确认、light 主题预设、子代理 spawn 观察层 - @helix4u — 11 PR · 录音提示音、MCP 工具打断、一系列稳定性修复
- @austinpickett — 8 PR · Dashboard react-router + 侧边栏 + sticky header + 下拉组件、Vercel 部署、更新 / 重启按钮
- @alt-glitch — 8 PR · Matrix / Mattermost / 飞书的 PLATFORM_HINTS,Matrix 修复
- @ethernet8023、@benbarclay — 各 3 PR
- @Aslaaen — 2 PR
其他贡献
@jerilynzheng(ai-gateway 定价)、@JimLiu(baoyu-comic)、@Dusk1e(轨迹压缩器凭证)、@DeployFaith(Dashboard 移动端)、@v1k22(concept-diagrams)、@omnissiah-comelse(adversarial-ux-test)、@coekfung(Telegram MarkdownV2 可展开引用块)、@liftaris(TUI provider 解析)、@arihantsethia(skill 分析 Dashboard)、@topcheer + @xing8star(QQBot 基础)、@I3eg1nner(SECURITY.md),@jquesnelle(原 Tool Gateway 工作)等。
自 v0.9.0 起共 29 位社区贡献者(含 co-author 共 290 位)。完整名单见官方发布说明。
升级建议
如果你属于下面任一情况,建议优先关注 v0.11.0:
- 想用新版 TUI:交互体验彻底换代,sticky 输入框、状态栏计时、子代理可视化体感差别很大;
- 要接 AWS Bedrock / NVIDIA NIM / Arcee / Step Plan / Gemini CLI OAuth / ai-gateway:这次都走原生路径,配置成本低于绕转换层;
- 想用 GPT-5.5:通过 ChatGPT Codex OAuth 直连,无需单独 API Key;
- 要做 QQBot,或者在做飞书 / 钉钉 / 企业微信 / Telegram / Discord 的深度整合:每个平台都带了不少能力补齐;
- 想自定义 Dashboard 或写工具插件:
register_command/dispatch_tool/transform_tool_result/ Dashboard tab 这几个新点位能覆盖很多此前做不到的场景; - 关心代理可控性:
/steer允许中途纠偏、orchestrator+max_spawn_depth让多代理委派更安全。
所有用户 都建议测试后升级:本次一并带进了 v0.10.0 之后积累的 482 个 fix: PR,涵盖流式、会话、记忆、编码、进程清理、网关重连等关键路径。