Hermes Agent v0.18.0 发布说明

发布日期：2026 年 7 月 1 日 官方标签：v2026.7.1 与上一版对比：v2026.6.19...v2026.7.1

本页基于官方 GitHub Release 做了结构化中文整理，便于快速浏览。

一句话概览

官方将本次更新命名为 「The Judgment Release（判断力版本）」，核心主题是：

过去一周半，团队几乎把全部精力投入一个目标：清空整个仓库的所有 P0 和 P1 issue 与 PR——截至本次发布，它们已 100% 关闭。在此之上，v0.18.0 关注的是 Hermes“想得多好”，以及它如何知道自己的工作真正完成了。

重点变化：

P0/P1 全量清零：12 天内解决约 700 个最高优先级事项（3 个 P0 issue + 8 个 P0 PR、493 个 P1 issue + 188 个 P1 PR），整个仓库的开放 P0/P1 数量归零，官方承诺此后长期保持为零。
Mixture-of-Agents 成为一等公民：命名的 MoA 预设直接以 moa provider 下的虚拟模型出现在 CLI、TUI、桌面端和 Gateway 的所有模型选择器里，像选普通模型一样选择一个"模型委员会"。
每个参考模型的推理过程可见：MoA 运行时每个参考模型的完整输出以独立标注块渲染，最终聚合答案改为实时流式输出，不再长时间静默后一次性出现。
Agent 学会用证据验证自己的工作：Hermes 会为编码工作记录验证证据，通过真正运行项目检查来判断任务完成，而不是自我宣称成功；/goal 新增完成契约（completion contracts），并提供 pre_verify hook 接入自定义检查。
/learn 一条命令蒸馏技能：对一个目录、一个 URL 或刚刚走过的工作流运行 /learn，Hermes 会按 CONTRIBUTING.md 的标准自动写出一个可复用技能。
/journey 学习时间线：CLI 和 TUI 新增可交互的学习时间线，展示 Hermes 积累的记忆与技能并支持就地编辑删除；桌面端配套推出可播放的记忆图谱（memory graph）。
后台子代理并行扇出：delegate_task 可以一次派出多个后台并行子代理，聊天不被阻塞，全部完成后合并为一条整合回复返回。
桌面端新增一等公民 Projects：按 profile 组织的代码库侧栏、编码轨道、评审面板、git worktree 管理和面向 agent 的项目工具，桌面端正式变成编码驾驶舱。
Gateway 可规模化部署：新增空闲休眠（scale-to-zero）与外部 drain 协调，重启、迁移、自动更新前可平滑排空，不再掐断进行中的对话。
自我改进成本大幅下降：回合后的自我改进 fork 改走辅助模型、消化上下文摘要而非重放全量对话，并自适应节奏。
Google Vertex AI 成为一等 provider：通过 GCP 服务账号自动铸造并刷新短时 OAuth2 token 使用 Gemini，无需静态 API Key，也不会中途过期。
安全加固一轮：MCP 配置持久化攻击面收紧、拦截可外泄凭据的 cron base_url 覆盖、文件读取前缀密钥一次性哨兵、Slack xapp- token 脱敏、浏览器云元数据下限、aiohttp CVE 下限等。

规模数据（自 v0.17.0 起）：约 1,720 次提交 · 998 个合并 PR · 2,215 个文件变更 · 约 251,000 行新增 · 约 41,000 行删除 · 949 个 issue 关闭 · 381 位贡献者。

我应该升级吗？

如果你属于以下任一场景，建议优先升级 v0.18.0：

你被某个久拖未决的 bug 困扰 —— 本窗口共关闭约 1,950 个 issue 和 PR，其中包括中断保护压缩的 sibling-fork 等长期问题，你遇到的问题很可能已经被修复。
你在难题上希望多个前沿模型共同推理 —— MoA 现在是一次选择即可用的虚拟模型，且能看到每个参考模型的完整推理再看聚合结论。
你把编码任务交给 Hermes 并希望"完成"可信 —— 验证证据账本、/goal 完成契约和 pre_verify hook 把"我觉得修好了"变成"测试通过，证据在此"。
你想让 Hermes 沉淀你的工作流 —— /learn 把技能创作从手工编写变成一条命令，/journey 和桌面端记忆图谱让 agent 的记忆不再是黑箱。
你经常并行派发多个子任务 —— 后台扇出让"并行调研五个竞品"这类任务不再阻塞主会话，结束后拿到一份整合总结。
你在桌面端做编码工作 —— Projects、多终端面板、聊天内 PR 风格 diff、就地小改动编辑器让桌面端接近完整编码工作台。
你为团队托管 Hermes 或做托管服务 —— scale-to-zero、drain 协调、Dashboard OIDC confidential client、API server 并发上限都让生产运行更稳。
你的组织通过 Google Cloud 用 Gemini —— Vertex AI provider 指向服务账号即可用，token 自动续期。
你关注凭据与注入防护 —— 本次安全轮次减少了 prompt 注入或错误配置泄露凭据的途径，公网暴露或多人实例尤其值得升级。

升级前仍建议备份 SOUL.md、MEMORY.md、skills/、Gateway 配置、profile 配置和长期会话数据。注意本版包含一次 v32 迁移（verify-on-stop 默认值调整），自托管 Dashboard、远程 Gateway、多 profile 和消息平台用户建议先在一台实例上验证再推广。

重点亮点

P0/P1 清零行动：整个仓库的最高优先级事项 100% 关闭

这是本次发布的头条。团队用一周半时间日夜清理优先级积压，截至发布时整个仓库的开放 P0/P1 归零：

优先级	关闭 issue	合并 PR
P0（严重）	3	8
P1（高）	493	188
合计	496	196

12 天内约 692 个最高优先级事项被解决，最后收尾的是中断保护压缩的 sibling-fork bug（issue #56391）及其修复（#56416）。官方特别致谢社区贡献者 @kshitijk4poor——cron 可靠性专项、压缩 fork 修复、凭据外泄加固和大量 P1 关闭都出自他手。官方同时承诺：此后 P0/P1 将长期保持为零。

Mixture-of-Agents：从"模式"升级为"可选择的模型"

MoA 过去是一个需要开关的模式，现在每个命名的 MoA 预设都以 moa provider 下的虚拟模型出现在所有模型选择器中（CLI、TUI、桌面端、Gateway），与 Claude、GPT、Grok 并列。选择"my-council"就像选择任何模型一样，Hermes 自动把提示词路由给整个集成。

体验上有两个关键改进：每个参考模型的完整输出以独立标注块渲染——你可以先读 GPT-5 怎么想、Claude 怎么想、Grok 怎么想，再看聚合模型的综合；最终答案改为实时流式输出。/moa 退化为一次性语法糖（跑完恢复原模型），持久切换走模型选择器。参考模型现在能看到完整工具状态并在每个用户/工具响应上触发；moa.save_traces 可选把全回合轨迹持久化为 JSONL 用于调试与评测。可靠性方面修复了参考/聚合模型的真实 provider 路由、上下文窗口按聚合模型解析等一系列问题。

主要 PR：#46081、#53548、#53561、#53793、#55625、#56101。

验证与目标：Agent 用证据证明工作完成

Hermes 现在会为编码工作记录验证证据账本（profile 级，记录 agent.coding_context 探测到的项目规范检查），并通过真正运行项目检查来决定任务是否完成，而不是靠模型自我断言。/goal 新增完成契约：你声明"完成"长什么样，常驻目标循环根据证据而非模型感觉来裁决；/goal wait <pid> 可以把循环挂在一个后台进程上等待。pre_verify hook 支持接入自定义检查。

默认值经过一次性 v32 迁移调整：verify-on-stop 默认关闭、纯文档修改跳过验证、消息平台入口不启用，避免验证行为打扰轻量场景。

主要 PR：#50501、#52285、#55413、#53552。

`/learn` 与 `/journey`：看得见、管得住的自我改进

/learn <anything> 把任何东西蒸馏成可复用技能——一个目录、一个 URL，或者五分钟前你带着 Hermes 走过的工作流，写出的技能自动遵循 CONTRIBUTING.md 的技能标准。/journey 则给 CLI 和 TUI 带来学习时间线：Hermes 随时间积累的记忆和技能一目了然，可以就地编辑或删除。配合桌面端新的记忆图谱（自上而下、可播放的放射状时间线），你第一次可以真正"看到"agent 知道什么、如何成长，并修剪错误的部分。

成本侧同样重要：回合后的自我改进 fork（决定是否保存记忆或技能的那个）现在路由到辅助模型、消化上下文摘要而非重放整个对话、并自适应节奏——自我改进保留，主模型价格不再全额支付。

主要 PR：#51506、#55555、#55226、#49252。

后台扇出：派出一小队子代理，然后继续干活

delegate_task 现在可以一次派出多个后台并行子代理：聊天永远不被阻塞，全部子代理完成后，结果合并成一条整合回复返回。"并行调研这五个竞品""同时审计这三个模块"这类任务可以直接扔出去，然后继续做别的事，结束时拿到一份干净的总结而不用逐个盯梢。CLI 和 TUI 状态栏会跟踪后台子代理的运行状态。

主要 PR：#49734、#51441。

桌面端：Projects 编码驾驶舱与记忆图谱

桌面端新增真正的按 profile 组织的 Projects——代码库侧栏、编码轨道、评审面板、git worktree 管理和面向 agent 的项目工具，背后是完整的 project → repo → lane 模型；文件夹选择器和 git 驾驶舱（状态、评审、worktree）都感知远程 Gateway。配套还有多终端面板（含只读的 agent 终端，标签页和回滚缓冲区跨重启保留）、聊天内 PR 风格文件 diff、文件预览面板的就地小改动编辑器。

体验层面：长线程的对话时间线导航栏、上下文用量分解弹窗、子代理观察窗的只读旁观转录、可拖拽的浮动 composer 窗口、自动朗读回复开关、窗口大小位置记忆等。宠物（Pets）功能也有一轮打磨：可选的漫游宠物、更自然的移动、帧级精确的孵化流程。底层完成了一波 composer 与"上帝文件"拆解重构，并通过共享 WebSocket 层让桌面端与 Dashboard（hermes serve）解耦。

主要 PR：#49037、#54385、#54517、#50731、#55226。

Gateway 规模化：scale-to-zero 与 drain 协调

Gateway 现在可以在空闲时休眠，并在重启、迁移或自动更新前干净地静默——不丢失进行中的对话。托管或纯 relay 的 Hermes 实例可以在无人使用时缩容到零、有请求时按需唤醒；破坏性生命周期操作会协调外部 drain，没有人会在回合中途被掐断。修复还包括把 restart_drain_timeout 默认为 0 以消除一个 systemd 崩溃循环、自愈卡在 draining/degraded 状态的 gateway。

Relay 推进到 Phase 5/6：唤醒原语、缓冲翻转、passthrough_forward over WS、每 agent 多平台身份、按投递（而非 source.platform）授权 relay 事件等。Dashboard 侧新增未认证自动跳转 portal SSO、自托管 OIDC 的 confidential client（client_secret）支持、Keys 页面管理任意自定义 .env 键。API server 增加可配置的并发运行上限以防 DoS。

主要 PR：#52243、#52937、#54824、#55344、#50007。

模型与 provider：Google Vertex AI 一等接入

Vertex AI 成为 Gemini 模型的一等 provider（走 Vertex 的 OpenAI 兼容端点）。过去用普通自定义 provider 接 Vertex 总是会话中途报错，原因是 Vertex 没有静态 API Key——每个请求都需要从服务账号 JSON 或应用默认凭据（ADC）铸造约 1 小时时效的 OAuth2 token。Hermes 现在自动铸造并续期这些 token：如果你的组织通过 Google Cloud 运行 Gemini，把 Hermes 指向服务账号即可，无需粘贴 token，也不会中途过期。

其他 provider 变化：Krea 接入托管的 Nous Subscription gateway；Z.AI 新增端点选择器（Global/China/Coding Plan）；Ollama cloud 接通 reasoning_effort；移除 google-gemini-cli 与 google-antigravity OAuth provider；Nous OAuth 支持 NOUS_INFERENCE_BASE_URL 覆盖。

主要 PR：#56363、#52647、#52364。

消息平台：可续接的 cron 与多平台增强

Cron continuations 是本次消息侧的主线：cron 任务的产出现在可以直接续聊（优先线程续接，回退 DM 镜像），Slack 支持频道内扁平续接投递，创建/列出 cron 时若 gateway 未运行会给出警告。

各平台增强：Telegram 命令菜单可配置且默认上限提高（技能不再被挤出菜单）、富草稿预览单独开关；Slack 可选 Block Kit 渲染 agent 消息；Discord 支持把推理过程渲染为 -# 子文本；WhatsApp 经 Baileys bridge 原生投递媒体；Teams 原生发送视频/语音/文档；photon sidecar 升级 spectrum-ts v8 并支持 tapback 关联；Raft 新增 gateway 配置向导；Signal 支持 AAC 语音条转封装。slack/dingtalk/whatsapp/matrix/feishu/telegram/wecom/email/sms 适配器迁移为 bundled。

主要 PR：#52250、#56254、#51716、#56102、#53598、#49408。

安全与可靠性：凭据边界与 cron 可靠性专项

本窗口集中加固了多个面：MCP 配置持久化攻击面收紧；拦截可外泄 provider 凭据的 cron base_url 覆盖；文件读取中前缀密钥使用一次性哨兵；Slack App-Level（xapp-）token 脱敏；所有浏览器后端强制云元数据下限（CDP 非本地）；browser_back 导航后重查私网守卫；/resume 与 /sessions 按调用方来源隔离（修复 IDOR）；懒加载消息路径统一 aiohttp 3.14.1 CVE 下限并加防漂移守卫。

cron 可靠性专项：未固定模型的任务在 provider 漂移时安全失败（fail closed）；错过宽限期的任务补跑一次而不是永远顺延；ticker 在 BaseException 下保活并带心跳感知状态；已启用的 MCP server 叠加到按任务 toolset 上。Windows 侧：抑制控制台闪烁、加固 gateway 重启、GUI 更新后无窗口重生 gateway、whatsapp/desktop 优先使用托管 node。

主要 PR：#50476、#56196、#54166、#56227、#56237、#51051、#50062。

其他值得注意的变化

/prompt 在编辑器里写提示词：打开 $EDITOR 用真正的 markdown 写长的多行提示词，保存后作为下一条消息排队——对经常写长指令的用户是极大的体验改善。
CLI / TUI 新增 /reasoning full（不设上限的思考展示）、/timestamps 与 /history 时间戳、内置工具的友好人话标签。
Blank Slate 极简安装模式：从一个最小 agent 开始，所有能力按需开启。
Agent loop：web_extract 改为截断存储而非 LLM 摘要；@ 引用并发展开；一次性 LLM 助手 + llm.oneshot gateway RPC；支持多个 HERMES_WRITE_SAFE_ROOT 目录。
压缩与会话：就地压缩（单会话 ID）成为默认；升级前快照现在包含 projects.db 和 Kanban 看板。
Kanban：任务生命周期插件钩子（claimed/completed/blocked）、类型化阻塞原因与解锁循环断路器、交接新鲜度标记。
技能：新增 cloudflare-temporary-deploy 可选技能、creative-ideation v2.1.0 方法库；LSP 新增 PowerShellEditorServices；mem0 升级 v3 API 并支持 OSS 模式。
性能：gateway 平台适配器懒加载、libyaml CSafeLoader 解析配置、FTS5 段合并与 handoff_state 索引缓解写锁竞争、list_profiles 单趟扫描。
桌面端 Dashboard 均支持备份的导入/创建/下载。
本窗口有四项变更回滚以待重新评估：cron 任务存储回到按 profile、不再克隆 auth.json（复制 OAuth 授权会导致兄弟实例被吊销）、Windows 终端弹窗方案、prompt_caching.enabled 开关。

升级建议

常规升级仍然使用：

hermes update

如果你使用包管理器、Docker、Nix 或 Windows 原生安装，请按对应安装方式升级到当前稳定版。本版包含一次 v32 配置迁移（verify-on-stop 默认值），升级前建议先确认当前安装路径、Gateway 暴露方式、消息平台凭据、MCP 配置和长期记忆路径。

升级后建议做五件事：

运行 hermes --version，确认版本已经到 v0.18.0。
在模型选择器里确认 moa provider 下的预设是否符合预期；如果之前依赖 /moa 持久切换，注意它现在是一次性行为。
如果你在编码场景使用 /goal 或依赖任务自动收尾，检查 verify-on-stop 迁移后的默认值是否符合你的预期。
如果使用 cron 定时任务，验证一个常用任务的触发与续聊行为（本版 cron 存储回到按 profile）。
试一次 /learn 和 /journey，看看 Hermes 为你沉淀了什么——顺手清掉不想保留的记忆。

一句话概览​

我应该升级吗？​

重点亮点​

P0/P1 清零行动：整个仓库的最高优先级事项 100% 关闭​

Mixture-of-Agents：从"模式"升级为"可选择的模型"​

验证与目标：Agent 用证据证明工作完成​

/learn 与 /journey：看得见、管得住的自我改进​

后台扇出：派出一小队子代理，然后继续干活​

桌面端：Projects 编码驾驶舱与记忆图谱​

Gateway 规模化：scale-to-zero 与 drain 协调​

模型与 provider：Google Vertex AI 一等接入​

消息平台：可续接的 cron 与多平台增强​

安全与可靠性：凭据边界与 cron 可靠性专项​

其他值得注意的变化​

升级建议​

参考链接​