Hermes Agent v0.18.0 发布说明
发布日期:2026 年 7 月 1 日 官方标签:
v2026.7.1与上一版对比:v2026.6.19...v2026.7.1
本页基于官方 GitHub Release 做了结构化中文整理,便于快速浏览。
一句话概览
官方将本次更新命名为 「The Judgment Release(判断力版本)」,核心主题是:
过去一周半,团队几乎把全部精力投入一个目标:清空整个仓库的所有 P0 和 P1 issue 与 PR——截至本次发布,它们已 100% 关闭。在此之上,v0.18.0 关注的是 Hermes“想得多好”,以及它如何知道自己的工作真正完成了。
重点变化:
- P0/P1 全量清零:12 天内解决约 700 个最高优先级事项(3 个 P0 issue + 8 个 P0 PR、493 个 P1 issue + 188 个 P1 PR),整个仓库的开放 P0/P1 数量归零,官方承诺此后长期保持为零。
- Mixture-of-Agents 成为一等公民:命名的 MoA 预设直接以
moaprovider 下的虚拟模型出现在 CLI、TUI、桌面端和 Gateway 的所有模型选择器里,像选普通模型一样选择一个"模型委员会"。 - 每个参考模型的推理过程可见:MoA 运行时每个参考模型的完整输出以独立标注块渲染,最终聚合答案改为实时流式输出,不再长时间静默后一次性出现。
- Agent 学会用证据验证自己的工作:Hermes 会为编码工作记录验证证据,通过真正运行项目检查来判断任务完成,而不是自我宣称成功;
/goal新增完成契约(completion contracts),并提供pre_verifyhook 接入自定义检查。 /learn一条命令蒸馏技能:对一个目录、一个 URL 或刚刚走过的工作流运行/learn,Hermes 会按 CONTRIBUTING.md 的标准自动写出一个可复用技能。/journey学习时间线:CLI 和 TUI 新增可交互的学习时间线,展示 Hermes 积累的记忆与技能并支持就地编辑删除;桌面端配套推出可播放的记忆图谱(memory graph)。- 后台子代理并行扇出:
delegate_task可以一次派出多个后台并行子代理,聊天不被阻塞,全部完成后合并为一条整合回复返回。 - 桌面端新增一等公民 Projects:按 profile 组织的代码库侧栏、编码轨道、评审面板、git worktree 管理和面向 agent 的项目工具,桌面端正式变成编码驾驶舱。
- Gateway 可规模化部署:新增空闲休眠(scale-to-zero)与外部 drain 协调,重启、迁移、自动更新前可平滑排空,不再掐断进行中的对话。
- 自我改进成本大幅下降:回合后的自我改进 fork 改走辅助模型、消化上下文摘要而非重放全量对话,并自适应节奏。
- Google Vertex AI 成为一等 provider:通过 GCP 服务账号自动铸造并刷新短时 OAuth2 token 使用 Gemini,无需静态 API Key,也不会中途过期。
- 安全加固一轮:MCP 配置持久化攻击面收紧、拦截可外泄凭据的 cron
base_url覆盖、文件读取前缀密钥一次性哨兵、Slackxapp-token 脱敏、浏览器云元数据下限、aiohttpCVE 下限等。
规模数据(自 v0.17.0 起):约 1,720 次提交 · 998 个合并 PR · 2,215 个文件变更 · 约 251,000 行新增 · 约 41,000 行删除 · 949 个 issue 关闭 · 381 位贡献者。
我应该升级吗?
如果你属于以下任一场景,建议优先升级 v0.18.0:
- 你被某个久拖未决的 bug 困扰 —— 本窗口共关闭约 1,950 个 issue 和 PR,其中包括中断保护压缩的 sibling-fork 等长期问题,你遇到的问题很可能已经被修复。
- 你在难题上希望多个前沿模型共同推理 —— MoA 现在是一次选择即可用的虚拟模型,且能看到每个参考模型的完整推理再看聚合结论。
- 你把编码任务交给 Hermes 并希望"完成"可信 —— 验证证据账本、
/goal完成契约和pre_verifyhook 把"我觉得修好了"变成"测试通过,证据在此"。 - 你想让 Hermes 沉淀你的工作流 ——
/learn把技能创作从手工编写变成一条命令,/journey和桌面端记忆图谱让 agent 的记忆不再是黑箱。 - 你经常并行派发多个子任务 —— 后台扇出让"并行调研五个竞品"这类任务不再阻塞主会话,结束后拿到一份整合总结。
- 你在桌面端做编码工作 —— Projects、多终端面板、聊天内 PR 风格 diff、就地小改动编辑器让桌面端接近完整编码工作台。
- 你为团队托管 Hermes 或做托管服务 —— scale-to-zero、drain 协调、Dashboard OIDC confidential client、API server 并发上限都让生产运行更稳。
- 你的组织通过 Google Cloud 用 Gemini —— Vertex AI provider 指向服务账号即可用,token 自动续期。
- 你关注凭据与注入防护 —— 本次安全轮次减少了 prompt 注入或错误配置泄露凭据的途径,公网暴露或多人实例尤其值得升级。
升级前仍建议备份
SOUL.md、MEMORY.md、skills/、Gateway 配置、profile 配置和长期会话数据。注意本版包含一次 v32 迁移(verify-on-stop 默认值调整),自托管 Dashboard、远程 Gateway、多 profile 和消息平台用户建议先在一台实例上验证再推广。
重点亮点
P0/P1 清零行动:整个仓库的最高优先级事项 100% 关闭
这是本次发布的头条。团队用一周半时间日夜清理优先级积压,截至发布时整个仓库的开放 P0/P1 归零:
| 优先级 | 关闭 issue | 合并 PR |
|---|---|---|
| P0(严重) | 3 | 8 |
| P1(高) | 493 | 188 |
| 合计 | 496 | 196 |
12 天内约 692 个最高优先级事项被解决,最后收尾的是中断保护压缩的 sibling-fork bug(issue #56391)及其修复(#56416)。官方特别致谢社区贡献者 @kshitijk4poor——cron 可靠性专项、压缩 fork 修复、凭据外泄加固和大量 P1 关闭都出自他手。官方同时承诺:此后 P0/P1 将长期保持为零。
Mixture-of-Agents:从"模式"升级为"可选择的模型"
MoA 过去是一个需要开关的模式,现在每个命名的 MoA 预设都以 moa provider 下的虚拟模型出现在所有模型选择器中(CLI、TUI、桌面端、Gateway),与 Claude、GPT、Grok 并列。选择"my-council"就像选择任何模型一样,Hermes 自动把提示词路由给整个集成。
体验上有两个关键改进:每个参考模型的完整输出以独立标注块渲染——你可以先读 GPT-5 怎么想、Claude 怎么想、Grok 怎么想,再看聚合模型的综合;最终答案改为实时流式输出。/moa 退化为一次性语法糖(跑完恢复原模型),持久切换走模型选择器。参考模型现在能看到完整工具状态并在每个用户/工具响应上触发;moa.save_traces 可选把全回合轨迹持久化为 JSONL 用于调试与评测。可靠性方面修复了参考/聚合模型的真实 provider 路由、上下文窗口按聚合模型解析等一系列问题。
主要 PR:#46081、#53548、#53561、#53793、#55625、#56101。
验证与目标:Agent 用证据证明工作完成
Hermes 现在会为编码工作记录验证证据账本(profile 级,记录 agent.coding_context 探测到的项目规范检查),并通过真正运行项目检查来决定任务是否完成,而不是靠模型自我断言。/goal 新增完成契约:你声明"完成"长什么样,常驻目标循环根据证据而非模型感觉来裁决;/goal wait <pid> 可以把循环挂在一个后台进程上等待。pre_verify hook 支持接入自定义检查。
默认值经过一次性 v32 迁移调整:verify-on-stop 默认关闭、纯文档修改跳过验证、消息平台入口不启用,避免验证行为打扰轻量场景。
主要 PR:#50501、#52285、#55413、#53552。
/learn 与 /journey:看得见、管得住的自我改进
/learn <anything> 把任何东西蒸馏成可复用技能——一个目录、一个 URL,或者五分钟前你带着 Hermes 走过的工作流,写出的技能自动遵循 CONTRIBUTING.md 的技能标准。/journey 则给 CLI 和 TUI 带来学习时间线:Hermes 随时间积累的记忆和技能一目了然,可以就地编辑或删除。配合桌面端新的记忆图谱(自上而下、可播放的放射状时间线),你第一次可以真正"看到"agent 知道什么、如何成长,并修剪错误的部分。
成本侧同样重要:回合后的自我改进 fork(决定是否保存记忆或技能的那个)现在路由到辅助模型、消化上下文摘要而非重放整个对话、并自适应节奏——自我改进保留,主模型价格不再全额支付。
主要 PR:#51506、#55555、#55226、#49252。
后台扇出:派出一小队子代理,然后继续干活
delegate_task 现在可以一次派出多个后台并行子代理:聊天永远不被阻塞,全部子代理完成后,结果合并成一条整合回复返回。"并行调研这五个竞品""同时审计这三个模块"这类任务可以直接扔出去,然后继续做别的事,结束时拿到一份干净的总结而不用逐个盯梢。CLI 和 TUI 状态栏会跟踪后台子代理的运行状态。
桌面端:Projects 编码驾驶舱与记忆图谱
桌面端新增真正的按 profile 组织的 Projects——代码库侧栏、编码轨道、评审面板、git worktree 管理和面向 agent 的项目工具,背后是完整的 project → repo → lane 模型;文件夹选择器和 git 驾驶舱(状态、评审、worktree)都感知远程 Gateway。配套还有多终端面板(含只读的 agent 终端,标签页和回滚缓冲区跨重启保留)、聊天内 PR 风格文件 diff、文件预览面板的就地小改动编辑器。
体验层面:长线程的对话时间线导航栏、上下文用量分解弹窗、子代理观察窗的只读旁观转录、可拖拽的浮动 composer 窗口、自动朗读回复开关、窗口大小位置记忆等。宠物(Pets)功能也有一轮打磨:可选的漫游宠物、更自然的移动、帧级精确的孵化流程。底层完成了一波 composer 与"上帝文件"拆解重构,并通过共享 WebSocket 层让桌面端与 Dashboard(hermes serve)解耦。
主要 PR:#49037、#54385、#54517、#50731、#55226。
Gateway 规模化:scale-to-zero 与 drain 协调
Gateway 现在可以在空闲时休眠,并在重启、迁移或自动更新前干净地静默——不丢失进行中的对话。托管或纯 relay 的 Hermes 实例可以在无人使用时缩容到零、有请求时按需唤醒;破坏性生命周期操作会协调外部 drain,没有人会在回合中途被掐断。修复还包括把 restart_drain_timeout 默认为 0 以消除一个 systemd 崩溃循环、自愈卡在 draining/degraded 状态的 gateway。
Relay 推进到 Phase 5/6:唤醒原语、缓冲翻转、passthrough_forward over WS、每 agent 多平台身份、按投递(而非 source.platform)授权 relay 事件等。Dashboard 侧新增未认证自动跳转 portal SSO、自托管 OIDC 的 confidential client(client_secret)支持、Keys 页面管理任意自定义 .env 键。API server 增加可配置的并发运行上限以防 DoS。
主要 PR:#52243、#52937、#54824、#55344、#50007。
模型与 provider:Google Vertex AI 一等接入
Vertex AI 成为 Gemini 模型的一等 provider(走 Vertex 的 OpenAI 兼容端点)。过去用普通自定义 provider 接 Vertex 总是会话中途报错,原因是 Vertex 没有静态 API Key——每个请求都需要从服务账号 JSON 或应用默认凭据(ADC)铸造约 1 小时时效的 OAuth2 token。Hermes 现在自动铸造并续期这些 token:如果你的组织通过 Google Cloud 运行 Gemini,把 Hermes 指向服务账号即可,无需粘贴 token,也不会中途过期。
其他 provider 变化:Krea 接入托管的 Nous Subscription gateway;Z.AI 新增端点选择器(Global/China/Coding Plan);Ollama cloud 接通 reasoning_effort;移除 google-gemini-cli 与 google-antigravity OAuth provider;Nous OAuth 支持 NOUS_INFERENCE_BASE_URL 覆盖。
消息平台:可续接的 cron 与多平台增强
Cron continuations 是本次消息侧的主线:cron 任务的产出现在可以直接续聊(优先线程续接,回退 DM 镜像),Slack 支持频道内扁平续接投递,创建/列出 cron 时若 gateway 未运行会给出警告。
各平台增强:Telegram 命令菜单可配置且默认上限提高(技能不再被挤出菜单)、富草稿预览单独开关;Slack 可选 Block Kit 渲染 agent 消息;Discord 支持把推理过程渲染为 -# 子文本;WhatsApp 经 Baileys bridge 原生投递媒体;Teams 原生发送视频/语音/文档;photon sidecar 升级 spectrum-ts v8 并支持 tapback 关联;Raft 新增 gateway 配置向导;Signal 支持 AAC 语音条转封装。slack/dingtalk/whatsapp/matrix/feishu/telegram/wecom/email/sms 适配器迁移为 bundled。
主要 PR:#52250、#56254、#51716、#56102、#53598、#49408。
安全与可靠性:凭据边界与 cron 可靠性专项
本窗口集中加固了多个面:MCP 配置持久化攻击面收紧;拦截可外泄 provider 凭据的 cron base_url 覆盖;文件读取中前缀密钥使用一次性哨兵;Slack App-Level(xapp-)token 脱敏;所有浏览器后端强制云元数据下限(CDP 非本地);browser_back 导航后重查私网守卫;/resume 与 /sessions 按调用方来源隔离(修复 IDOR);懒加载消息路径统一 aiohttp 3.14.1 CVE 下限并加防漂移守卫。
cron 可靠性专项:未固定模型的任务在 provider 漂移时安全失败(fail closed);错过宽限期的任务补跑一次而不是永远顺延;ticker 在 BaseException 下保活并带心跳感知状态;已启用的 MCP server 叠加到按任务 toolset 上。Windows 侧:抑制控制台闪烁、加固 gateway 重启、GUI 更新后无窗口重生 gateway、whatsapp/desktop 优先使用托管 node。
主要 PR:#50476、#56196、#54166、#56227、#56237、#51051、#50062。
其他值得注意的变化
/prompt在编辑器里写提示词:打开$EDITOR用真正的 markdown 写长的多行提示词,保存后作为下一条消息排队——对经常写长指令的用户是极大的体验改善。- CLI / TUI 新增
/reasoning full(不设上限的思考展示)、/timestamps与/history时间戳、内置工具的友好人话标签。 - Blank Slate 极简安装模式:从一个最小 agent 开始,所有能力按需开启。
- Agent loop:
web_extract改为截断存储而非 LLM 摘要;@ 引用并发展开;一次性 LLM 助手 +llm.oneshotgateway RPC;支持多个HERMES_WRITE_SAFE_ROOT目录。 - 压缩与会话:就地压缩(单会话 ID)成为默认;升级前快照现在包含
projects.db和 Kanban 看板。 - Kanban:任务生命周期插件钩子(claimed/completed/blocked)、类型化阻塞原因与解锁循环断路器、交接新鲜度标记。
- 技能:新增
cloudflare-temporary-deploy可选技能、creative-ideation v2.1.0 方法库;LSP 新增 PowerShellEditorServices;mem0 升级 v3 API 并支持 OSS 模式。 - 性能:gateway 平台适配器懒加载、libyaml
CSafeLoader解析配置、FTS5 段合并与handoff_state索引缓解写锁竞争、list_profiles单趟扫描。 - 桌面端 Dashboard 均支持备份的导入/创建/下载。
- 本窗口有四项变更回滚以待重新评估:cron 任务存储回到按 profile、不再克隆
auth.json(复制 OAuth 授权会导致兄弟实例被吊销)、Windows 终端弹窗方案、prompt_caching.enabled开关。
升级建议
常规升级仍然使用:
hermes update
如果你使用包管理器、Docker、Nix 或 Windows 原生安装,请按对应安装方式升级到当前稳定版。本版包含一次 v32 配置迁移(verify-on-stop 默认值),升级前建议先确认当前安装路径、Gateway 暴露方式、消息平台凭据、MCP 配置和长期记忆路径。
升级后建议做五件事:
- 运行
hermes --version,确认版本已经到 v0.18.0。 - 在模型选择器里确认
moaprovider 下的预设是否符合预期;如果之前依赖/moa持久切换,注意它现在是一次性行为。 - 如果你在编码场景使用
/goal或依赖任务自动收尾,检查 verify-on-stop 迁移后的默认值是否符合你的预期。 - 如果使用 cron 定时任务,验证一个常用任务的触发与续聊行为(本版 cron 存储回到按 profile)。
- 试一次
/learn和/journey,看看 Hermes 为你沉淀了什么——顺手清掉不想保留的记忆。