跳到主要内容

Hermes Agent v0.14.0 发布说明

发布日期:2026 年 5 月 16 日 官方标签:v2026.5.16 与上一版对比:v2026.5.7...v2026.5.16

本页基于官方 GitHub 发布说明做了结构化中文整理,便于快速浏览。

一句话概览

官方将本次更新命名为 「The Foundation Release(基石版本)」,核心主题是:

Hermes Agent 开始把安装、运行、扩展和跨平台使用这些基础问题一次性补齐。

重点变化:

  • pip install hermes-agent 正式可用,轮子内置 Ink TUI bundle 与 shell launcher,不再必须克隆仓库或跑 shell installer。
  • 安装体积大幅瘦身:Slack / Matrix / 飞书 / 钉钉、图像生成、语音、Camofox、Codex app-server 等重型后端改为首次使用时懒安装,[all] extras 删除已被 lazy-deps 覆盖的依赖。
  • 原生 Windows 进入早期 Beta:PowerShell 安装器、MinGit 自动安装、Microsoft Store Python stub 检测、Ctrl+C 前台处理等基础链路落地。
  • xAI Grok 通过 SuperGrok OAuth 接入grok-4.3 升级到 1M token 上下文窗口
  • hermes proxy 本地 OpenAI-compatible 代理:把 Claude Pro、ChatGPT Pro、SuperGrok 等 OAuth provider 暴露为 OpenAI API endpoint,Codex / Aider / Cline / Continue 可直接接入。
  • x_search 成为一等 X(Twitter)搜索工具,支持 OAuth 或 API Key。
  • Microsoft Teams 端到端接通:Graph 鉴权、webhook listener、pipeline runtime 与 outbound delivery 一起落地。
  • 性能大幅改善hermes 启动少约 19 秒;browser_console 评估改走持久 CDP 连接,官方称提升 180 倍。
  • LINE + SimpleX Chat 新增为消息平台,总平台数来到 22。
  • 跨会话 1 小时 Claude prompt cache/handoff 实时迁移会话、Telegram / Discord 的 clarify 原生按钮、Discord 历史消息回填。
  • 写入诊断升级:每轮文件变更摘要 + LSP 语义诊断,明显强于 v0.13.0 的语法级 post-write lint。
  • vision_analyze 直接把像素交给视觉模型,新增统一可插拔 video_generatecomputer_use 的 cua-driver 现在可用于非 Anthropic provider。
  • 插件系统继续扩展:插件可通过 ctx.llm 调用当前模型、用 tool_override 替换内置工具。
  • Skills Hub 默认接入 huggingface/skills trusted tap,新增 9 个 optional skill。
  • 12 个 P0 + 50 个 P1 问题关闭,安全侧包括 sudo bypass、SSRF、dashboard auth、供应链 advisory checker 等。

规模数据(自 v0.13.0 起):808 次提交 · 633 个合并 PR · 1,393 个文件变更 · 165,061 行新增 · 545 个 issue 关闭(含 12 个 P0、50 个 P1) · 215 位社区贡献者

我应该升级吗?

如果你属于以下任一场景,建议优先升级 v0.14.0

  1. 新装 Hermes 或给团队铺环境 —— PyPI 包 + 依赖懒安装 + 分层 fallback,让安装流程更接近普通 Python CLI。
  2. Windows 用户 —— 原生 Windows 已进入 early beta,不再必须依赖 WSL 才能跑基本 loop。
  3. 有 Claude Pro / ChatGPT Pro / SuperGrok 订阅 —— hermes proxy 可把 OAuth 订阅变成 OpenAI-compatible endpoint,复用到 Codex、Aider、Cline、Continue 等工具。
  4. 需要 Grok 大上下文 —— SuperGrok OAuth + grok-4.3 1M context 适合整仓库、长文档、研究资料集输入。
  5. 经常做网页 / 浏览器自动化 —— 持久 CDP 连接让 browser_console 从秒级变成毫秒级调用。
  6. 长时间使用 Claude —— 1 小时跨会话 prompt cache 会让 /new 后的系统提示、skills、memory 前缀继续复用缓存。
  7. 用 Teams / LINE / SimpleX Chat 做消息入口 —— Teams 已补齐端到端链路,LINE 与 SimpleX Chat 新增为原生平台。
  8. 依赖 Agent 写代码或改文件 —— LSP 语义诊断 + 每轮文件变更 footer 能更早暴露写入失败、类型错误、缺失 import 等问题。
  9. 做插件或内部扩展 —— ctx.llmtool_override 让插件可以复用当前 provider / credentials,并可替换核心工具实现。
  10. 关注安全和企业部署 —— 本次关闭 12 个 P0 与 50 个 P1,重点覆盖 sudo、SSRF、dashboard auth、供应链扫描、quick command 输出净化等路径。

所有用户 都建议测试后升级:本次既有安装与性能基础设施,也有安全修复;尤其是网关、插件、浏览器、文件写入、Codex runtime 和多平台消息通道用户,升级收益更明显。

重点亮点

PyPI 安装 + 依赖瘦身

Hermes Agent 现在可以直接:

pip install hermes-agent
hermes

官方 wheel 内置 Ink TUI bundle 和 shell launcher。更重要的是,过去 pip install hermes-agent 会把很多你不一定会用到的适配器和 SDK 一起装上;v0.14.0 改为重型后端首次使用时再安装

懒安装覆盖的典型组件包括 Slack / Matrix / 飞书 / 钉钉 adapter、hindsight client、Codex app-server、Pixverse / Camofox / image-gen SDK、voice / TTS provider 等。[all] extras 也同步删除了 lazy-deps 已覆盖的依赖。 主要 PR:#24220#24515#25014#25038#25766#21818#26593#26148

原生 Windows 支持进入早期 Beta

v0.14.0 开始,Hermes 可以在 cmd.exe 与 PowerShell 下原生运行。官方同时补了完整 PowerShell 安装器、MinGit 自动安装、Microsoft Store Python stub 检测、前台 Ctrl+C 处理等基础能力。

这仍是 early beta:官方明确还有边角问题,但在干净 Windows 机器上的基本 loop 已经能跑通。 主要 PR:#21561

SuperGrok OAuth + Grok 1M 上下文

如果你有 SuperGrok 订阅,现在可以通过 xAI 账号登录,在 Hermes 内直接使用 Grok,无需单独 API Key。grok-4.3 同时升级到 1M token context window,适合整仓库、长篇资料、研究语料等一次性输入。

本次还补了 entitlement error 处理,以及 SSH 到远程机器时如何完成 OAuth 的 tunnel 文档。 主要 PR:#26534#26664#26644#26592

hermes proxy:OAuth 订阅变成 OpenAI-compatible endpoint

新增 hermes proxy。它会在本机启动一个 OpenAI API 兼容 endpoint,背后实际走你已登录的 OAuth provider,例如 Claude Pro、ChatGPT Pro、SuperGrok。

这意味着 Codex CLI、Aider、Cline、Continue 或自写脚本,只要支持 OpenAI-compatible endpoint,就可以复用现有订阅,不需要额外 API Key。 主要 PR:#25969

x_search 成为 Hermes 的一等工具,不再需要安装 skill 或手写集成。Agent 可以直接搜索 X 时间线、查找 thread、定位具体帖子。鉴权支持 X OAuth 或 API Key。 主要 PR:#26763

Microsoft Teams 端到端接通

Teams 在 v0.12.0 已作为插件平台出现,这次补齐了真正可用的端到端链路:Microsoft Graph auth、client foundation、接收 Teams 事件的 webhook listener、pipeline plugin runtime,以及 outbound delivery。

配置好 bot 后,可以在 Teams channel、DM 或群聊中直接和 Hermes 对话。 主要 PR:#21922#21969#22007#22024

性能:冷启动少约 19 秒,浏览器调用 180 倍加速

本次性能优化有两条主线:

  • 冷启动:重型 adapter 延迟加载,模型 catalog 优先读磁盘缓存,doctor 检查并行,chat -q 可跳过欢迎 banner。官方称 hermes 启动少约 19 秒,hermes tools 的 All-Platforms 页面从 14 秒降到 1.5 秒以内。
  • 浏览器工具browser_console 评估复用同一个 Chrome DevTools 持久连接,不再每次开新 DevTools session;官方称提升 180 倍。

主要 PR:#22138#22120#22681#22790#22808#22831#22859#22904#22766#25341#23226

Claude 跨会话 1 小时 prompt cache

使用 Claude(Anthropic / OpenRouter / Nous Portal)时,system prompt、skills、memory 等 prompt 前缀现在可以跨会话缓存 1 小时。

实际收益是:刚开 /new 会话也能复用上一轮还热着的缓存,首轮响应更快、成本更低;后台 memory review 也能命中这份缓存。 主要 PR:#23828#25434#24778

LINE + SimpleX Chat:平台数到 22

新增两个消息平台:

  • LINE:面向日本、韩国、台湾等地区的 LINE Messaging API。
  • SimpleX Chat:无用户 ID 的隐私导向去中心化聊天平台。

加上它们后,Hermes 支持的消息平台总数达到 22。 主要 PR:#23197#26232

/handoff:会话可以实时转交

/handoff 现在会把当前活跃会话完整迁移到目标 model、persona 或 profile:消息、工具调用、上下文全部保留。

这适合在调试中途把会话从快模型交给深度推理模型,或在不同 profile 之间交接任务分工。 主要 PR:#23395

clarify 原生按钮 + Discord 历史回填

  • Telegram 和 Discord 上,clarify 多选题现在会显示平台原生按钮,不再要求用户手打选项编号。
  • Hermes 首次加入 Discord channel 或 thread 时,会默认读取近期消息历史,再决定如何回复。

主要 PR:#24199#25485#25984

写入诊断:从语法 lint 升级到 LSP 语义诊断

v0.13.0 的 post-write lint 主要检查 Python / JSON / YAML / TOML 语法。v0.14.0 又往前走了一步:

  • 每轮文件变更 footer:Agent 在每个修改文件的 turn 后都会看到简短的磁盘变更摘要,包括文件路径、行数、真实 delta。
  • LSP 语义诊断write_file / patch 后运行真实 language server,把新增错误反馈给 Agent。类型错误、未定义符号、缺失 import 这类问题可以更早暴露。

主要 PR:#24498#24168#25978

视觉、视频与桌面控制

  • vision_analyze 直接传像素:如果当前模型具备视觉能力,图片不再先转成文字描述,而是把原始像素交给 GPT-5、Claude、Gemini、Grok-vision 等视觉模型。
  • 统一 video_generate:视频生成改为一个可插拔工具,后端 provider 可以通过插件添加。
  • computer_use cua-driver 后端:现在不再绑定 Anthropic SDK,非 Anthropic provider 也能驱动 GUI,且补了 focus-safe 操作与 hermes update 后刷新机制。

主要 PR:#22955#25126#21967#24063

终端与 ACP:链接可点击,Zed 一键安装

  • 任何支持 OSC8 的终端中,Agent 输出里的 URL 现在是可点击链接,减少复制长链接的摩擦。
  • Zed ACP Registry 集成:Hermes 进入 Zed Agent Client Protocol registry,安装路径走 uvx,不依赖 npm;hermes acp --setup-browser 可为 registry 安装补齐浏览器工具。

主要 PR:#25071#24013#26079#26120#26234

Provider 与模型:Pareto Code、NovitaAI、Qwen Cloud

  • OpenRouter Pareto Code router 新增 min_coding_score 配置项,可按编码质量下限选择更便宜的模型。
  • NovitaAI 成为新 provider,补充开源模型托管路径。
  • Alibaba Cloud provider 在 UI 中改名为 Qwen Cloud,旧配置键继续兼容。
  • Codex app-server runtime 为 OpenAI / Codex 路径提供可选 runtime,支持 session reuse、wedged session 退休、OAuth refresh 分类等。

主要 PR:#22838#25507#24835#24182#25769

插件系统:ctx.llmtool_override

插件作者现在可以:

  • 通过 ctx.llm 直接调用当前 provider / model / credentials,不需要自己接 client。
  • 通过 tool_override 替换内置工具实现。
  • 使用 standalone_sender_fn 做 out-of-process cron delivery。
  • 打开 HERMES_PLUGINS_DEBUG=1 查看插件发现日志。

主要 PR:#23194#26759#22461#22684

Skills Hub 默认接入 Hugging Face tap + 9 个新 optional skill

Skills Hub 默认接入 hermes-skills/huggingface trusted tap。新技能发布到 Hugging Face 后,用户可以从自己的 hermes skills 浏览器里直接安装。

新增 9 个 optional skill:

  • Hyperliquid:perp / spot trading,走 SDK + REST。
  • Yahoo Finance:市场数据、基本面、历史数据。
  • api-testing:REST / GraphQL 调试配方。
  • Unified EVM multi-chain:统一覆盖 Ethereum、L2、Base 等链。
  • darwinian-evolver:进化式 prompt / skill 调优。
  • osint-investigation:人物、域名、组织 OSINT 调查配方。
  • pinggy-tunnel:把本地服务暴露到公网。
  • watchers:通过 cron no_agent 轮询 RSS / HTTP JSON / GitHub 做变更检测。
  • Notion overhaul:适配 2026 年 5 月 Developer Platform。

主要 PR:#26219#23582#23583#23590#25299#26760#26729#26765#21881#26612

搜索与 Web 工具

  • Brave Search 免费层DDGS / DuckDuckGo 加入 web-search provider。
  • Tavily /crawl 支持 Bearer auth header。
  • x_search 单独成为 X / Twitter 搜索工具。

主要 PR:#21337#24658#26763

Kanban 继续补强

v0.14.0 不是 Kanban 的首发版本,但继续补了不少实用能力:

  • specify:用辅助 LLM 展开 triage task。
  • orchestrator board tools:新增 kanban_listkanban_unblock
  • stranded_in_ready:诊断无人认领的 ready 任务。
  • Dashboard batch QOL、全局 tooltip / docs link、notifier delivery 去重与失败回滚。
  • 移除 kanban_comment 中 caller-controlled author override,并清理 comment author 渲染。

主要 PR:#21435#23012#23578#23550#21541#23401#23423#22435#22769

Cron 与 API Server

  • Cron 支持 deliver=all,可向所有已连接 channel 广播。
  • job 操作支持按名称查找。
  • 修复空 Cron dashboard tab 与 partial-record crash。
  • cron origin 不再注入 HERMES_SESSION_* contextvars。
  • API server 暴露 run approval events,避免程序化调用时因为审批请求静默挂住。

主要 PR:#21495#26231#22389#22382#21899

CLI / TUI / Dashboard

CLI:

  • banner 与状态栏显示 YOLO 模式警告。
  • destructive slash command 增加确认提示。
  • 新增 docker_extra_argsdisplay.timestamps
  • delegate 工具描述展示真实并发与 spawn-depth 限制。

TUI:

  • 新增 /sessions,可浏览和恢复历史会话。
  • 支持 attach 到已有 gateway。
  • markdown link 解析为可读标题。
  • markdown table 支持宽度感知渲染,窄屏可纵向 fallback。
  • 审批 / clarify / confirm prompt 期间允许滚动 transcript 与按 Esc。
  • 切换 personality 时保留当前 session。

Dashboard / GUI:

  • embedded TUI 走 dashboard gateway。
  • token / cost analytics 默认隐藏在配置项后。
  • Langfuse observability 修复。
  • Cron modal 与 analytics 继续打磨。

主要 PR:#26238#22687#23599#22694#20805#21846#21978#24013#26195#26717#26414#20942#21979#25438#26320

安全加固:12 个 P0 + 50 个 P1 关闭

本次安全与可靠性修复规模很大,重点包括:

  • sudo brute-force block、sudo-stdin / askpass 变体标记为 DANGEROUS。
  • 关闭多个 dangerous-command detection bypass,并净化 tool error 再注入模型上下文的路径。
  • 修复 Skills Hub 剩余 SSRF fetch path。
  • Dashboard plugin API routes 要求 auth。
  • quick commands 中净化 env 并脱敏输出。
  • 减少 subprocess 调用中的不必要 shell=True
  • Google Chat relay 的 sender_type 净化。
  • 安装时加入 supply-chain advisory checker。
  • 安全策略改为明确 OS-level isolation 是边界。

主要 PR:#23736#26829#26823#22843#23220#23584#25149#22432#24220#20317

可靠性修复

  • SQLite 在 NFS / SMB / FUSE 上自动回退到 journal_mode=DELETE,修复网络挂载上的 /resume
  • Codex runtime 退休 wedged sessions,加入 post-tool watchdog 与 OAuth refresh 分类。
  • MCP 初始鉴权失败不再反复重试。
  • Gateway 在平台失败时保持运行,引入 per-platform circuit breaker 与 /platform
  • ACP 支持 inline file attachment resources。
  • CI shared PR checks unblock 与状态稳定化。

主要 PR:#22043#25769#26260#25776#25778#26600#21407#21012#25957

i18n:16 个语言环境

Gateway commands 与 Web Dashboard 完成更完整的本地化,本次新增 8 个 locale,总数来到 16 个。 主要 PR:#22914

文档、测试与已回滚内容

文档:

  • 修复 Voice & TTS provider 表。
  • Skills Hub 左侧栏显示 per-skill 页面。
  • Gateway help 与 docstring 提及微信。
  • Skills Hub 信息面板更丰富。
  • 大量 provider、platform、skill、Windows 安装路径、dashboard 文档打磨。

测试与 CI:

  • 共享 PR 检查解锁与 shared test state 稳定。
  • 平台、provider、plugin、边界情况新增大量回归覆盖。

已回滚 / 调整:

  • /goal checklist + /subgoal feature stack 被回滚;/subgoal 后来以更简单形式回归。
  • Scrollback box width clamp 回滚,以恢复全宽边框。
  • fix(cli): tolerate unreadable dirs when building systemd PATH 被回滚。

贡献者

核心

  • @teknium1:release lead、architecture,本窗口约 406 个 PR 合入。

主要社区贡献者

  • @kshitijk4poor38 个 PR · Telegram cadence / streaming / topic routing、安全加固(sudo、SSRF、kanban_comment、dashboard auth)、Codex runtime hygiene、NovitaAI provider、profile / banner 修复、飞书 update card、gateway QOL。
  • @alt-glitch13 个 PR · Markdown table TUI rendering、HERMES_SESSION_ID 环境变量、hindsight-client optional dependency、Nix extraDependencyGroups
  • @OutThisLife(Brooklyn Nicholson)12 个 PR · TUI turn segmentation、attach-to-gateway、markdown link titles、dashboard gateway embedded TUI、Ink cursor sync、prompts 期间滚动 / Esc。
  • @austinpickett8 个 PR · /sessions slash command、personality 切换保留 session、cron modals、dashboard analytics。
  • @helix4u5 个 PR · Google Chat setup、system Chromium 下跳过 browser install、Windows Ctrl+C preservation。
  • @rob-maron4 个 PR · Nous Portal 作为 model metadata authority、provider polish。
  • @stephenschoettler3 个 PR · CI stabilization。
  • @ethernet80233 个 PR · platform / gateway work。

其他贡献

完整贡献者列表非常长,包含 215 位社区贡献者(含 co-author)。请参阅官方发布页