Hermes Agent v0.14.0 发布说明
发布日期:2026 年 5 月 16 日 官方标签:
v2026.5.16与上一版对比:v2026.5.7...v2026.5.16
本页基于官方 GitHub 发布说明做了结构化中文整理,便于快速浏览。
一句话概览
官方将本次更新命名为 「The Foundation Release(基石版本)」,核心主题是:
Hermes Agent 开始把安装、运行、扩展和跨平台使用这些基础问题一次性补齐。
重点变化:
pip install hermes-agent正式可用,轮子内置 Ink TUI bundle 与 shell launcher,不再必须克隆仓库或跑 shell installer。- 安装体积大幅瘦身:Slack / Matrix / 飞书 / 钉钉、图像生成、语音、Camofox、Codex app-server 等重型后端改为首次使用时懒安装,
[all]extras 删除已被 lazy-deps 覆盖的依赖。 - 原生 Windows 进入早期 Beta:PowerShell 安装器、MinGit 自动安装、Microsoft Store Python stub 检测、Ctrl+C 前台处理等基础链路落地。
- xAI Grok 通过 SuperGrok OAuth 接入,
grok-4.3升级到 1M token 上下文窗口。 hermes proxy本地 OpenAI-compatible 代理:把 Claude Pro、ChatGPT Pro、SuperGrok 等 OAuth provider 暴露为 OpenAI API endpoint,Codex / Aider / Cline / Continue 可直接接入。x_search成为一等 X(Twitter)搜索工具,支持 OAuth 或 API Key。- Microsoft Teams 端到端接通:Graph 鉴权、webhook listener、pipeline runtime 与 outbound delivery 一起落地。
- 性能大幅改善:
hermes启动少约 19 秒;browser_console评估改走持久 CDP 连接,官方称提升 180 倍。 - LINE + SimpleX Chat 新增为消息平台,总平台数来到 22。
- 跨会话 1 小时 Claude prompt cache、
/handoff实时迁移会话、Telegram / Discord 的clarify原生按钮、Discord 历史消息回填。 - 写入诊断升级:每轮文件变更摘要 + LSP 语义诊断,明显强于 v0.13.0 的语法级 post-write lint。
vision_analyze直接把像素交给视觉模型,新增统一可插拔video_generate,computer_use的 cua-driver 现在可用于非 Anthropic provider。- 插件系统继续扩展:插件可通过
ctx.llm调用当前模型、用tool_override替换内置工具。 - Skills Hub 默认接入
huggingface/skillstrusted tap,新增 9 个 optional skill。 - 12 个 P0 + 50 个 P1 问题关闭,安全侧包括 sudo bypass、SSRF、dashboard auth、供应链 advisory checker 等。
规模数据(自 v0.13.0 起):808 次提交 · 633 个合并 PR · 1,393 个文件变更 · 165,061 行新增 · 545 个 issue 关闭(含 12 个 P0、50 个 P1) · 215 位社区贡献者。
我应该升级吗?
如果你属于以下任一场景,建议优先升级 v0.14.0:
- 新装 Hermes 或给团队铺环境 —— PyPI 包 + 依赖懒安装 + 分层 fallback,让安装流程更接近普通 Python CLI。
- Windows 用户 —— 原生 Windows 已进入 early beta,不再必须依赖 WSL 才能跑基本 loop。
- 有 Claude Pro / ChatGPT Pro / SuperGrok 订阅 ——
hermes proxy可把 OAuth 订阅变成 OpenAI-compatible endpoint,复用到 Codex、Aider、Cline、Continue 等工具。 - 需要 Grok 大上下文 —— SuperGrok OAuth +
grok-4.31M context 适合整仓库、长文档、研究资料集输入。 - 经常做网页 / 浏览器自动化 —— 持久 CDP 连接让
browser_console从秒级变成毫秒级调用。 - 长时间使用 Claude —— 1 小时跨会话 prompt cache 会让
/new后的系统提示、skills、memory 前缀继续复用缓存。 - 用 Teams / LINE / SimpleX Chat 做消息入口 —— Teams 已补齐端到端链路,LINE 与 SimpleX Chat 新增为原生平台。
- 依赖 Agent 写代码或改文件 —— LSP 语义诊断 + 每轮文件变更 footer 能更早暴露写入失败、类型错误、缺失 import 等问题。
- 做插件或内部扩展 ——
ctx.llm与tool_override让插件可以复用当前 provider / credentials,并可替换核心工具实现。 - 关注安全和企业部署 —— 本次关闭 12 个 P0 与 50 个 P1,重点覆盖 sudo、SSRF、dashboard auth、供应链扫描、quick command 输出净化等路径。
所有用户 都建议测试后升级:本次既有安装与性能基础设施,也有安全修复;尤其是网关、插件、浏览器、文件写入、Codex runtime 和多平台消息通道用户,升级收益更明显。
重点亮点
PyPI 安装 + 依赖瘦身
Hermes Agent 现在可以直接:
pip install hermes-agent
hermes
官方 wheel 内置 Ink TUI bundle 和 shell launcher。更重要的是,过去 pip install hermes-agent 会把很多你不一定会用到的适配器和 SDK 一起装上;v0.14.0 改为重型后端首次使用时再安装。
懒安装覆盖的典型组件包括 Slack / Matrix / 飞书 / 钉钉 adapter、hindsight client、Codex app-server、Pixverse / Camofox / image-gen SDK、voice / TTS provider 等。[all] extras 也同步删除了 lazy-deps 已覆盖的依赖。
主要 PR:#24220、#24515、#25014、#25038、#25766、#21818、#26593、#26148。
原生 Windows 支持进入早期 Beta
v0.14.0 开始,Hermes 可以在 cmd.exe 与 PowerShell 下原生运行。官方同时补了完整 PowerShell 安装器、MinGit 自动安装、Microsoft Store Python stub 检测、前台 Ctrl+C 处理等基础能力。
这仍是 early beta:官方明确还有边角问题,但在干净 Windows 机器上的基本 loop 已经能跑通。 主要 PR:#21561。
SuperGrok OAuth + Grok 1M 上下文
如果你有 SuperGrok 订阅,现在可以通过 xAI 账号登录,在 Hermes 内直接使用 Grok,无需单独 API Key。grok-4.3 同时升级到 1M token context window,适合整仓库、长篇资料、研究语料等一次性输入。
本次还补了 entitlement error 处理,以及 SSH 到远程机器时如何完成 OAuth 的 tunnel 文档。 主要 PR:#26534、#26664、#26644、#26592。
hermes proxy:OAuth 订阅变成 OpenAI-compatible endpoint
新增 hermes proxy。它会在本机启动一个 OpenAI API 兼容 endpoint,背后实际走你已登录的 OAuth provider,例如 Claude Pro、ChatGPT Pro、SuperGrok。
这意味着 Codex CLI、Aider、Cline、Continue 或自写脚本,只要支持 OpenAI-compatible endpoint,就可以复用现有订阅,不需要额外 API Key。 主要 PR:#25969。
x_search:X / Twitter 搜索成为内置工具
x_search 成为 Hermes 的一等工具,不再需要安装 skill 或手写集成。Agent 可以直接搜索 X 时间线、查找 thread、定位具体帖子。鉴权支持 X OAuth 或 API Key。
主要 PR:#26763。
Microsoft Teams 端到端接通
Teams 在 v0.12.0 已作为插件平台出现,这次补齐了真正可用的端到端链路:Microsoft Graph auth、client foundation、接收 Teams 事件的 webhook listener、pipeline plugin runtime,以及 outbound delivery。
配置好 bot 后,可以在 Teams channel、DM 或群聊中直接和 Hermes 对话。 主要 PR:#21922、#21969、#22007、#22024。
性能:冷启动少约 19 秒,浏览器调用 180 倍加速
本次性能优化有两条主线:
- 冷启动:重型 adapter 延迟加载,模型 catalog 优先读磁盘缓存,doctor 检查并行,
chat -q可跳过欢迎 banner。官方称hermes启动少约 19 秒,hermes tools的 All-Platforms 页面从 14 秒降到 1.5 秒以内。 - 浏览器工具:
browser_console评估复用同一个 Chrome DevTools 持久连接,不再每次开新 DevTools session;官方称提升 180 倍。
主要 PR:#22138、#22120、#22681、#22790、#22808、#22831、#22859、#22904、#22766、#25341、#23226。
Claude 跨会话 1 小时 prompt cache
使用 Claude(Anthropic / OpenRouter / Nous Portal)时,system prompt、skills、memory 等 prompt 前缀现在可以跨会话缓存 1 小时。
实际收益是:刚开 /new 会话也能复用上一轮还热着的缓存,首轮响应更快、成本更低;后台 memory review 也能命中这份缓存。
主要 PR:#23828、#25434、#24778。
LINE + SimpleX Chat:平台数到 22
新增两个消息平台:
- LINE:面向日本、韩国、台湾等地区的 LINE Messaging API。
- SimpleX Chat:无用户 ID 的隐私导向去中心化聊天平台。
加上它们后,Hermes 支持的消息平台总数达到 22。 主要 PR:#23197、#26232。
/handoff:会话可以实时转交
/handoff 现在会把当前活跃会话完整迁移到目标 model、persona 或 profile:消息、工具调用、上下文全部保留。
这适合在调试中途把会话从快模型交给深度推理模型,或在不同 profile 之间交接任务分工。 主要 PR:#23395。
clarify 原生按钮 + Discord 历史回填
- Telegram 和 Discord 上,
clarify多选题现在会显示平台原生按钮,不再要求用户手打选项编号。 - Hermes 首次加入 Discord channel 或 thread 时,会默认读取近期消息历史,再决定如何回复。
写入诊断:从语法 lint 升级到 LSP 语义诊断
v0.13.0 的 post-write lint 主要检查 Python / JSON / YAML / TOML 语法。v0.14.0 又往前走了一步:
- 每轮文件变更 footer:Agent 在每个修改文件的 turn 后都会看到简短的磁盘变更摘要,包括文件路径、行数、真实 delta。
- LSP 语义诊断:
write_file/patch后运行真实 language server,把新增错误反馈给 Agent。类型错误、未定义符号、缺失 import 这类问题可以更早暴露。
视觉、视频与桌面控制
vision_analyze直接传像素:如果当前模型具备视觉能力,图片不再先转成文字描述,而是把原始像素交给 GPT-5、Claude、Gemini、Grok-vision 等视觉模型。- 统一
video_generate:视频生成改为一个可插拔工具,后端 provider 可以通过插件添加。 computer_usecua-driver 后端:现在不再绑定 Anthropic SDK,非 Anthropic provider 也能驱动 GUI,且补了 focus-safe 操作与hermes update后刷新机制。
主要 PR:#22955、#25126、#21967、#24063。
终端与 ACP:链接可点击,Zed 一键安装
- 任何支持 OSC8 的终端中,Agent 输出里的 URL 现在是可点击链接,减少复制长链接的摩擦。
- Zed ACP Registry 集成:Hermes 进入 Zed Agent Client Protocol registry,安装路径走
uvx,不依赖 npm;hermes acp --setup-browser可为 registry 安装补齐浏览器工具。
主要 PR:#25071、#24013、#26079、#26120、#26234。
Provider 与模型:Pareto Code、NovitaAI、Qwen Cloud
- OpenRouter Pareto Code router 新增
min_coding_score配置项,可按编码质量下限选择更便宜的模型。 - NovitaAI 成为新 provider,补充开源模型托管路径。
- Alibaba Cloud provider 在 UI 中改名为 Qwen Cloud,旧配置键继续兼容。
- Codex app-server runtime 为 OpenAI / Codex 路径提供可选 runtime,支持 session reuse、wedged session 退休、OAuth refresh 分类等。
主要 PR:#22838、#25507、#24835、#24182、#25769。
插件系统:ctx.llm 与 tool_override
插件作者现在可以:
- 通过
ctx.llm直接调用当前 provider / model / credentials,不需要自己接 client。 - 通过
tool_override替换内置工具实现。 - 使用
standalone_sender_fn做 out-of-process cron delivery。 - 打开
HERMES_PLUGINS_DEBUG=1查看插件发现日志。
主要 PR:#23194、#26759、#22461、#22684。
Skills Hub 默认接入 Hugging Face tap + 9 个新 optional skill
Skills Hub 默认接入 hermes-skills/huggingface trusted tap。新技能发布到 Hugging Face 后,用户可以从自己的 hermes skills 浏览器里直接安装。
新增 9 个 optional skill:
- Hyperliquid:perp / spot trading,走 SDK + REST。
- Yahoo Finance:市场数据、基本面、历史数据。
- api-testing:REST / GraphQL 调试配方。
- Unified EVM multi-chain:统一覆盖 Ethereum、L2、Base 等链。
- darwinian-evolver:进化式 prompt / skill 调优。
- osint-investigation:人物、域名、组织 OSINT 调查配方。
- pinggy-tunnel:把本地服务暴露到公网。
- watchers:通过 cron
no_agent轮询 RSS / HTTP JSON / GitHub 做变更检测。 - Notion overhaul:适配 2026 年 5 月 Developer Platform。
主要 PR:#26219、#23582、#23583、#23590、#25299、#26760、#26729、#26765、#21881、#26612。
搜索与 Web 工具
- Brave Search 免费层 与 DDGS / DuckDuckGo 加入 web-search provider。
- Tavily
/crawl支持 Bearer auth header。 x_search单独成为 X / Twitter 搜索工具。
Kanban 继续补强
v0.14.0 不是 Kanban 的首发版本,但继续补了不少实用能力:
specify:用辅助 LLM 展开 triage task。- orchestrator board tools:新增
kanban_list与kanban_unblock。 stranded_in_ready:诊断无人认领的 ready 任务。- Dashboard batch QOL、全局 tooltip / docs link、notifier delivery 去重与失败回滚。
- 移除
kanban_comment中 caller-controlled author override,并清理 comment author 渲染。
主要 PR:#21435、#23012、#23578、#23550、#21541、#23401、#23423、#22435、#22769。
Cron 与 API Server
- Cron 支持
deliver=all,可向所有已连接 channel 广播。 - job 操作支持按名称查找。
- 修复空 Cron dashboard tab 与 partial-record crash。
- cron origin 不再注入
HERMES_SESSION_*contextvars。 - API server 暴露 run approval events,避免程序化调用时因为审批请求静默挂住。
主要 PR:#21495、#26231、#22389、#22382、#21899。
CLI / TUI / Dashboard
CLI:
- banner 与状态栏显示 YOLO 模式警告。
- destructive slash command 增加确认提示。
- 新增
docker_extra_args与display.timestamps。 - delegate 工具描述展示真实并发与 spawn-depth 限制。
TUI:
- 新增
/sessions,可浏览和恢复历史会话。 - 支持 attach 到已有 gateway。
- markdown link 解析为可读标题。
- markdown table 支持宽度感知渲染,窄屏可纵向 fallback。
- 审批 / clarify / confirm prompt 期间允许滚动 transcript 与按 Esc。
- 切换 personality 时保留当前 session。
Dashboard / GUI:
- embedded TUI 走 dashboard gateway。
- token / cost analytics 默认隐藏在配置项后。
- Langfuse observability 修复。
- Cron modal 与 analytics 继续打磨。
主要 PR:#26238、#22687、#23599、#22694、#20805、#21846、#21978、#24013、#26195、#26717、#26414、#20942、#21979、#25438、#26320。
安全加固:12 个 P0 + 50 个 P1 关闭
本次安全与可靠性修复规模很大,重点包括:
- sudo brute-force block、
sudo-stdin/askpass变体标记为 DANGEROUS。 - 关闭多个 dangerous-command detection bypass,并净化 tool error 再注入模型上下文的路径。
- 修复 Skills Hub 剩余 SSRF fetch path。
- Dashboard plugin API routes 要求 auth。
- quick commands 中净化 env 并脱敏输出。
- 减少 subprocess 调用中的不必要
shell=True。 - Google Chat relay 的 sender_type 净化。
- 安装时加入 supply-chain advisory checker。
- 安全策略改为明确 OS-level isolation 是边界。
主要 PR:#23736、#26829、#26823、#22843、#23220、#23584、#25149、#22432、#24220、#20317。
可靠性修复
- SQLite 在 NFS / SMB / FUSE 上自动回退到
journal_mode=DELETE,修复网络挂载上的/resume。 - Codex runtime 退休 wedged sessions,加入 post-tool watchdog 与 OAuth refresh 分类。
- MCP 初始鉴权失败不再反复重试。
- Gateway 在平台失败时保持运行,引入 per-platform circuit breaker 与
/platform。 - ACP 支持 inline file attachment resources。
- CI shared PR checks unblock 与状态稳定化。
主要 PR:#22043、#25769、#26260、#25776、#25778、#26600、#21407、#21012、#25957。
i18n:16 个语言环境
Gateway commands 与 Web Dashboard 完成更完整的本地化,本次新增 8 个 locale,总数来到 16 个。 主要 PR:#22914。
文档、测试与已回滚内容
文档:
- 修复 Voice & TTS provider 表。
- Skills Hub 左侧栏显示 per-skill 页面。
- Gateway help 与 docstring 提及微信。
- Skills Hub 信息面板更丰富。
- 大量 provider、platform、skill、Windows 安装路径、dashboard 文档打磨。
测试与 CI:
- 共享 PR 检查解锁与 shared test state 稳定。
- 平台、provider、plugin、边界情况新增大量回归覆盖。
已回滚 / 调整:
/goalchecklist +/subgoalfeature stack 被回滚;/subgoal后来以更简单形式回归。- Scrollback box width clamp 回滚,以恢复全宽边框。
fix(cli): tolerate unreadable dirs when building systemd PATH被回滚。
贡献者
核心
- @teknium1:release lead、architecture,本窗口约 406 个 PR 合入。
主要社区贡献者
- @kshitijk4poor — 38 个 PR · Telegram cadence / streaming / topic routing、安全加固(sudo、SSRF、kanban_comment、dashboard auth)、Codex runtime hygiene、NovitaAI provider、profile / banner 修复、飞书 update card、gateway QOL。
- @alt-glitch — 13 个 PR · Markdown table TUI rendering、
HERMES_SESSION_ID环境变量、hindsight-client optional dependency、NixextraDependencyGroups。 - @OutThisLife(Brooklyn Nicholson) — 12 个 PR · TUI turn segmentation、attach-to-gateway、markdown link titles、dashboard gateway embedded TUI、Ink cursor sync、prompts 期间滚动 / Esc。
- @austinpickett — 8 个 PR ·
/sessionsslash command、personality 切换保留 session、cron modals、dashboard analytics。 - @helix4u — 5 个 PR · Google Chat setup、system Chromium 下跳过 browser install、Windows Ctrl+C preservation。
- @rob-maron — 4 个 PR · Nous Portal 作为 model metadata authority、provider polish。
- @stephenschoettler — 3 个 PR · CI stabilization。
- @ethernet8023 — 3 个 PR · platform / gateway work。
其他贡献
完整贡献者列表非常长,包含 215 位社区贡献者(含 co-author)。请参阅官方发布页。