Hermes Agent 中文社区日报（详细版） 4月22日

01 来源：X

DESIGN.md 作为开放标准正式发布，双层结构（YAML 机器层 + 人类可读 rationale）

YAML Front Matter 负责机器可读的设计 token（colors、语义化命名等），正文写人类可读的 rationale，让设计规范既能被工具消费也便于人审阅。已开源，期待主流 coding agent 接入。

02 来源：X

Scarf：Swift 编写的 macOS 原生 GUI，给 Hermes AI agent 提供图形界面，支持同时管理多个本地与远程 Hermes 服务器

原生 macOS 应用，实时可视化 agent 活动、会话、配置与系统状态；一个界面同时接多个 Hermes 实例（本地 + 远程），适合需要多服务编排或做 demo 演示的场景。

03 来源：X

Obscura：Rust 实现的 AI Agent / 爬虫专用 headless 浏览器引擎，内存 30MB、启动 85ms，兼容 CDP

定位是 Headless Chrome 的替代品，相比 Chrome 动辄数 GB 内存、冷启动秒级的开销做了极致压缩。实现 CDP 协议，Puppeteer / Playwright 生态的脚本可直接迁移，适合大规模并发抓取或 Agent 浏览场景。

04 来源：Hermes 中文社区微信群 6

统信系统成功安装 Hermes，验证了跨 Linux 发行版兼容性

群友在统信操作系统上完成 Hermes 安装并运行，表明 Hermes 在非主流发行版（如统信 UOS）中具备可用性，无需额外适配即可部署。

05 来源：Hermes 中文社区微信群 17

火山方舟推出 Coding Plan 服务，支持多模型接入，订阅享9折优惠

方舟 Coding Plan 新增支持 Doubao、GLM、DeepSeek、Kimi、MiniMax 等模型，工具调用无限制；当前提供9折优惠，最低36元/月，订阅周期越长单价越低。

06 来源：Hermes 中文社区微信群 17

Termux 部署 Hermes 成为潜在轻量部署方案，有群友关注可行性

有成员提出在 Termux（Android 终端环境）中部署 Hermes 的需求，适用于移动端或无桌面环境的轻量实验场景；该路径需确认 Hermes 对 Python 3.11+ 及依赖库（如 fastapi、uvicorn）在 Termux 的兼容性。

07 来源：Hermes 中文社区微信群 7

Hermes Agent 本地部署时 context length 最低限制为 64000，需在 config.yaml 中正确配置并确保模型自身支持。

用户实测在 4090 显卡上将 config.yaml 中上下文长度设为 64000 后仍报错，说明该限制不仅取决于配置，还依赖模型权重本身是否具备对应上下文能力；建议优先选择原生支持长上下文的模型。

08 来源：Hermes 中文社区微信群 5

Hermes 官方宣布小米 Mimo 平台提供两周免费体验，相关文档已上线

小米 Mimo 平台开放 Hermes 免费试用，时长为两周，适用于新用户快速上手；文档明确说明该活动已上线，但未标注具体起止日期，需用户自行确认当前是否仍在有效期内。

09 来源：Hermes 中文社区微信群 5

OpenRouter 曾上线的‘大象模型’实为阿里蚂蚁百灵模型，更名后仍可继续使用

该模型在 OpenRouter 平台以‘大象’为代号上线后结束服务，经社区确认其技术来源为阿里蚂蚁团队研发的百灵（Bailong）多模态模型；用户可通过更换模型名称方式在兼容平台继续调用。

10 来源：Hermes 中文社区微信群 5

Hermes 支持绑定多个飞书机器人，配置可行

在飞书生态集成场景中，Hermes 允许为同一工作区或不同业务线配置多个飞书机器人，实现多渠道/多角色的 Agent 分发；该能力适用于需隔离消息流或区分权限的团队协作场景。

11 来源：Hermes 中文社区微信群 11

doocs/md 是一个开源微信 Markdown 在线编辑与渲染工具，支持本地部署

doocs/md 是一个轻量级微信 Markdown 编辑器项目，提供实时预览、代码高亮、LaTeX 渲染等功能，适合嵌入 Hermes 工作流中作为文档生成或知识整理辅助工具；GitHub 仓库已由群友分享。

12 来源：Hermes 中文社区微信群 19

企业微信机器人需配置可见范围与Hermes白名单一致，否则仅创建者可触发回复。

群内讨论指出，企业微信机器人在群聊中仅对创建者生效，是因权限设置、可见范围配置与Hermes白名单未对齐所致；建议限制授权人数并确保二者配置严格匹配，避免全员可触发导致管理失控。

13 来源：Hermes 中文社区微信群 19

Hermes暂不支持自动调用用户指导创建的Skill，需手动确认或检查模型能力边界；Qwen3.5、GLM5、StepFun CodingPlan等模型被推荐用于办公与轻量代码场景。

有用户反馈Hermes在多轮对话中未调用自定义Skill且出现逻辑混乱，属当前能力限制；群内共识推荐Qwen3.5（阿里云TokenPlan）、GLM5（VB场景）、StepFun CodingPlan（稳定低429）及OpenRouter上的Elephant-Alpha（免费）作为替代方案。

14 来源：Hermes 中文社区微信群 19

微信机器人登录白屏或失败，主因是扫码后未完成权限逐项配置或设备授权未开启；需复制链接至浏览器扫码，并手动设置权限而非全默认。

微信登录失败常见于手机扫码后白屏、二维码过期或权限未显式授权；正确流程为：复制登录链接至PC浏览器扫码 → 登录成功后在微信中向机器人发送任意消息触发配对 → 进入Hermes后逐项开启所需权限（不可全选默认），并确保设备授权已开启。

15 来源：Hermes 中文社区微信群 19

Hermes在WSL中API配置残留问题可通过删除~/.hermes/.env文件强制重置，避免旧API密钥持续覆盖新配置。

当Hermes在WSL中无法更新API（如Minimax更换为其他模型）时，旧配置可能缓存在.env文件中导致跳过URL输入步骤；直接删除~/.hermes/.env文件后重新运行hermes setup即可触发完整配置流程。

16 来源：Hermes 中文社区微信群 14

Hermes 与 Ollama 组合对硬件要求不高，普通家用 PC 可运行文字类任务；8B 模型推荐 RTX 4060 或 Mac Mini 等平台。

群内确认 Hermes 本身与 Ollama 集成无高硬件门槛，仅处理文本时普通家用 PC 即可；若需运行 8B 模型，RTX 4060 或 Mac Mini（尤其高内存版）是性价比之选；Mac 统一内存机制在本地推理中具备调度优势。

17 来源：Hermes 中文社区微信群 9

OpenWebUI 可与 Hermes 集成，支持知识库、外部提示词、技能和工具库调用。

群友分享了将 Hermes 作为模型接入 OpenWebUI 的实践，可复用其内置知识库功能，并在 WebUI 中集成额外提示词、技能及工具库，提升 Hermes 的上下文延续与多模态能力。该方案还支持手机远程访问和命令行免重启对话。

18 来源：Hermes 中文社区微信群 18

本地知识库推荐 mem0 + Qdrant + Ollama 嵌入方案，无需 API Key，纯本地运行

针对本地敏感数据场景，群友实践并推荐 mem0 作为记忆插件，搭配 Ollama 运行轻量嵌入模型（如 nomic-embed-text）、Qdrant 向量数据库，实现全自动记忆召回；CPU 即可运行，不依赖 GPU，且支持 Docker 一键部署。

19 来源：Hermes 中文社区微信群 18

Hermes 支持多模型配置与动态切换，推荐按任务复杂度分层使用：免费模型处理常规任务，DeepSeek-v3.2 处理复杂编码

群友验证 Hermes 可配置多个模型（如 gemma-4-e4b-it、DeepSeek-v3.2、Qwen3），通过 CLI 或 Web UI 自由切换；复杂任务（如 Excel 公式平移合并）推荐使用 DeepSeek-v3.2，而日常查询可用免费 7B 模型，兼顾成本与效果。

20 来源：Hermes 中文社区微信群 18

本地模型部署推荐 vLLM 替代 Ollama，尤其对 Qwen 等大模型更稳定高效

针对本地部署卡顿、CPU 占用高、响应慢等问题，群友明确指出 Ollama 对 Qwen27B/Qwen3 235B 等大模型支持不佳，推荐改用 vLLM 作为推理后端，显著提升吞吐与稳定性；该方案对 GPU 显存要求明确，需按模型规模合理选配。