Hermes Agent 中文社区日报 6月26日

01 模型评测来源：Hermes Agent 中文社区微信群 53

GLM 5.2 coding 体验反馈：模型效果好但额度难抢，5.1 已被强制升级

实际使用反馈显示，GLM 5.2 coding 在编程能力上表现优秀，但每日额度紧张且定价偏高。目前平台已将 5.1 版本强制迁移至 5.2，仅保留总限速差异。建议根据实际额度需求合理规划使用。

02 开源项目来源：Hermes Agent 中文社区微信群 1(工作群）

Hermes 记忆底座 Mnemosyne-OS 已开源

该项目定位为公共智慧底座与记忆集中服务，旨在提供可替代主流厂商的社区级长期记忆方案。目前基于 Obsidian 等工具开发，仍在快速迭代中，适合关注长期记忆与知识管理的开发者持续关注。

03 开源项目来源：Hermes Agent 中文社区飞书群 1

绿联云 NAS 应用中心已支持直接部署 Hermes

绿联云（UGREEN NAS）的应用中心已上架 Hermes Agent，可直接通过应用中心一键安装部署，无需手动配置 Docker 或宝塔面板。适合已有该 NAS 设备的用户快速搭建私有化环境。

05 部署运维来源：Hermes 中文社区互联网 IT 软件 1

Qwen 27B/35B 长上下文显存占用实测，TurboQuant 可显著压缩

实测数据：27B-Q8 开启 256K 上下文约需 88GB 显存；27B-A3B 开启 300K 上下文约需 40–60GB。配合 TurboQuant 与 mtpX3 可进一步降低显存占用。35B-A3B 约需 40GB，长上下文场景性价比相对偏低，建议根据实际需求选择。

06 架构设计来源：Hermes Agent 中文社区飞书群 1

建议将初始注入精简为固定 10 个常用 skill，其余按主题动态按需搜索加载

针对 Hermes 初始注入过大的问题，可采用“固定 10 个高频 skill + 其余按关键词或主题动态搜索加载”的策略，能将初始注入量压缩一半以上，降低长会话首屏延迟与 token 消耗。

07 架构设计来源：Hermes Agent 中文社区飞书群 1

群友验证多 Agent 分层协作方案：Hermes 统筹，Claude 与 Codex 负责架构和 Review，国产模型承担开发任务

针对大型项目上下文成本过高的问题，可采用强弱模型分层策略：由 Hermes 担任 PM 拆分任务并输出 Markdown 需求文档，Claude Code 担任架构师，Codex 负责代码 Review，国产便宜模型执行具体编码。该方案能节省主模型上下文长度，但会增加二次理解与代码风格对齐成本，最终交付质量仍取决于最强模型的审核能力，建议对关键产出进行人工白盒/黑盒审核后再上线生产。

08 工作流来源：Hermes Agent 中文社区飞书群 1

利用 Obsidian 为 Hermes 搭建自主维护的外置记忆与复盘系统

可让 Hermes 按规范目录结构将每日工作内容与定时任务执行结果写入 Obsidian，实现“飞书看摘要、Obsidian 存详情”的分流机制。每日关闭前下达更新指令，即可由 Agent 自主维护知识库。

09 模型评测来源：Hermes 中文社区互联网 IT 软件 1

Qwable-v1-Q8 接入 Hermes 易出现工具调用死循环，建议仅作 coding 子 agent

Qwable-v1-Q8 与 Hermes 配合时工具调用较为激进，实测容易陷入循环。稳定性不足以承担主 agent 角色，更适宜独立处理代码子任务，主链路可切换回 Qwen 等更稳定的模型。

10 模型评测来源：Hermes Agent 中文社区飞书群 1

DeepSeek V4 存在输出策略波动的降智现象，关键任务需预留兜底

即使模型版本号未变更，实际输出风格和能力边界也可能因后台策略调整而出现波动，此前可执行的操作可能被拦截。建议对高依赖任务设计降级或替代方案，避免单点依赖。

11 额度福利来源：Hermes Agent 中文社区飞书群 1

OpenCode Zen 与 SenseNova 均提供免费 DeepSeek V4 Flash，后者为满血 1M 上下文窗口

OpenCode Zen 不限速且额度较大，但免费版仅支持 200K 上下文窗口，长对话容易触发上下文压缩。SenseNova 的免费版则提供满血 1M 上下文，更适合长对话场景。日常简单任务下，200K 已基本够用。

12 排障经验来源：Hermes Agent 中文社区微信群 86

配置 DeepSeek API 时报错 400，检查发现是 .env 文件中 key 被脱敏导致

在 Hermes 中配置 DeepSeek 模型后若遇到 400 错误，可检查 .env 文件最后一行的 deepseek.apikey 是否被脱敏隐藏，直接粘贴真实 API Key 后可恢复正常调用。

13 架构设计来源：Hermes Agent 中文社区微信群 83

更换底层大模型后 Agent 通常需要重建，记忆管理本质更接近便签条而非认知延续

切换大模型时，即使具备较强的记忆管理能力，Agent 往往仍需重新构建与适配。现有记忆机制更多是信息的记录与调取，而非模型认知能力的真正延续，其他类似工具也存在同样限制。

14 排障经验来源：Hermes 中文社区金融量化财会

AI agent 访问财经网站遭 502/403 拦截，建议模拟浏览器、页面快照或直连数据库导入

使用 Python urllib/request 直接请求东方财富、新浪行情等财经站点时，易被识别为非浏览器请求而返回 502/403。可行规避方案包括：通过 curl/requests 模拟浏览器请求头绕过反爬；对目标页面做快照或缓存；或直接从内部数据库导出数据，再由 Hermes Agent 接入数据库读取。

15 额度福利来源：Hermes 中文社区互联网 IT 软件 1

JoyCode 提供免费试用，每日约 300 万 token 额度

群内反馈 JoyCode 当前开放四天免费试用，每日可用额度约 300 万 token，可用于体验复杂开发任务。

16 工作流来源：Hermes Agent 中文社区微信群 87

明确工作流比纠结 Agent 工具选型更重要

与其在不同 Agent 工具之间反复比较，不如先梳理和明确具体的工作流程。工作流清晰后，工具选择会更加明确，也能避免陷入反复对比的困境。

17 工作流来源：Hermes Agent 中文社区微信群 85

Hermes 对接 Zotero 实现文献管理自动化

通过将 Hermes Agent 与 Zotero 文献管理工具对接，可将以往需要手动操作或编写 JavaScript 的文献管理工作流自动化，提升学术文献的收集与整理效率。

18 工具推荐来源：Hermes Agent 中文社区 Chatbot群

TRAE 新版本支持网页元素精准评论，提升 Agent 交互精度

字节系 AI 编程 IDE TRAE 新版增加对网页内容的评论功能，区别于以往直接添加元素到对话上下文，可更精准定位 AI 理解范围，避免歧义猜测。

19 工作流来源：Hermes Agent 中文社区 Chatbot群

Agent 支持直接拉取远程 SKILL.md 并自动注册为 Neo Skill

当提供远程 Skill 链接时，Agent 可自动读取 SKILL.md 内容，按照 Neo 生命周期完成解析、创建 payload 并发布为 stable 技能。该流程实现了零手动配置的 Skill 远程安装与扩展，适用于快速集成第三方工具能力或复用社区分享的 Skill 模板。

20 工具推荐来源：Hermes 中文社区互联网 IT 软件 1

群友开源 GPU 监控工具 gputop 可辅助本地部署性能调优

该工具用于实时监控 GPU 状态与资源占用，可辅助大模型本地部署时的显存、温度及风扇管理，降低多卡长期负载下的稳定性风险。

21 配置技巧来源：Hermes Agent 中文社区飞书群 1

新版 /learn 命令支持通过链接直接生成 Skill，使用体验提升明显

更新到 0.17 版本后，/learn 功能体验显著提升。只需发送 /learn 加上目标链接，即可自动将其生成为 Skill，简化了过去需要手动配置的流程。适合需要快速将外部能力集成到 Agent 的场景。