FRIDAY · DAILY DIGEST
星期五
1 分钟了解每日 AI 最新动态
2026 年 6 月 26 日
Hermes Agent 中文社区日报
社区 21
社区摘录 COMMUNITY · 21
  • 01 模型评测 来源:Hermes Agent 中文社区微信群 53

    GLM 5.2 coding 体验反馈:模型效果好但额度难抢,5.1 已被强制升级

    实际使用反馈显示,GLM 5.2 coding 在编程能力上表现优秀,但每日额度紧张且定价偏高。目前平台已将 5.1 版本强制迁移至 5.2,仅保留总限速差异。建议根据实际额度需求合理规划使用。

  • 02 开源项目 来源:Hermes Agent 中文社区微信群 1(工作群)

    Hermes 记忆底座 Mnemosyne-OS 已开源

    该项目定位为公共智慧底座与记忆集中服务,旨在提供可替代主流厂商的社区级长期记忆方案。目前基于 Obsidian 等工具开发,仍在快速迭代中,适合关注长期记忆与知识管理的开发者持续关注。

  • 03 开源项目 来源:Hermes Agent 中文社区飞书群 1

    推荐 New-API 开源项目部署本地 API 中转,支持多 Key 聚合与秒级精确统计

    New-API 是一个开源的 API 中转项目,可聚合多家供应商的 Key,实现统一入口与自动路由,并提供精确到秒的 Token 消耗统计。对于无法查看实时明细的供应商,中转能有效解决黑盒计费问题,也可灵活设置不同模型和供应商的使用优先级。项目支持 Docker 一键部署,也可让 Hermes Agent 自行完成部署。

  • 04 部署运维 来源:Hermes Agent 中文社区微信群 85

    绿联云 NAS 应用中心已支持直接部署 Hermes

    绿联云(UGREEN NAS)的应用中心已上架 Hermes Agent,可直接通过应用中心一键安装部署,无需手动配置 Docker 或宝塔面板。适合已有该 NAS 设备的用户快速搭建私有化环境。

  • 05 部署运维 来源:Hermes 中文社区 互联网 IT 软件 1

    Qwen 27B/35B 长上下文显存占用实测,TurboQuant 可显著压缩

    实测数据:27B-Q8 开启 256K 上下文约需 88GB 显存;27B-A3B 开启 300K 上下文约需 40–60GB。配合 TurboQuant 与 mtpX3 可进一步降低显存占用。35B-A3B 约需 40GB,长上下文场景性价比相对偏低,建议根据实际需求选择。

  • 06 架构设计 来源:Hermes Agent 中文社区飞书群 1

    建议将初始注入精简为固定 10 个常用 skill,其余按主题动态按需搜索加载

    针对 Hermes 初始注入过大的问题,可采用“固定 10 个高频 skill + 其余按关键词或主题动态搜索加载”的策略,能将初始注入量压缩一半以上,降低长会话首屏延迟与 token 消耗。

  • 07 架构设计 来源:Hermes Agent 中文社区飞书群 1

    群友验证多 Agent 分层协作方案:Hermes 统筹,Claude 与 Codex 负责架构和 Review,国产模型承担开发任务

    针对大型项目上下文成本过高的问题,可采用强弱模型分层策略:由 Hermes 担任 PM 拆分任务并输出 Markdown 需求文档,Claude Code 担任架构师,Codex 负责代码 Review,国产便宜模型执行具体编码。该方案能节省主模型上下文长度,但会增加二次理解与代码风格对齐成本,最终交付质量仍取决于最强模型的审核能力,建议对关键产出进行人工白盒/黑盒审核后再上线生产。

  • 08 工作流 来源:Hermes Agent 中文社区飞书群 1

    利用 Obsidian 为 Hermes 搭建自主维护的外置记忆与复盘系统

    可让 Hermes 按规范目录结构将每日工作内容与定时任务执行结果写入 Obsidian,实现“飞书看摘要、Obsidian 存详情”的分流机制。每日关闭前下达更新指令,即可由 Agent 自主维护知识库。

  • 09 模型评测 来源:Hermes 中文社区 互联网 IT 软件 1

    Qwable-v1-Q8 接入 Hermes 易出现工具调用死循环,建议仅作 coding 子 agent

    Qwable-v1-Q8 与 Hermes 配合时工具调用较为激进,实测容易陷入循环。稳定性不足以承担主 agent 角色,更适宜独立处理代码子任务,主链路可切换回 Qwen 等更稳定的模型。

  • 10 模型评测 来源:Hermes Agent 中文社区飞书群 1

    DeepSeek V4 存在输出策略波动的降智现象,关键任务需预留兜底

    即使模型版本号未变更,实际输出风格和能力边界也可能因后台策略调整而出现波动,此前可执行的操作可能被拦截。建议对高依赖任务设计降级或替代方案,避免单点依赖。

  • 11 额度福利 来源:Hermes Agent 中文社区飞书群 1

    OpenCode Zen 与 SenseNova 均提供免费 DeepSeek V4 Flash,后者为满血 1M 上下文窗口

    OpenCode Zen 不限速且额度较大,但免费版仅支持 200K 上下文窗口,长对话容易触发上下文压缩。SenseNova 的免费版则提供满血 1M 上下文,更适合长对话场景。日常简单任务下,200K 已基本够用。

  • 12 排障经验 来源:Hermes Agent 中文社区微信群 86

    配置 DeepSeek API 时报错 400,检查发现是 .env 文件中 key 被脱敏导致

    在 Hermes 中配置 DeepSeek 模型后若遇到 400 错误,可检查 .env 文件最后一行的 deepseek.apikey 是否被脱敏隐藏,直接粘贴真实 API Key 后可恢复正常调用。

  • 13 架构设计 来源:Hermes Agent 中文社区微信群 83

    更换底层大模型后 Agent 通常需要重建,记忆管理本质更接近便签条而非认知延续

    切换大模型时,即使具备较强的记忆管理能力,Agent 往往仍需重新构建与适配。现有记忆机制更多是信息的记录与调取,而非模型认知能力的真正延续,其他类似工具也存在同样限制。

  • 14 排障经验 来源:Hermes 中文社区 金融 量化 财会

    AI agent 访问财经网站遭 502/403 拦截,建议模拟浏览器、页面快照或直连数据库导入

    使用 Python urllib/request 直接请求东方财富、新浪行情等财经站点时,易被识别为非浏览器请求而返回 502/403。可行规避方案包括:通过 curl/requests 模拟浏览器请求头绕过反爬;对目标页面做快照或缓存;或直接从内部数据库导出数据,再由 Hermes Agent 接入数据库读取。

  • 15 额度福利 来源:Hermes 中文社区 互联网 IT 软件 1

    JoyCode 提供免费试用,每日约 300 万 token 额度

    群内反馈 JoyCode 当前开放四天免费试用,每日可用额度约 300 万 token,可用于体验复杂开发任务。

  • 16 工作流 来源:Hermes Agent 中文社区微信群 87

    明确工作流比纠结 Agent 工具选型更重要

    与其在不同 Agent 工具之间反复比较,不如先梳理和明确具体的工作流程。工作流清晰后,工具选择会更加明确,也能避免陷入反复对比的困境。

  • 17 工作流 来源:Hermes Agent 中文社区微信群 85

    Hermes 对接 Zotero 实现文献管理自动化

    通过将 Hermes Agent 与 Zotero 文献管理工具对接,可将以往需要手动操作或编写 JavaScript 的文献管理工作流自动化,提升学术文献的收集与整理效率。

  • 18 工具推荐 来源:Hermes Agent 中文社区 Chatbot群

    TRAE 新版本支持网页元素精准评论,提升 Agent 交互精度

    字节系 AI 编程 IDE TRAE 新版增加对网页内容的评论功能,区别于以往直接添加元素到对话上下文,可更精准定位 AI 理解范围,避免歧义猜测。

  • 19 工作流 来源:Hermes Agent 中文社区 Chatbot群

    Agent 支持直接拉取远程 SKILL.md 并自动注册为 Neo Skill

    当提供远程 Skill 链接时,Agent 可自动读取 SKILL.md 内容,按照 Neo 生命周期完成解析、创建 payload 并发布为 stable 技能。该流程实现了零手动配置的 Skill 远程安装与扩展,适用于快速集成第三方工具能力或复用社区分享的 Skill 模板。

  • 20 工具推荐 来源:Hermes 中文社区 互联网 IT 软件 1

    群友开源 GPU 监控工具 gputop 可辅助本地部署性能调优

    该工具用于实时监控 GPU 状态与资源占用,可辅助大模型本地部署时的显存、温度及风扇管理,降低多卡长期负载下的稳定性风险。

  • 21 配置技巧 来源:Hermes Agent 中文社区飞书群 1

    新版 /learn 命令支持通过链接直接生成 Skill,使用体验提升明显

    更新到 0.17 版本后,/learn 功能体验显著提升。只需发送 /learn 加上目标链接,即可自动将其生成为 Skill,简化了过去需要手动配置的流程。适合需要快速将外部能力集成到 Agent 的场景。