2026-04-21 · 周二
Hermes Agent 中文社区日报|4月21日
上下文管理、Web UI、多模态 MCP 与本地模型部署经验汇总。
文章中提到的链接在哪?请前往公众号获取详细版本日报(含链接)。去公众号文字版 →
本期社区摘录 · 共 17 条
- 01Hermes Agent 支持在 setup 时配置本地模型上下文长度,可通过交互提示设置。来源:Hermes Agent 中文社区微信群 10
- 02可通过将简单重复任务分流至 auxiliary 小模型(如免费轻量模型)来降低主模型 token 消耗。来源:Hermes Agent 中文社区微信群 10
- 03推荐使用 nesquena/hermes-webui 作为 Hermes Agent 的 Web 界面客户端,兼容安卓平板,体验良好来源:Hermes Agent 中文社区微信群 4
- 04天翼云 8.8 元服务器搭配免费开源模型可满足 Hermes 基础部署需求。来源:Hermes Agent 中文社区微信群 8
- 05Hermes 支持通过 Minimax 官方 MCP 插件实现图像生成与视觉理解,需配置对应 API Key 并启用 MCP。来源:Hermes Agent 中文社区微信群 3
- 06Hermes Web UI Dashboard 开源项目发布,提供中文界面、会话管理、定时任务等增强功能来源:Hermes Agent 中文社区微信群 13
- 07服务器部署 Hermes Web UI 需开放 3001 端口,ufw 防火墙配置方法已验证可用来源:Hermes Agent 中文社区微信群 13
- 08Qwen3.6-35B-A3B 在双卡 RTX 3080(20GB×2)上实测推理速度约 69 tokens/s,显存占用约 30GB来源:Hermes Agent 中文社区微信群 5
- 09NVIDIA 免费 API 对 GLM-5.1 等新模型支持受限,仅开放 GLM-4.7;免费额度为每日 1000 次请求,需充值解锁来源:Hermes Agent 中文社区微信群 5
- 10本地运行大模型时需警惕模型文件真实性,社区报告存在套壳/假模型(如冒充 nemotron-3-nano-4b)导致乱答来源:Hermes Agent 中文社区微信群 5
- 11Hermes Agent 可通过集成 mem0 + Ollama + Qdrant 实现语义记忆增强,支持对话自动嵌入与实时检索。来源:Hermes Agent 中文社区微信群 9
- 12Hermes 默认对话上下文压缩策略为三轮后强制开启新对话,但可通过 context 插件或 LCM 方案实现更灵活的上下文管理。来源:Hermes Agent 中文社区微信群 9
- 13Hermes 支持本地备份迁移,已有插件可实现技能与环境变量一键打包来源:Hermes Agent 中文社区微信群 2
- 14Hermes 本地模型接入 Ollama 效果不佳,9B 以下模型响应质量低、记忆能力弱。来源:Hermes Agent 中文社区微信群 17
- 15企业微信定时任务静默不触发,需确认消息接收权限与 Bot 配置状态。来源:Hermes Agent 中文社区微信群 17
- 16Hermes Agent 支持通过 SkillHub(skillhub.cn)安装和管理技能,OpenClaw 技能多数可直接复用。来源:Hermes Agent 中文社区微信群 14
- 17天翼云息壤平台提供多个小模型各2500万免费Token额度,底层支持千问、豆包等模型。来源:Hermes Agent 中文社区微信群 14