-
硅基流动与美团Longcat大模型提供免费额度,可作为灵活切换的备选API源。
硅基流动目前提供16元注册余额,支持随时切换模型;美团Longcat每日提供五千万token免费额度。两者均可作为日常开发或测试的备用方案,有效降低调用成本。
-
日常开发工作流建议与 Coding Agent 架构设计。
建议将 Hermes 定位为产品经理与规范制定者,配合 Claude Code/Codex 等工具执行编码。可通过编写结构化 Skill 明确项目背景、编码规范与交付标准,并参考 OpenSpec 实现 SDD 驱动开发。底层推荐采用 Python 脚本+CLI/Server 的原子化架构,通过 HTTP 与上层通用 Agent 交互。
-
单台DGX Spark本地部署模型性能实测与量化建议。
单台DGX Spark设备运行Gemma4 31B 全精度FP16,上下文256K,显存占用约100G,跑出约7token/s;Gemma4 26B A4B在 NVFP4 量化下跑出 52 tok/s,可满足生产需求。另外推荐Qwen3.6-35B-A3B模型,在同类硬件上运行建议开启NVFP4量化以保障流畅度。
-
复杂工具调用场景下,MCP协议稳定性显著优于原生Skill,建议优先采用。
原生Skill在部分模型上调用成功率较低且易出现模糊匹配,配置MCP服务可大幅提升工具调用的可靠性。若必须使用Skill,建议明确设定Agent指令规范,或尝试切换至对工具调用支持更优的模型。
-
Agent 仅回复不执行任务时,可尝试开启自我审计或切换底层模型
当智能体出现只输出文本而不触发实际工具执行的情况时,可通过提示其进行“自我审计”来纠正行为逻辑。若该问题持续存在,更换能力更强或更适配的底层模型通常能有效恢复执行链路。
-
社区分享开源 Hermes 可视化接口控制 UI。
该仓库实现了独立的 Hermes 控制层接口,支持脱离默认前端进行交互。适用于需要定制化管理面板、对接自有业务系统或进行底层控制逻辑扩展的开发需求。
-
Hermes 支持接入个人微信,可通过官方接口或 clawBot 实现免维护连接。
群内确认 Hermes 已兼容个人微信接入,无需依赖企业号。结合 clawBot 可在安卓设备或平板上部署为日常助理,配置消息频道与模型后即可自动运行,稳定性较好。
-
Hermes 已集成 codex-cli,可用于代码生成与任务下发,关键代码需人工复核。
通过内置的 codex-cli 可灵活下发编程任务,适合处理日常开发小需求。由于 AI 在虚拟环境生成的代码可能无法覆盖真实硬件工况或特定边界条件,涉及生产安全或设备控制的代码提交前必须进行人工测试。
-
推荐火山引擎的 mem0 Agent外置记忆系统。
火山引擎版 mem0 目前免费且与原版差异不大。memOS 与 mem0 为不同项目,建议优先使用 Hermes 自带记忆系统,按需再扩展第三方外置记忆方案。
-
推荐搭配 browser-harness 提升 Hermes 操控浏览器的执行速度。
针对浏览器自动化操作响应缓慢的问题,实测使用 browser-harness 工具可显著优化延迟。该方案可作为替代原生或低效控制模块的优选,提升网页交互与数据抓取效率。
-
量化交易Agent建议将策略引擎与决策引擎分离,并控制同类因子数量。
策略与决策分离开发可有效避免模型过拟合。因子构建时同类指标保留1至2个即可,过多重复因子会干扰判断。推荐让LLM直接输出标准化交易JSON,由独立执行模块处理下单。
-
优化 memory.md 内容结构并完善 Skill 引导可显著提升 Agent 表现。
记忆文件不宜堆砌过多信息,应仅保留核心要点以避免上下文干扰。配合详细完善的 Skill 配置,对任务执行效果的影响往往大于单纯切换底层模型。
-
本地部署需确保模型上下文窗口≥64K,且需要注意CORS配置问题。
Hermes 对模型上下文长度有硬性要求,部分 8B 小模型默认仅 40K 可能无法正常运行。在 WebUI 中使用本地部署模型时,需注意正确设置CORS请求跨域。
-
社区推荐多款 AI 辅助工具与 Web UI
推荐
cc-switch用于 Claude Code/Codex 多模型密钥管理与免登录配置;EKKOLearnAI/hermes-web-ui提供 Hermes 第三方可视化交互界面。推荐开源企业级 AI 数据预处理平台:天枢,支持文档、图片、音频等多模态数据处理 。 -
社区推荐 deepseek-v4-flash 与 minimax 作为高性价比模型,另推荐 Opencode GO 低价订阅计划。
针对日常任务与自动化场景,deepseek-v4-flash 表现稳定, Minimax 成本较低。若需更高调用额度,可考虑 Opencode GO 订阅方案,国外闭源模型在此类场景下性价比偏低。
-
简单网页爬取可直接使用强模型配合角色提示词,无需复杂构建Skill。
针对竞品数据抓取等常规需求,直接调用具备强代码与逻辑能力的模型,并赋予专业爬虫工程师角色提示词,即可快速生成抓取逻辑,大幅降低自定义技能的开发成本。 扫码加入 Hermes Agent 中文社区微信群