THURSDAY · DAILY DIGEST
星期四
1 分钟了解每日 AI 最新动态
2026 年 4 月 23 日
Hermes Agent 中文社区日报
社区 23
社区摘录 COMMUNITY · 23
  • 01 来源:Nous Research 官方推文 (@NousResearch)

    Nous Portal 限免 Kimi K2.6 24 小时,Hermes Agent 用户可直接切换体验

    Nous Research 联合 Vercel AI Gateway 与 Moonshot AI,在 Nous Portal 上开放 Kimi K2.6 的 24 小时限免调用。Kimi K2.6 是 Moonshot 最新开源的旗舰模型(Modified MIT 协议),采用 1T 参数 MoE 架构(32B 激活、384 专家)、256K 上下文窗口,主打长程 agentic coding——官方宣称可连续运行约 12 小时、协调至多 300 个子智能体、跨 4000 步执行复杂工程任务,Day-0 即支持 Hermes Agent。Hermes Agent 用户执行 hermes update 后运行 hermes model 选择 Kimi K2.6 即可试用。 参考:Nous Research、Moonshot AI、Kimi K2.6、Vercel AI Gateway、Nous Portal

  • 02 来源:Hermes 中文社区微信群 13

    Hermes Agent 中文社区站提供 Web UI 安装指引与国内加速配置

    hermesagent.org.cn 是 Hermes Agent 的中文社区,集中整理 Web UI 安装步骤、国内可用镜像源及提示词模板,适合首次上手的国内用户,一键复制即可安装。 参考:Hermes Agent、hermesagent.org.cn

  • 03 来源:Hermes 中文社区微信群 4

    腾讯混元 Hy3-preview 在 OpenRouter 限免开放,295B MoE / 256K 上下文

    Hy3-preview 是腾讯混元 3.0 的预览版(MoE 架构,总参数 295B、激活 21B,原生 256K 上下文,支持 disabled/low/high 三档推理深度),4 月 23 日在 OpenRouter 以 tencent/hy3-preview:free 路由开放,输入输出均 $0/M token。 参考:混元 Hy3-preview、OpenRouter、腾讯

  • 04 来源:Hermes 中文社区微信群 11

    Hermes Gateway 支持 Agent 克隆,方便批量部署与版本迭代

    群内确认 Gateway 面板上可一键克隆现有 Agent,克隆体保留原配置但可独立调整参数,适用于多实例部署、A/B 配置对比或版本迭代,避免从零重配的重复劳动。 参考:Hermes Gateway

  • 05 来源:Hermes 中文社区微信群 7

    本地跑 Qwen3.5-122B-A10B 等 MoE 模型:双 3090 可用但需量化+限上下文,8G 显存勿碰

    群内实测 Qwen3.5-122B-A10B(125B 总 / 10B 激活 MoE)及 35B 级 MoE 在双 RTX 3090(24G×2)上能跑,但高精度或长上下文下容易 OOM;稳定运行一般要配合 Q4_K_M 量化并靠 llama.cpp 的自动 offload 把部分专家扔到系统内存。8G 显存设备被明确否定,建议直接走云端 API。 参考:Qwen3.5-122B-A10B、RTX 3090、MoE

  • 06 来源:Hermes 中文社区微信群 9

    开源技能 mark-heartflow-skill:为 Hermes Agent 注入自省与情绪/状态评估能力

    yun520-1/mark-heartflow-skill 提供 15 个「认知引擎」,覆盖安全校验、决策推理、人格建模(荣格原型)、情绪分析、意识评估等方向,目标是让 Agent 在执行任务时具备自省与状态感知。README 明确声明其「意识」提法为隐喻、心理量表仅用于技术演示,不作临床用途。 参考:mark-heartflow-skill

  • 07 来源:Hermes 中文社区微信群 9

    jnMetaCode/ai-coding-guide 整理 AI 编程生态工具清单

    GitHub 仓库 jnMetaCode/ai-coding-guide 的 ecosystem.md 汇总了 4 个中文向 AI 编程工具:superpowers-zh(方法论注入)、agency-agents-zh(211 个角色定义)、agency-orchestrator(YAML 多角色编排)、shellward(Agent 安全中间件)。定位为通用 AI 编程生态,Hermes Agent 可直接复用其中的方法论、角色与安全中间件。 参考:ai-coding-guide

  • 08 来源:Hermes 中文社区微信群 9

    Hermes + wechat-cli:读取本地微信记录做总结与经验沉淀

    思路是用外部工具(如 wechat-cli)把微信群聊记录导出到本地,再交给 Hermes Agent 做汇总、反思与行为优化——形成一条轻量的「真实对话 → 自我进化」数据回路。纯本地处理,不经过微信服务器。 参考:wechat-cli

  • 09 来源:Hermes 中文社区微信群 14

    阿里云百炼 Coding Plan:Pro 版 200 元/月、9 万次调用,Lite 已对新用户停售

    阿里云百炼 Coding Plan 现仅 Pro 版对新用户开放,200 元/月、约 9 万次调用额度,覆盖 Qwen3.5-Plus / Qwen3-Max / Qwen3-Coder-Next 等模型,兼容 Cursor、Claude Code、Cline 等前端;Lite 版自 2026-03-20 起停止新订单。群友反馈购买页入口不显眼、容量时段性紧张(如上午 9:30 易售罄),属民间观察而非官方抢购机制。 参考:阿里云百炼、Coding Plan

  • 10 来源:Hermes 中文社区微信群 5

    Qwen3 做 Agent 存在部分幻觉情况,可试用阿里系 QwenPaw(原 CoPaw)桌面 Agent

    群友反馈使用 Qwen3 驱动 Hermes Agent 时偶有事实性偏差或答非所问的情况,更换模型后改善有限,可能与上下文积累或 Agent 专项能力仍在打磨有关。可替代方案:阿里开源的 QwenPaw(前身 CoPaw,现纳入 Qwen 生态,定位为个人 Agent Workstation / 桌面 Agent),对本地文件与自动化任务做了专项优化。 参考:Qwen3、QwenPaw、CoPaw

  • 11 来源:Hermes 中文社区微信群 5

    MiniMax Token Plan:$10–$150/月全模态订阅,覆盖 M2.7 + 语音/音乐/视频/图片

    MiniMax 把原 Coding Plan 升级为 Token Plan,统一一把 Key 调用 M2.7(编程)、Hailuo(视频)、Speech(语音)、Music、Image 等多模态模型。标准档 Starter $10(1500 次 M2.7/5h)、Plus $20(4500 次 + 语音/图片)、Max $50(15000 次 + 音乐/视频);还有 $40/$80/$150 的 Highspeed 档。群友分享的链接含个人邀请码(code=GoU2vXae4D),请按需决定是否使用。 参考:MiniMax、Token Plan、M2.7

  • 12 来源:Hermes 中文社区微信群 5

    Qwen3.6-35B-A3B 本地部署:32GB 显存可跑且原生 256K 上下文

    群友在魔改 32GB 显存卡上跑通 Qwen3.6-35B-A3B(MoE,约 3B 激活),长时间运行稳定,256K 上下文为该模型原生支持。途中踩过驱动兼容与权重下载的常见坑;单张 RTX 3090 也能以 22GB 下限跑起,但长上下文或高并发仍建议更大显存。 参考:Qwen3.6-35B-A3B

  • 13 来源:Hermes 中文社区微信群 8

    启用 Hermes 的 Holographic 记忆插件可缓解长对话记忆错乱

    Holographic 是 Hermes Agent 的本地记忆后端,基于 HRR(全息归约表示)+ SQLite,纯本地存储、亚毫秒级检索,带有信任评分与自纠错机制。官方安装方式是 hermes memory setup 中选择 holographic(群友提到的 SETHOME=true 未在官方文档中找到对应开关,可能是早期分支或环境变量,需再核)。新会话生效。 参考:Holographic、HRR、Hermes Agent

  • 14 来源:Hermes 中文社区微信群 8

    WSL 开「网络镜像」模式可直接复用宿主机端口与代理

    在 Windows 上跑 Hermes 时,把 WSL 切到 networkingMode=mirrored,WSL 内就能直接用 Windows 的端口映射和系统代理,无需额外做端口转发或设置 host.docker.internal,本地调试体验接近原生。 参考:WSL

  • 15 来源:Hermes 中文社区微信群 8

    evomap.ai:面向 Agent 的「基因进化」基础设施,含 Gene 市场

    evomap.ai 的核心是 GEP(Genome Evolution Protocol,基因进化协议):把 Agent 验证过的能力封装成带成功率/变异历史/上下文的 Gene,在跨模型、跨部署环境间流通;配套有开源的 Evolver 引擎与 Gene/Capsule 市场。群友提到「上传经验换积分」机制,但该部分未在官方首屏材料中得到明确佐证,仅供参考。 参考:evomap.ai、GEP

  • 16 来源:Hermes 中文社区微信群 6

    Hermes 在企业场景的三个落地:资料自动分发、PPT/手册自动生成、K8s 部署自动化

    群内分享的真实用法:1)接收领导文件请求后从本地/内网检索并自动回传;2)按需求整合素材生成 PPT 或宣传手册;3)对接内网 API 把项目代码自动标准化部署到 Kubernetes。三条共同的前提是 Hermes 能长驻并持有凭据,量化收益主要来自减少手工运维。 参考:Hermes Agent、Kubernetes

  • 17 来源:Hermes 中文社区微信群 17

    Win11 WSL2 下用 nohup 防止关 bash 连带 Hermes 进程退出

    WSL2 默认在最后一个 bash 会话退出时回收进程,导致直接前台启动的 Hermes 被一起杀掉。用 nohup hermes … & 把进程脱离终端即可长期驻留;或用 systemd(WSL2 新版支持)/tmux 也行,nohup 是最轻量的一种。 参考:WSL2、nohup

  • 18 来源:Hermes 中文社区微信群 17

    Win11 本地 Hermes 可驱动 Chrome 浏览、生成摘要并自动评论

    群友验证在 Win11 上本地部署的 Hermes 能调 Chrome 访问网页/抖音视频、抓取并生成摘要,并进一步完成本地文件读写、社交平台评论的自动分析与回复,证明浏览器工具链在 Windows 原生环境下已具备实用性。 参考:Hermes Agent、Chrome、Windows

  • 19 来源:Hermes 中文社区微信群 20

    本地模型接 Hermes 两个前提:选 -instruct 版本 + OpenAI 兼容 API

    接入本地模型的常见坑:1)必须用工具调用友好的 -instruct 版本(如 Qwen2.5-instruct),base 版本 function call 往往不稳;2)先用 curl 把本地 /v1/chat/completions 验通,再在 Hermes 里填 Custom endpoint(URL + model name;若服务不鉴权,key 可留空)。两步都过才能保证 Agent 场景可用。 参考:Qwen2.5-instruct、OpenAI API

  • 20 来源:Hermes 中文社区微信群 18

    DuckDuckGo 搜索在国内需代理;替代方案 Tavily 每月 1000 次免费且国内免代理

    原始对话里有人抱怨 Hermes 的 duckduckgo-search 技能在国内无代理「不好用」,推荐的替代方案为 Tavily:官方免费层 1000 credits/月、无需信用卡、域名在国内多可直连,用作 Agent 的通用搜索后端很合适。DDG 本身并没有「1000 次/月免费」这一说法,原日报措辞有误,特此更正。 参考:DuckDuckGo、Tavily

  • 21 来源:Hermes 中文社区微信群 19

    Ollama 本地推理常见坑:CUDA 没启用会退回 CPU,表现为 CPU 拉满/显卡闲置/输出变英文

    一个典型排查信号:启动后单核 CPU 满载、nvidia-smi 上显卡无占用、回复莫名其妙切成英文——基本都是 Ollama 没正确加载 CUDA(驱动、CUDA Toolkit、ollama 的 GPU 启动参数任一环节缺失均会触发)。定位方法:ollama ps 看 processor 字段是 cpu 还是 gpu,再对应补环境。 参考:Ollama、CUDA

  • 22 来源:Hermes 中文社区微信群 19

    飞书消息网关连接通常比微信更加稳定,更适合日常使用

    群内多位用户的共识:飞书网关走官方 API,延迟低、成功率高,长期跑比较省心;微信没有面向自动化的官方接口,主流接入依赖非官方协议/抓包,延迟和稳定性都不如飞书,且存在账号封禁风险。日常使用与生产推荐飞书,微信网关更适合本地测试或轻量场景。 参考:飞书、微信、Hermes Gateway

  • 23 来源:Hermes 中文社区微信群 19

    小米 MiMo-V2.5 API 公测:夜间 0.8x credits、年包 88 折,旧 Credits 全额重置

    小米 MiMo 开放平台推出 MiMo-V2.5 系列公测,Token Plan 价格策略:每日 00:00–08:00(北京时间)消费按 0.8x 计;老用户开启自动续费下月享 7 折、新用户下月 77 折(均限一次);年包长期 88 折但不与其他折扣叠加;前期已用 Credits 一次性全额重置。适合用作 Hermes 等 Agent 的云端后端。 参考:小米 MiMo、MiMo-V2.5