-
Hermes 支持为模型单独配置图片识别辅助模型,收到图片后自动切换完成读图
在 Hermes 中可为 DeepSeek 等纯文本主模型单独配置视觉/图片识别辅助模型。当用户发送图片时,系统会自动调用该辅助模型进行解析,无需手动安装 OCR 技能或手动切换模型。此功能特别适合混合使用文本模型与多模态模型的场景。
-
纯图或无文字图片场景建议直接采用多模态模型理解,OCR 技能难以覆盖
当图片中不含可提取文字(如机械结构示意图、UI 截图、场景照片等),或需要理解视觉语义、空间关系时,传统 OCR 技能效果有限。建议直接调用支持视觉的多模态大模型,或在 Hermes 中配置多模态辅助模型处理此类输入。
-
法律、保险等高壁垒行业使用 Agent 必须持续沉淀行业专属知识
通用模型难以覆盖法律、保险、装修、医疗等知识密集且风险敏感的领域。必须通过持续投喂行业资料、真实案例、法规更新及个人经验进行知识沉淀,否则 Agent 输出容易缺乏专业深度和实操价值,存在误导风险。
-
文案类 Agent 需持续投喂优质与劣质样例及临时灵感,以避免输出流于通用模板
用于撰写朋友圈、营销文案、品牌内容等需要个人风格的场景时,仅靠系统提示词容易产出模板化内容。建议持续反馈优质案例、明确否定不理想输出,并注入临时灵感与人设细节,才能让 Agent 输出的内容更贴合真实人设与语境。
-
Hermes 桌面版安装卡在 Node.js 或 Desktop App 环节时,可通过 CLI 先行安装再启动桌面
若官网直接安装 Hermes 官方桌面版时卡在 Node.js 或 Desktop App 阶段,可尝试先安装 Hermes CLI(推荐 0.17.0 及以上版本),然后执行
hermes desktop命令让其自动完成桌面环境初始化。此方法可绕过部分安装器问题,与现有 CLI 部署不冲突。 -
Midjourney 正式进军医疗健康领域,推出全身体超声扫描仪(Ultrasonic CT)
Midjourney 近日宣布成立 Midjourney Medical 部门,推出首款硬件产品「Midjourney Scanner」(全身体超声 CT)。该设备利用水环境中的超声波传感器阵列,在约 60 秒内完成全身扫描,无辐射、无磁场,图像分辨率可达亚毫米级,初期定位为身体成分与结构成像。 计划在全球逐步部署超过 5 万台设备,首站研究型 Midjourney Spa 预计 2027 年在旧金山落地,后续逐步扩展。该项目目前仍处于早期研发与监管准备阶段(需通过 FDA 等审批),关于频繁全身筛查的临床获益与潜在过度诊断风险,业界存在一定讨论。
-
Google 开发者计划可手动领取每月 API 额度支持
加入 Google 开发者计划后,部分用户可通过 AI Studio 或相关开发者权益每月手动申领一定额度(如约 10 美元等值)的 API 使用支持。申领前需开通 Google Cloud 结算账号并绑定支付方式,额度通常按月主动领取,不会自动累积。适合个人开发者或小型项目测试使用。
-
Hermes Agent 中文社区桌面端更新至 0.5.3 版本,内置 Hermes 内核 v0.17.0
中文社区桌面端已发布 0.5.3 版本(可通过社区站点获取安装包)。该版本内置 Hermes 内核 v0.17.0,支持连接本地已安装的 Hermes Agent 或远程服务器部署的实例,可将社区桌面端作为 CLI 版本的可视化界面使用,与现有 CLI 部署完全兼容,不冲突。
-
B站有较新的 Hermes 安装与使用教程视频可供参考
社区分享了一条较新的 B站 Hermes Agent 安装与配置教程视频,覆盖从零部署、常见问题排查及实用技巧,适合手动部署或初次接触的用户作为官方文档的补充参考。
-
优云智算提供 P40 云电脑实例(约 0.4 元/小时)适合远程部署 Hermes Agent
该平台提供 P40(24GB 显存)实例,8 核 64GB 内存配置,实测生成速度约 20 tokens/s,不使用时不扣费,还可获得公网 IP。适合轻量级 Hermes Agent 远程部署,长期成本通常低于本地满载电费。
-
公司级 AI 短剧制作成本目前约 600-900 元/分钟
有从业者分享,目前公司级 AI 短剧项目的实际制作成本大致在 600-900 元/分钟区间(含模型调用、后期、人工审核等)。多数项目仍处于探索阶段,盈利能力有待进一步验证。
-
推荐 Cascadeur 2025.1 用于 AI 动画与动作补帧
Cascadeur 2025.1 新增 AI Inbetweening(智能补帧)功能,可自动生成自然流畅的动作过渡,结合 AutoPosing、物理模拟和 GLTF 导入等特性,适合有一定 3D 基础的用户以半自动化方式制作高质量动画内容,相比纯 AI 生成可显著降低成本与后期工作量。
-
Agent Loop 自主决策模式下仍缺乏成熟的级联记忆管理方案
开启 Agent Loop 并允许完全自主决策时,Agent 虽能自行规划工作流与行动方向,但长期运行容易出现磁盘空间占用增加、历史记忆膨胀以及幻觉累积等问题。目前业界尚未有被广泛验证的通用级联记忆管理「银弹」方案,仍需结合人工监控与定期清理策略。
-
Hermes Agent 可通过 WorkBuddy 等平台与技能生态扩展能力
Hermes Agent 支持与 WorkBuddy(腾讯推出的桌面 AI Agent)等平台联动,利用 OpenClaw 等技能互操作标准学习或复用技能,从而扩展 Agent 的能力边界与适用场景,为构建更丰富的跨平台工作流提供了额外路径。
-
推荐 OpenWebSearch 作为 SearXNG 在国内环境的搜索补充方案
针对 SearXNG 配置百度、搜狗等国内引擎时频繁触发反爬限制的问题,可引入 OpenWebSearch 作为流量补充或替代方案。该工具对国内网络环境更友好,也支持根据需求进行二次开发与链路适配,适合个人本地部署场景。
-
低成本本地模型部署方案:两块 V100-16G 可运行 31B 模型,P104 魔改卡成本极低
社区分享的实测经验:两块 V100-16G 显卡可勉强支撑 31B 参数模型运行;另有采用三块 P104-100-8G 魔改(驱动识别为 GTX 1070)的超低成本方案,单卡二手价格通常不足百元。实际 AI 推理任务中显卡功耗往往低于标称功率,满功率场景多出现在游戏或压力测试中。