Baoyu Comic(宝玉漫画)
支持多种艺术风格和语调的知识漫画创作者。创建具有详细分镜布局和顺序图像生成的原创教育漫画。当用户要求创建“知识漫画”、“教育漫画”、“传记漫画 (biography comic)”、“教程漫画 (tutorial comic)”或“《逻辑漫画》风格漫画 (Logicomix-style comic)”时使用。
技能元数据
| 来源 | 捆绑(默认安装) |
| 路径 | skills/creative/baoyu-comic |
| 版本 | 1.56.1 |
| 作者 | 宝玉 (JimLiu) |
| 许可证 | MIT |
| 标签 | comic, knowledge-comic, creative, image-generation |
参考:完整 SKILL.md
以下是 Hermes 在触发此技能时加载的完整技能定义。这是技能激活时代理看到的指令。
知识漫画创作者
改编自 baoyu-comic,适用于 Hermes Agent 的工具生态系统。
创建具有灵活艺术风格 × 语调组合的原创知识漫画。
何时使用
当用户要求创建知识/教育漫画、传记漫画、教程漫画,或使用“知识漫画”、“教育漫画”或“《逻辑漫画》风格”等术语时,触发此技能。用户提供内容(文本、文件路径、URL 或主题),并可选择指定艺术风格、语调、布局、纵横比或语言。
参考图像
Hermes 的 image_generate 工具是仅提示词 (prompt-only) 的——它接受文本提示和纵横比,并返回图像 URL。它不接受参考图像。当用户提供参考图像时,用它来提取文本形式的特征,这些特征将嵌入到每一页的提示词中:
接收:当用户提供文件路径时接受它们(或在对话中粘贴图像)。
- 文件路径 → 复制到漫画输出旁边的
refs/NN-ref-{slug}.{ext}以保留出处 - 无路径的粘贴图像 → 通过
clarify向用户询问路径,或作为文本备选方案口头提取风格特征 - 无参考 → 跳过此部分
使用模式(每个参考):
| 用法 | 效果 |
|---|---|
style | 提取风格特征(线条处理、纹理、情绪)并附加到每一页的提示词主体中 |
palette | 提取十六进制颜色代码并附加到每一页的提示词主体中 |
scene | 提取场景构图或主体注释并附加到相关页面中 |
当存在参考时,在每一页的提示词 frontmatter 中记录:
references:
- ref_id: 01
filename: 01-ref-scene.png
usage: style
traits: "muted earth tones, soft-edged ink wash, low-contrast backgrounds"
角色一致性由 characters/characters.md 中的文本描述驱动(在第 3 步编写),这些描述会内联嵌入到每一页的提示词中(第 5 步)。第 7.1 步中生成的可选 PNG 角色表是供人类审查的产物,而不是 image_generate 的输入。
选项
视觉维度
| 选项 | 值 | 描述 |
|---|---|---|
| 艺术风格 (Art) | ligne-claire(默认)、manga、realistic、ink-brush、chalk、minimalist | 艺术风格 / 渲染技法 |
| 语调 (Tone) | neutral(默认)、warm、dramatic、romantic、energetic、vintage、action | 情绪 / 氛围 |
| 布局 (Layout) | standard(默认)、cinematic、dense、splash、mixed、webtoon、four-panel | 分镜排列 |
| 纵横比 (Aspect) | 3:4(默认,纵向)、4:3(横向)、16:9(宽屏) | 页面纵横比 |
| 语言 (Language) | auto(默认)、zh、en、ja 等 | 输出语言 |
| 参考 (Refs) | 文件路径 | 用于提取风格/调色板特征的参考图像(不传递给图像模型)。参见上方的 参考图像。 |
部分工作流选项
| 选项 | 描述 |
|---|---|
| 仅分镜 (Storyboard only) | 仅生成分镜,跳过提示词和图像 |
| 仅提示词 (Prompts only) | 生成分镜 + 提示词,跳过图像 |
| 仅图像 (Images only) | 从现有提示词目录生成图像 |
| 重新生成 N (Regenerate N) | 仅重新生成特定页面(例如 3 或 2,5,8) |
详情:references/partial-workflows.md
艺术风格、语调及预设目录
-
艺术风格(6 种):
ligne-claire、manga、realistic、ink-brush、chalk、minimalist。完整定义位于references/art-styles/<style>.md。 -
语调(7 种):
neutral、warm、dramatic、romantic、energetic、vintage、action。完整定义位于references/tones/<tone>.md。 -
预设(5 种),具有超出单纯艺术风格+语调的特殊规则:
预设 等效组合 特色 ohmshamanga + neutral 视觉隐喻,无对话头像,小道具揭示 wuxiaink-brush + action 气效、战斗视觉效果、氛围感 shoujomanga + romantic 装饰元素、眼部细节、浪漫桥段 concept-storymanga + warm 视觉符号系统、成长弧光、对话与动作平衡 four-panelminimalist + neutral + four-panel 布局 起承转合结构、黑白+点缀色、火柴人角色 完整规则位于
references/presets/<preset>.md—— 选择预设时加载该文件。 -
兼容性矩阵和内容信号 → 预设表位于 references/auto-selection.md。在步骤 2 中推荐组合之前,请先阅读此文档。
文件结构
输出目录:comic/{topic-slug}/
- Slug:从主题中提取的 2-4 个单词的 kebab-case 格式(例如,
alan-turing-bio) - 冲突处理:附加时间戳(例如,
turing-story-20260118-143052)
内容:
| 文件 | 描述 |
|---|---|
source-{slug}.md | 保存的源内容(kebab-case slug 与输出目录匹配) |
analysis.md | 内容分析 |
storyboard.md | 包含分镜细分的故事板 |
characters/characters.md | 角色定义 |
characters/characters.png | 角色参考表(从 image_generate 下载) |
prompts/NN-{cover|page}-[slug].md | 生成提示词 |
NN-{cover|page}-[slug].png | 生成的图像(从 image_generate 下载) |
refs/NN-ref-{slug}.{ext} | 用户提供的参考图像(可选,用于溯源) |
语言处理
检测优先级:
- 用户指定的语言(显式选项)
- 用户的对话语言
- 源内容语言
规则:在所有交互中使用用户的输入语言:
- 故事板大纲和场景描述
- 图像生成提示词
- 用户选择选项和确认
- 进度更新、问题、错误、摘要
技术术语保留英文。
工作流
进度检查清单
Comic Progress:
- [ ] Step 1: Setup & Analyze
- [ ] 1.1 Analyze content
- [ ] 1.2 Check existing directory
- [ ] Step 2: Confirmation - Style & options ⚠️ REQUIRED
- [ ] Step 3: Generate storyboard + characters
- [ ] Step 4: Review outline (conditional)
- [ ] Step 5: Generate prompts
- [ ] Step 6: Review prompts (conditional)
- [ ] Step 7: Generate images
- [ ] 7.1 Generate character sheet (if needed) → characters/characters.png
- [ ] 7.2 Generate pages (with character descriptions embedded in prompt)
- [ ] Step 8: Completion report
流程
Input → Analyze → [Check Existing?] → [Confirm: Style + Reviews] → Storyboard → [Review?] → Prompts → [Review?] → Images → Complete
步骤摘要
| 步骤 | 操作 | 关键输出 |
|---|---|---|
| 1.1 | 分析内容 | analysis.md, source-{slug}.md |
| 1.2 | 检查现有目录 | 处理冲突 |
| 2 | 确认风格、焦点、受众、评论 | 用户偏好 |
| 3 | 生成故事板 + 角色 | storyboard.md, characters/ |
| 4 | 审查大纲(如请求) | 用户批准 |
| 5 | 生成提示词 | prompts/*.md |
| 6 | 审查提示词(如请求) | 用户批准 |
| 7.1 | 生成角色表(如需要) | characters/characters.png |
| 7.2 | 生成页面 | *.png 文件 |
| 8 | 完成报告 | 摘要 |
用户提问
使用 clarify 工具来确认选项。由于 clarify 一次只处理一个问题,请先问最重要的问题,然后按顺序进行。完整的步骤 2 问题集参见 references/workflow.md。
超时处理(关键):clarify 可能返回 "The user did not provide a response within the time limit. Use your best judgement to make the choice and proceed." — 这不代表用户同意将所有内容设为默认值。
- 仅将其视为该单一问题的默认值。继续按顺序询问剩余的步骤 2 问题;每个问题都是独立的同意点。
- 在下一条消息中向用户明确展示该默认值,以便他们有机会纠正:例如,
"Style: defaulted to ohmsha preset (clarify timed out). Say the word to switch."— 未报告的默认值与从未询问过无法区分。 - 不要在一次超时后将步骤 2 合并为单次“使用所有默认值”的操作。如果用户确实缺席,他们对所有五个问题都会同样缺席——但当他们回来时,他们可以纠正可见的默认值,而无法纠正不可见的默认值。
步骤 7:图像生成
使用 Hermes 内置的 image_generate 工具进行所有图像渲染。其 schema 仅接受 prompt 和 aspect_ratio(landscape | portrait | square);它返回一个 URL,而非本地文件。因此,必须将每个生成的页面或角色表下载到输出目录。
提示词文件要求(强制):在调用 image_generate 之前,将每张图像的完整最终提示词写入 prompts/ 下的独立文件(命名格式:NN-{type}-[slug].md)。提示词文件是可复现性记录。
纵横比映射 — 故事板的 aspect_ratio 字段映射到 image_generate 的格式如下:
| 故事板纵横比 | image_generate 格式 |
|---|---|
3:4, 9:16, 2:3 | portrait |
4:3, 16:9, 3:2 | landscape |
1:1 | square |
下载步骤 — 每次调用 image_generate 后:
- 从工具结果中读取 URL
- 使用绝对输出路径获取图像字节,例如:
curl -fsSL "<url>" -o /abs/path/to/comic/<slug>/NN-page-<slug>.png - 在继续下一页之前,验证该确切路径下的文件是否存在且非空
切勿依赖 shell 当前工作目录(CWD)的持久性来处理 -o 路径。 终端工具的持久化 shell CWD 可能会在不同批次之间发生变化(会话过期、TERMINAL_LIFETIME_SECONDS 限制、或失败的 cd 命令导致你留在错误的目录中)。curl -o relative/path.png 是一个静默的陷阱:如果 CWD 发生偏移,文件将被写入其他位置且不会报错。始终向 -o 传递完全限定的绝对路径,或者向终端工具传递 workdir=<abs path>。2026 年 4 月事故:一部 10 页漫画的第 06-09 页被错误地保存到了仓库根目录,而非 comic/<slug>/,原因是第 3 批任务继承了第 2 批任务的过时 CWD,导致 curl -o 06-page-skills.png 写入了错误的目录。随后 agent 花费了几个回合声称文件存在于它们实际不存在的位置。
7.1 角色表(Character sheet) — 当漫画为多页且包含重复出现的角色时,生成角色表(保存至 characters/characters.png,纵横比为 landscape)。对于简单的预设(例如四格极简风格)或单页漫画,请跳过此步骤。在调用 image_generate 之前,必须存在提示文件 characters/characters.md。渲染出的 PNG 是一个面向人类的审查工件(以便用户直观验证角色设计),并作为后续重新生成或手动编辑提示的参考——它不驱动步骤 7.2。页面提示已在步骤 5 中根据 characters/characters.md 中的文本描述编写完成;image_generate 无法接受图像作为视觉输入。
7.2 页面(Pages) — 在调用 image_generate 之前,每个页面的提示必须已位于 prompts/NN-{cover|page}-[slug].md。由于 image_generate 仅基于提示,角色一致性是通过在步骤 5 期间将角色描述(源自 characters/characters.md)内联嵌入到每个页面提示中来强制执行的。无论是否在 7.1 中生成 PNG 表,嵌入操作均统一执行;PNG 仅作为审查/重新生成的辅助工具。
备份规则:对于现有的 prompts/…md 和 …png 文件 → 在重新生成之前,使用 -backup-YYYYMMDD-HHMMSS 后缀重命名。
完整的分步工作流程(分析、分镜、审查关卡、重新生成变体):references/workflow.md。
参考资料
核心模板:
- analysis-framework.md - 深度内容分析
- character-template.md - 角色定义格式
- storyboard-template.md - 分镜结构
- ohmsha-guide.md - Ohmsha 漫画 specifics
风格定义:
references/art-styles/- 艺术风格(ligne-claire、manga、realistic、ink-brush、chalk、minimalist)references/tones/- 色调(neutral、warm、dramatic、romantic、energetic、vintage、action)references/presets/- 带有特殊规则的预设(ohmsha、wuxia、shoujo、concept-story、four-panel)references/layouts/- 布局(standard、cinematic、dense、splash、mixed、webtoon、four-panel)
工作流程:
- workflow.md - 完整工作流程详情
- auto-selection.md - 内容信号分析
- partial-workflows.md - 部分工作流程选项
页面修改
| 操作 | 步骤 |
|---|---|
| 编辑 | 首先更新提示文件 → 重新生成图像 → 下载新的 PNG |
| 添加 | 在指定位置创建提示 → 生成时嵌入角色描述 → 重新编号后续页面 → 更新分镜 |
| 删除 | 移除文件 → 重新编号后续页面 → 更新分镜 |
重要提示:更新页面时,务必在重新生成之前首先更新提示文件(prompts/NN-{cover|page}-[slug].md)。这确保了更改有据可查且可复现。
常见陷阱
- 图像生成:每页耗时 10-30 秒;失败时自动重试一次
- 务必下载
image_generate返回的 URL 到本地 PNG 文件——下游工具(以及用户审查)期望输出目录中存在文件,而非临时 URL - 为
curl -o使用绝对路径——切勿依赖跨批次的持久化 shell 当前工作目录(CWD)。这是一个隐蔽的陷阱:文件会落入错误的目录,导致在预期路径上执行ls时显示为空。参见步骤 7“下载步骤”。 - 对敏感的公众人物使用风格化的替代方案
- 需要确认步骤 2——不得跳过
- 步骤 4/6 为条件执行——仅当用户在步骤 2 中请求时才执行
- 步骤 7.1 角色表——推荐用于多页漫画,对于简单预设则为可选。该 PNG 文件用于辅助审查或重新生成;页面提示词(在步骤 5 中编写)使用的是
characters/characters.md中的文本描述,而非 PNG 图像。image_generate不接受图像作为视觉输入 - 清除机密信息——在写入任何输出文件之前,扫描源内容中是否包含 API 密钥、令牌或凭证