Baoyu Comic（宝玉漫画）

支持多种艺术风格和语调的知识漫画创作者。创建具有详细分镜布局和顺序图像生成的原创教育漫画。当用户要求创建“知识漫画”、“教育漫画”、“传记漫画 (biography comic)”、“教程漫画 (tutorial comic)”或“《逻辑漫画》风格漫画 (Logicomix-style comic)”时使用。

技能元数据


来源	捆绑（默认安装）
路径	`skills/creative/baoyu-comic`
版本	`1.56.1`
作者	宝玉 (JimLiu)
许可证	MIT
标签	`comic`, `knowledge-comic`, `creative`, `image-generation`

参考：完整 SKILL.md

信息

以下是 Hermes 在触发此技能时加载的完整技能定义。这是技能激活时代理看到的指令。

知识漫画创作者

改编自 baoyu-comic，适用于 Hermes Agent 的工具生态系统。

创建具有灵活艺术风格 × 语调组合的原创知识漫画。

何时使用

当用户要求创建知识/教育漫画、传记漫画、教程漫画，或使用“知识漫画”、“教育漫画”或“《逻辑漫画》风格”等术语时，触发此技能。用户提供内容（文本、文件路径、URL 或主题），并可选择指定艺术风格、语调、布局、纵横比或语言。

参考图像

Hermes 的 image_generate 工具是仅提示词 (prompt-only) 的——它接受文本提示和纵横比，并返回图像 URL。它不接受参考图像。当用户提供参考图像时，用它来提取文本形式的特征，这些特征将嵌入到每一页的提示词中：

接收：当用户提供文件路径时接受它们（或在对话中粘贴图像）。

文件路径 → 复制到漫画输出旁边的 refs/NN-ref-{slug}.{ext} 以保留出处
无路径的粘贴图像 → 通过 clarify 向用户询问路径，或作为文本备选方案口头提取风格特征
无参考 → 跳过此部分

使用模式（每个参考）：

用法	效果
`style`	提取风格特征（线条处理、纹理、情绪）并附加到每一页的提示词主体中
`palette`	提取十六进制颜色代码并附加到每一页的提示词主体中
`scene`	提取场景构图或主体注释并附加到相关页面中

当存在参考时，在每一页的提示词 frontmatter 中记录：

references:
  - ref_id: 01
    filename: 01-ref-scene.png
    usage: style
    traits: "muted earth tones, soft-edged ink wash, low-contrast backgrounds"

角色一致性由 characters/characters.md 中的文本描述驱动（在第 3 步编写），这些描述会内联嵌入到每一页的提示词中（第 5 步）。第 7.1 步中生成的可选 PNG 角色表是供人类审查的产物，而不是 image_generate 的输入。

选项

视觉维度

选项	值	描述
艺术风格 (Art)	ligne-claire（默认）、manga、realistic、ink-brush、chalk、minimalist	艺术风格 / 渲染技法
语调 (Tone)	neutral（默认）、warm、dramatic、romantic、energetic、vintage、action	情绪 / 氛围
布局 (Layout)	standard（默认）、cinematic、dense、splash、mixed、webtoon、four-panel	分镜排列
纵横比 (Aspect)	3:4（默认，纵向）、4:3（横向）、16:9（宽屏）	页面纵横比
语言 (Language)	auto（默认）、zh、en、ja 等	输出语言
参考 (Refs)	文件路径	用于提取风格/调色板特征的参考图像（不传递给图像模型）。参见上方的参考图像。

部分工作流选项

选项	描述
仅分镜 (Storyboard only)	仅生成分镜，跳过提示词和图像
仅提示词 (Prompts only)	生成分镜 + 提示词，跳过图像
仅图像 (Images only)	从现有提示词目录生成图像
重新生成 N (Regenerate N)	仅重新生成特定页面（例如 `3` 或 `2,5,8`）

详情：references/partial-workflows.md

艺术风格、语调及预设目录

艺术风格（6 种）：ligne-claire、manga、realistic、ink-brush、chalk、minimalist。完整定义位于 references/art-styles/<style>.md。
语调（7 种）：neutral、warm、dramatic、romantic、energetic、vintage、action。完整定义位于 references/tones/<tone>.md。

预设（5 种），具有超出单纯艺术风格+语调的特殊规则：

预设	等效组合	特色
`ohmsha`	manga + neutral	视觉隐喻，无对话头像，小道具揭示
`wuxia`	ink-brush + action	气效、战斗视觉效果、氛围感
`shoujo`	manga + romantic	装饰元素、眼部细节、浪漫桥段
`concept-story`	manga + warm	视觉符号系统、成长弧光、对话与动作平衡
`four-panel`	minimalist + neutral + four-panel 布局	起承转合结构、黑白+点缀色、火柴人角色

完整规则位于 references/presets/<preset>.md —— 选择预设时加载该文件。

兼容性矩阵和内容信号 → 预设表位于 references/auto-selection.md。在步骤 2 中推荐组合之前，请先阅读此文档。

文件结构

输出目录：comic/{topic-slug}/

Slug：从主题中提取的 2-4 个单词的 kebab-case 格式（例如，alan-turing-bio）
冲突处理：附加时间戳（例如，turing-story-20260118-143052）

内容：

文件	描述
`source-{slug}.md`	保存的源内容（kebab-case slug 与输出目录匹配）
`analysis.md`	内容分析
`storyboard.md`	包含分镜细分的故事板
`characters/characters.md`	角色定义
`characters/characters.png`	角色参考表（从 `image_generate` 下载）
`prompts/NN-{cover\|page}-[slug].md`	生成提示词
`NN-{cover\|page}-[slug].png`	生成的图像（从 `image_generate` 下载）
`refs/NN-ref-{slug}.{ext}`	用户提供的参考图像（可选，用于溯源）

语言处理

检测优先级：

用户指定的语言（显式选项）
用户的对话语言
源内容语言

规则：在所有交互中使用用户的输入语言：

故事板大纲和场景描述
图像生成提示词
用户选择选项和确认
进度更新、问题、错误、摘要

技术术语保留英文。

工作流

进度检查清单

Comic Progress:
- [ ] Step 1: Setup & Analyze
  - [ ] 1.1 Analyze content
  - [ ] 1.2 Check existing directory
- [ ] Step 2: Confirmation - Style & options ⚠️ REQUIRED
- [ ] Step 3: Generate storyboard + characters
- [ ] Step 4: Review outline (conditional)
- [ ] Step 5: Generate prompts
- [ ] Step 6: Review prompts (conditional)
- [ ] Step 7: Generate images
  - [ ] 7.1 Generate character sheet (if needed) → characters/characters.png
  - [ ] 7.2 Generate pages (with character descriptions embedded in prompt)
- [ ] Step 8: Completion report

流程

Input → Analyze → [Check Existing?] → [Confirm: Style + Reviews] → Storyboard → [Review?] → Prompts → [Review?] → Images → Complete

步骤摘要

步骤	操作	关键输出
1.1	分析内容	`analysis.md`, `source-{slug}.md`
1.2	检查现有目录	处理冲突
2	确认风格、焦点、受众、评论	用户偏好
3	生成故事板 + 角色	`storyboard.md`, `characters/`
4	审查大纲（如请求）	用户批准
5	生成提示词	`prompts/*.md`
6	审查提示词（如请求）	用户批准
7.1	生成角色表（如需要）	`characters/characters.png`
7.2	生成页面	`*.png` 文件
8	完成报告	摘要

用户提问

使用 clarify 工具来确认选项。由于 clarify 一次只处理一个问题，请先问最重要的问题，然后按顺序进行。完整的步骤 2 问题集参见 references/workflow.md。

超时处理（关键）：clarify 可能返回 "The user did not provide a response within the time limit. Use your best judgement to make the choice and proceed." — 这不代表用户同意将所有内容设为默认值。

仅将其视为该单一问题的默认值。继续按顺序询问剩余的步骤 2 问题；每个问题都是独立的同意点。
在下一条消息中向用户明确展示该默认值，以便他们有机会纠正：例如，"Style: defaulted to ohmsha preset (clarify timed out). Say the word to switch." — 未报告的默认值与从未询问过无法区分。
不要在一次超时后将步骤 2 合并为单次“使用所有默认值”的操作。如果用户确实缺席，他们对所有五个问题都会同样缺席——但当他们回来时，他们可以纠正可见的默认值，而无法纠正不可见的默认值。

步骤 7：图像生成

使用 Hermes 内置的 image_generate 工具进行所有图像渲染。其 schema 仅接受 prompt 和 aspect_ratio（landscape | portrait | square）；它返回一个 URL，而非本地文件。因此，必须将每个生成的页面或角色表下载到输出目录。

提示词文件要求（强制）：在调用 image_generate 之前，将每张图像的完整最终提示词写入 prompts/ 下的独立文件（命名格式：NN-{type}-[slug].md）。提示词文件是可复现性记录。

纵横比映射 — 故事板的 aspect_ratio 字段映射到 image_generate 的格式如下：

故事板纵横比	`image_generate` 格式
`3:4`, `9:16`, `2:3`	`portrait`
`4:3`, `16:9`, `3:2`	`landscape`
`1:1`	`square`

下载步骤 — 每次调用 image_generate 后：

从工具结果中读取 URL
使用绝对输出路径获取图像字节，例如： curl -fsSL "<url>" -o /abs/path/to/comic/<slug>/NN-page-<slug>.png
在继续下一页之前，验证该确切路径下的文件是否存在且非空

切勿依赖 shell 当前工作目录（CWD）的持久性来处理 -o 路径。 终端工具的持久化 shell CWD 可能会在不同批次之间发生变化（会话过期、TERMINAL_LIFETIME_SECONDS 限制、或失败的 cd 命令导致你留在错误的目录中）。curl -o relative/path.png 是一个静默的陷阱：如果 CWD 发生偏移，文件将被写入其他位置且不会报错。始终向 -o 传递完全限定的绝对路径，或者向终端工具传递 workdir=<abs path>。2026 年 4 月事故：一部 10 页漫画的第 06-09 页被错误地保存到了仓库根目录，而非 comic/<slug>/，原因是第 3 批任务继承了第 2 批任务的过时 CWD，导致 curl -o 06-page-skills.png 写入了错误的目录。随后 agent 花费了几个回合声称文件存在于它们实际不存在的位置。

7.1 角色表（Character sheet） — 当漫画为多页且包含重复出现的角色时，生成角色表（保存至 characters/characters.png，纵横比为 landscape）。对于简单的预设（例如四格极简风格）或单页漫画，请跳过此步骤。在调用 image_generate 之前，必须存在提示文件 characters/characters.md。渲染出的 PNG 是一个面向人类的审查工件（以便用户直观验证角色设计），并作为后续重新生成或手动编辑提示的参考——它不驱动步骤 7.2。页面提示已在步骤 5 中根据 characters/characters.md 中的文本描述编写完成；image_generate 无法接受图像作为视觉输入。

7.2 页面（Pages） — 在调用 image_generate 之前，每个页面的提示必须已位于 prompts/NN-{cover|page}-[slug].md。由于 image_generate 仅基于提示，角色一致性是通过在步骤 5 期间将角色描述（源自 characters/characters.md）内联嵌入到每个页面提示中来强制执行的。无论是否在 7.1 中生成 PNG 表，嵌入操作均统一执行；PNG 仅作为审查/重新生成的辅助工具。

备份规则：对于现有的 prompts/…md 和 …png 文件 → 在重新生成之前，使用 -backup-YYYYMMDD-HHMMSS 后缀重命名。

完整的分步工作流程（分析、分镜、审查关卡、重新生成变体）：references/workflow.md。

参考资料

核心模板：

analysis-framework.md - 深度内容分析
character-template.md - 角色定义格式
storyboard-template.md - 分镜结构
ohmsha-guide.md - Ohmsha 漫画 specifics

风格定义：

references/art-styles/ - 艺术风格（ligne-claire、manga、realistic、ink-brush、chalk、minimalist）
references/tones/ - 色调（neutral、warm、dramatic、romantic、energetic、vintage、action）
references/presets/ - 带有特殊规则的预设（ohmsha、wuxia、shoujo、concept-story、four-panel）
references/layouts/ - 布局（standard、cinematic、dense、splash、mixed、webtoon、four-panel）

工作流程：

workflow.md - 完整工作流程详情
auto-selection.md - 内容信号分析
partial-workflows.md - 部分工作流程选项

页面修改

操作	步骤
编辑	首先更新提示文件 → 重新生成图像 → 下载新的 PNG
添加	在指定位置创建提示 → 生成时嵌入角色描述 → 重新编号后续页面 → 更新分镜
删除	移除文件 → 重新编号后续页面 → 更新分镜

重要提示：更新页面时，务必在重新生成之前首先更新提示文件（prompts/NN-{cover|page}-[slug].md）。这确保了更改有据可查且可复现。

常见陷阱

图像生成：每页耗时 10-30 秒；失败时自动重试一次
务必下载 image_generate 返回的 URL 到本地 PNG 文件——下游工具（以及用户审查）期望输出目录中存在文件，而非临时 URL
为 curl -o 使用绝对路径——切勿依赖跨批次的持久化 shell 当前工作目录（CWD）。这是一个隐蔽的陷阱：文件会落入错误的目录，导致在预期路径上执行 ls 时显示为空。参见步骤 7“下载步骤”。
对敏感的公众人物使用风格化的替代方案
需要确认步骤 2——不得跳过
步骤 4/6 为条件执行——仅当用户在步骤 2 中请求时才执行
步骤 7.1 角色表——推荐用于多页漫画，对于简单预设则为可选。该 PNG 文件用于辅助审查或重新生成；页面提示词（在步骤 5 中编写）使用的是 characters/characters.md 中的文本描述，而非 PNG 图像。image_generate 不接受图像作为视觉输入
清除机密信息——在写入任何输出文件之前，扫描源内容中是否包含 API 密钥、令牌或凭证

技能元数据​

参考：完整 SKILL.md​

知识漫画创作者

何时使用​

参考图像​

选项​

视觉维度​

部分工作流选项​

艺术风格、语调及预设目录​

文件结构​

语言处理​

工作流​

进度检查清单​

流程​

步骤摘要​

用户提问​

步骤 7：图像生成​

参考资料​

页面修改​

常见陷阱​