Baoyu Comic(寶玉漫畫)
支持多種藝術風格和語調的知識漫畫創作者。創建具有詳細分鏡佈局和順序圖像生成的原創教育漫畫。當用戶要求創建“知識漫畫”、“教育漫畫”、“傳記漫畫 (biography comic)”、“教程漫畫 (tutorial comic)”或“《邏輯漫畫》風格漫畫 (Logicomix-style comic)”時使用。
技能元數據
| 來源 | 捆綁(默認安裝) |
| 路徑 | skills/creative/baoyu-comic |
| 版本 | 1.56.1 |
| 作者 | 寶玉 (JimLiu) |
| 許可證 | MIT |
| 標籤 | comic, knowledge-comic, creative, image-generation |
參考:完整 SKILL.md
以下是 Hermes 在觸發此技能時加載的完整技能定義。這是技能激活時代理看到的指令。
知識漫畫創作者
改編自 baoyu-comic,適用於 Hermes Agent 的工具生態系統。
創建具有靈活藝術風格 × 語調組合的原創知識漫畫。
何時使用
當用戶要求創建知識/教育漫畫、傳記漫畫、教程漫畫,或使用“知識漫畫”、“教育漫畫”或“《邏輯漫畫》風格”等術語時,觸發此技能。用戶提供內容(文本、文件路徑、URL 或主題),並可選擇指定藝術風格、語調、佈局、縱橫比或語言。
參考圖像
Hermes 的 image_generate 工具是僅提示詞 (prompt-only) 的——它接受文本提示和縱橫比,並返回圖像 URL。它不接受參考圖像。當用戶提供參考圖像時,用它來提取文本形式的特徵,這些特徵將嵌入到每一頁的提示詞中:
接收:當用戶提供文件路徑時接受它們(或在對話中粘貼圖像)。
- 文件路徑 → 複製到漫畫輸出旁邊的
refs/NN-ref-{slug}.{ext}以保留出處 - 無路徑的粘貼圖像 → 通過
clarify向用戶詢問路徑,或作為文本備選方案口頭提取風格特徵 - 無參考 → 跳過此部分
使用模式(每個參考):
| 用法 | 效果 |
|---|---|
style | 提取風格特徵(線條處理、紋理、情緒)並附加到每一頁的提示詞主體中 |
palette | 提取十六進制顏色代碼並附加到每一頁的提示詞主體中 |
scene | 提取場景構圖或主體註釋並附加到相關頁面中 |
當存在參考時,在每一頁的提示詞 frontmatter 中記錄:
references:
- ref_id: 01
filename: 01-ref-scene.png
usage: style
traits: "muted earth tones, soft-edged ink wash, low-contrast backgrounds"
角色一致性由 characters/characters.md 中的文本描述驅動(在第 3 步編寫),這些描述會內聯嵌入到每一頁的提示詞中(第 5 步)。第 7.1 步中生成的可選 PNG 角色表是供人類審查的產物,而不是 image_generate 的輸入。
選項
視覺維度
| 選項 | 值 | 描述 |
|---|---|---|
| 藝術風格 (Art) | ligne-claire(默認)、manga、realistic、ink-brush、chalk、minimalist | 藝術風格 / 渲染技法 |
| 語調 (Tone) | neutral(默認)、warm、dramatic、romantic、energetic、vintage、action | 情緒 / 氛圍 |
| 佈局 (Layout) | standard(默認)、cinematic、dense、splash、mixed、webtoon、four-panel | 分鏡排列 |
| 縱橫比 (Aspect) | 3:4(默認,縱向)、4:3(橫向)、16:9(寬屏) | 頁面縱橫比 |
| 語言 (Language) | auto(默認)、zh、en、ja 等 | 輸出語言 |
| 參考 (Refs) | 文件路徑 | 用於提取風格/調色板特徵的參考圖像(不傳遞給圖像模型)。參見上方的 參考圖像。 |
部分工作流選項
| 選項 | 描述 |
|---|---|
| 僅分鏡 (Storyboard only) | 僅生成分鏡,跳過提示詞和圖像 |
| 僅提示詞 (Prompts only) | 生成分鏡 + 提示詞,跳過圖像 |
| 僅圖像 (Images only) | 從現有提示詞目錄生成圖像 |
| 重新生成 N (Regenerate N) | 僅重新生成特定頁面(例如 3 或 2,5,8) |
詳情:references/partial-workflows.md
藝術風格、語調及預設目錄
-
藝術風格(6 種):
ligne-claire、manga、realistic、ink-brush、chalk、minimalist。完整定義位於references/art-styles/<style>.md。 -
語調(7 種):
neutral、warm、dramatic、romantic、energetic、vintage、action。完整定義位於references/tones/<tone>.md。 -
預設(5 種),具有超出單純藝術風格+語調的特殊規則:
預設 等效組合 特色 ohmshamanga + neutral 視覺隱喻,無對話頭像,小道具揭示 wuxiaink-brush + action 氣效、戰鬥視覺效果、氛圍感 shoujomanga + romantic 裝飾元素、眼部細節、浪漫橋段 concept-storymanga + warm 視覺符號系統、成長弧光、對話與動作平衡 four-panelminimalist + neutral + four-panel 佈局 起承轉合結構、黑白+點綴色、火柴人角色 完整規則位於
references/presets/<preset>.md—— 選擇預設時加載該文件。 -
兼容性矩陣和內容信號 → 預設表位於 references/auto-selection.md。在步驟 2 中推薦組合之前,請先閱讀此文檔。
文件結構
輸出目錄:comic/{topic-slug}/
- Slug:從主題中提取的 2-4 個單詞的 kebab-case 格式(例如,
alan-turing-bio) - 衝突處理:附加時間戳(例如,
turing-story-20260118-143052)
內容:
| 文件 | 描述 |
|---|---|
source-{slug}.md | 保存的源內容(kebab-case slug 與輸出目錄匹配) |
analysis.md | 內容分析 |
storyboard.md | 包含分鏡細分的故事板 |
characters/characters.md | 角色定義 |
characters/characters.png | 角色參考表(從 image_generate 下載) |
prompts/NN-{cover|page}-[slug].md | 生成提示詞 |
NN-{cover|page}-[slug].png | 生成的圖像(從 image_generate 下載) |
refs/NN-ref-{slug}.{ext} | 用戶提供的參考圖像(可選,用於溯源) |
語言處理
檢測優先級:
- 用戶指定的語言(顯式選項)
- 用戶的對話語言
- 源內容語言
規則:在所有交互中使用用戶的輸入語言:
- 故事板大綱和場景描述
- 圖像生成提示詞
- 用戶選擇選項和確認
- 進度更新、問題、錯誤、摘要
技術術語保留英文。
工作流
進度檢查清單
Comic Progress:
- [ ] Step 1: Setup & Analyze
- [ ] 1.1 Analyze content
- [ ] 1.2 Check existing directory
- [ ] Step 2: Confirmation - Style & options ⚠️ REQUIRED
- [ ] Step 3: Generate storyboard + characters
- [ ] Step 4: Review outline (conditional)
- [ ] Step 5: Generate prompts
- [ ] Step 6: Review prompts (conditional)
- [ ] Step 7: Generate images
- [ ] 7.1 Generate character sheet (if needed) → characters/characters.png
- [ ] 7.2 Generate pages (with character descriptions embedded in prompt)
- [ ] Step 8: Completion report
流程
Input → Analyze → [Check Existing?] → [Confirm: Style + Reviews] → Storyboard → [Review?] → Prompts → [Review?] → Images → Complete
步驟摘要
| 步驟 | 操作 | 關鍵輸出 |
|---|---|---|
| 1.1 | 分析內容 | analysis.md, source-{slug}.md |
| 1.2 | 檢查現有目錄 | 處理衝突 |
| 2 | 確認風格、焦點、受眾、評論 | 用戶偏好 |
| 3 | 生成故事板 + 角色 | storyboard.md, characters/ |
| 4 | 審查大綱(如請求) | 用戶批准 |
| 5 | 生成提示詞 | prompts/*.md |
| 6 | 審查提示詞(如請求) | 用戶批准 |
| 7.1 | 生成角色表(如需要) | characters/characters.png |
| 7.2 | 生成頁面 | *.png 文件 |
| 8 | 完成報告 | 摘要 |
用戶提問
使用 clarify 工具來確認選項。由於 clarify 一次只處理一個問題,請先問最重要的問題,然後按順序進行。完整的步驟 2 問題集參見 references/workflow.md。
超時處理(關鍵):clarify 可能返回 "The user did not provide a response within the time limit. Use your best judgement to make the choice and proceed." — 這不代表用戶同意將所有內容設為默認值。
- 僅將其視為該單一問題的默認值。繼續按順序詢問剩餘的步驟 2 問題;每個問題都是獨立的同意點。
- 在下一條消息中向用戶明確展示該默認值,以便他們有機會糾正:例如,
"Style: defaulted to ohmsha preset (clarify timed out). Say the word to switch."— 未報告的默認值與從未詢問過無法區分。 - 不要在一次超時後將步驟 2 合併為單次“使用所有默認值”的操作。如果用戶確實缺席,他們對所有五個問題都會同樣缺席——但當他們回來時,他們可以糾正可見的默認值,而無法糾正不可見的默認值。
步驟 7:圖像生成
使用 Hermes 內置的 image_generate 工具進行所有圖像渲染。其 schema 僅接受 prompt 和 aspect_ratio(landscape | portrait | square);它返回一個 URL,而非本地文件。因此,必須將每個生成的頁面或角色表下載到輸出目錄。
提示詞文件要求(強制):在調用 image_generate 之前,將每張圖像的完整最終提示詞寫入 prompts/ 下的獨立文件(命名格式:NN-{type}-[slug].md)。提示詞文件是可復現性記錄。
縱橫比映射 — 故事板的 aspect_ratio 字段映射到 image_generate 的格式如下:
| 故事板縱橫比 | image_generate 格式 |
|---|---|
3:4, 9:16, 2:3 | portrait |
4:3, 16:9, 3:2 | landscape |
1:1 | square |
下載步驟 — 每次調用 image_generate 後:
- 從工具結果中讀取 URL
- 使用絕對輸出路徑獲取圖像字節,例如:
curl -fsSL "<url>" -o /abs/path/to/comic/<slug>/NN-page-<slug>.png - 在繼續下一頁之前,驗證該確切路徑下的文件是否存在且非空
切勿依賴 shell 當前工作目錄(CWD)的持久性來處理 -o 路徑。 終端工具的持久化 shell CWD 可能會在不同批次之間發生變化(會話過期、TERMINAL_LIFETIME_SECONDS 限制、或失敗的 cd 命令導致你留在錯誤的目錄中)。curl -o relative/path.png 是一個靜默的陷阱:如果 CWD 發生偏移,文件將被寫入其他位置且不會報錯。始終向 -o 傳遞完全限定的絕對路徑,或者向終端工具傳遞 workdir=<abs path>。2026 年 4 月事故:一部 10 頁漫畫的第 06-09 頁被錯誤地保存到了倉庫根目錄,而非 comic/<slug>/,原因是第 3 批任務繼承了第 2 批任務的過時 CWD,導致 curl -o 06-page-skills.png 寫入了錯誤的目錄。隨後 agent 花費了幾個回合聲稱文件存在於它們實際不存在的位置。
7.1 角色表(Character sheet) — 當漫畫為多頁且包含重複出現的角色時,生成角色表(保存至 characters/characters.png,縱橫比為 landscape)。對於簡單的預設(例如四格極簡風格)或單頁漫畫,請跳過此步驟。在調用 image_generate 之前,必須存在提示文件 characters/characters.md。渲染出的 PNG 是一個面向人類的審查工件(以便用戶直觀驗證角色設計),並作為後續重新生成或手動編輯提示的參考——它不驅動步驟 7.2。頁面提示已在步驟 5 中根據 characters/characters.md 中的文本描述編寫完成;image_generate 無法接受圖像作為視覺輸入。
7.2 頁面(Pages) — 在調用 image_generate 之前,每個頁面的提示必須已位於 prompts/NN-{cover|page}-[slug].md。由於 image_generate 僅基於提示,角色一致性是通過在步驟 5 期間將角色描述(源自 characters/characters.md)內聯嵌入到每個頁面提示中來強制執行的。無論是否在 7.1 中生成 PNG 表,嵌入操作均統一執行;PNG 僅作為審查/重新生成的輔助工具。
備份規則:對於現有的 prompts/…md 和 …png 文件 → 在重新生成之前,使用 -backup-YYYYMMDD-HHMMSS 後綴重命名。
完整的分步工作流程(分析、分鏡、審查關卡、重新生成變體):references/workflow.md。
參考資料
核心模板:
- analysis-framework.md - 深度內容分析
- character-template.md - 角色定義格式
- storyboard-template.md - 分鏡結構
- ohmsha-guide.md - Ohmsha 漫畫 specifics
風格定義:
references/art-styles/- 藝術風格(ligne-claire、manga、realistic、ink-brush、chalk、minimalist)references/tones/- 色調(neutral、warm、dramatic、romantic、energetic、vintage、action)references/presets/- 帶有特殊規則的預設(ohmsha、wuxia、shoujo、concept-story、four-panel)references/layouts/- 佈局(standard、cinematic、dense、splash、mixed、webtoon、four-panel)
工作流程:
- workflow.md - 完整工作流程詳情
- auto-selection.md - 內容信號分析
- partial-workflows.md - 部分工作流程選項
頁面修改
| 操作 | 步驟 |
|---|---|
| 編輯 | 首先更新提示文件 → 重新生成圖像 → 下載新的 PNG |
| 添加 | 在指定位置創建提示 → 生成時嵌入角色描述 → 重新編號後續頁面 → 更新分鏡 |
| 刪除 | 移除文件 → 重新編號後續頁面 → 更新分鏡 |
重要提示:更新頁面時,務必在重新生成之前首先更新提示文件(prompts/NN-{cover|page}-[slug].md)。這確保了更改有據可查且可復現。
常見陷阱
- 圖像生成:每頁耗時 10-30 秒;失敗時自動重試一次
- 務必下載
image_generate返回的 URL 到本地 PNG 文件——下游工具(以及用戶審查)期望輸出目錄中存在文件,而非臨時 URL - 為
curl -o使用絕對路徑——切勿依賴跨批次的持久化 shell 當前工作目錄(CWD)。這是一個隱蔽的陷阱:文件會落入錯誤的目錄,導致在預期路徑上執行ls時顯示為空。參見步驟 7“下載步驟”。 - 對敏感的公眾人物使用風格化的替代方案
- 需要確認步驟 2——不得跳過
- 步驟 4/6 為條件執行——僅當用戶在步驟 2 中請求時才執行
- 步驟 7.1 角色表——推薦用於多頁漫畫,對於簡單預設則為可選。該 PNG 文件用於輔助審查或重新生成;頁面提示詞(在步驟 5 中編寫)使用的是
characters/characters.md中的文本描述,而非 PNG 圖像。image_generate不接受圖像作為視覺輸入 - 清除機密信息——在寫入任何輸出文件之前,掃描源內容中是否包含 API 密鑰、令牌或憑證