歌曲创作与 AI 音乐

歌曲创作技巧、AI 音乐生成提示词（侧重 Suno）、戏仿/改编技巧、语音技巧以及经验教训。这些是工具和思路，而非规则。当艺术需要时，可以打破任何规则。

技能元数据


来源	捆绑包（默认安装）
路径	`skills/creative/songwriting-and-ai-music`

参考：完整 SKILL.md

信息

以下是 Hermes 在触发此技能时加载的完整技能定义。这是技能激活时代理看到的指令。

歌曲创作与 AI 音乐生成

这里的所有内容都是指南，而非规则。艺术会故意打破规则。使用对歌曲有益的部分。忽略无益的部分。

1. 歌曲结构（选择一种或自创）

常见框架——根据需要混合、修改或抛弃：

ABABCB  Verse/Chorus/Verse/Chorus/Bridge/Chorus    (most pop/rock)
AABA    Verse/Verse/Bridge/Verse (refrain-based)    (jazz standards, ballads)
ABAB    Verse/Chorus alternating                    (simple, direct)
AAA     Verse/Verse/Verse (strophic, no chorus)     (folk, storytelling)

六个构建模块：

前奏 (Intro) — 营造氛围，吸引听众
主歌 (Verse) — 故事、细节、世界观构建
预副歌 (Pre-Chorus) — 高潮前的可选张力铺垫
副歌 (Chorus) — 情感核心，人们记住的部分
桥段 (Bridge) — 岔路，视角或调性的转变
尾奏 (Outro) — 告别，可以呼应或颠覆其余部分

你不需要包含所有部分。一些优秀的歌曲仅由一个不断演变的段落组成。结构服务于情感，反之亦然。

2. 押韵、格律与声音

押韵类型（从紧密到松散）：

完全押韵 (Perfect)：lean/mean
家族押韵 (Family)：crate/braid
元音押韵 (Assonance)：had/glass（元音相同，结尾不同）
辅音押韵 (Consonance)：scene/when（元音不同，结尾相似）
近韵/斜韵 (Near/slant)：足以暗示联系，但不强制锁定

混合使用它们。全部使用完全押韵听起来可能像童谣。全部使用斜韵听起来可能显得懒散。精髓在于融合。

内部押韵 (INTERNAL RHYME)：在行内押韵，而不仅仅在行尾。 "We pruned the lies from bleeding trees / Distilled the storm from entropy" — "lies/flies," "trees/entropy" 创造了内部回声。

格律 (METER)：重读音节与非重读音节的节奏。

平行行之间的音节数匹配有助于可唱性
重读音节比总数更重要
大声朗读。如果结巴，说明格律需要调整。
故意打破格律可以创造强调或惊喜

3. 情感弧线与动态

将歌曲视为一段旅程，而非平坦的道路。

能量映射（大致概念，非规定）：前奏: 2-3 | 主歌: 5-6 | 预副歌: 7 副歌: 8-9 | 桥段: 可变 | 最终副歌: 9-10

最强大的动态技巧：对比。

尖叫之前的低语比单纯尖叫更有力
稀疏先于密集。慢先于快。低先于高。
drop（高潮跌落）之所以有效，是因为有铺垫
沉默也是一种乐器

“从低语到咆哮再到低语”——以亲密开始， buildup 至全功率，然后剥离回归脆弱。适用于民谣、史诗、赞歌。

4. 撰写有效的歌词

展示，而非讲述（通常情况）：

“我很伤心” = 平淡
“你的连帽衫还挂在门边的钩子上” = 生动
但有时直白地说出“我献出生命”就是力量所在

记忆点 (THE HOOK)：

人们记住、哼唱、重复的那一行
通常是标题或核心短语
当旋律 + 歌词 + 情感一致时效果最佳
将其放在冲击力最强的位置（通常是副歌的第一行或最后一行）

** prosody（词曲配合）** — 歌词与音乐相互支持：

稳定的情感（解决、平静）搭配平稳的旋律、完全押韵、 resolved 和弦
不稳定的情感（渴望、怀疑）搭配游走的旋律、近韵、未解决和弦
主歌旋律通常较低，副歌较高
但如果对歌曲有益，可以反转这一点

避免（除非你是故意为之）：

自动化的陈词滥调（未经铺垫的“金子般的心”）
为了押韵而强行改变词序（“尤达式说话”）
每个部分能量相同（动态平淡）
将初稿视为神圣不可侵犯——修改即创作

5. 戏仿与改编

当用新歌词重写现有歌曲时：

骨架：首先映射原曲的结构。

计算每行的音节数
标记押韵方案（ABAB, AABB 等）
识别哪些音节是重读的
注意长音/持续音出现的位置

填入新词：

将重读音节匹配到与原曲相同的节拍上
总音节数可以浮动 1-2 个非重读音节
在长持续音上，尽量匹配原曲的元音音色 （如果原曲用“oo”元音拉长“LOOOVE”，那么“FOOOD”比 “LIFE”更合适）
在关键位置进行单音节替换以保持节奏完整（Crime -> Code, Snake -> Noose）
跟着原曲唱出新词——如果结巴，就修改

概念：

选择一个足以支撑整首歌的强大概念
从标题/记忆点开始，向外构建
首先生成大量原始素材（双关语、短语、意象），然后将最好的素材融入结构中
如果你需要在某处使用特定行，请逆向工程押韵方案来为其铺垫

保留部分原文：保留少数原始行或结构不变，可增加辨识度，让受众感受到关联。

6. Suno AI 提示词工程

风格/流派描述字段

公式（按需调整）：流派 + 情绪 + 时代 + 乐器 + 人声风格 + 制作 + 动态变化

BAD:  "sad rock song"
GOOD: "Cinematic orchestral spy thriller, 1960s Cold War era, smoky
       sultry female vocalist, big band jazz, brass section with
       trumpets and french horns, sweeping strings, minor key,
       vintage analog warmth"

描述旅程，而不仅仅是流派：

"Begins as a haunting whisper over sparse piano. Gradually layers
 in muted brass. Builds through the chorus with full orchestra.
 Second verse erupts with raw belting intensity. Outro strips back
 to a lone piano and a fragile whisper fading to silence."

技巧：

V4.5+ 版本在“风格”字段支持多达 1,000 个字符 — 充分利用
不要使用艺术家姓名或商标。改为描述声音。 “1960年代冷战间谍惊悚片铜管乐”而非“詹姆斯·邦德风格” “90年代垃圾摇滚”而非“涅槃乐队风格”
如果有偏好，请指定 BPM 和调性
使用“排除风格”字段来指定你不想要的内容
出人意料的流派组合可能成为亮点：“波萨诺瓦陷阱音乐”、 “阿巴拉契亚哥特”、“芯片音乐爵士”
构建人声人物设定，而不仅仅是性别： “一位饱经风霜的伤感歌手，拥有烟熏般的女低音，略带沙哑，从脆弱开始，逐渐建立起毁灭性的力量感”

元标签（放在歌词字段的 [方括号] 内）

结构： [Intro] [Verse] [Verse 1] [Pre-Chorus] [Chorus] [Post-Chorus] [Hook] [Bridge] [Interlude] [Instrumental] [Instrumental Break] [Guitar Solo] [Breakdown] [Build-up] [Outro] [Silence] [End]

人声表现： [Whispered] [Spoken Word] [Belted] [Falsetto] [Powerful] [Soulful] [Raspy] [Breathy] [Smooth] [Gritty] [Staccato] [Legato] [Vibrato] [Melismatic] [Harmonies] [Choir] [Harmonized Chorus]

动态变化： [High Energy] [Low Energy] [Building Energy] [Explosive] [Emotional Climax] [Gradual swell] [Orchestral swell] [Quiet arrangement] [Falling tension] [Slow Down]

性别： [Female Vocals] [Male Vocals]

氛围： [Melancholic] [Euphoric] [Nostalgic] [Aggressive] [Dreamy] [Intimate] [Dark Atmosphere]

音效： [Vinyl Crackle] [Rain] [Applause] [Static] [Thunder]

为了加强效果，请在风格字段和歌词中都放置标签。每部分最多保留 5-8 个标签 — 太多会让 AI 困惑。不要自相矛盾（在同一部分中同时使用 [Calm] 和 [Aggressive]）。

自定义模式

进行严肃创作时始终使用自定义模式（分离“风格”+“歌词”）
歌词字段限制：约 3,000 个字符（约 40-60 行）
始终添加结构标签 — 如果没有它们，Suno 默认会生成平淡的主歌/副歌/主歌结构，缺乏情感起伏

7. AI 歌手的语音技巧

AI 歌手不阅读文本 — 它们进行发音。请帮助它们：

语音重拼：

按照发音拼写单词：“through” -> “thru”
专有名词的错误率最高 — 尽早测试
“Nous” -> “Noose”（强制正确发音）
使用连字符引导音节：“Re-search”、“bio-engineering”

演绎控制：

全大写 = 更响亮、更强烈
元音延长：“lo-o-o-ove” = 持续音/ melisma（花腔）
省略号：“I... need... you” = 戏剧性停顿
连字符拉伸：“ne-e-ed” = 情感拉伸

始终：

将数字拼写出来：“24/7” -> “twenty four seven”
将首字母缩写分开：“AI” -> “A I” 或 “A-I”
先在简短的 30 秒片段中测试专有名词/生僻词
一旦生成，发音就固定了 — 务必在生成之前在歌词中修正

8. 工作流

先撰写概念/钩子（hook）— 情感核心是什么？
如果是改编，映射原始结构（音节、押韵、重音）
生成原始素材 — 在结构化之前自由头脑风暴
将歌词草稿填入结构中
大声朗读/演唱 — 捕捉拗口之处，修正格律
构建 Suno 风格描述 — 描绘动态旅程
在歌词中添加元标签以指导表演
至少生成 3-5 个变体 — 将它们视为录音试唱
挑选最佳版本，使用“扩展/继续”功能基于有潜力的部分进行构建
如果偶然发生了很棒的效果，保留它

预期：每获得 1 个好结果大约需要 ~3-5 次生成。修改是正常的。在扩展过程中风格可能会漂移 — 扩展时重申流派/情绪。

9. 经验教训

在风格字段中描述动态弧线比仅仅列出流派重要得多。“从低语到咆哮再到低语”为 Suno 提供了表演地图。
在戏仿作品中保留部分原始行不变，可增加辨识度和情感重量 — 受众能感受到原作的影子。
歌曲中的桥段（bridge）位置是转换意象的地方。将原作的具体引用替换为你主题中的隐喻，同时保持其情感功能（反思、转折、启示）。
在钩子/标签中使用单音节词替换，是在改变含义的同时保持节奏的最干净方式。
在风格字段中对人声人物设定的强力描述，比任何单个元标签带来的影响都更大。
不要拘泥于规则。如果某一行破坏了格律但冲击力更强，那就保留它。感觉才是最重要的。技艺服务于艺术，反之亦然。

技能元数据​

参考：完整 SKILL.md​

歌曲创作与 AI 音乐生成

1. 歌曲结构（选择一种或自创）​

2. 押韵、格律与声音​

3. 情感弧线与动态​

4. 撰写有效的歌词​

5. 戏仿与改编​

6. Suno AI 提示词工程​

风格/流派描述字段​

元标签（放在歌词字段的 [方括号] 内）​

自定义模式​

7. AI 歌手的语音技巧​

8. 工作流​

9. 经验教训​