歌曲创作与 AI 音乐
歌曲创作技巧、AI 音乐生成提示词(侧重 Suno)、戏仿/改编技巧、语音技巧以及经验教训。这些是工具和思路,而非规则。当艺术需要时,可以打破任何规则。
技能元数据
| 来源 | 捆绑包(默认安装) |
| 路径 | skills/creative/songwriting-and-ai-music |
参考:完整 SKILL.md
以下是 Hermes 在触发此技能时加载的完整技能定义。这是技能激活时代理看到的指令。
歌曲创作与 AI 音乐生成
这里的所有内容都是指南,而非规则。艺术会故意打破规则。 使用对歌曲有益的部分。忽略无益的部分。
1. 歌曲结构(选择一种或自创)
常见框架——根据需要混合、修改或抛弃:
ABABCB Verse/Chorus/Verse/Chorus/Bridge/Chorus (most pop/rock)
AABA Verse/Verse/Bridge/Verse (refrain-based) (jazz standards, ballads)
ABAB Verse/Chorus alternating (simple, direct)
AAA Verse/Verse/Verse (strophic, no chorus) (folk, storytelling)
六个构建模块:
- 前奏 (Intro) — 营造氛围,吸引听众
- 主歌 (Verse) — 故事、细节、世界观构建
- 预副歌 (Pre-Chorus) — 高潮前的可选张力铺垫
- 副歌 (Chorus) — 情感核心,人们记住的部分
- 桥段 (Bridge) — 岔路,视角或调性的转变
- 尾奏 (Outro) — 告别,可以呼应或颠覆其余部分
你不需要包含所有部分。一些优秀的歌曲仅由一个不断演变的段落组成。结构服务于情感,反之亦然。
2. 押韵、格律与声音
押韵类型(从紧密到松散):
- 完全押韵 (Perfect):lean/mean
- 家族押韵 (Family):crate/braid
- 元音押韵 (Assonance):had/glass(元音相同,结尾不同)
- 辅音押韵 (Consonance):scene/when(元音不同,结尾相似)
- 近韵/斜韵 (Near/slant):足以暗示联系,但不强制锁定
混合使用它们。全部使用完全押韵听起来可能像童谣。 全部使用斜韵听起来可能显得懒散。精髓在于融合。
内部押韵 (INTERNAL RHYME):在行内押韵,而不仅仅在行尾。 "We pruned the lies from bleeding trees / Distilled the storm from entropy" — "lies/flies," "trees/entropy" 创造了内部回声。
格律 (METER):重读音节与非重读音节的节奏。
- 平行行之间的音节数匹配有助于可唱性
- 重读音节比总数更重要
- 大声朗读。如果结巴,说明格律需要调整。
- 故意打破格律可以创造强调或惊喜
3. 情感弧线与动态
将歌曲视为一段旅程,而非平坦的道路。
能量映射(大致概念,非规定): 前奏: 2-3 | 主歌: 5-6 | 预副歌: 7 副歌: 8-9 | 桥段: 可变 | 最终副歌: 9-10
最强大的动态技巧:对比。
- 尖叫之前的低语比单纯尖叫更有力
- 稀疏先于密集。慢先于快。低先于高。
- drop(高潮跌落)之所以有效,是因为有铺垫
- 沉默也是一种乐器
“从低语到咆哮再到低语”——以亲密开始, buildup 至全功率, 然后剥离回归脆弱。适用于民谣、史诗、赞歌。
4. 撰写有效的歌词
展示,而非讲述(通常情况):
- “我很伤心” = 平淡
- “你的连帽衫还挂在门边的钩子上” = 生动
- 但有时直白地说出“我献出生命”就是力量所在
记忆点 (THE HOOK):
- 人们记住、哼唱、重复的那一行
- 通常是标题或核心短语
- 当旋律 + 歌词 + 情感一致时效果最佳
- 将其放在冲击力最强的位置(通常是副歌的第一行或最后一行)
** prosody(词曲配合)** — 歌词与音乐相互支持:
- 稳定的情感(解决、平静)搭配平稳的旋律、 完全押韵、 resolved 和弦
- 不稳定的情感(渴望、怀疑)搭配游走的旋律、 近韵、未解决和弦
- 主歌旋律通常较低,副歌较高
- 但如果对歌曲有益,可以反转这一点
避免(除非你是故意为之):
- 自动化的陈词滥调(未经铺垫的“金子般的心”)
- 为了押韵而强行改变词序(“尤达式说话”)
- 每个部分能量相同(动态平淡)
- 将初稿视为神圣不可侵犯——修改即创作
5. 戏仿与改编
当用新歌词重写现有歌曲时:
骨架:首先映射原曲的结构。
- 计算每行的音节数
- 标记押韵方案(ABAB, AABB 等)
- 识别哪些音节是重读的
- 注意长音/持续音出现的位置
填入新词:
- 将重读音节匹配到与原曲相同的节拍上
- 总音节数可以浮动 1-2 个非重读音节
- 在长持续音上,尽量匹配原曲的元音音色 (如果原曲用“oo”元音拉长“LOOOVE”,那么“FOOOD”比 “LIFE”更合适)
- 在关键位置进行单音节替换以保持节奏完整 (Crime -> Code, Snake -> Noose)
- 跟着原曲唱出新词——如果结巴,就修改
概念:
- 选择一个足以支撑整首歌的强大概念
- 从标题/记忆点开始,向外构建
- 首先生成大量原始素材(双关语、短语、意象), 然后将最好的素材融入结构中
- 如果你需要在某处使用特定行,请逆向工程 押韵方案来为其铺垫
保留部分原文:保留少数原始行或结构不变,可增加辨识度,让受众感受到关联。
6. Suno AI 提示词工程
风格/流派描述字段
公式(按需调整): 流派 + 情绪 + 时代 + 乐器 + 人声风格 + 制作 + 动态变化
BAD: "sad rock song"
GOOD: "Cinematic orchestral spy thriller, 1960s Cold War era, smoky
sultry female vocalist, big band jazz, brass section with
trumpets and french horns, sweeping strings, minor key,
vintage analog warmth"
描述旅程,而不仅仅是流派:
"Begins as a haunting whisper over sparse piano. Gradually layers
in muted brass. Builds through the chorus with full orchestra.
Second verse erupts with raw belting intensity. Outro strips back
to a lone piano and a fragile whisper fading to silence."
技巧:
- V4.5+ 版本在“风格”字段支持多达 1,000 个字符 — 充分利用
- 不要使用艺术家姓名或商标。改为描述声音。 “1960年代冷战间谍惊悚片铜管乐”而非“詹姆斯·邦德风格” “90年代垃圾摇滚”而非“涅槃乐队风格”
- 如果有偏好,请指定 BPM 和调性
- 使用“排除风格”字段来指定你不想要的内容
- 出人意料的流派组合可能成为亮点:“波萨诺瓦陷阱音乐”、 “阿巴拉契亚哥特”、“芯片音乐爵士”
- 构建人声人物设定,而不仅仅是性别: “一位饱经风霜的伤感歌手,拥有烟熏般的女低音,略带沙哑, 从脆弱开始,逐渐建立起毁灭性的力量感”
元标签(放在歌词字段的 [方括号] 内)
结构: [Intro] [Verse] [Verse 1] [Pre-Chorus] [Chorus] [Post-Chorus] [Hook] [Bridge] [Interlude] [Instrumental] [Instrumental Break] [Guitar Solo] [Breakdown] [Build-up] [Outro] [Silence] [End]
人声表现: [Whispered] [Spoken Word] [Belted] [Falsetto] [Powerful] [Soulful] [Raspy] [Breathy] [Smooth] [Gritty] [Staccato] [Legato] [Vibrato] [Melismatic] [Harmonies] [Choir] [Harmonized Chorus]
动态变化: [High Energy] [Low Energy] [Building Energy] [Explosive] [Emotional Climax] [Gradual swell] [Orchestral swell] [Quiet arrangement] [Falling tension] [Slow Down]
性别: [Female Vocals] [Male Vocals]
氛围: [Melancholic] [Euphoric] [Nostalgic] [Aggressive] [Dreamy] [Intimate] [Dark Atmosphere]
音效: [Vinyl Crackle] [Rain] [Applause] [Static] [Thunder]
为了加强效果,请在风格字段和歌词中都放置标签。 每部分最多保留 5-8 个标签 — 太多会让 AI 困惑。 不要自相矛盾(在同一部分中同时使用 [Calm] 和 [Aggressive])。
自定义模式
- 进行严肃创作时始终使用自定义模式(分离“风格”+“歌词”)
- 歌词字段限制:约 3,000 个字符(约 40-60 行)
- 始终添加结构标签 — 如果没有它们,Suno 默认会生成平淡的 主歌/副歌/主歌结构,缺乏情感起伏
7. AI 歌手的语音技巧
AI 歌手不阅读文本 — 它们进行发音。请帮助它们:
语音重拼:
- 按照发音拼写单词:“through” -> “thru”
- 专有名词的错误率最高 — 尽早测试
- “Nous” -> “Noose”(强制正确发音)
- 使用连字符引导音节:“Re-search”、“bio-engineering”
演绎控制:
- 全大写 = 更响亮、更强烈
- 元音延长:“lo-o-o-ove” = 持续音/ melisma(花腔)
- 省略号:“I... need... you” = 戏剧性停顿
- 连字符拉伸:“ne-e-ed” = 情感拉伸
始终:
- 将数字拼写出来:“24/7” -> “twenty four seven”
- 将首字母缩写分开:“AI” -> “A I” 或 “A-I”
- 先在简短的 30 秒片段中测试专有名词/生僻词
- 一旦生成,发音就固定了 — 务必在生成之前在歌词中修正
8. 工作流
- 先撰写概念/钩子(hook)— 情感核心是什么?
- 如果是改编,映射原始结构(音节、押韵、重音)
- 生成原始素材 — 在结构化之前自由头脑风暴
- 将歌词草稿填入结构中
- 大声朗读/演唱 — 捕捉拗口之处,修正格律
- 构建 Suno 风格描述 — 描绘动态旅程
- 在歌词中添加元标签以指导表演
- 至少生成 3-5 个变体 — 将它们视为录音试唱
- 挑选最佳版本,使用“扩展/继续”功能基于有潜力的部分进行构建
- 如果偶然发生了很棒的效果,保留它
预期:每获得 1 个好结果大约需要 ~3-5 次生成。修改是正常的。 在扩展过程中风格可能会漂移 — 扩展时重申流派/情绪。
9. 经验教训
- 在风格字段中描述动态弧线比仅仅列出流派重要得多。“从低语到咆哮再到低语”为 Suno 提供了表演地图。
- 在戏仿作品中保留部分原始行不变,可增加辨识度和情感重量 — 受众能感受到原作的影子。
- 歌曲中的桥段(bridge)位置是转换意象的地方。 将原作的具体引用替换为你主题中的隐喻,同时保持其情感功能(反思、转折、启示)。
- 在钩子/标签中使用单音节词替换,是在改变含义的同时保持节奏的最干净方式。
- 在风格字段中对人声人物设定的强力描述,比任何单个元标签带来的影响都更大。
- 不要拘泥于规则。如果某一行破坏了格律但冲击力更强,那就保留它。感觉才是最重要的。技艺服务于艺术,反之亦然。