跳到主要内容

歌曲创作与 AI 音乐

歌曲创作技巧、AI 音乐生成提示词(侧重 Suno)、戏仿/改编技巧、语音技巧以及经验教训。这些是工具和思路,而非规则。当艺术需要时,可以打破任何规则。

技能元数据

来源捆绑包(默认安装)
路径skills/creative/songwriting-and-ai-music

参考:完整 SKILL.md

信息

以下是 Hermes 在触发此技能时加载的完整技能定义。这是技能激活时代理看到的指令。

歌曲创作与 AI 音乐生成

这里的所有内容都是指南,而非规则。艺术会故意打破规则。 使用对歌曲有益的部分。忽略无益的部分。


1. 歌曲结构(选择一种或自创)

常见框架——根据需要混合、修改或抛弃:

ABABCB  Verse/Chorus/Verse/Chorus/Bridge/Chorus    (most pop/rock)
AABA Verse/Verse/Bridge/Verse (refrain-based) (jazz standards, ballads)
ABAB Verse/Chorus alternating (simple, direct)
AAA Verse/Verse/Verse (strophic, no chorus) (folk, storytelling)

六个构建模块:

  • 前奏 (Intro) — 营造氛围,吸引听众
  • 主歌 (Verse) — 故事、细节、世界观构建
  • 预副歌 (Pre-Chorus) — 高潮前的可选张力铺垫
  • 副歌 (Chorus) — 情感核心,人们记住的部分
  • 桥段 (Bridge) — 岔路,视角或调性的转变
  • 尾奏 (Outro) — 告别,可以呼应或颠覆其余部分

你不需要包含所有部分。一些优秀的歌曲仅由一个不断演变的段落组成。结构服务于情感,反之亦然。


2. 押韵、格律与声音

押韵类型(从紧密到松散):

  • 完全押韵 (Perfect):lean/mean
  • 家族押韵 (Family):crate/braid
  • 元音押韵 (Assonance):had/glass(元音相同,结尾不同)
  • 辅音押韵 (Consonance):scene/when(元音不同,结尾相似)
  • 近韵/斜韵 (Near/slant):足以暗示联系,但不强制锁定

混合使用它们。全部使用完全押韵听起来可能像童谣。 全部使用斜韵听起来可能显得懒散。精髓在于融合。

内部押韵 (INTERNAL RHYME):在行内押韵,而不仅仅在行尾。 "We pruned the lies from bleeding trees / Distilled the storm from entropy" — "lies/flies," "trees/entropy" 创造了内部回声。

格律 (METER):重读音节与非重读音节的节奏。

  • 平行行之间的音节数匹配有助于可唱性
  • 重读音节比总数更重要
  • 大声朗读。如果结巴,说明格律需要调整。
  • 故意打破格律可以创造强调或惊喜

3. 情感弧线与动态

将歌曲视为一段旅程,而非平坦的道路。

能量映射(大致概念,非规定): 前奏: 2-3 | 主歌: 5-6 | 预副歌: 7 副歌: 8-9 | 桥段: 可变 | 最终副歌: 9-10

最强大的动态技巧:对比

  • 尖叫之前的低语比单纯尖叫更有力
  • 稀疏先于密集。慢先于快。低先于高。
  • drop(高潮跌落)之所以有效,是因为有铺垫
  • 沉默也是一种乐器

“从低语到咆哮再到低语”——以亲密开始, buildup 至全功率, 然后剥离回归脆弱。适用于民谣、史诗、赞歌。


4. 撰写有效的歌词

展示,而非讲述(通常情况):

  • “我很伤心” = 平淡
  • “你的连帽衫还挂在门边的钩子上” = 生动
  • 但有时直白地说出“我献出生命”就是力量所在

记忆点 (THE HOOK)

  • 人们记住、哼唱、重复的那一行
  • 通常是标题或核心短语
  • 当旋律 + 歌词 + 情感一致时效果最佳
  • 将其放在冲击力最强的位置(通常是副歌的第一行或最后一行)

** prosody(词曲配合)** — 歌词与音乐相互支持:

  • 稳定的情感(解决、平静)搭配平稳的旋律、 完全押韵、 resolved 和弦
  • 不稳定的情感(渴望、怀疑)搭配游走的旋律、 近韵、未解决和弦
  • 主歌旋律通常较低,副歌较高
  • 但如果对歌曲有益,可以反转这一点

避免(除非你是故意为之):

  • 自动化的陈词滥调(未经铺垫的“金子般的心”)
  • 为了押韵而强行改变词序(“尤达式说话”)
  • 每个部分能量相同(动态平淡)
  • 将初稿视为神圣不可侵犯——修改即创作

5. 戏仿与改编

当用新歌词重写现有歌曲时:

骨架:首先映射原曲的结构。

  • 计算每行的音节数
  • 标记押韵方案(ABAB, AABB 等)
  • 识别哪些音节是重读
  • 注意长音/持续音出现的位置

填入新词

  • 将重读音节匹配到与原曲相同的节拍上
  • 总音节数可以浮动 1-2 个非重读音节
  • 在长持续音上,尽量匹配原曲的元音音色 (如果原曲用“oo”元音拉长“LOOOVE”,那么“FOOOD”比 “LIFE”更合适)
  • 在关键位置进行单音节替换以保持节奏完整 (Crime -> Code, Snake -> Noose)
  • 跟着原曲唱出新词——如果结巴,就修改

概念

  • 选择一个足以支撑整首歌的强大概念
  • 从标题/记忆点开始,向外构建
  • 首先生成大量原始素材(双关语、短语、意象), 然后将最好的素材融入结构中
  • 如果你需要在某处使用特定行,请逆向工程 押韵方案来为其铺垫

保留部分原文:保留少数原始行或结构不变,可增加辨识度,让受众感受到关联。


6. Suno AI 提示词工程

风格/流派描述字段

公式(按需调整): 流派 + 情绪 + 时代 + 乐器 + 人声风格 + 制作 + 动态变化

BAD:  "sad rock song"
GOOD: "Cinematic orchestral spy thriller, 1960s Cold War era, smoky
sultry female vocalist, big band jazz, brass section with
trumpets and french horns, sweeping strings, minor key,
vintage analog warmth"

描述旅程,而不仅仅是流派:

"Begins as a haunting whisper over sparse piano. Gradually layers
in muted brass. Builds through the chorus with full orchestra.
Second verse erupts with raw belting intensity. Outro strips back
to a lone piano and a fragile whisper fading to silence."

技巧:

  • V4.5+ 版本在“风格”字段支持多达 1,000 个字符 — 充分利用
  • 不要使用艺术家姓名或商标。改为描述声音。 “1960年代冷战间谍惊悚片铜管乐”而非“詹姆斯·邦德风格” “90年代垃圾摇滚”而非“涅槃乐队风格”
  • 如果有偏好,请指定 BPM 和调性
  • 使用“排除风格”字段来指定你想要的内容
  • 出人意料的流派组合可能成为亮点:“波萨诺瓦陷阱音乐”、 “阿巴拉契亚哥特”、“芯片音乐爵士”
  • 构建人声人物设定,而不仅仅是性别: “一位饱经风霜的伤感歌手,拥有烟熏般的女低音,略带沙哑, 从脆弱开始,逐渐建立起毁灭性的力量感”

元标签(放在歌词字段的 [方括号] 内)

结构: [Intro] [Verse] [Verse 1] [Pre-Chorus] [Chorus] [Post-Chorus] [Hook] [Bridge] [Interlude] [Instrumental] [Instrumental Break] [Guitar Solo] [Breakdown] [Build-up] [Outro] [Silence] [End]

人声表现: [Whispered] [Spoken Word] [Belted] [Falsetto] [Powerful] [Soulful] [Raspy] [Breathy] [Smooth] [Gritty] [Staccato] [Legato] [Vibrato] [Melismatic] [Harmonies] [Choir] [Harmonized Chorus]

动态变化: [High Energy] [Low Energy] [Building Energy] [Explosive] [Emotional Climax] [Gradual swell] [Orchestral swell] [Quiet arrangement] [Falling tension] [Slow Down]

性别: [Female Vocals] [Male Vocals]

氛围: [Melancholic] [Euphoric] [Nostalgic] [Aggressive] [Dreamy] [Intimate] [Dark Atmosphere]

音效: [Vinyl Crackle] [Rain] [Applause] [Static] [Thunder]

为了加强效果,请在风格字段歌词中都放置标签。 每部分最多保留 5-8 个标签 — 太多会让 AI 困惑。 不要自相矛盾(在同一部分中同时使用 [Calm] 和 [Aggressive])。

自定义模式

  • 进行严肃创作时始终使用自定义模式(分离“风格”+“歌词”)
  • 歌词字段限制:约 3,000 个字符(约 40-60 行)
  • 始终添加结构标签 — 如果没有它们,Suno 默认会生成平淡的 主歌/副歌/主歌结构,缺乏情感起伏

7. AI 歌手的语音技巧

AI 歌手不阅读文本 — 它们进行发音。请帮助它们:

语音重拼:

  • 按照发音拼写单词:“through” -> “thru”
  • 专有名词的错误率最高 — 尽早测试
  • “Nous” -> “Noose”(强制正确发音)
  • 使用连字符引导音节:“Re-search”、“bio-engineering”

演绎控制:

  • 全大写 = 更响亮、更强烈
  • 元音延长:“lo-o-o-ove” = 持续音/ melisma(花腔)
  • 省略号:“I... need... you” = 戏剧性停顿
  • 连字符拉伸:“ne-e-ed” = 情感拉伸

始终:

  • 将数字拼写出来:“24/7” -> “twenty four seven”
  • 将首字母缩写分开:“AI” -> “A I” 或 “A-I”
  • 先在简短的 30 秒片段中测试专有名词/生僻词
  • 一旦生成,发音就固定了 — 务必在生成之前在歌词中修正

8. 工作流

  1. 先撰写概念/钩子(hook)— 情感核心是什么?
  2. 如果是改编,映射原始结构(音节、押韵、重音)
  3. 生成原始素材 — 在结构化之前自由头脑风暴
  4. 将歌词草稿填入结构中
  5. 大声朗读/演唱 — 捕捉拗口之处,修正格律
  6. 构建 Suno 风格描述 — 描绘动态旅程
  7. 在歌词中添加元标签以指导表演
  8. 至少生成 3-5 个变体 — 将它们视为录音试唱
  9. 挑选最佳版本,使用“扩展/继续”功能基于有潜力的部分进行构建
  10. 如果偶然发生了很棒的效果,保留它

预期:每获得 1 个好结果大约需要 ~3-5 次生成。修改是正常的。 在扩展过程中风格可能会漂移 — 扩展时重申流派/情绪。


9. 经验教训

  • 在风格字段中描述动态弧线比仅仅列出流派重要得多。“从低语到咆哮再到低语”为 Suno 提供了表演地图。
  • 在戏仿作品中保留部分原始行不变,可增加辨识度和情感重量 — 受众能感受到原作的影子。
  • 歌曲中的桥段(bridge)位置是转换意象的地方。 将原作的具体引用替换为你主题中的隐喻,同时保持其情感功能(反思、转折、启示)。
  • 在钩子/标签中使用单音节词替换,是在改变含义的同时保持节奏的最干净方式。
  • 在风格字段中对人声人物设定的强力描述,比任何单个元标签带来的影响都更大。
  • 不要拘泥于规则。如果某一行破坏了格律但冲击力更强,那就保留它。感觉才是最重要的。技艺服务于艺术,反之亦然。