跳到主要內容

歌曲創作與 AI 音樂

歌曲創作技巧、AI 音樂生成提示詞(側重 Suno)、戲仿/改編技巧、語音技巧以及經驗教訓。這些是工具和思路,而非規則。當藝術需要時,可以打破任何規則。

技能元數據

來源捆綁包(默認安裝)
路徑skills/creative/songwriting-and-ai-music

參考:完整 SKILL.md

信息

以下是 Hermes 在觸發此技能時加載的完整技能定義。這是技能激活時代理看到的指令。

歌曲創作與 AI 音樂生成

這裡的所有內容都是指南,而非規則。藝術會故意打破規則。 使用對歌曲有益的部分。忽略無益的部分。


1. 歌曲結構(選擇一種或自創)

常見框架——根據需要混合、修改或拋棄:

ABABCB  Verse/Chorus/Verse/Chorus/Bridge/Chorus    (most pop/rock)
AABA Verse/Verse/Bridge/Verse (refrain-based) (jazz standards, ballads)
ABAB Verse/Chorus alternating (simple, direct)
AAA Verse/Verse/Verse (strophic, no chorus) (folk, storytelling)

六個構建模塊:

  • 前奏 (Intro) — 營造氛圍,吸引聽眾
  • 主歌 (Verse) — 故事、細節、世界觀構建
  • 預副歌 (Pre-Chorus) — 高潮前的可選張力鋪墊
  • 副歌 (Chorus) — 情感核心,人們記住的部分
  • 橋段 (Bridge) — 岔路,視角或調性的轉變
  • 尾奏 (Outro) — 告別,可以呼應或顛覆其餘部分

你不需要包含所有部分。一些優秀的歌曲僅由一個不斷演變的段落組成。結構服務於情感,反之亦然。


2. 押韻、格律與聲音

押韻類型(從緊密到鬆散):

  • 完全押韻 (Perfect):lean/mean
  • 家族押韻 (Family):crate/braid
  • 元音押韻 (Assonance):had/glass(元音相同,結尾不同)
  • 輔音押韻 (Consonance):scene/when(元音不同,結尾相似)
  • 近韻/斜韻 (Near/slant):足以暗示聯繫,但不強制鎖定

混合使用它們。全部使用完全押韻聽起來可能像童謠。 全部使用斜韻聽起來可能顯得懶散。精髓在於融合。

內部押韻 (INTERNAL RHYME):在行內押韻,而不僅僅在行尾。 "We pruned the lies from bleeding trees / Distilled the storm from entropy" — "lies/flies," "trees/entropy" 創造了內部回聲。

格律 (METER):重讀音節與非重讀音節的節奏。

  • 平行行之間的音節數匹配有助於可唱性
  • 重讀音節比總數更重要
  • 大聲朗讀。如果結巴,說明格律需要調整。
  • 故意打破格律可以創造強調或驚喜

3. 情感弧線與動態

將歌曲視為一段旅程,而非平坦的道路。

能量映射(大致概念,非規定): 前奏: 2-3 | 主歌: 5-6 | 預副歌: 7 副歌: 8-9 | 橋段: 可變 | 最終副歌: 9-10

最強大的動態技巧:對比

  • 尖叫之前的低語比單純尖叫更有力
  • 稀疏先於密集。慢先於快。低先於高。
  • drop(高潮跌落)之所以有效,是因為有鋪墊
  • 沉默也是一種樂器

“從低語到咆哮再到低語”——以親密開始, buildup 至全功率, 然後剝離迴歸脆弱。適用於民謠、史詩、讚歌。


4. 撰寫有效的歌詞

展示,而非講述(通常情況):

  • “我很傷心” = 平淡
  • “你的連帽衫還掛在門邊的鉤子上” = 生動
  • 但有時直白地說出“我獻出生命”就是力量所在

記憶點 (THE HOOK)

  • 人們記住、哼唱、重複的那一行
  • 通常是標題或核心短語
  • 當旋律 + 歌詞 + 情感一致時效果最佳
  • 將其放在衝擊力最強的位置(通常是副歌的第一行或最後一行)

** prosody(詞曲配合)** — 歌詞與音樂相互支持:

  • 穩定的情感(解決、平靜)搭配平穩的旋律、 完全押韻、 resolved 和絃
  • 不穩定的情感(渴望、懷疑)搭配遊走的旋律、 近韻、未解決和絃
  • 主歌旋律通常較低,副歌較高
  • 但如果對歌曲有益,可以反轉這一點

避免(除非你是故意為之):

  • 自動化的陳詞濫調(未經鋪墊的“金子般的心”)
  • 為了押韻而強行改變詞序(“尤達式說話”)
  • 每個部分能量相同(動態平淡)
  • 將初稿視為神聖不可侵犯——修改即創作

5. 戲仿與改編

當用新歌詞重寫現有歌曲時:

骨架:首先映射原曲的結構。

  • 計算每行的音節數
  • 標記押韻方案(ABAB, AABB 等)
  • 識別哪些音節是重讀
  • 注意長音/持續音出現的位置

填入新詞

  • 將重讀音節匹配到與原曲相同的節拍上
  • 總音節數可以浮動 1-2 個非重讀音節
  • 在長持續音上,儘量匹配原曲的元音音色 (如果原曲用“oo”元音拉長“LOOOVE”,那麼“FOOOD”比 “LIFE”更合適)
  • 在關鍵位置進行單音節替換以保持節奏完整 (Crime -> Code, Snake -> Noose)
  • 跟著原曲唱出新詞——如果結巴,就修改

概念

  • 選擇一個足以支撐整首歌的強大概念
  • 從標題/記憶點開始,向外構建
  • 首先生成大量原始素材(雙關語、短語、意象), 然後將最好的素材融入結構中
  • 如果你需要在某處使用特定行,請逆向工程 押韻方案來為其鋪墊

保留部分原文:保留少數原始行或結構不變,可增加辨識度,讓受眾感受到關聯。


6. Suno AI 提示詞工程

風格/流派描述字段

公式(按需調整): 流派 + 情緒 + 時代 + 樂器 + 人聲風格 + 製作 + 動態變化

BAD:  "sad rock song"
GOOD: "Cinematic orchestral spy thriller, 1960s Cold War era, smoky
sultry female vocalist, big band jazz, brass section with
trumpets and french horns, sweeping strings, minor key,
vintage analog warmth"

描述旅程,而不僅僅是流派:

"Begins as a haunting whisper over sparse piano. Gradually layers
in muted brass. Builds through the chorus with full orchestra.
Second verse erupts with raw belting intensity. Outro strips back
to a lone piano and a fragile whisper fading to silence."

技巧:

  • V4.5+ 版本在“風格”字段支持多達 1,000 個字符 — 充分利用
  • 不要使用藝術家姓名或商標。改為描述聲音。 “1960年代冷戰間諜驚悚片銅管樂”而非“詹姆斯·邦德風格” “90年代垃圾搖滾”而非“涅槃樂隊風格”
  • 如果有偏好,請指定 BPM 和調性
  • 使用“排除風格”字段來指定你想要的內容
  • 出人意料的流派組合可能成為亮點:“波薩諾瓦陷阱音樂”、 “阿巴拉契亞哥特”、“芯片音樂爵士”
  • 構建人聲人物設定,而不僅僅是性別: “一位飽經風霜的傷感歌手,擁有煙燻般的女低音,略帶沙啞, 從脆弱開始,逐漸建立起毀滅性的力量感”

元標籤(放在歌詞字段的 [方括號] 內)

結構: [Intro] [Verse] [Verse 1] [Pre-Chorus] [Chorus] [Post-Chorus] [Hook] [Bridge] [Interlude] [Instrumental] [Instrumental Break] [Guitar Solo] [Breakdown] [Build-up] [Outro] [Silence] [End]

人聲表現: [Whispered] [Spoken Word] [Belted] [Falsetto] [Powerful] [Soulful] [Raspy] [Breathy] [Smooth] [Gritty] [Staccato] [Legato] [Vibrato] [Melismatic] [Harmonies] [Choir] [Harmonized Chorus]

動態變化: [High Energy] [Low Energy] [Building Energy] [Explosive] [Emotional Climax] [Gradual swell] [Orchestral swell] [Quiet arrangement] [Falling tension] [Slow Down]

性別: [Female Vocals] [Male Vocals]

氛圍: [Melancholic] [Euphoric] [Nostalgic] [Aggressive] [Dreamy] [Intimate] [Dark Atmosphere]

音效: [Vinyl Crackle] [Rain] [Applause] [Static] [Thunder]

為了加強效果,請在風格字段歌詞中都放置標籤。 每部分最多保留 5-8 個標籤 — 太多會讓 AI 困惑。 不要自相矛盾(在同一部分中同時使用 [Calm] 和 [Aggressive])。

自定義模式

  • 進行嚴肅創作時始終使用自定義模式(分離“風格”+“歌詞”)
  • 歌詞字段限制:約 3,000 個字符(約 40-60 行)
  • 始終添加結構標籤 — 如果沒有它們,Suno 默認會生成平淡的 主歌/副歌/主歌結構,缺乏情感起伏

7. AI 歌手的語音技巧

AI 歌手不閱讀文本 — 它們進行發音。請幫助它們:

語音重拼:

  • 按照發音拼寫單詞:“through” -> “thru”
  • 專有名詞的錯誤率最高 — 儘早測試
  • “Nous” -> “Noose”(強制正確發音)
  • 使用連字符引導音節:“Re-search”、“bio-engineering”

演繹控制:

  • 全大寫 = 更響亮、更強烈
  • 元音延長:“lo-o-o-ove” = 持續音/ melisma(花腔)
  • 省略號:“I... need... you” = 戲劇性停頓
  • 連字符拉伸:“ne-e-ed” = 情感拉伸

始終:

  • 將數字拼寫出來:“24/7” -> “twenty four seven”
  • 將首字母縮寫分開:“AI” -> “A I” 或 “A-I”
  • 先在簡短的 30 秒片段中測試專有名詞/生僻詞
  • 一旦生成,發音就固定了 — 務必在生成之前在歌詞中修正

8. 工作流

  1. 先撰寫概念/鉤子(hook)— 情感核心是什麼?
  2. 如果是改編,映射原始結構(音節、押韻、重音)
  3. 生成原始素材 — 在結構化之前自由頭腦風暴
  4. 將歌詞草稿填入結構中
  5. 大聲朗讀/演唱 — 捕捉拗口之處,修正格律
  6. 構建 Suno 風格描述 — 描繪動態旅程
  7. 在歌詞中添加元標籤以指導表演
  8. 至少生成 3-5 個變體 — 將它們視為錄音試唱
  9. 挑選最佳版本,使用“擴展/繼續”功能基於有潛力的部分進行構建
  10. 如果偶然發生了很棒的效果,保留它

預期:每獲得 1 個好結果大約需要 ~3-5 次生成。修改是正常的。 在擴展過程中風格可能會漂移 — 擴展時重申流派/情緒。


9. 經驗教訓

  • 在風格字段中描述動態弧線比僅僅列出流派重要得多。“從低語到咆哮再到低語”為 Suno 提供了表演地圖。
  • 在戲仿作品中保留部分原始行不變,可增加辨識度和情感重量 — 受眾能感受到原作的影子。
  • 歌曲中的橋段(bridge)位置是轉換意象的地方。 將原作的具體引用替換為你主題中的隱喻,同時保持其情感功能(反思、轉折、啟示)。
  • 在鉤子/標籤中使用單音節詞替換,是在改變含義的同時保持節奏的最乾淨方式。
  • 在風格字段中對人聲人物設定的強力描述,比任何單個元標籤帶來的影響都更大。
  • 不要拘泥於規則。如果某一行破壞了格律但衝擊力更強,那就保留它。感覺才是最重要的。技藝服務於藝術,反之亦然。