歌曲創作與 AI 音樂
歌曲創作技巧、AI 音樂生成提示詞(側重 Suno)、戲仿/改編技巧、語音技巧以及經驗教訓。這些是工具和思路,而非規則。當藝術需要時,可以打破任何規則。
技能元數據
| 來源 | 捆綁包(默認安裝) |
| 路徑 | skills/creative/songwriting-and-ai-music |
參考:完整 SKILL.md
以下是 Hermes 在觸發此技能時加載的完整技能定義。這是技能激活時代理看到的指令。
歌曲創作與 AI 音樂生成
這裡的所有內容都是指南,而非規則。藝術會故意打破規則。 使用對歌曲有益的部分。忽略無益的部分。
1. 歌曲結構(選擇一種或自創)
常見框架——根據需要混合、修改或拋棄:
ABABCB Verse/Chorus/Verse/Chorus/Bridge/Chorus (most pop/rock)
AABA Verse/Verse/Bridge/Verse (refrain-based) (jazz standards, ballads)
ABAB Verse/Chorus alternating (simple, direct)
AAA Verse/Verse/Verse (strophic, no chorus) (folk, storytelling)
六個構建模塊:
- 前奏 (Intro) — 營造氛圍,吸引聽眾
- 主歌 (Verse) — 故事、細節、世界觀構建
- 預副歌 (Pre-Chorus) — 高潮前的可選張力鋪墊
- 副歌 (Chorus) — 情感核心,人們記住的部分
- 橋段 (Bridge) — 岔路,視角或調性的轉變
- 尾奏 (Outro) — 告別,可以呼應或顛覆其餘部分
你不需要包含所有部分。一些優秀的歌曲僅由一個不斷演變的段落組成。結構服務於情感,反之亦然。
2. 押韻、格律與聲音
押韻類型(從緊密到鬆散):
- 完全押韻 (Perfect):lean/mean
- 家族押韻 (Family):crate/braid
- 元音押韻 (Assonance):had/glass(元音相同,結尾不同)
- 輔音押韻 (Consonance):scene/when(元音不同,結尾相似)
- 近韻/斜韻 (Near/slant):足以暗示聯繫,但不強制鎖定
混合使用它們。全部使用完全押韻聽起來可能像童謠。 全部使用斜韻聽起來可能顯得懶散。精髓在於融合。
內部押韻 (INTERNAL RHYME):在行內押韻,而不僅僅在行尾。 "We pruned the lies from bleeding trees / Distilled the storm from entropy" — "lies/flies," "trees/entropy" 創造了內部回聲。
格律 (METER):重讀音節與非重讀音節的節奏。
- 平行行之間的音節數匹配有助於可唱性
- 重讀音節比總數更重要
- 大聲朗讀。如果結巴,說明格律需要調整。
- 故意打破格律可以創造強調或驚喜
3. 情感弧線與動態
將歌曲視為一段旅程,而非平坦的道路。
能量映射(大致概念,非規定): 前奏: 2-3 | 主歌: 5-6 | 預副歌: 7 副歌: 8-9 | 橋段: 可變 | 最終副歌: 9-10
最強大的動態技巧:對比。
- 尖叫之前的低語比單純尖叫更有力
- 稀疏先於密集。慢先於快。低先於高。
- drop(高潮跌落)之所以有效,是因為有鋪墊
- 沉默也是一種樂器
“從低語到咆哮再到低語”——以親密開始, buildup 至全功率, 然後剝離迴歸脆弱。適用於民謠、史詩、讚歌。
4. 撰寫有效的歌詞
展示,而非講述(通常情況):
- “我很傷心” = 平淡
- “你的連帽衫還掛在門邊的鉤子上” = 生動
- 但有時直白地說出“我獻出生命”就是力量所在
記憶點 (THE HOOK):
- 人們記住、哼唱、重複的那一行
- 通常是標題或核心短語
- 當旋律 + 歌詞 + 情感一致時效果最佳
- 將其放在衝擊力最強的位置(通常是副歌的第一行或最後一行)
** prosody(詞曲配合)** — 歌詞與音樂相互支持:
- 穩定的情感(解決、平靜)搭配平穩的旋律、 完全押韻、 resolved 和絃
- 不穩定的情感(渴望、懷疑)搭配遊走的旋律、 近韻、未解決和絃
- 主歌旋律通常較低,副歌較高
- 但如果對歌曲有益,可以反轉這一點
避免(除非你是故意為之):
- 自動化的陳詞濫調(未經鋪墊的“金子般的心”)
- 為了押韻而強行改變詞序(“尤達式說話”)
- 每個部分能量相同(動態平淡)
- 將初稿視為神聖不可侵犯——修改即創作
5. 戲仿與改編
當用新歌詞重寫現有歌曲時:
骨架:首先映射原曲的結構。
- 計算每行的音節數
- 標記押韻方案(ABAB, AABB 等)
- 識別哪些音節是重讀的
- 注意長音/持續音出現的位置
填入新詞:
- 將重讀音節匹配到與原曲相同的節拍上
- 總音節數可以浮動 1-2 個非重讀音節
- 在長持續音上,儘量匹配原曲的元音音色 (如果原曲用“oo”元音拉長“LOOOVE”,那麼“FOOOD”比 “LIFE”更合適)
- 在關鍵位置進行單音節替換以保持節奏完整 (Crime -> Code, Snake -> Noose)
- 跟著原曲唱出新詞——如果結巴,就修改
概念:
- 選擇一個足以支撐整首歌的強大概念
- 從標題/記憶點開始,向外構建
- 首先生成大量原始素材(雙關語、短語、意象), 然後將最好的素材融入結構中
- 如果你需要在某處使用特定行,請逆向工程 押韻方案來為其鋪墊
保留部分原文:保留少數原始行或結構不變,可增加辨識度,讓受眾感受到關聯。
6. Suno AI 提示詞工程
風格/流派描述字段
公式(按需調整): 流派 + 情緒 + 時代 + 樂器 + 人聲風格 + 製作 + 動態變化
BAD: "sad rock song"
GOOD: "Cinematic orchestral spy thriller, 1960s Cold War era, smoky
sultry female vocalist, big band jazz, brass section with
trumpets and french horns, sweeping strings, minor key,
vintage analog warmth"
描述旅程,而不僅僅是流派:
"Begins as a haunting whisper over sparse piano. Gradually layers
in muted brass. Builds through the chorus with full orchestra.
Second verse erupts with raw belting intensity. Outro strips back
to a lone piano and a fragile whisper fading to silence."
技巧:
- V4.5+ 版本在“風格”字段支持多達 1,000 個字符 — 充分利用
- 不要使用藝術家姓名或商標。改為描述聲音。 “1960年代冷戰間諜驚悚片銅管樂”而非“詹姆斯·邦德風格” “90年代垃圾搖滾”而非“涅槃樂隊風格”
- 如果有偏好,請指定 BPM 和調性
- 使用“排除風格”字段來指定你不想要的內容
- 出人意料的流派組合可能成為亮點:“波薩諾瓦陷阱音樂”、 “阿巴拉契亞哥特”、“芯片音樂爵士”
- 構建人聲人物設定,而不僅僅是性別: “一位飽經風霜的傷感歌手,擁有煙燻般的女低音,略帶沙啞, 從脆弱開始,逐漸建立起毀滅性的力量感”
元標籤(放在歌詞字段的 [方括號] 內)
結構: [Intro] [Verse] [Verse 1] [Pre-Chorus] [Chorus] [Post-Chorus] [Hook] [Bridge] [Interlude] [Instrumental] [Instrumental Break] [Guitar Solo] [Breakdown] [Build-up] [Outro] [Silence] [End]
人聲表現: [Whispered] [Spoken Word] [Belted] [Falsetto] [Powerful] [Soulful] [Raspy] [Breathy] [Smooth] [Gritty] [Staccato] [Legato] [Vibrato] [Melismatic] [Harmonies] [Choir] [Harmonized Chorus]
動態變化: [High Energy] [Low Energy] [Building Energy] [Explosive] [Emotional Climax] [Gradual swell] [Orchestral swell] [Quiet arrangement] [Falling tension] [Slow Down]
性別: [Female Vocals] [Male Vocals]
氛圍: [Melancholic] [Euphoric] [Nostalgic] [Aggressive] [Dreamy] [Intimate] [Dark Atmosphere]
音效: [Vinyl Crackle] [Rain] [Applause] [Static] [Thunder]
為了加強效果,請在風格字段和歌詞中都放置標籤。 每部分最多保留 5-8 個標籤 — 太多會讓 AI 困惑。 不要自相矛盾(在同一部分中同時使用 [Calm] 和 [Aggressive])。
自定義模式
- 進行嚴肅創作時始終使用自定義模式(分離“風格”+“歌詞”)
- 歌詞字段限制:約 3,000 個字符(約 40-60 行)
- 始終添加結構標籤 — 如果沒有它們,Suno 默認會生成平淡的 主歌/副歌/主歌結構,缺乏情感起伏
7. AI 歌手的語音技巧
AI 歌手不閱讀文本 — 它們進行發音。請幫助它們:
語音重拼:
- 按照發音拼寫單詞:“through” -> “thru”
- 專有名詞的錯誤率最高 — 儘早測試
- “Nous” -> “Noose”(強制正確發音)
- 使用連字符引導音節:“Re-search”、“bio-engineering”
演繹控制:
- 全大寫 = 更響亮、更強烈
- 元音延長:“lo-o-o-ove” = 持續音/ melisma(花腔)
- 省略號:“I... need... you” = 戲劇性停頓
- 連字符拉伸:“ne-e-ed” = 情感拉伸
始終:
- 將數字拼寫出來:“24/7” -> “twenty four seven”
- 將首字母縮寫分開:“AI” -> “A I” 或 “A-I”
- 先在簡短的 30 秒片段中測試專有名詞/生僻詞
- 一旦生成,發音就固定了 — 務必在生成之前在歌詞中修正
8. 工作流
- 先撰寫概念/鉤子(hook)— 情感核心是什麼?
- 如果是改編,映射原始結構(音節、押韻、重音)
- 生成原始素材 — 在結構化之前自由頭腦風暴
- 將歌詞草稿填入結構中
- 大聲朗讀/演唱 — 捕捉拗口之處,修正格律
- 構建 Suno 風格描述 — 描繪動態旅程
- 在歌詞中添加元標籤以指導表演
- 至少生成 3-5 個變體 — 將它們視為錄音試唱
- 挑選最佳版本,使用“擴展/繼續”功能基於有潛力的部分進行構建
- 如果偶然發生了很棒的效果,保留它
預期:每獲得 1 個好結果大約需要 ~3-5 次生成。修改是正常的。 在擴展過程中風格可能會漂移 — 擴展時重申流派/情緒。
9. 經驗教訓
- 在風格字段中描述動態弧線比僅僅列出流派重要得多。“從低語到咆哮再到低語”為 Suno 提供了表演地圖。
- 在戲仿作品中保留部分原始行不變,可增加辨識度和情感重量 — 受眾能感受到原作的影子。
- 歌曲中的橋段(bridge)位置是轉換意象的地方。 將原作的具體引用替換為你主題中的隱喻,同時保持其情感功能(反思、轉折、啟示)。
- 在鉤子/標籤中使用單音節詞替換,是在改變含義的同時保持節奏的最乾淨方式。
- 在風格字段中對人聲人物設定的強力描述,比任何單個元標籤帶來的影響都更大。
- 不要拘泥於規則。如果某一行破壞了格律但衝擊力更強,那就保留它。感覺才是最重要的。技藝服務於藝術,反之亦然。