見出し画像

Udio | AI music generator で遊ぶ

割引あり

はじめに

Udioは音楽生成AIサービスです

同じ音楽生成AIで現在(2024/5/6)有名どころ(?)の
SunoAIとよく比較されているサービスです

えるさんは両方使っておりどちらも好きですが
現在のところだと、以下の感じなのかなあと思っています
・SunoAI:
 ・生成曲の長さが2分と長め
  ・ポン出しでも割といい感じに作ってくれる
  ・ある程度まとまった単位(A-B-サビ とか)生成可
 ・出来たものの修正は出来ない(後半に追加は出来る)

・Udio:
 ・生成曲の長さが30秒程度と短め
  ・生成単位はサビから作成が推奨らしい
 ・30秒程度の状態であればRemixでバリエーション生成可
 ・曲の前にも後にも追加出来る

ある程度まとまった単位を生成できるけど修正し辛いSunoAI
修正可能だけど思ったように修正するのはなかなか難しいUdio
な印象でしょうか

Udioで作った曲(SunoAIもついでに

まずは今回Udioさんで作った作品です

参考としてSunoAIさんはこんな感じです

うーん、どの曲もえるさん好みで素敵…!!

このNoteとしてはUdioさんメインなので基本Udioさんで曲を作るまでの話になります


Udioで曲作成! の前に

公式のドキュメント

TERMS OF SERVICE、PRIVACY POLICY あたりはまあもちろん読むとして
Guide、Open Tutorial、FAQ などなども役にたつので読んでおきます
以下はOpen Tutorialを除いたリンクになります


生成時間単位(32秒)を考える

多分以下だと思っているのですが、、合ってるのかなあ
教えて有識者ー!?👀💦

ちなみにテンポは1分間の♪の数で、
120というのは1分間に♪が120個のことです
テンポはもちろん曲ジャンルによって変わりますが、
一般的には120くらいだと言われています

次に、曲の単位には「小節」というものがあり
これまたいろいろ有るのですが、1小節♪4個が一般的です

また、メロディ(サビとか)は小節が集まった単位なのですが、
これもいろいろ有るものの、恐らく一般的には
8小節または16小節=1メロディ くらいです

16小節×♪4個=♪64個→テンポ120だと32秒 なので、
多分そうなんだろうなあと思った感じです

合わせて、歌ものであっても32秒をフルでボーカル入りには
してこない印象なので、
サビ8小節+他のメロディ4小節くらい+前奏とか間奏4小節
あたりがUdioさんの基本形な気がしています

音は刻んだり伸ばしたりするので目安は無いようなものかもですが
歌詞の文字数=♪の数 とすると歌詞の文字数は以下あたりなのかなあ
・サビ用に32文字   ⇒ 8文字×4行
・他のメロ用に16文字 ⇒ 8文字×2行
Udioさんガイドおすすめの6行にも合うので、
勝手に納得しているえるさんなのでした

Udioのプロンプトを把握したい

UdioはAuto-completionsとSuggested tagsの機能があるので
Udioで機能しやすいプロンプトを把握することができます

こんなやつ

デフォルトのモードであれば自由な記述をタグに変換してくれるので
特に気にしなくてもよいのですが
良さげなタグをUdioさんが勝手に入れてくるため
細かい指定をしたい場合はマニュアルモードにして
タグを把握しつつ入力することが良さそうです

だいたいガイドさんの受け売りになります

以下は参考として、Auto-completionsで出てきたものをメモりつつ
Claude3 Opusで補足をつけたものになります
補足の妥当性は確認していないので参考程度で

12 string guitar: 12弦ギターを使用することを指定するキーワード。
13 pop4/5: 不明な記号の組み合わせ。おそらくポップ音楽の特性を表していると思われる。
1960s: 1960年代の音楽スタイルを指定するキーワード。
1970s: 1970年代の音楽スタイルを指定するキーワード。
1973: 1973年の音楽スタイルや特徴を指定するキーワード。
1974: 1974年の音楽スタイルや特徴を指定するキーワード。
1980s: 1980年代の音楽スタイルを指定するキーワード。
1983: 1983年の音楽スタイルや特徴を指定するキーワード。
1984: 1984年の音楽スタイルや特徴を指定するキーワード。
1985: 1985年の音楽スタイルや特徴を指定するキーワード。
1986: 1986年の音楽スタイルや特徴を指定するキーワード。
1990s: 1990年代の音楽スタイルを指定するキーワード。
1991: 1991年の音楽スタイルや特徴を指定するキーワード。
1992: 1992年の音楽スタイルや特徴を指定するキーワード。
1993: 1993年の音楽スタイルや特徴を指定するキーワード。
1994: 1994年の音楽スタイルや特徴を指定するキーワード。
1995: 1995年の音楽スタイルや特徴を指定するキーワード。
1996: 1996年の音楽スタイルや特徴を指定するキーワード。
2 tone: 不明な記号の組み合わせ。音楽の特性を表していると思われる。
2/5: 音楽の評価やランキングを表していると思われる数値。
2000: 2000年の音楽スタイルや特徴を指定するキーワード。
2002: 2002年の音楽スタイルや特徴を指定するキーワード。
2003: 2003年の音楽スタイルや特徴を指定するキーワード。
2004: 2004年の音楽スタイルや特徴を指定するキーワード。
2005: 2005年の音楽スタイルや特徴を指定するキーワード。
2006: 2006年の音楽スタイルや特徴を指定するキーワード。
2007: 2007年の音楽スタイルや特徴を指定するキーワード。
2008: 2008年の音楽スタイルや特徴を指定するキーワード。
2009: 2009年の音楽スタイルや特徴を指定するキーワード。
2-step: ガラージハウスのサブジャンルの1つ。
3/5: 音楽の評価やランキングを表していると思われる数値。
30bpm: 曲のテンポを指定するキーワード。bpmは「beats per minute」の略で、1分間あたりの拍数を表す。
40 premiers: 不明な記号の組み合わせ。
43: 不明な数値。
4cd=20E: 不明な記号の組み合わせ。
4chan: 匿名掲示板の名称。
4E: 不明な記号の組み合わせ。
5 pages: 不明な記号の組み合わせ。
5/5: 音楽の評価やランキングを表していると思われる数値。
50s: 1950年代の音楽スタイルを指定するキーワード。
52: 不明な数値。
60s: 1960年代の音楽スタイルを指定するキーワード。
60's British rock: 1960年代の音楽スタイルを指定するキーワード。
60's oldies: 1960年代のオールディーズ音楽を指定するキーワード。
70s: 1970年代の音楽スタイルを指定するキーワード。
80s: 1980年代の音楽スタイルを指定するキーワード。
8-bit: 8ビット音源を使用した音楽スタイルを指定するキーワード。
8cm cd: 8センチCD(シングルCD)のフォーマットを指定するキーワード。
90 s r b: 1990年代のR&B音楽を指定するキーワード。
9d0fec0b: 不明な記号の組み合わせ。
acoustic guitar: アコースティックギターを使用することを指定するキーワード。
adult contemporary: アダルト・コンテンポラリー(AC)音楽のジャンルを指定するキーワード。
album rock: アルバム・ロック(プログレッシブ・ロック)のジャンルを指定するキーワード。
alternative: オルタナティブ・ロック音楽のジャンルを指定するキーワード。
alternative rock: オルタナティブ・ロック音楽のジャンルを指定するキーワード。
alternative/indie rock: オルタナティブ・ロックとインディー・ロックの融合ジャンルを指定するキーワード。
ambient: アンビエント音楽のジャンルを指定するキーワード。
anthemic: アンセミック(賛美歌のような)な音楽の特徴を指定するキーワード。
art rock: アート・ロック音楽のジャンルを指定するキーワード。
atmospheric: 大気的な、雰囲気のある音楽の特徴を指定するキーワード。
ballad: バラード(叙情的な歌)のジャンルを指定するキーワード。
bass: ベース(低音)の音域や楽器を指定するキーワード。
bass guitar: ベースギターを使用することを指定するキーワード。
big band: ビッグバンド・ジャズの編成やジャンルを指定するキーワード。
bittersweet: ビタースウィート(苦楽混じり)な音楽の特徴を指定するキーワード。
black metal: ブラックメタル音楽のジャンルを指定するキーワード。
blues: ブルース音楽のジャンルを指定するキーワード。
blues rock: ブルースロック音楽のジャンルを指定するキーワード。
boastful: 自慢するような、誇らしげな音楽の特徴を指定するキーワード。
box: 不明なキーワード。
box set: 複数のアルバムや作品をまとめたボックスセットを指定するキーワード。
breakbeat: ブレイクビート(ドラムの演奏技法の一種)を使用した音楽スタイルを指定するキーワード。
breakup: 失恋や別れを主題にした音楽の特徴を指定するキーワード。
c86: 1986年にNME誌が企画したカセットテープ・コンピレーションのタイトル。インディー・ポップの流行のきっかけとなった。
cello: チェロを使用することを指定するキーワード。
classic rock: 1960年代後半から1970年代にかけて活躍したロックバンドの音楽スタイル。
classical: クラシック音楽のジャンルを指定するキーワード。
club: クラブで流れるようなダンス音楽。
complex: 複雑な構成の音楽の特徴を指定するキーワード。
conscious: 社会的・政治的メッセージ性の強い音楽の特徴を指定するキーワード。
contemporary jazz: コンテンポラリー・ジャズ音楽のジャンルを指定するキーワード。
contemporary pop/rock: コンテンポラリー・ポップ/ロック音楽のジャンルを指定するキーワード。
contemporary R&B: コンテンポラリー・R&B音楽のジャンルを指定するキーワード。
country: カントリー音楽のジャンルを指定するキーワード。
country rock: カントリー音楽とロック音楽を融合したジャンル。
dance: ダンス・ミュージックのジャンルを指定するキーワード。
dance-pop: ダンス・ポップ音楽のジャンルを指定するキーワード。
dark: 暗く重い雰囲気の音楽の特徴を指定するキーワード。
death metal: 過激な歌詞とヘヴィなサウンドを特徴とするメタルの一派。
deep house: ディープハウス音楽のジャンルを指定するキーワード。
disco: 1970年代に流行したダンス音楽。
dj mix: DJによるミックス音源であることを指定するキーワード。
double bass: コントラバス(ダブルベース)を使用することを指定するキーワード。
downtempo: ダウンテンポ(ゆっくりとしたテンポ)の音楽スタイルを指定するキーワード。
drums (drum set): ドラムセットを使用することを指定するキーワード。
dub: ダブ・ミュージック(レゲエの一種)のジャンルを指定するキーワード。
easy listening: イージーリスニング音楽のジャンルを指定するキーワード。
eclectic: 様々なジャンルを織り交ぜた音楽スタイル。
electric guitar: エレキギターを使用することを指定するキーワード。
electro: エレクトロ音楽のジャンルを指定するキーワード。
electro house: エレクトロハウス音楽のジャンルを指定するキーワード。
electronic: 電子楽器を主体とした音楽。
electropop: エレクトロポップ音楽のジャンルを指定するキーワード。
Emotional: 感情を強く表現する音楽性を表す言葉。
energetic: 精力的でアグレッシブなサウンド。
Ethereal: 夢幻的で神秘的な雰囲気を持つ音楽性を表す言葉。
euro house: ヨーロッパ発祥のハウス音楽。
europop: ヨーロッパ諸国で人気のポップミュージック。
experimental: 実験的な音楽の特徴を指定するキーワード。
female vocalist: 女性ボーカリストが歌っていることを指定するキーワード。
flute: フルートを使用することを指定するキーワード。
flute: フルートの音色が特徴的な音楽。
folk: フォーク音楽のジャンルを指定するキーワード。
folk pop: フォークポップ音楽のジャンルを指定するキーワード。
funk: ファンク音楽のジャンルを指定するキーワード。
funk: 1960年代後半に発祥した、リズミカルなダンス音楽。
funk soul: ファンク・ソウル音楽のジャンルを指定するキーワード。
future jazz: フューチャー・ジャズ音楽のジャンルを指定するキーワード。
futuristic: 未来的な音楽の特徴を指定するキーワード。
gangsta rap: ギャングの生活を題材にしたラップ。
garage house: ガラージハウス音楽のジャンルを指定するキーワード。
garage rock: ガレージロック音楽のジャンルを指定するキーワード。
glam rock: グラムロック音楽のジャンルを指定するキーワード。
glitch: 電子音を不規則に配置することで生み出される音楽スタイル。
goth rock: ダークでシリアスな世界観のロック。
gothic metal: ゴシックメタル音楽のジャンルを指定するキーワード。
gothic rock: ゴシックロック音楽のジャンルを指定するキーワード。
Gregorian chant: 中世のカトリック教会の典礼で歌われるラテン語の聖歌。単旋律で、神秘的な雰囲気。
grunge: グランジ音楽のジャンルを指定するキーワード。
guitar: ギターを使用することを指定するキーワード。
happy: 明るく楽しい雰囲気の音楽の特徴を指定するキーワード。
hard rock: よりヘヴィでアグレッシブなロックサウンド。
heavy: 重厚な音楽の特徴を指定するキーワード。
heavy metal: ヘビーメタル音楽のジャンルを指定するキーワード。
hedonistic: 快楽主義的な音楽の特徴を指定するキーワード。
hip hop: ヒップホップ音楽のジャンルを指定するキーワード。
house: ハウス音楽のジャンルを指定するキーワード。
humorous: ユーモラスな音楽の特徴を指定するキーワード。
hypnotic: 催眠的な音楽の特徴を指定するキーワード。
idm (intelligent dance music): インテリジェント・ダンス・ミュージック(IDM)のジャンルを指定するキーワード。
indie: インディー音楽のジャンルを指定するキーワード。
indie pop: インディー・ポップ音楽のジャンルを指定するキーワード。
indie rock: インディーズレーベルから発表されるロック音楽。
indietronica: インディーロックと電子音楽の融合ジャンル。
industrial: 機械的な電子音を多用した音楽ジャンル。
instrumental: 歌詞のない器楽曲。
introspective: 内省的で物思いにふける曲調。
jangle pop: 明るくキラキラとしたギターサウンドが印象的なポップス。
jazz: 即興演奏を取り入れた、自由度の高い音楽ジャンル。
jazz fusion: ジャズとロック、ファンクなどを融合させた音楽スタイル。
jazz pop: ジャズの要素を取り入れたポピュラー音楽。
jazz rap: ジャズとラップを組み合わせた音楽スタイル。
jazz vocals: ジャズ風のボーカルを主体とした音楽。
jazz-funk: ジャズとファンクを組み合わせた音楽スタイル。
jazz-rock: ジャズとロックを融合させた音楽ジャンル。
j-pop: 日本のポピュラー音楽。
jungle: 電子音楽の一種で、ブレイクビーツを使用するのが特徴。
keyboard: キーボードの音色が前面に出ている音楽。
krautrock: 1960年代後半から1970年代にかけてのドイツのロック音楽。
latin: ラテン音楽の要素を取り入れた音楽。
leftfield: 従来の形式にとらわれない実験的な音楽。
lgm 533:-
lo-fi: 音質にこだわらない、荒々しい音作り。
lonely: 孤独感や寂しさを感じさせる曲調。
longing: 強い憧れや切なさを表現した音楽。
love: 愛をテーマにした音楽。
lush: 豊かで華やかなサウンド。
male vocalist: 男性ボーカルが歌唱する音楽。
mechanical: 機械的な音が特徴的な音楽。
melancholic: 憂鬱で物悲しげな曲調。
mellow: 穏やかでまろやかな音楽。
melodic: メロディアスで歌いやすい音楽。
membranophone: 膜鳴楽器(ドラムなど)を使用した音楽。
metal: 重厚でアグレッシブなロックの一ジャンル。
modern classical: 現代のクラシック音楽。
movie soundtrack: 映画のサウンドトラック。
mysterious: 神秘的な雰囲気を醸し出す音楽。
neo-psychedelia: サイケデリック・ロックのリバイバル的な新しい音楽スタイル。
new age: 瞑想や自然をテーマにしたリラクゼーション音楽。
new wave: 1970年代後半から1980年代前半にかけての先鋭的なロック音楽。
nocturnal: 夜を連想させるような幻想的な音楽。
noisy: ノイジーでカオティックなサウンド。
non-music: 音楽以外の音が使われている音響作品。
nu metal: ヘヴィメタルとヒップホップを融合させた1990年代のロックジャンル。
oldies 60s: 1960年代のポピュラー音楽。
organ: オルガンの音色が印象的な音楽。
party: パーティーで盛り上がる明るく楽しい音楽。
passionate: 情熱的な音楽表現。
percussion: パーカッション(打楽器)が重要な役割を果たす音楽。
piano: ピアノの音色が特徴的な音楽。
playful: 遊び心溢れる音楽表現。
pop: 大衆向けのキャッチーでメロディアスな音楽。
pop rap: ポップスとラップを融合させた音楽スタイル。
pop rock: ポップスとロックを組み合わせた音楽ジャンル。
pop/rock: ポップスとロックの要素を併せ持つ音楽。
psychedelic rock: 1960年代後半に流行した、幻想的な音響が特徴のロック。
punk: 1970年代に誕生したシンプルでアグレッシブなロックジャンル。
q recommends: Q誌がお勧めする音楽。
qawwali: パキスタンやインドに伝わるイスラム教の伝統音楽。
qti-tqcs: -
quantis: -
québec: カナダのケベック州を指す用語です。この地域で制作された音楽を指している可能性があります。
québécois: ケベック州の伝統音楽。
queercor: -
quena: アンデス地方の伝統的な縦笛の一種です。この楽器を使用した音楽を指している可能性があります。
quiet storm: スムーズでロマンティックなソウル・ミュージック。
quirky: 奇抜で風変わりな音楽性。
r&b: リズム・アンド・ブルース。
rap: リズミカルな語り口調の歌唱スタイル。
raw: 荒削りで剥き出しの音楽表現。
reggae: ジャマイカ発祥の音楽ジャンル。
remix: 既存の曲をリミックスした音源。
repetitive: 反復的なフレーズを多用した音楽。
rhythmic: リズム感が強調された音楽。
rock: 1950年代に誕生した、エレキギターを主体としたポピュラー音楽。
rock & roll: 1950年代に流行したロックンロール。
rock and roll: ロックンロール。
romantic: ロマンティックな雰
sampled by 3: この音楽がサンプリングされた回数が3回であることを示しているのかもしれません
sentimental: 感傷的な雰囲気の音楽。
sexual: 性的な表現や暗示が含まれる音楽。
singer-songwriter: シンガーソングライター、作詞作曲と歌唱を自ら手がける音楽家。
slowcore: ゆったりとしたテンポと静謐な曲調が特徴的なロックジャンル。
smooth jazz: 穏やかでメロディアスなジャズのスタイル。
soft rock: マイルドでポップ寄りのロック。
soul: 黒人音楽から生まれた、ゴスペルとR&Bを起源とする音楽ジャンル。
soundtrack: 映画やゲームなどの付随音楽。
Spoken Word: 詩の朗読やストーリーテリングなど、言葉を中心とした表現。音楽とも融合することがある。
swing: 1930年代に誕生したジャズのスタイルの一つ。
synthesizer: シンセサイザーの音色が色濃く出ている音楽。
synthpop: シンセサイザーを主体としたポップミュージック。
synth-pop: シンセサイザーを主体としたポップミュージック。
tech house: テクノロジー色の強いハウス・ミュージック。
techno: 電子音を用いたダンスミュージックの一ジャンル。
tenor saxophone: テナーサックスの音色が特徴的な音楽。
tex-mex: メキシコ音楽とカントリー、ブルースなどが融合したスタイル。
trackno3: 音楽アルバムの3番目のトラックを指している可能性があります。
trance: 電子音楽の一ジャンルで、反復的なリズムとメロディが特徴。
trap: 2010年代に流行したヒップホップの一スタイル。
trip hop: ヒップホップをベースにした幻想的でスローテンポな電子音楽。
trombone: トロンボーンの音色を生かした音楽。
trumpet: トランペットの音色を生かした音楽。
UK garage: イギリス発祥のガラージ・ミュージック。
uplifting: 高揚感や勇気を与えてくれる音楽性。
urban: 都会的でスタイリッシュな音楽性。
vibraphone: ビブラフォンの音色が特徴的な音楽。
video game music: テレビゲームのBGM。
viola: ビオラの音色が特徴的な音楽。
violence: 暴力的な表現や激しさのある音楽性。
violin: バイオリンの音色が特徴的な音楽。
vocal: 声の表現が重視されている音楽。
vocal group: コーラスグループによる音楽。
vocal jazz: ジャズボーカルを主体とした音楽スタイル。
vocal pop: ポップスにおけるボーカル音楽。
vocal trance: ボーカル主体のトランス・ミュージック。
Vocaloid: 歌声を合成するソフトウェア。初音ミクなどのキャラクターで知られる。
wall of sound: フィル・スペクター が編み出した音響効果。
war: 戦争をテーマにした音楽。
warm: 暖かみのあるサウンド。
west coast hip hop: アメリカ西海岸で誕生したヒップホップ。
west coast rap: アメリカ西海岸のラップスタイル。
winter: 冬をイメージした音楽性。
wonky: 型破りでいびつなビートを持つ電子音楽。
woodwind: 木管楽器の音色を生かした音楽。
world: 世界各地の民族音楽の要素を取り入れたジャンル。
Wurlitzer electric piano: ウーリッツァー社の電気ピアノの音色が使われた音楽。
x-mas: クリスマスソング。
xote: ブラジル北東部に伝わる伝統的な音楽とダンスです。
xylophone: 木琴の音色が使われている音楽。
yacht rock: 1970年代後半から1980年代前半にかけて流行した都会的なロック。
zamba: アルゼンチンの民族舞曲の一つ。
zeuhl: マニアックで複雑な構成が特徴のプログレッシブ・ロック。
zither: ツィターという弦楽器の音色が使われている音楽。
zolo: -
zouk: カリブ海のクレオール音楽とポップスが融合したジャンル。
zydeco: アメリカ南部ルイジアナ州の黒人音楽。
zz unknown genre: -

Special descriptorsについて

Special descriptorsとはUdioさんに曲の雰囲気を伝えるもので
SunoAIさんだとMetatagsとか言われているものです

ただガイドにもあまり記載は無いんですよね💦

こんな感じ

参考に以下はSunoAIのMetatagsから引っ張ってきたものです

[Verse]
[Chorus]
[Sad Verse]
[Happy Chorus]

[Pre-Chorus]
[Bridge]
[Shout]
[Whimsical]
[Melancholy]

[Hook]

[Break]
[Interlude]
[melodic interlude]

[Outro]
[Refrain]
[Big Finish]

[End]
[Fade Out]
[Fade to End]

[Break]
[Instrumental Interlude]
[Melodic Bass]
[Percussion Break]
[Syncopated Bass]
[Fingerstyle Guitar Solo]
[Build]
[Bass Drop]

[Female Narrator]
[Diva Solo]
[Gospel Choir]
[Primal Scream]
[Rap Verse]

効果ありかどうかは未確認なので、参考程度で

Udioで今回の曲を作るまで

生成した曲数(ベース曲作成まで)

10曲くらいだった気がします
2曲ずつ生成されるので5生成ですね

割と早くに出力された印象ですがどうなんだろう

生成した曲数(ベース曲のRemix/Extend)

ベース曲を作った後はそこからRemixしたりExtendしたりして
ベース曲の雰囲気を少し変えてみたり、
ベース曲を伸ばしていきます

今回のケースですと
100曲くらい生成したかなあ

もともとはベース曲をサビとして
サビ→前奏→A→B→サビ・・・ 
みたいな構成にしようと後ろをExtendしていたのですが
なかなか上手くいかず…💦
結局のところは以下みたいなExtendにしました
A←B←サビ→間奏

使用した曲数

4曲使用しています
各々、以下のようなExtendしたものを使った、、気がします
各々の太字部分を使った感じです

[前奏用]
前奏←サビ
[メイン部分]
A←B←サビ→間奏→C
[サビの別版用]
サビ→サビ2
[アウトロ用]
サビ

サビ(Remix)→アウトロ

最終的に目指した構成は以下です

前奏→A→B→サビ→間奏→C→サビ2→サビ(Remix)→アウトロ

曲作成後のセルフ反省会場

ここからは主に曲に対してもう少しこうしたかった的な内容だったり
個人的なメモも含むので
有料記事にしようかと思います

ここから先は

1,243字 / 1画像

この記事が気に入ったらサポートをしてみませんか?