音楽生成AI「Stable Audio」の実力を試してみる

2023年9月24日 14:01

Stable Audioとは

　画像生成AIのStable Diffusionを開発したことで知られる英国企業Stability AI音楽生成AIサービス「Stable Audio」を開始しました。

元記事

　無料のBasicプランでは１カ月で２０回まで、１回あたり４５秒まで、商用利用不可となっています。
　２０回だと、ちょっと実験しただけで使い切ってしまいそうなので、ここでは最初に誰もが試しそうなことをやってみます。
　ある程度の知見を得てから、実際に作成してみることで使用回数の省略に役立ててください。

プロンプトの生成

　Stable Diffusion用に作成したChatGPTのプロンプトを使ってStable Audio用のプロンプトを作成してみました。

参考に、その時の流れはこんな感じです。

https://chat.openai.com/share/57b2ef66-45c9-4f98-9046-c7d8fb1e6527

Stable Audioに入力したプロンプト
sunset,beach,orange sky, pink clouds,mother,looking out to sea,father,children,playing,sandcastles,kite,laughter,joy,golden glow,long shadows,emotional complexity,positive vibe,realism,detailed facial expressions,imperfections in the sand,details in the sky,ripples in the water,lighting effects,transitional moments,fleeting happiness,undertone of awareness,atmosphere of family bonding,poignant,depth of field

これで生成したものが、なんだか不安定で音楽になっていなかったので、プロンプトを短くしました。

mother waiting, emotional depth, children playing, father involved, family bonding, sunset backdrop, nuanced expressions

　これもまだ不安定だったので、ここからどうやったら音楽として安定するかの追及に入ります。

プロンプトの改善

　まずは音楽のジャンルを決めて、プロンプトの最初に記述しました。合わせてBPMも設定しました。
　
jazz,calm,Sadness,emotional depth,mother waiting, , children playing, family bonding, sunset backdrop, piano, violin, guitar, trombone, drums,60BPM

　少しjzaaの雰囲気は出てきましたが、それでもフニャフニャした音楽です。

　jazzなので、楽器を特定して作成してみました。
　ピアノ、バイオリン、ギター、トロンボーンを使って、ドラムを使わないようにしてみました。
jazz,calm,Sadness,emotional depth,mother waiting, , children playing, family bonding, sunset backdrop, piano, violin, guitar, trombone, no drums,60BPM

　使う楽器や、逆に使わない楽器の指定もできるようです。

　次にpopと120BPMにして速いテンポにしてみました。

pop,emotional depth, children playing, family bonding, sunset backdrop,120BPM

　だいぶん音楽らしくなってきました。
　どうやら速いテンポの方がこのモデルは得意な感じがしますね。

　こうなると、音楽の雰囲気を具体化した方が良さそうな感じがしたので、有名なアーティストの名称をプロンプトに含めることにしました。

R&B,Michael Jackson ,emotional , children playing, family bonding, sunset backdrop,120BPM

　かなり音楽として安定してきました。
　この他にもThe BeatlesやMiles Davisを入れてみると、同じプロンプトでも曲調がかなり変わります。

　最後に、プロンプトをもっと少なくしたらどうなるかと思い、「Fire」の１つだけで試してみました。
　FireといえばQUEENですよね(笑)

Rock,QUEEN ,Fire,120BPM

　何となく、それっぽくなってきたぞ！

　なお、音楽のジャンルについてはこちらのサイトが便利でした。
　ジャンル表記が英語なのが使えますね。

まとめ

　今回の検証をまとめます。

音楽のジャンルを入れる
BPMを入れる
アーティスト名を入れると安定する。
入れたい楽器があればプロンプトに入れる。

　音楽生成AIは出たばかりで、これから情報が増えてくると上手に使えこなせるでしょうが、まだまだ実験の段階です。

　ChatGPTやStable Diffutionでやってきたプロンプトの知見は活かせそうです。

　今後AIが身近になるにつれ、プロンプトが書ける技術が必修になりそうです。
　これは使用するAIが変わっても、必要な能力としては不変だということが今回わかったことです。

　プロンプトが書けるか書けないかで今後の人生が大きく変わります。

　プロンプトを書けるようになりたい方はこちらから相談ください。

　
#AI #AIの活かし方 #StableAudio #Stable #StableDiffusion #生成AI #音楽生成 #ChatGPT #プロンプト #きらめき #音楽 #AIとやってみた

この記事が参加している募集

AIとやってみた

24,666件

この記事が気に入ったらサポートをしてみませんか？