英語のプロンプトを入力するだけで、AIが作曲してくれる音楽生成AI「Stable Audio」を使って遊んでみましたよ。
Stable Audioとは
「Stable Audio」は、2023年8月に高品質な音楽を生成できる初の商用可能なオーディオ生成AIとして発表されました。
そして先日「Stable Audio 2.0」が発表されましたので、今回は2.0で遊んでみようという話です。
なお名前から察する通り、提供元は画像生成AIでおなじみ「Stable Diffusion」の開発元と同じStability AIです。
使い方
まず公式サイトにアクセスします。
https://stableaudio.com/generate
画面右上の「Sign up」からサインアップします。
Googleアカウントが使えるので、自前のアカウントでサインアップします。
サインアップできたら、このような画面になります。
(いくつか生成した履歴がありますが気にしないで下さい笑)
あとは「Prompt」に英語でプロンプトを入力し、「Generate」ボタンを押すだけで曲が生成できます。
要領はStable Diffusionと大体同じですが、何を入力したら良いか分からないという方のために「Prompt Libray」が用意されています。
この中から好きなものを選ぶと、規定のプロンプト自動で入力されます。
(再生ボタンをクリックするとサンプル音源が流れます。ありがてえ!)
そのまま使っても良し、BPMを変えたり追加・削除しても良し。
「Model」はそのまま(2.0)で良いでしょう。
「Duration」は生成する曲の長さです(最大3分)。
「Input audio」は2.0から搭載された機能で、オーディオからオーディオへの変換機能です(Stable Diffusionでいうとimg2imgみたいなやつ)。
「Add extras」をクリックすると、「steps」や「seed」の値を設定できます。
あとは「Generate」ボタンを押せば、数秒~数分で曲が完成します。
作ってみた曲
自分でいくつか作ってみましたが、Prompt Librayのみで生成するとイマイチな感じだったので、シンプルに「rock music, powerful」だけで生成してみました。
生成してみた曲がこちら↓
クオリティは何ともですが、これが数分で出来てしまうのは素直にすごいな!と思いました。
もっとプロンプトを練ったりオプションを細かく設定すれば、もっと良くなるのでしょうね。
YouTube動画BGMぐらいなら全然使えそうです。
今後の進化に期待ですね!