AIによる作成はもはや止まるところを知らない。RT

StableDiffusionを音楽生成に応用したAI!
ついに拡散モデルが音楽生成に。
text2img,img2imgと同じようなことができて、例えばタイピング音が徐々にジャズになっていくという実験的な音楽も生成できてしまう。ヤベーw t.co/1Pmi3dexLV

twitter.com/bioshok3/status/16

フォロー

ふむふむ RT

「音楽を含む音声はスペクトログラム画像に変換できる→Stable Diffusion(アルゴリズムは無改造)にスペクトログラム画像を追加学習させる→スペクトログラムをテキストから画像生成させる→その画像を音声に戻したら音楽になる!」って、確かに言われてみれば理屈はわかるけど、マジかよ……… t.co/fOkJOnLdFK

twitter.com/needle/status/1603

SD自体はあくまで画像を生成してるだけなので、img2img・インペインティング・ネガティブプロンプト・潜在空間内の遷移などなど普段のSDで使えるテクニックは全部使える。ヤベェ。

twitter.com/needle/status/1603

ログインして会話に参加
グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。