**skawa (guru）** @skawa@mstdn.guru · 2022年12月16日 08:04

**skawa (guru）** @skawa@mstdn.guru · 2022年12月16日 08:04

skawa (guru） @skawa@mstdn.guru

2022年12月16日 08:04

AIによる作成はもはや止まるところを知らない。RT

StableDiffusionを音楽生成に応用したAI！
ついに拡散モデルが音楽生成に。
text2img,img2imgと同じようなことができて、例えばタイピング音が徐々にジャズになっていくという実験的な音楽も生成できてしまう。ヤベーw https://t.co/1Pmi3dexLV

https://twitter.com/bioshok3/status/1603415026085163008

**skawa (guru）** @skawa@mstdn.guru · 2022-12-16T08:08:16Z

skawa (guru） @skawa@mstdn.guru

ふむふむ　RT

「音楽を含む音声はスペクトログラム画像に変換できる→Stable Diffusion（アルゴリズムは無改造）にスペクトログラム画像を追加学習させる→スペクトログラムをテキストから画像生成させる→その画像を音声に戻したら音楽になる！」って、確かに言われてみれば理屈はわかるけど、マジかよ……… https://t.co/fOkJOnLdFK

https://twitter.com/needle/status/1603420003352838144

SD自体はあくまで画像を生成してるだけなので、img2img・インペインティング・ネガティブプロンプト・潜在空間内の遷移などなど普段のSDで使えるテクニックは全部使える。ヤベェ。

https://twitter.com/needle/status/1603420690371444736

2022年12月16日 08:08 · · Metatext · · ·

ログインして会話に参加

リソース

開発者向け

Mastodon とは？

mstdn.guru

さらに…