そもそもollamaやdiffusersが快適に動くハードを所有してない(所有する意欲が無い)のに、情報にばかり踊っちゃってるんだけど、にしても、近い将来stableaudioopenで謎音楽量産に至りたいのなら、diffusersのほうの修得に集中すべきなんだろな。ついついdeepseek騒動につられてpiでollamaとかのトライにハマりそうだけど、そのヘンはコピペに近いノリで便乗出来るようになるのをアンテナ立てて待ってるくらいでイイかも
というか、ソレゾレいろんな思惑を含んだ既成仕組みやモデルを利用しようとするから、先ずハードを更新するトコから始めなきゃならなくなるけど、自分規模のAI遊びに励むのならpytorchやらnumpyで基礎中の基礎から取り組んで、何をどうするとどのパワーが足りなくなるとかも体験していったほうが楽しそう。そうじゃない部分は、新webサービスがベータの間、ブラウザで遊ばせてもらうのでイイ
似た事がiPad10で時々遊んでるdrawthingsについても言えて、アプリがリストアップしてくれてるモデルにただただプロンプト入れて試してる段階から卒業しないとな
1) 先ずは、あのアプリで時前のモデルを育てる方法が有るのなら(有りそう)ソコに注力2)各メニューの使い方のマスター。特に、画像修正や付け足し(inpaint?)の方法を見に付ける3) huggingから野良のモデル落として来て遊ぶのにも、手順的に慣れる
しかし、2あたりは画像を渡してプロンプトで要求すれば、やってくれる未来への予感は有るよな。webサービス系のも、その手のサブ機能増えてるようなだしで
考えてみると、drawthingsはiPadで使える画像用ollamaみたいな存在なのか。自分でモデル育てるのも出来るとなると、diffusers的な側面も持つ感じかな
ついでに考えとくに、linuxのグラフィックスがwaylandからさらに次のに行くまで生きてるとは思えないけど、Xからの移行でもアレコレ有るわけなので、自分自身の領域の作業はVTというかCUIで完結(つまりサーバ的セットアップ?)出来るようにして来た態勢は、カッコつけでやってた想定以上に意味有るコトのように思えて来た
Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。