ローカルでLLM動かしてていろいろとわかったところとしては質問が長くなるとGPUのメモリの利用率が跳ね上がったまま固定されるっていうところ。 ってなるとやっぱ5090が欲しくなるという無限ループに(メモリ倍増モデルがあれば下位バージョンでもいいですが)w
Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。