QWEN3 30B A3B MLX 4bitをM1 MaxのMacbook Proで動かしてるけど60tok/secくらい性能出ててバカみたいに早くてローカルLLMの世界変わってるこれだったらCLINEから普通に使える速度英語でThoughtsが表示されてるから推論型ってこと?
DeepSeek R1 32B MLX 4bitとか10tok/secくらいしか性能出なかったから一気に実用的に・・・
なぜこの手順が必要でしょうか?mstdn.guruはあなたが登録されているサーバーではないかもしれないので、まずあなたのサーバーに転送する必要があります。 アカウントをお持ちではないですか?こちらからサインアップできます
mstdn.guru