**twitwi_shibata** @twitwi_shibata@mstdn.guru · 2025-03-29T10:31:16Z

twitwi_shibata @twitwi_shibata@mstdn.guru

twitwi_shibata @twitwi_shibata@mstdn.guru

物語を書くのはいいかもしれないけど、難しいAIコーディングや数学は、ローカルLLMだと厳しいかもしれないね。

* **Simple Math Benchmark**:
* Llama 3.2 1 billion: 18正解, 12不正解 * Llama 3.2 3 billion: 高い精度 * Falcon 3 54: 全て正解 * Qwen 2.5 coder 32 billion: いくつか間違いあり

* **Typer Command Benchmark (難易度の高いタスク)**: *
ほとんどのローカルモデルが0%の精度 * Deepseek V3: 26%の精度

https://youtu.be/OwUm-4I22QI?si=iyPg1qkW6xKkT4PY

2025年03月29日 10:31 · · Web · · ·

ログインして会話に参加

リソース

開発者向け

Mastodon とは？

mstdn.guru

さらに…