フォロー

LLaMAはリッチなモデルだと2トークン/秒という話からラズパイでも10秒で1トークンという話まであって幅の広さがいいっすね。RT

I've sucefully runned LLaMA 7B model on my 4GB RAM Raspberry Pi 4. It's super slow about 10sec/token. But it looks we can run powerful cognitive pipelines on a cheap hardware. twitter.com/miolini/status/163

twitter.com/miolini/status/163

ログインして会話に参加
グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。