フォロー

メモメモ RP

FlashAttention2入れて更に10%位早くなってメモリ使用量が減った
←TensorRT+FA2
→TensorRTのみ
x.com/vqmp7pwqbefqkog/status/1

あとFA2入れる過程でまたcudnnなんたらdllのエラーポップが出るようになったんだけど、やっぱりtorch内のdllをコピーしてnvidia内に上書きしたら直った
torch とnvidiaで違うファイルになってると出るエラーなんか?
x.com/vqmp7pwqbefqkog/status/1

ログインして会話に参加
グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。