**zenji** @zenji@mstdn.guru · 2020-06-09T10:16:21Z

zenji @zenji@mstdn.guru

遅ればせながらNVIDIAの新GPU「Ampere A100」のDeep Dive解説でございます。
注目は基本的にTensorコアの刷新なのですが、ここが意外にややこしい。
Turing世代以前のTensorコアの単位演算器がFP16ベースだったのがAmpereではTF32という新形式に改められました。いうなれば19ビット浮動小数点なのですが、これ、レジスタサイズもメモリフットプリントも実は32ビットで、演算回路も32ビット設計でした。むしろ注目は、このTF32演算器がFP16ないしはBF16という新数値形式を同時に2つ1パックにして演算器に流し込めるところにあります。その辺りの解説がメインです。
あとは、Async Copyという新ループ処理構造、具体的にはCUDA11での新プログラミングモデルへの対応辺りですかね。
ボクの見立てでは、A100、TITANブランドでは出ないと思います。なぜってNVENCもレイトレユニットも載ってないから(笑)

https://www.4gamer.net/games/121/G012181/20200527061/

2020年06月09日 10:16 · · Web · · ·

**ブーツィー** @bootsy@mstdn.guru · 2020年06月09日 10:34

**ブーツィー** @bootsy@mstdn.guru · 2020年06月09日 10:34

2020年06月09日 10:34

ブーツィー @bootsy@mstdn.guru

@zenji GA100とA100の使い方が逆位なってませんか？ GA100はチップでA100は製品名だと思うのですが。

ログインして会話に参加

リソース

開発者向け

Mastodon とは？

mstdn.guru

さらに…