なつたんさん
-
フリンの分類ではSIMD
-
ベクトル計算に強い
-
CUDA(Compute Unified Device Architecture)
-
NVIDIAの用語が多いので読むときは要注意
ベクター化ループなど
ベクトルと計算してベクトルになるのがテンソル
-
回転,拡大/縮小行列
-
投影行列
-
ホモグラフィー行列
ある物体を2つの別視点から見ている画像を合成
VR,パノラマ画像など
大容量DRAM
スカラプロセッサ
大量のベクトル計算用ALU
GPUメモリ・グローバルメモリ
ローカルメモリ・プライベートメモリ・レジスタファイル
-
Cray X-MP
1984, 400MFLOPS
ローカルメモリはなく,レジスタファイルのみ -
SX-9
2007, 1.6TFLOPS
ローカルメモリはなく,レジスタファイルのみ -
Cell Broadband Engine
2006, 218GFLOPS
DRAMから直接計算はできず,一度SPE内に持ってくる必要がありプログラム難易度高 -
Nvidia GTX1080
2016, 8.9TFLOPS
スカラプロセッサはCPUにまかせる
PTX(Oarallel Thread Execution)のデコードを行い,空いている他のGPUなどの情報を把握した上でタスクを割り振ることができる -
Tensilica Vision DSP Pt
-
Adreno225
-
Adreno530
2015, 519GFLOPS
- ヘネシー&パターソン コンピュータアーキテクチャ 定量的アプローチ