takagi · March 4, 2016 04:08 · gos-k · Mar 10, 2016 · takagi · Mar 11, 2016
diff --git a/gistfile1.txt b/gistfile1.txt

 https://github.com/takagi/cl-cuda/tree/issue/49.symbol-macro

 ・時間を食う処理は、update-density と update-force で、全体の 90% 以上

 ・アルゴリズムは所与としたとき、GPU の使い方のレベルで高速化する余地はあるか？
 　→メモリアクセスにあまり局所性がなさそう
 　→グローバルメモリへのアクセスが律速なので、それ以上はもうやりようがない？

 ・グリッドやブロックの割当てはどのようにやるもの？
 　→影響するパラメータを変えるたびに手計算してハードコードしているがそういうもの？

 ・粒子インデックスの計算はどのようにやるもの？
 　→グリッドやブロックの割当て方に影響を受けるがそういうもの？
 　→[0,n) でディスパッチしてくれたらいいのに

	https://github.com/takagi/cl-cuda/tree/issue/49.symbol-macro

	・時間を食う処理は、update-density と update-force で、全体の 90% 以上

	・アルゴリズムは所与としたとき、GPU の使い方のレベルで高速化する余地はあるか？
	→メモリアクセスにあまり局所性がなさそう
	→グローバルメモリへのアクセスが律速なので、それ以上はもうやりようがない？

	・グリッドやブロックの割当てはどのようにやるもの？
	→影響するパラメータを変えるたびに手計算してハードコードしているがそういうもの？

	・粒子インデックスの計算はどのようにやるもの？
	→グリッドやブロックの割当て方に影響を受けるがそういうもの？
	→[0,n) でディスパッチしてくれたらいいのに