最適化に関するまとめ。Particleworksでは、FermiからKeplerに変えることで平均1.47倍の性能向上が見られた。ただし、Fermi用に最適化したコードそのままではあまり性能は向上しない。warpを単位としてSIMD的に処理を記述すること、ブロック数とスレッド数を適切に選択すること、Warp Shuffle命令を利用すること、テクスチャの代わりに、const * _restrictを利用することが、Kepler最適化のポイントである