畳み込み処理、バイアス、ReLUそれぞれでGPUメモリに読み書きしていたカーネル融合しアクセスを減らす

畳み込み処理、バイアス、ReLUそれぞれでGPUメモリに読み書きしていたカーネル融合しアクセスを減らす