小さいバッチ処理で行列が狭くなるため「GEMM」ではなく「GEMV」を使う。ベクタ積なのでcuBLAS関数を活用

小さいバッチ処理で行列が狭くなるため「GEMM」ではなく「GEMV」を使う。ベクタ積なのでcuBLAS関数を活用