別のGPUとデータ交換が必要な範囲を先に計算しデータ転送を実施。データ転送中に単一GPUで独立して計算可能な範囲の処理を進めることで、データ転送のレイテンシを隠蔽する

別のGPUとデータ交換が必要な範囲を先に計算しデータ転送を実施。データ転送中に単一GPUで独立して計算可能な範囲の処理を進めることで、データ転送のレイテンシを隠蔽する