複数の領域に分割して計算する場合、境界部分のデータ転送がボトルネックになることを防ぐために計算と通信をオーバーラップしてこれを隠蔽する。最近ではGPU上で計算している裏で、ほかの計算をCPU上でも実行するといった手法を取り入れている