アルベン氏が示した概念図。左の図が従来のTransformerモデルでのGPUでの実行、それを4つのGPUでEP:Expert Parallelism、TP:Tensor Parallelismに分割して実行するようにするのをさらに2分割することでより効率よく実行できるようにする。そうしたより並列性を高めるという考え方でBlackwellは設計されている

アルベン氏が示した概念図。左の図が従来のTransformerモデルでのGPUでの実行、それを4つのGPUでEP:Expert Parallelism、TP:Tensor Parallelismに分割して実行するようにするのをさらに2分割することでより効率よく実行できるようにする。そうしたより並列性を高めるという考え方でBlackwellは設計されている