ニュース

AMD、Vega10コア採用で単精度12.3TFLOPSの「Radeon Instinct MI25」

Radeon Instinct MI25

 米AMDは、HPCシステム向けのGPUアクセラレータ「Radeon Instinct MI25/MI8/MI6」の仕様を公開した。

 機械学習や深層学習(ディープラーニング)のトレーニングおよび推論処理での利用を想定したアクセラレータで、2016年末に発表されている製品(25TFLOPSのスーパーGPU「Vega」をGPUコンピュート市場に投入するAMD参照)だが、サーバー向けプロセッサ「EPYC」の仕様公開に合わせて仕様の詳細が明らかとなった。

 最上位のRadeon Instinct MI25は“Vega10”コアを採用しており、単精度浮動小数点演算(FP32)で12.3 TFLOPS、半精度浮動小数点演算(FP16)で24.6 TFLOPSの処理性能を謳う。

 5月に発表されている「Radeon Vega Frontier Edition」もVega10コアを採用するが、FP32は13 TFLOPSとなっているため、わずかながらクロックなどに差があるとみられる。

 Radeon Instinct MI8およびMI6は、それぞれFijiアーキテクチャとPolarisアーキテクチャを採用している。仕様は以下の通りで、参考までに、Radeon Vega Frontier Editionおよび、NVIDIA製GPUアクセラレータ「Tesla V100/P100」も併記している。

モデルRadeon Instinct MI25Radeon Instinct MI8Radeon Instinct MI6Radeon Vega Frontier EditionTesla V100 PCIeTesla P100 PCIe (16GBメモリ版)
アーキテクチャVega10FijiPolarisVega10VoltaPascal
コア数4,0962,3044,0965,1203,584
倍精度演算性能(FP64)768 GFLOPS512 GFLOPS358 GFLOPS?7 TFLOPS4.7 TFLOPS
単精度演算性能(FP32)12.3 TFLOPS8.2 TFLOPS5.7 TFLOPS13 TFLOPS14 TFLOPS9.3 TFLOPS
半精度演算性能(FP16)24.6 TFLOPS8.2 TFLOPS5.7 TFLOPS25 TFLOPS-18.7 TFLOPS
メモリ2,048-bit HBM2 16GB4,096-bit HBM1 4GB256-bit GDDR5 16GBHBM2 16GB4,096-bit HBM2 16GB4,096-bit HBM2 16GB
メモリ帯域484 GB/s512 GB/s224 GB/s480 GBs/s900 GB/s732 GB/s
接続インターフェイスPCI Express 3.0 x16PCI Express 3.0PCI Express 3.0PCI Express 3.0PCI Express 3.0
フォームファクタPCIe FHFL/2スロットPCIe FHHL/2スロットPCIe FHFL/1スロットPCIe FHFL/2スロットPCIe FHFL
消費電力300W175W150W?250W
Radeon Instinct MI8
Radeon Instinct MI6