ニュース
AMD、Vega10コア採用で単精度12.3TFLOPSの「Radeon Instinct MI25」
2017年6月21日 19:19
米AMDは、HPCシステム向けのGPUアクセラレータ「Radeon Instinct MI25/MI8/MI6」の仕様を公開した。
機械学習や深層学習(ディープラーニング)のトレーニングおよび推論処理での利用を想定したアクセラレータで、2016年末に発表されている製品(25TFLOPSのスーパーGPU「Vega」をGPUコンピュート市場に投入するAMD参照)だが、サーバー向けプロセッサ「EPYC」の仕様公開に合わせて仕様の詳細が明らかとなった。
最上位のRadeon Instinct MI25は“Vega10”コアを採用しており、単精度浮動小数点演算(FP32)で12.3 TFLOPS、半精度浮動小数点演算(FP16)で24.6 TFLOPSの処理性能を謳う。
5月に発表されている「Radeon Vega Frontier Edition」もVega10コアを採用するが、FP32は13 TFLOPSとなっているため、わずかながらクロックなどに差があるとみられる。
Radeon Instinct MI8およびMI6は、それぞれFijiアーキテクチャとPolarisアーキテクチャを採用している。仕様は以下の通りで、参考までに、Radeon Vega Frontier Editionおよび、NVIDIA製GPUアクセラレータ「Tesla V100/P100」も併記している。
モデル | Radeon Instinct MI25 | Radeon Instinct MI8 | Radeon Instinct MI6 | Radeon Vega Frontier Edition | Tesla V100 PCIe | Tesla P100 PCIe (16GBメモリ版) |
---|---|---|---|---|---|---|
アーキテクチャ | Vega10 | Fiji | Polaris | Vega10 | Volta | Pascal |
コア数 | 4,096 | 2,304 | 4,096 | 5,120 | 3,584 | |
倍精度演算性能(FP64) | 768 GFLOPS | 512 GFLOPS | 358 GFLOPS | ? | 7 TFLOPS | 4.7 TFLOPS |
単精度演算性能(FP32) | 12.3 TFLOPS | 8.2 TFLOPS | 5.7 TFLOPS | 13 TFLOPS | 14 TFLOPS | 9.3 TFLOPS |
半精度演算性能(FP16) | 24.6 TFLOPS | 8.2 TFLOPS | 5.7 TFLOPS | 25 TFLOPS | - | 18.7 TFLOPS |
メモリ | 2,048-bit HBM2 16GB | 4,096-bit HBM1 4GB | 256-bit GDDR5 16GB | HBM2 16GB | 4,096-bit HBM2 16GB | 4,096-bit HBM2 16GB |
メモリ帯域 | 484 GB/s | 512 GB/s | 224 GB/s | 480 GBs/s | 900 GB/s | 732 GB/s |
接続インターフェイス | PCI Express 3.0 x16 | PCI Express 3.0 | PCI Express 3.0 | PCI Express 3.0 | PCI Express 3.0 | |
フォームファクタ | PCIe FHFL/2スロット | PCIe FHHL/2スロット | PCIe FHFL/1スロット | PCIe FHFL/2スロット | PCIe FHFL | |
消費電力 | 300W | 175W | 150W | ? | 250W |