ニュース
AMD、Vega10コア採用で単精度12.3TFLOPSの「Radeon Instinct MI25」
2017年6月21日 19:19
米AMDは、HPCシステム向けのGPUアクセラレータ「Radeon Instinct MI25/MI8/MI6」の仕様を公開した。
機械学習や深層学習(ディープラーニング)のトレーニングおよび推論処理での利用を想定したアクセラレータで、2016年末に発表されている製品(25TFLOPSのスーパーGPU「Vega」をGPUコンピュート市場に投入するAMD参照)だが、サーバー向けプロセッサ「EPYC」の仕様公開に合わせて仕様の詳細が明らかとなった。
最上位のRadeon Instinct MI25は“Vega10”コアを採用しており、単精度浮動小数点演算(FP32)で12.3 TFLOPS、半精度浮動小数点演算(FP16)で24.6 TFLOPSの処理性能を謳う。
5月に発表されている「Radeon Vega Frontier Edition」もVega10コアを採用するが、FP32は13 TFLOPSとなっているため、わずかながらクロックなどに差があるとみられる。
Radeon Instinct MI8およびMI6は、それぞれFijiアーキテクチャとPolarisアーキテクチャを採用している。仕様は以下の通りで、参考までに、Radeon Vega Frontier Editionおよび、NVIDIA製GPUアクセラレータ「Tesla V100/P100」も併記している。
| モデル | Radeon Instinct MI25 | Radeon Instinct MI8 | Radeon Instinct MI6 | Radeon Vega Frontier Edition | Tesla V100 PCIe | Tesla P100 PCIe (16GBメモリ版) |
|---|---|---|---|---|---|---|
| アーキテクチャ | Vega10 | Fiji | Polaris | Vega10 | Volta | Pascal |
| コア数 | 4,096 | 2,304 | 4,096 | 5,120 | 3,584 | |
| 倍精度演算性能(FP64) | 768 GFLOPS | 512 GFLOPS | 358 GFLOPS | ? | 7 TFLOPS | 4.7 TFLOPS |
| 単精度演算性能(FP32) | 12.3 TFLOPS | 8.2 TFLOPS | 5.7 TFLOPS | 13 TFLOPS | 14 TFLOPS | 9.3 TFLOPS |
| 半精度演算性能(FP16) | 24.6 TFLOPS | 8.2 TFLOPS | 5.7 TFLOPS | 25 TFLOPS | - | 18.7 TFLOPS |
| メモリ | 2,048-bit HBM2 16GB | 4,096-bit HBM1 4GB | 256-bit GDDR5 16GB | HBM2 16GB | 4,096-bit HBM2 16GB | 4,096-bit HBM2 16GB |
| メモリ帯域 | 484 GB/s | 512 GB/s | 224 GB/s | 480 GBs/s | 900 GB/s | 732 GB/s |
| 接続インターフェイス | PCI Express 3.0 x16 | PCI Express 3.0 | PCI Express 3.0 | PCI Express 3.0 | PCI Express 3.0 | |
| フォームファクタ | PCIe FHFL/2スロット | PCIe FHHL/2スロット | PCIe FHFL/1スロット | PCIe FHFL/2スロット | PCIe FHFL | |
| 消費電力 | 300W | 175W | 150W | ? | 250W | |










![[Amazon限定ブランド]CCL い・ろ・は・すラベルレス 2LPET ×8本 ミネラルウォーター 無味 製品画像:1位](https://m.media-amazon.com/images/I/41h0MHfvhkL._SL160_.jpg)








