ニュース

NVIDIA、Voltaアーキテクチャ採用「Tesla V100」のPCI Express版を年内投入

Tesla V100 PCIe

 米NVIDIAは19日(米国時間)、PCI Expressカード版GPUアクセラレータ「Tesla V100」を発表した。

 すでにSXM2版とともにPCIe版が存在することは発表されていた(NVIDIA、Volta世代の「Tesla V100」投入参照)が、今回の発表で仕様の詳細が明らかにされた。

 Texla V100についての詳細は、「本格的に深層学習へ舵を切った真のジャイアントコア『Tesla V100』」を参照されたい。

 CUDAコアや深層学習向け演算に特化したTensorコアの数はPCIe/SXM2版ともに共通だが、PCIe版では消費電力がSXM2版の300Wから250Wに下げられ、演算性能もSXM2版から若干低下している。これはPascalアーキテクチャを採用した「Tesla P100」と同様の構成となる。

モデルTesla V100 PCIeTesla V100 SXM2Tesla P100 PCIeTesla P100 SXM2
アーキテクチャVoltaPascal
製造プロセス12 nm FFN16 nm FinFET+
トランジスタ数21.1億15.3億
CUDAコア数5,1203,584
Tensorコア数640-
ベースクロック?1,126MHz1,328MHz
ブーストクロック?1,455 MHz1,303MHz1,480 MHz
倍精度演算性能(FP64)7 TFLOPs7.5 TFLOPs4.7 TFLOPs5.3TFLOPs
単精度演算性能(FP32)14 TFLOPs15 TFLOPs9.3 TFLOPs10.6 TFLOPs
半精度演算性能(FP16)-18.7 TFLOPs21.2 TFLOPs
Tensor演算性能112 TFLOPs120 TFLOPs-
メモリ4,096-bit HBM2 16GB3,072-bit HBM2 12GB
4,096-bit HBM2 16GB
4,096-bit HBM2 16GB
メモリ帯域900 GB/s549 GB/s (12GB HBM2)
732 GB/s (16GB HBM2)
732 GB/s
接続インターフェイスPCI Express 3.0NVLinkPCI Express 3.0NVLink
フォームファクタPCIe FHFLSXM2PCIe FHFLSXM2
消費電力250W300W250W300W

 PCIe版Tesla V100の発売時期については、NVIDIAは、Hewlett Packard Enterpriseなどのリセラーパートナーより、PCIe版Tesla V100および搭載システムを今年中に提供開始するとしている。