ニュース

NVIDIA、Voltaアーキテクチャ採用5,120 CUDAコア/210億トランジスタの新GPU「Tesla V100」

~Tensor Core搭載で深層学習能力は120TFLOPS

Tesla V100

 米NVIDIAは10日(現地時間)、初のVoltaアーキテクチャを採用した深層学習向けGPU「Tesla V100」を発表した。

 Pascalアーキテクチャの「Tesla P100」の後継となるモデルで、Voltaアーキテクチャを採用。新たにAI向けのTensor Core 640基を内蔵し、深層学習性能は120TFLOPSに達する。

 Tesla V100は地球上でもっとも集積度の高い半導体としており、トランジスタ数はついに210億に達した。TSMCの12nm FinFETプロセスを用いて製造され、ダイサイズは815平方mmと、かつてないサイズとなっている(P100は610平方mm)。

 CUDAコア数は5,120基、ブーストクロックは1,455MHz。テクスチャユニット数は320基。浮動小数点演算性能は64bit精度で7.5TFLOPS、32bit精度で10TFLOPSとされている。メモリは16GB、4,096bitのHBM2で、バンド幅は900GB/s。L2キャッシュサイズは6,144KB。また、300GB/sのNVLinkを備える。TDPは300W。

 また、深層学習向けサーバー「DGX-1」をTesla V100に置き換えたバージョン(価格は149,000ドル)、DGX-1をスケールダウンした「DGX Station」(69,000ドル)、そして8基のTesla V100を搭載し、クラウドのサーバーとして利用できる「HGX-1」の3製品の提供開始を発表した。

Voltaの新しいTensorコア
Pascalと比較して、深層学習のトレーニングで12倍、推論で6倍の性能を実現する
Tesla V100を掲げるジェンスン・フアンCEO