ニュース

NVIDIA、Maxwellベースで7TFLOPSを実現する機械学習向け「Tesla M40」

~Low Profileの1スロットの「Tesla M4」も

「Tesla M40」

 米NVIDIAは10日(現地時間)、機械学習向けのGPU「Tesla M40」と「Tesla M4」を発表した。出荷時期はM40が2015年末、M4が2016年第1四半期。

 現行のTeslaはデスクトップやノートPC向けより1世代古い「Kepler」アーキテクチャだったが、今回の新製品で「Maxwell」へと切り替わった。また、Teslaシリーズは伝統的に、大規模な科学計算や解析を主な用途に掲げていたが、昨今はより正確で詳細な動画/画像の判定や、音声認識、個人識別などを実現する機械学習の需要が急増していることから、そうった用途を見据えた製品となっている。なお、Tesla Kシリーズは今後も併売される。

 M40はボード1枚当たりの性能最大化を目指したもので、同社では機械学習向けの世界最高速アクセラレータとしている。一方のM4は、1枚当たりの絶対性能は下がるが、LowProfileで1スロットなコンパクトカードとなっており、最大限の性能が求められる機械学習よりも、機械学習で得られた結果を元にした推論を行なうような用途向けとなっている。

 M40の仕様は、CUDAコア数が3,072基、搭載メモリがGDDR5 12GBで、帯域は288GB/sec、単精度浮動小数点演算のピーク性能は7TFLOPSに達する。消費電力は250W。

 M4の仕様は、CUDAコア数が1,024基、搭載メモリがGDDR5 4GBで、帯域は88GB/sec、単精度浮動小数点演算のピーク性能は2.2TFLOPS、消費電力は50~75W。

「Tesla M4」

 また、同社は高出力で低遅延なWebサービスをもたらす「GPU REST ENGINE」や、FFmpegへのGPU最適化、画像サイズ変換のエンジンなども併せて提供する。

 これらの製品をデータセンターに採用することで、例えば5,000セッションの動画ストリーミング配信において、同等規模のCPUのみのサーバーを利用した場合と比べ、消費電力を8分の1程度に低減できるとしている。

(若杉 紀彦)