後藤弘茂のWeekly海外ニュース

NVIDIAが発表したTuringベースのワークステーション戦略

後藤弘茂 (Hiroshige Goto)

2019年3月20日 18:13

データサイエンティストに向けたワークステーション

　NVIDIAからワークステーションが登場する。NVIDIAが主催するGPUコンピューティングのカンファレンス「GTC(GPU Technology Conference) 2019」で、同社は、データサイエンティスト向けのワークステーションを市場に提案した。NVIDIAがリファレンスデザインを提供し、DellやHP、Lenovoなどのベンダーが実際のワークステーションを販売する。

　ハードウェア的には、NVIDIAのビジュアライゼーション向けグラフィックスカードの「Quadro RTX 8000または6000」をデュアルで搭載する。2枚のQuadro RTXはNVLinkで相互接続され、最大で96GBのメモリをシェアできる。演算性能は最大で260TFLOPS(FP16)となる。マシンラーニング(機械学習)のインファレンス(推論)なら8-bit整数で522TOPS、4-bitで1,044TOPSだ。これにCUDA上のマシンラーニング向けのライブラリ群「CUDA-X」やツールをプリインストールする。NVIDIAは、今回からNVIDIAが提供するCUDAのライブラリ群をまとめてCUDA-Xという名称にしている。

NVIDIAがリファレンスデザインを作るデータサイエンス向けワークステーション

CUDA-XのAIのエコシステム。NVIDIAのライブラリ群とサードーパーティのツール類

　唐突に見えるNVIDIAのワークステーション戦略には、そもそもデータサイエンス分野が急速に勃興してきた背景がある。

　データサイエンティストは、データを解析して、理解しやすいかたちに加工したり、解析のためのアルゴリズムの改良や開発を行なう。ビジュアル化して事業計画などの意志決定を容易にすることから、機械学習によってユーザー体験を向上させるサービスを開発することまで含む幅広い職種だ。こうした業務自体は以前から存在したが、ビッグデータとディープラーニング(深層学習)によって、様相が大きく変わり、ここ7～8年はデータサイエンスと分類されている。

NVIDIAの想定するデータサイエンスワークフローの例

NVIDIAの想定するデータサイエンスワークフローとNVIDIAのライブラリ

ユーザーが自分でワークステーションを作り始めた

　コンピュータサイエンスがコンピュートインテンシブな時代の科学なら、データサイエンスはデータインテンシブな時代の科学だ。データサイエンティストの業務では、マシンラーニングを用いて膨大なデータの解析や、新しい機能をサービスに実装して行く必要がある。データアナリストとデータエンジニアの2種類の職種が複合しているが、実際にはどちらかに偏っている場合が多い。

　データサイエンティストでは、膨大なデータの処理のためにコンピューティングがヘビーなタスクが多く、計算性能が必要となる。もちろん、その中身のほとんどがニューラルネットワークであり、またビジュアライゼーションが必要となるケースもある。つまり、NVIDIA GPUがアクセラレートできるワークロードだ。そして、ローカルでそうした作業をしたいというニーズがデータサイエンティストの中にあった。

Jensen Huang(ジェンスン・フアン)氏(Founder and CEO, NVIDIA)

　米サンノゼのGTCのキーノートスピーチの中で、Jensen Huang(ジェンスン・フアン)氏(Founder and CEO, NVIDIA)は、データサイエンスワークステーションのきっかけを説明した。それによると、NVIDIAからの提案からスタートしたのではなく、データサイエンティストが自分達でこうしたワークステーションを作り始めたことに端を発しているという。データサイエンティストが、自分のローカル環境で作業ができるマシンを必要としている。ニーズが先にあって、そこにNVIDIAがリファレンスを投入するというパターンとなる。

NVIDIAが想定する、今後重要となるデータサイエンスによるサービス実装の例。音声と画像/映像で認識し、応答を音声と画像で生成する

現状のデータサイエンティストの業務の一例。50万のアクセスポイントの状況をビジュアル化して分析する

ワークステーションという分野の復権?

　NVIDIAのデータサイエンスワークステーションは、ワークステーションというカテゴリでくくると面白い状況変化となる。

　ワークステーションでは、かつて、RISC系CPUのマシンが市場を支配していた時代があった。これは、RISC系CPUに性能や機能(64-bitやマルチソケットなど)のアドバンテージがあったためだ。PCより性能や機能で勝るRISCベースのワークステーションが、UNIX系OSベースでエンジニアリングやビジュアライゼーションなどで使われた。その時代には、RISCワークステーションとx86系PCの違いは、CPUやOSなどによって明瞭で、製品セグメントが差別化されていた。

　しかし、x86系CPUの性能と機能が追いつくと、ワークステーション分野もx86が占めるようになった。x86でサーバーやワークステーションまでが構成される時代になると、ワークステーションとハイエンドPCの境界が曖昧となり、ワークステーションというカテゴリ自体の存在感が薄れて行った。エンジニアリング分野などのコンピューティングワークロードが、ハイエンドPCクラスの性能で十分処理できるようになったことも大きい。

　今回のNVIDIAのデータサイエンスワークステーションは、こうした歴史への揺り戻しと見ることもできる。現在では、重いワークロードは、膨大なデータに対する並列処理やニューラルネットワークになりつつある。今の汎用CPUの多くは、そうしたワークロードを効率よく処理することが難しい。そこで、ヘビーなGPUを搭載したマシンを新たなワークステーションとして成立させようというストーリーとなる。

　ここまでが、ワークステーションの話だが、NVIDIAの対データサイエンス戦略には続きがある。それはデータセンタ側のサーバーだ。

データサイエンス向けサーバーも登場

　実際には、データサイエンティストが自分の手元で作業をしたいというニーズ以上に、サーバー側で処理をさせたいというニーズが強い。たとえば、Webで提供しているサービスにインファレンスを実装するならサーバー側となる。ここで、NVIDIAは、現在のコンピュータセンタを単純化した概念図で示す。

　下の図の左上はスーパーコンピュータだ。コンピューティング性能が極めて高いこの分野では、コンピュートノードにヘビーにGPUを載せた構成が主流となっている。青がCPU、大きな緑はGPU群で、コンピュテーションの多くはGPUに負っている。もちろん、これはNVIDIAのビューで、異なる構成もあるが、米国ではスーパーコンピュータでGPUの勢いが非常に強いことは確かだ。

　一方、右下は現在のwebサーバーなどの一般的な構成を示している。それほど高性能ではないCPUの小さなクラスタにスケールアウトしている。かつて、SQLが処理の主体だったデータセンタではCPUも大きかったが、今ではデータセンターの中の大多数の構成はそこそこの性能のCPUノードとなっている。

NVIDIAから見たサーバールームのワークロードとハードウェア構成の概念図。青がCPU、緑がGPU。左上のスーパーコンピュータはクラスタの粒度が大きくGPUヘビーな構成。対して右下のハイパースケールなデータセンタは粒度が小さな多数のCPUノードにスケールアウトした構成となっている

　NVIDIAは、データサイエンスのワークロードの性能と粒度の要請は、ちょうどスーパーコンピュータとスケールアウトしたデータセンターの中間にあると見ている。このニーズに対応するためには、データセンターにGPUサーバーのノードを導入することが適しているとなる。こうしたニーズでは、Volta(ボルタ)ベースのヘビーなGPUサーバーは向いておらず、Turing(チューリング)ベースのGPUサーバーが適している。GPUコンピューティング向けに開発されたVoltaは性能は高いが電力消費もコストも大きい。それに対して、Turingの方が廉価かつ省電力に導入できる。

データサイエンスのワークロードの特徴は、スーパーコンピュータと従来のデータセンタの中間に位置するとNVIDIAは指摘する。対応するためには、スケールアウトしたCPUノードにGPUを加える必要があるとNVIDIAは示している

データヘビーな分野にはVoltaベースのDGX-2を、スケールアウトしたCPUノードにはTuringベースの新たなデータサイエンスサーバーをNVIDIAは投入する

　この戦略に沿って、パートナー各社からTuringベースのデータサイエンスサーバーが投入される。ややこしいことに、ビジュアライゼーション向けでもNVIDIAはTuringベースのRTXサーバーを発表している。そちらは、従来なら映画制作などのレンダーファームをターゲットとしていたタイプのサーバーだ。

　こうして見ると、NVIDIAのサーバー向けGPU戦略は、GPUラインナップにTuringアーキテクチャが加わったことで階層が厚くなり、より広い市場へ浸透できる可能性が開けたことがわかる。Turingは、グラフィックス向けとして開発されたが、ニューラルネットワーク向けのテンサーコアを持つため、サーバーへの展開も開けている。このあたりは、グラフィックスにフォーカスしたGPUであっても、グラフィックスに機能を絞り込まず、ニューラルネットワーク向けの機能を入れ込んだNVIDIAの戦略の利点だ。

Turing T4 GPUベースのデータサイエンスサーバーも多くのサーバーベンダから提供される

CPUだけのノードと比較するとT4 GPUを加えたノードの方がデータサイエンスの処理が10倍高速化するとNVIDIAは謳う