後藤弘茂のWeekly海外ニュース
NVIDIAが発表したTuringベースのワークステーション戦略
2019年3月20日 18:13
データサイエンティストに向けたワークステーション
NVIDIAからワークステーションが登場する。NVIDIAが主催するGPUコンピューティングのカンファレンス「GTC(GPU Technology Conference) 2019」で、同社は、データサイエンティスト向けのワークステーションを市場に提案した。NVIDIAがリファレンスデザインを提供し、DellやHP、Lenovoなどのベンダーが実際のワークステーションを販売する。
ハードウェア的には、NVIDIAのビジュアライゼーション向けグラフィックスカードの「Quadro RTX 8000または6000」をデュアルで搭載する。2枚のQuadro RTXはNVLinkで相互接続され、最大で96GBのメモリをシェアできる。演算性能は最大で260TFLOPS(FP16)となる。マシンラーニング(機械学習)のインファレンス(推論)なら8-bit整数で522TOPS、4-bitで1,044TOPSだ。これにCUDA上のマシンラーニング向けのライブラリ群「CUDA-X」やツールをプリインストールする。NVIDIAは、今回からNVIDIAが提供するCUDAのライブラリ群をまとめてCUDA-Xという名称にしている。
唐突に見えるNVIDIAのワークステーション戦略には、そもそもデータサイエンス分野が急速に勃興してきた背景がある。
データサイエンティストは、データを解析して、理解しやすいかたちに加工したり、解析のためのアルゴリズムの改良や開発を行なう。ビジュアル化して事業計画などの意志決定を容易にすることから、機械学習によってユーザー体験を向上させるサービスを開発することまで含む幅広い職種だ。こうした業務自体は以前から存在したが、ビッグデータとディープラーニング(深層学習)によって、様相が大きく変わり、ここ7~8年はデータサイエンスと分類されている。
ユーザーが自分でワークステーションを作り始めた
コンピュータサイエンスがコンピュートインテンシブな時代の科学なら、データサイエンスはデータインテンシブな時代の科学だ。データサイエンティストの業務では、マシンラーニングを用いて膨大なデータの解析や、新しい機能をサービスに実装して行く必要がある。データアナリストとデータエンジニアの2種類の職種が複合しているが、実際にはどちらかに偏っている場合が多い。
データサイエンティストでは、膨大なデータの処理のためにコンピューティングがヘビーなタスクが多く、計算性能が必要となる。もちろん、その中身のほとんどがニューラルネットワークであり、またビジュアライゼーションが必要となるケースもある。つまり、NVIDIA GPUがアクセラレートできるワークロードだ。そして、ローカルでそうした作業をしたいというニーズがデータサイエンティストの中にあった。
米サンノゼのGTCのキーノートスピーチの中で、Jensen Huang(ジェンスン・フアン)氏(Founder and CEO, NVIDIA)は、データサイエンスワークステーションのきっかけを説明した。それによると、NVIDIAからの提案からスタートしたのではなく、データサイエンティストが自分達でこうしたワークステーションを作り始めたことに端を発しているという。データサイエンティストが、自分のローカル環境で作業ができるマシンを必要としている。ニーズが先にあって、そこにNVIDIAがリファレンスを投入するというパターンとなる。
ワークステーションという分野の復権?
NVIDIAのデータサイエンスワークステーションは、ワークステーションというカテゴリでくくると面白い状況変化となる。
ワークステーションでは、かつて、RISC系CPUのマシンが市場を支配していた時代があった。これは、RISC系CPUに性能や機能(64-bitやマルチソケットなど)のアドバンテージがあったためだ。PCより性能や機能で勝るRISCベースのワークステーションが、UNIX系OSベースでエンジニアリングやビジュアライゼーションなどで使われた。その時代には、RISCワークステーションとx86系PCの違いは、CPUやOSなどによって明瞭で、製品セグメントが差別化されていた。
しかし、x86系CPUの性能と機能が追いつくと、ワークステーション分野もx86が占めるようになった。x86でサーバーやワークステーションまでが構成される時代になると、ワークステーションとハイエンドPCの境界が曖昧となり、ワークステーションというカテゴリ自体の存在感が薄れて行った。エンジニアリング分野などのコンピューティングワークロードが、ハイエンドPCクラスの性能で十分処理できるようになったことも大きい。
今回のNVIDIAのデータサイエンスワークステーションは、こうした歴史への揺り戻しと見ることもできる。現在では、重いワークロードは、膨大なデータに対する並列処理やニューラルネットワークになりつつある。今の汎用CPUの多くは、そうしたワークロードを効率よく処理することが難しい。そこで、ヘビーなGPUを搭載したマシンを新たなワークステーションとして成立させようというストーリーとなる。
ここまでが、ワークステーションの話だが、NVIDIAの対データサイエンス戦略には続きがある。それはデータセンタ側のサーバーだ。
データサイエンス向けサーバーも登場
実際には、データサイエンティストが自分の手元で作業をしたいというニーズ以上に、サーバー側で処理をさせたいというニーズが強い。たとえば、Webで提供しているサービスにインファレンスを実装するならサーバー側となる。ここで、NVIDIAは、現在のコンピュータセンタを単純化した概念図で示す。
下の図の左上はスーパーコンピュータだ。コンピューティング性能が極めて高いこの分野では、コンピュートノードにヘビーにGPUを載せた構成が主流となっている。青がCPU、大きな緑はGPU群で、コンピュテーションの多くはGPUに負っている。もちろん、これはNVIDIAのビューで、異なる構成もあるが、米国ではスーパーコンピュータでGPUの勢いが非常に強いことは確かだ。
一方、右下は現在のwebサーバーなどの一般的な構成を示している。それほど高性能ではないCPUの小さなクラスタにスケールアウトしている。かつて、SQLが処理の主体だったデータセンタではCPUも大きかったが、今ではデータセンターの中の大多数の構成はそこそこの性能のCPUノードとなっている。
NVIDIAは、データサイエンスのワークロードの性能と粒度の要請は、ちょうどスーパーコンピュータとスケールアウトしたデータセンターの中間にあると見ている。このニーズに対応するためには、データセンターにGPUサーバーのノードを導入することが適しているとなる。こうしたニーズでは、Volta(ボルタ)ベースのヘビーなGPUサーバーは向いておらず、Turing(チューリング)ベースのGPUサーバーが適している。GPUコンピューティング向けに開発されたVoltaは性能は高いが電力消費もコストも大きい。それに対して、Turingの方が廉価かつ省電力に導入できる。
この戦略に沿って、パートナー各社からTuringベースのデータサイエンスサーバーが投入される。ややこしいことに、ビジュアライゼーション向けでもNVIDIAはTuringベースのRTXサーバーを発表している。そちらは、従来なら映画制作などのレンダーファームをターゲットとしていたタイプのサーバーだ。
こうして見ると、NVIDIAのサーバー向けGPU戦略は、GPUラインナップにTuringアーキテクチャが加わったことで階層が厚くなり、より広い市場へ浸透できる可能性が開けたことがわかる。Turingは、グラフィックス向けとして開発されたが、ニューラルネットワーク向けのテンサーコアを持つため、サーバーへの展開も開けている。このあたりは、グラフィックスにフォーカスしたGPUであっても、グラフィックスに機能を絞り込まず、ニューラルネットワーク向けの機能を入れ込んだNVIDIAの戦略の利点だ。