ニュース

NVIDIA、AI/RTXなどのライブラリをまとめた「CUDA-X」でCUDAを拡張

GTCの基調講演で講演するNVIDIA CEO ジェンスン・フアン氏

 米NVIDIAは、プライベートイベント「GTC」を3月18日~21日(現地時間)の4日間にわたり、米カリフォルニア州サンノゼにおいて開催している。初日には、CEOのジェンスン・フアン氏による基調講演が行なわれ、同社の新しい戦略などが明らかにされた。このなかでNVIDIAは、CUDAを拡張した「CUDA-X」を発表した。

 CUDA-Xは、CUDAの上に位置するソフトウェアライブラリだ。従来はcuDNNなど複数の製品から構成されていたAIのライブラリを1つにまとめた「CUDA-X AI」や、リアルタイムレイトレーシング用のRTXなどから構成されており、ソフトウェア開発者はそれらを活用することで、容易にGPUを利用した開発を行なえる。

 CUDA-Xは、一般的に使われているTensorFlowなどのディープラーニング(深層学習)のフレームワーク、さらにはGPUのパブリッククラウドサービスを提供するAmazon Web ServiceやAzure、Google Cloud Platform(GCP)などに対応しており、AIなどのソフトウェアの開発を一気通貫に行なうことができる。

今回は新しいGPUの発表はなく、ロードマップのアップデートもなかったGTC

いつものどおりトレードマークの革ジャンを着て登場したフアン氏

 NVIDIAのGTCはもともと、Gpu Technology Conferenceの略称でGTCとされてきたが、近年ではただGTCとだけ呼ばれることが多くなっている。その背景としては、GTCが従来はグラフィックスも含めた会議だったのに対し、ここ数年はGPUを利用したAIなどに焦点が当てられており、さらには自動運転などの新しい使い方を提案するものとしても活用されているからだ。

 それでも、毎年なんらかの新しいGPUなどが発表される場としても利用されており、一昨年(2017年)のGTCではTesla V100を、その前の年にはTesla P100といったデータセンター向けのGPUが発表されてきた。

 ただ、今年(2019年)はTuringの開発コードネームで知られる現在の最新GPUアーキテクチャが、昨年(2018年)の8月にカナダで行なわれたSIGGRAPHでQuadro RTX 8000/6000として発表され、その1週間後にドイツで行なわれたGamescomでTuringのGeForce RTXが発表され、その後データセンター向けのTesla T4が発表されている。このため、今回は新しいGPUの発表はなく、ロードマップに関してもとくにアップデートされることはなかった。

Mellanox CEO イヤル・ワルドマン氏(左)が登壇

 半導体関連の話題で言うと、GTC開幕前に明らかになったNVIDIAによるハイスピードI/Oを開発してきたベンダーとなる「Mellanox」の買収などが取り上げられた。

 Mellanoxはチップ間のハイスピードI/Oを開発している会社で、近い将来にNVIDIAが1つのパッケージに複数のダイを統合するときなどに同社の技術が役に立つと考えられている。

 具体的な製品が発表されたわけではないが、壇上にMellanox CEOのイヤル・ワルドマン氏が登壇し、Mellanox将来のNVIDIAのHPC向け製品に役立つ見通しであることなどが説明された。

Turingを搭載したAI開発がすぐにできるサーバーとワークステーションが富士通などのOEMから発表される

 では、今回のGTCではハードウェアの発表はなかったのかと言えば、そんなことはない。大きなハードウェア関連の発表としては、データセンター向けのサーバー製品群と、ワークステーション向けの製品という2種類の製品が発表された。

RTXサーバー

 データセンター向けサーバーでは、Quadro RTXを8つ搭載可能なRTXサーバー、さらには昨年発表されたTuringアーキテクチャのサーバー向け製品となる「Tesla T4」を搭載したサーバー製品となる「データサイエンス用エンタープライズ向けサーバー」を発表した。

データサイエンス用エンタープライズ向けサーバー

 CISCO、Dell EMC、HPE、Lenovoなどに加えて、日本の富士通からも発表される予定のデータサイエンス用エンタープライズ向けサーバーは、Tesla T4 GPUと、後述するCUDA-X AIなどのソフトウェアスタックを標準搭載する。

 さらに、NGC(NVIDIA GPU Cloud)と呼ばれる深層学習や機械学習で活用できるコンテナにも対応しており、企業は購入後すぐにAIのソフトウェア開発ができるようになっている。

データサイエンス用ワークステーション

 同様の製品はワークステーションにも用意されており、Quadro RTX 8000/6000を最大2枚搭載できる「データサイエンス用ワークステーション」が同時に発表されており、こちらもCUDA-X AIなどのソフトウェアライブラリなどを標準搭載。こちらも購入後すぐにAIのソフトウェア開発も取り組めることが特徴となる。Dell、HP、Lenovoなどのグローバルなワークステーションメーカーや、ホワイトボックスのローカルOEMなどから販売が開始される見通しだ。

従来はべつべつの名称だったCUDA用のライブラリをとりまとめて「CUDA-X」という総称に

CUDA-Xは、従来はバラバラに提供されてきたCUDA用ライブラリの総称

 今回の基調講演でフアン氏が盛んに強調していたのが、CUDA-Xと呼ばれるソフトウェアの開発ライブラリだ。

 CUDA-Xとは、従来はcuDNN、cuML、TensorRTなどとべつべつの名前で提供されてきたソフトウェア開発ライブラリの総称で、今後は用途ごとにまとめられて提供されることになる。RTX(リアルタイムレイトレーシング)、DRIVE(自動運転開発向け)、HPC、IS(Issac、ロボット開発)などについても、CUDA-Xとして整理されていき、よりすっきりした開発環境が提供されるという。

 フアン氏はCUDA-Xを、「GPUとCUDAはドメインスペシフィックコンピューティングを実現する基盤になっており、そのアクセラレーションとなるのがCUDA-Xだ。CUDA-Xにより、開発者はより目的に合ったアプリケーションを容易に開発できるようになる」と述べる。

 つまり、汎用のプログラマブルプロセッサであるGPUと、CUDA、そしてCUDA-Xを組み合わせることで、ソフトウェア開発者がGPUをまるで専用のプロセッサであるように利用し、アプリケーションプロセッサを作れるようになるということだ。

PRADAというのはもちろんフアン氏のジョーク

 フアン氏は「GPUはPRogrammableで、Accelerationで、Domains(領域を限定可能)なArchitectureであり、まさに“PRADA”だ(高級ファッションブランド)」とお得意のジョークを交えつつ、GPUの優位点がCUDAとCUDA-Xを利用したドメインスペシフィックコンピューティングをすでに実現していることにあるとした。

 米国のコンピュータ研究者の間では「ドメインスペシフィックコンピューティング」が1つの流行用語のようになっている。

 ドメインスペシフィックコンピューティングとは、特定領域(ドメイン)に向けた演算装置という意味で、CPUやGPUの進化が、プロセスルールの進化が従来よりも減速している影響であまり向上していないことから、特定用途のアクセラレータなどを組み合わせて性能を上げていくべきだという考えだ。

 それに対するフアン氏の答えは、GPUとCUDA、そしてCUDA-Xというソフトウェア開発環境を組み合わせれば、ドメインスペシフィックコンピューティングが実現可能になるというものである。

Amazon、Microsoft、Googleなどのパブリッククラウド事業者との提携も強化

GPU、CUDAとCUDA-Xから構成されるエコシステム。NVIDIAだけでなく、AWSなどのサービス事業者とも連携していることが特徴だとフアン氏

 フアン氏は、そうしたCUDA-Xによる具体例として、AI向けのCUDA-X AIに多くの時間を割き、Amazon Web ServiceがNVIDIAのTesla T4 GPUを利用したインスタンス(GPUのパブリッククラウドサービス)を開始したこと、Google Cloud Platform(GCP)とはGCP VM ImagesとKubeflowに対応したRAPIDS(CUDA-X AIの一部となるライブラリ)の提供、Microsoft Azureとの連携ではAzure Machine LearningサービスにRAPIDSの統合やNVIDIAのGPUを利用した音声認識サービスなど、パブリッククラウドのサービスを提供する他社との連携も強調した。

Microsoftの自然言語音声認識がCUDA-Xを利用して開発されているというデモ
Amazon Web Services(AWS)のマット・ガーマン氏(左)が両社のパートナーシップを説明

 フアン氏は、「昨日作ったPCのアプリケーションは明日販売されるPCでも動作する。それと同じように今日作ったCUDAのアプリケーションは、明日のCUDAのハードウェアでも動作する」と述べ、CUDAとCUDA-Xに対応したソフトウェアを一度作れば、それが将来のプラットフォームでも使い回すことができるとし、ソフトウェア開発者にそのメリットを強調した。