ニュース

NVIDIA、GTC Japan 2014でCUDAの最新トピックを紹介

～NVIDIA GRIDの無料体験も可能に

（2014/7/16 17:53）

基調講演に登壇した米NVIDIA特別研究員のデイビット B・カーク氏。手にするのは「Tegra K1」の開発キット「JETSON TK1」

　NVIDIAは16日、GPU開発者会議「GTC Japan 2014」を東京・六本木ミッドタウンで開催した。毎年恒例となった同イベントは年々規模を拡大し、2010年には480名の参加者で行なわれたものが、2014年は1,500名の事前登録がなされたという。

2014年のGTC Japan 2014は約1,500名が事前登録。自動車業界も含まれるなど参加者の業種も多彩となった

2年前から会場に用意されるようになったドーナツも年を追うごとに数を増している

　基調講演に登壇したのは、“GeForceの父”として知られる米NVIDIA特別研究員のデイビット B・カーク氏。4月に米サンノゼで開催された「GTC 2014」で発表された内容を中心にCUDAの最新状況などを紹介した。

　CUDAの現在については、5.2億個の対応GPUが出荷されており、CUDAのダウンロード数も250万を超え、あらゆるところにCUDAが入り込んでいることを紹介。そして、新たに生まれた利用事例として、CUDAを利用した航行(ナビゲーション)や衝突検知を行なう無人消火飛行機の性能を高めたオーストラリアのProject ResQu、HIVのCAPSID(カプシド)を3,000以上のGPUで解析したイリノイ大学の研究、乳がんの検出をCUDAを用いて行なうHologicの活用例を示した。

　さらに、DNA配列の中の頻出K-merのカウントや、ニューラルネットワーク(脳の神経細胞)も利用したロボットの適応型行動選択、手術のシミュレーションが可能になる生体の軟組織の変形/破壊シミュレーションなどへの適用研究が進められているとし、人々の生活を変えるようなところで活用され始めていることをアピールした。

　CUDA対応ハードウェアについても最新のトピックを紹介。6月にドイツで行なわれたISC 2014で、ARM 64bitとTeslaを組み合わせたHPCが発表されたことや、スーパーコンピュータの電力効率ランキング「Green 500」で、東京工業大学のTSUBAME-KFCの1位を始め15位までをTeslaが独占したこと、Tegraシリーズの最新モデル「Tegra K1」でデスクトップ用GPUとアーキテクチャが統一され、CUDAの全ての機能が利用できるようになったことなどが紹介された。

　特にTegra K1については、6月に米国で行なわれたGoogleの開発者会議であるGoogle I/O 2014で、Tegra K1を搭載したさまざまなデバイスによるデモや技術展示が行なわれていたことや、国内でもオリオスペックなどで少数ながら販売が行なわれている開発キット「JETSON TK1」についても言及した。

CUDAの採用例が増え、あらゆる場所に存在することを数字で紹介

無人飛行機による消化活動への応用などCUDAの採用例

国内学術機関によるさらなる応用への研究例

ARM 64bitとTeslaを組み合わせることで電力効率を高めたHPCが登場

2014年6月の「Green 500」ランキングでは1～15位をTesla搭載スパコンが占めた

Tegraシリーズも「Tegra K1」でGPUアーキテクチャが統合され、CUDAのフル機能を利用できるようになった

Google I/O 2014の技術デモにおいて、さまざまなAndroidデバイスがTegra K1を搭載

Tegra K1を搭載する開発キット「JETSON TK1」

　さらに、機械自らが学習して成長していく「機械学習」(マシンラーニング)も、2014年末までに1日あたりの画像アップロード枚数が20億枚に達するとも言われる膨大な画像データがインターネット上に存在することや、ディープニューラルネットワーク(脳の神経細胞)のシミュレーションの研究が進んできていること、そしてGPU(CUDA)に代表されるパラレルコンピューティングの普及という3つのトレンドが集約されている現在、この技術にとって重要なタイミングに来ているとして紹介。

　例として挙げられたのは、Googleが研究を進めていた「Google Brain」と呼ばれるもので、サーバー1,000台に合計でCPU 2,000個/16,000コアを用いて処理させていたことを、サーバー3台にGPU合計12個(18,432コア)に集約させて同等の性能を発揮。消費電力は600kWから4kWへ、コストは500万ドルから33,000ドルへ低減されたと言う。

　また、画像を解析して、写っているオブジェクトがヒトなのかイヌなのかなどを判定することのコンテストでは、GPUを利用したチームの割合が増え、2013年の大会では全てのカテゴリでGPU利用チームが優勝したと、機械学習におけるCUDAの有効性を訴求し、著名な企業、機関が研究を進めていることも紹介した。

機械学習は画像などのデータを元に機械自身が学んで成長していくもの

3つのトレンドが集約した今のタイミングは、機械学習にとっても重要な時期であるとする

Googleが研究していたGoogle Brainと同等の性能を、GPUを用いることで安価かつ低消費電力で実現した

画像分析のコンテストでもGPU利用者が中心

CUDAを利用した機械学習の研究が、著名な企業/機関により進められている

NVIDIA GRIDを無料体験を開始

NVIDIA HPC担当副社長・ソリューション・アーキテクトのマーク・ハミルトン氏

　続いて登壇した米NVIDIAのHPC担当副社長・ソリューション・アーキテクトのマーク・ハミルトン氏は、NVIDIA製GPUを用いた仮想化環境について紹介した。

　NVIDIAのGPUを仮想化に用いることで、これまでのデスクトップ仮想化環境とは「昼と夜ぐらい違う」とその差を表現。実際にGoogle Earthを用いて、GPUの有無による仮想化環境のレンダリング性能の差を示した。

　そして、NVIDIA GRIDを無料で体験できる「GRIDテストドライブ」の日本語版の提供を発表した。これは、自分のPCからNVIDIAが用意するサーバーへアクセスしてGRIDを用いた仮想デスクトップを体験できるというもの。無料のアカウント登録を行なった後、「NVIDIA GRID WorkSpace」というアプリケーションをローカルにインストールする必要がある。

　GRIDテストドライブで用意される仮想デスクトップ上には、あらかじめ性能を実感できるHTML5やCADソフトなどが用意されるほか、自分のデータを転送して試すことも可能という。

　また、米国のGTC 2014で発表されたTeslaを最大8枚搭載可能なクラウドサーバー向けアプライアンス「IRAY VCA」も紹介。本田技研工業のデザインシステムソフトで、外観から内装、内包する機能部品などのシミュレーションに、Teslaを用いたリアルタイムなレイトレーシングが活用していることをデモンストレーションした。

ハミルトン氏はNVIDIAの技術でもたらされる仮想化技術を「エンタープライズ仮想化2.0」と表現

GPUの有無による仮想デスクトップ環境のビジュアルの違いを「昼と夜ぐらい違う」と表現した

GRID環境を無料で体験できる「GRIDテストドライブ」を提供開始

GRIDテストドライブのデモ。HTML5や3Dレンダリング、3D CADなど、GRIDの性能を実感できるアプリケーションがあらかじめ用意される

Teslaを最大8枚搭載可能なクラウドサーバー用途向けアプライアンスの「IRAY VCA」

本田技研工業では200枚のGPUを用いてリアルタイムレイトレーシングを行なうデザインのシステムを活用している

複雑に光が入り込むことで収束が難しかった内装のシミュレーションのほか、全ての車載部品を情報を持たせることで確認が難しい断面や機能部品の状態も再現可能

米NVIDIAオートモーティブディレクターのダニー・シャピーロ氏

　自動車関連の情報については、米NVIDIAオートモーティブディレクターのダニー・シャピーロ氏が、さらに詳しくトレンドを紹介。設計のCADなどでは古くからGPUが活用されていたが、昨今バーチャルショーケースなどのマーケティング分野、さらに車載機器にまで取り入れられているとする。

　車載情報(インフォテインメント)システムでは、Audiやテスラモーターズの事例を紹介。特にAudiでは、モジュール化された基板を組み合わせ、ソフトウェアもハードウェアもアップデート可能なインフォテインメントシステムを開発したと言う。

　さらに、設計においてもNVIDIAのマテリアル定義言語によりインパネ素材などを変えながらシミュレーションできるよう進化。ドライブアシスタントについても、Tegra K1/JETSON TK1を活用することで、非常に小型の機材で実現できることをアピールしている。

自動車用のTegra K1コンピュータモジュール。さまざまなOSに対応し、その上で各社のシステムを実行できる

モジュール化された基板を組み合わせて製作されるAudiの車載システム

Tegraの性能向上に伴い、車載機器でできることも拡がっている

必要な情報のみをカスタマイズして表示できるデジタルコックピットの例

マテリアル定義言語により、GPUの演算能力を用いて素材ごとに光の挙動をシミュレーションできる。素材や視点を変えつつ設計を行なうインパネのシミュレーションをデモンストレーションした

ドライブアシストのためにさまざまなカメラ、センサーを自動車に取り付け、処理を行なう

CUDAによる認識技術と、必要になる性能の値。画像認識で駐車場の空きを検出するデモも披露された

従来のシステムでは左側のような大型のシステムが必要だったが、Tegra K1/JETSON TK1なら右側のような小型なものでドライブアシストを実現できると言う

　基調講演の最後には再びデイビット・カーク氏が登壇し、次世代のGPUについて紹介。すでにアナウンスされている、メモリ帯域幅のボトルネック改善のための、CPUやGPUの間の高速インターコネクト技術「NVLink」や、CUDAでの対応CPUの拡大、次世代GPU「Pascal」における3次元メモリの採用などを紹介。

　こうした次世代のチップを使い、「将来の世界をみんな一緒に作っていきましょう」と参加者に呼びかけた。

東京工業大学の青木尊之教授によるGPUの処理におけるボトルネックの研究成果

NVLinkによりCPU-GPU、GPU-GPUのインターコネクトを高速化し、データ転送のボトルネックを改善する

CUDA 6.5でARMをサポートしたほか、CUDAの全機能を多くのプラットフォームで利用できるようにしていく

次世代GPUでは3次元メモリを採用して、さらにメモリ帯域幅を拡張。電力効率も改善する

次世代GPUの「Pascal」。NVLinkや3次元メモリが採用される予定

GPUロードマップでは2016年にPascalが登場する予定。縦軸は単精度浮動小数点演算の電力あたりの性能

（多和田新也）