【イベントレポート】【GTCレポート】ジェンスン・フアン氏基調講演編～NVIDIAの次期GPU「Fermi」がついに公開

【GTCレポート】ジェンスン・フアン氏基調講演編

～NVIDIAの次期GPU「Fermi」がついに公開

NVIDIAのジェンスン・フアン氏

会期:9月30日～10月2日(現地時間)
会場:米国カリフォルニア州サンノゼThe Fairmont San Jose

　米NVIDIAが9月30日から10月2日(現地時間)の会期で主催する、GPU関連の開発者会議「GPU Technology Conference (GTC)」を米国カリフォルニア州The Fairmont San Joseで開幕した。

　2008年のこの時期は、コンシューマをメインターゲットにした「NVISION08」が開催されたが、今回は完全に対象を開発者に絞っている。そのため、初日の午前に行なわれたセッションは、DirectX 11の具体的コーディング手法など、かなり専門的な内容となっていた。

　しかし午後に行なわれた、同社社長兼CEOであるジェンスン・フアン氏の基調講演では、開発者以外にも分かりやすいさまざまなデモが交えられたほか、その後半には同社の次期GPUである「Fermi」(フェルミ、コードネーム)が初めて披露されるなど、話題性に富むものとなった。それでは、基調講演の様子を、順を追って紹介しよう。

　なお、序盤のプレゼン資料や舞台デモはすべて、特殊メガネを用いるステレオ3Dでスクリーンに投影された。そのため、掲載する写真は右目用と左目用の絵がダブったものとなっており、見にくくなっていることをご了承いただきたい。

NVIDIA GPUの進化の歴史

　フアン氏はまず今回のGTCが、業界でも初めてのGPUプログラマのための開発者会議であることを説明し、同社のGPUの歴史を振り返った。Riva 128に始まる初期のGPUでは、表示可能なポリゴン数を増やすことで進化を繰り返してきた。そして、その途中でGPUは、フアン氏が「セカンドフェーズ」と呼ぶ状態へと移行する。これが、シェーダのプログラマブル化である。

　ここで、同社はグラフィック言語「Cg (C for Graphics)」を公開。これにより、コンピュータグラフィックスで表現できることが増した。そして、その行き着く先として、ユーザーの間でGPUを汎用目的の演算に利用するGPGPUが始まることになり、それに鼓舞される形で2006年、NVIDIAはCUDAを開発、公開した。フアン氏は、こうして現在では'93年の世界最高峰のスーパーコンピュータの性能が、コンシューマPCのケースの中に収まるまでに至ったと、GPUのこれまでの進化ぶりを表現した。

●グラフィックは今後まだまだ綺麗になっていく

　続いてフアン氏は、現在のGPUの3つの用途について話を転じた。その1つがビジュアルコンピューティングだ。フアン氏は、ビジュアルコンピューティングとは、コンピュータグラフィックスを使ったサイエンスとアートだと説明する。

　ビジュアルコンピューティングにはいくつかの種類がある。1つはリアルタイム性を重視するもので、例としてはゲームがある。同じくある程度素早い反応を必要とするが、60fpsといったフレームレートを求めないものとして、インタラクティブビジュアルコンピューティングといものがある。例えば建築や設計などで、条件を変えてできあがりをシミュレーションするようなものである。最後の1つがオフラインビジュアルコンピューティングで、映画など、許される限りの時間と性能とお金をかけ、究極の表現力を追求するものだ。

　ここで、フアン氏はビジュアルコンピューティングの進化の例として10年前のGPUによる消防車のレンダリングを見せた。もちろん当時としては最高性能のもので、キューブ環境マッピングという最新技術も駆使していたが、今から見るとかなり見劣りするものだ。

　これが、数年後の2003年には「タイムマシーン」と呼ばれるデモに進化した。これは、車のボディがぴかぴかの新しいものから、徐々に古く、錆び付いていくデモだ。この表面の変化は1つのプログラムで実現している。

　それからさらに数年が経った現在はどうなったかというと、同社はフォトリアリスティックなレイトレーシングをGPUで実現する「OptiXエンジン」をリリースするに至った。レイトレーシングはあらゆる光線の進行や反射を計算するため、膨大な処理能力を必要とし、CPUでは1フレームレンダリングするのに数分以上要する。GPUでもその処理はまだ重いが、OptiXでは実用的なレベルの性能を実現している。


10年前のGPUで利用されたデモ	それから数年後にはプログラマブルシェーダで表現力が増した	現在は、レイトレーシングまでできるようになった

「FinePix REAL 3D W1」を紹介するフアン氏

　もう1つ、ビジュアルコンピューティングの新たな領域としてNVIDIAが最近取り組んでいるのが、ステレオグラスソリューション「3D Vision」だ。120Hz対応の液晶とシャッター式の専用メガネを使うことで、立体視を実現する。フアン氏は、NVIDIAのゲーム業界での長い歴史と経験により、ドライバの拡張だけで、既存のゲームでも立体視を可能にしたことをアピールした。

　また、立体視は映画業界やTV業界でも今後標準技術として採用が見込まれているほか、富士フイルムの3D対応デジタルカメラ「FinePix REAL 3D W1」により、3D Visionとの組み合わせで、写真も立体視が可能になったことを改めて示した。

　そしてフアン氏は、「グラフィックは今後まだまだ綺麗になっていく」と続けた。それは、物理演算をGPUで処理させることが可能になったからである。グラフィックデザイナーは、対象となるオブジェクトが少ない間は、手作業で相互干渉のあるアニメーションを表現できるが、オブジェクトが増えると、制御が困難になっていく。そこで、物理演算をGPUに計算させることで自動化させ、よりリアルで美しいグラフィック表現を実現しようといのがフアン氏の意図するところだ。

　ここでフアン氏はいくつかの世界初披露となる物理演算を用いたデモを披露した。いずれも従来のPCによるリアルタイム3Dとしては一線を画すもので、特に流体のデモは確かにコンピュータグラフィックスの新しい次元を垣間見させるものだ。

GPUによる流体の物理演算のデモ

GPUによる流体の物理演算のデモ2

GPUによる衝突の物理演算のデモ

●パラレルコンピューティング時代の新GPU「Fermi」が初公開

　続いてフアン氏は、GPUの第2の用途としてパラレルコンピューティングを取り上げた。これは、現在同社がもっとも注力している分野で、フアン氏によるとCUDAを開発するにあたって行なった最大の決断が、今後全てのGPUをCUDAに対応させることだったという。その結果として、現在では1億8千万のCUDA対応GPUが出荷され、9万人の開発者がCUDAを使い、200の大学で関連講座が開かれているという。

CUDAの基本思想はCPUとGPUのコプロセッシング

　CUDAの基本思想は、CPUによる中央集中的処理から、CPU+GPUによる共同処理への移行にある。プログラムのパラレル化を進めても、必ずシリアルの部分は残る。そのため、パラレルプロセッサ(GPU)だけの構成では、シリアルプロセッサ(CPU)だけよりも状況によっては性能が落ちる。フアン氏によると、理想的なのは1個程度のクアッドコアCPUと、4個程度のGPUの組み合わせだという。これにより、あらゆるコードの処理が高速化され、パラレル化が進んだプログラムでは数十～数百倍にまで速くなる。

　このような、劇的な高速化は、単なる速い遅いを超えた、それまでには不可能だったものの実現をもたらす。これまで、こういったパラレル化の恩恵が大きい領域としては、地質調査や金融分析、流体力学などが挙げられていたが、フアン氏は今回、パラレルコンピューティングによって、人命を救うことができるとの事例を示した。。

　その1つが画像診断による乳がん検診で、TechniScanの検査機では、4CPU構成を2 GPU構成に変えることで、それまで1時間以上かかっていた処理が30分以下に短縮されたという。現在では、ガンは早期発見されれば治療可能となっており、GPUが果たす役割がますます大きくなっていることを示した。

　しかし、NVIDIAはGPUの性能そして適用領域をさらに広げたいと考えている。そのための布石が、次期GPUアーキテクチャ「Fermi」である。Fermiは、GPGPUのためにフルスクラッチで開発されたという点で、これまでのGPUとは大きく異なる。

　すでに実動するチップもできているが、そのデモ内容も、グラフィックやゲームに関するものではなく、現行のTesla C1060に比べ、倍精度の浮動小数点演算性能が8倍になったことを示すGPGPUに関するものだった。

　フアン氏が公開した資料によると、Fermiのトランジスタ数は30億。SP数は512基で、GPGPUに不可欠なECCもサポートした。また、VisualStudio用開発環境「Nexus」を提供することも発表した。

　詳細については、後藤氏のコラムおよびGTCの別レポートを参照して欲しい。

現行のTesla C1060(左)とFermi(右)の倍精度浮動小数点演算性能の比較


Fermiを披露するフアン氏	Fermiのダイ写真と特徴

●GPUはWebコンピューティングにも展開

　最後にGPUの適用領域の3つ目としてフアン氏はWebコンピューティングを挙げた。ここでいうWebコンピューティングの定義はややあいまいだが、1つ目の事例として紹介されたのが、GPUによるFlashの高速化。現在、Web上のビデオコンテンツの8割はFlashを使っているが、今後これがGPUによるアクセラレーションが効くようになり、HDコンテンツもスムーズに再生できるようになる。

一般的ネットブック(左)とION搭載ネットブック(右)によるFlash HD動画の再生デモ

　もう1つの事例が、GPUを搭載したクラウドを活用したストリーミング3Dグラフィックス。前述の通り、レイトレーシングには膨大な処理能力が必要となるが、その計算をクラウド側で行なわせ、その出力をストリーミングでユーザー端末に送信することで、ネットブックのようなPCでも、リアルタイムとはいかないまでも、実用的な速度でレイトレーシングを行なうことができるというもの。

　このように、現在のGPUは、その用途をグラフィック処理中心から、汎用演算のためのプロセッサへと舵を切った。フアン氏は、現在は「演算GPUの時代」であり、高まるGPUの処理能力が新たなアプリケーションを生み、コンピューティング業界を超えて広まっていくとの展望を示し、講演を締めくくった。