後藤弘茂のWeekly海外ニュース

■後藤弘茂のWeekly海外ニュース■

Shader 3.0とPCI Express x16への対応を進めるNVIDIA
～NVIDIAキーパースンインタビュー2

NVIDIAのChief Scientist、David B. Kirk氏

　GeForce FXファミリでユニークなアーキテクチャを採ったNVIDIA。同社で、Chief Scientistを務めるDavid B. Kirk(デビッド・B・カーク)氏に、GeForce FX 5900(NV35)のアーキテクチャや今後の方向性などについて話を伺った。

●来年になれば誰もが32bitになる

【Q】GPUベンダーの中でNVIDIAだけが32bit精度をPixel Shaderサポートした。他のGPUはMicrosoftの同意を得て、Pixel Shaderの内部精度を24bitにした。なぜ、NVIDIAだけが違うのか。

【Kirk】24bitは、多すぎる精度か不十分な精度か、そのどちらかだ。実際の演算では、テクスチャアドレッシング、ダイレクション、リフレクション、バンプマッピング、あらゆる種類のジオメトリ演算、いずれも24bitでは十分ではない。

　また、この問題について、我々は今どうすべきかだけでなく、将来までを見通している。将来には、GPUもコンピュータワールドの完全な市民になると予想している。そのためには、GPUは国際標準のコンピュテーション精度に沿った正確さで計算できなければならない。だから、我々は、IEEE 754浮動小数点スタンダード(32bit)を最初から採用することに決めた。将来の科学コンピューティングユースに対応するには必要だからだ。

　それに対して、24bitという標準はどこにもない。言ってみれば変なフォーマットだ。

　32bitを採用したことで、我々のGPUは、フル精度のジオメトリ演算がPixel Shaderでもできる。毛や髪やバンプなどを、ジオメトリ情報を保ちながら処理できる。開発者は精度について心配する必要がない。もし、24bit精度で走らせていたら、オーバーフローしないようにとか、演算内容に気を配る必要が出てくる。開発者が容易に使えることを考えたら、これは簡単な決定だった。

　また、32bitは映画制作との互換性でも重要だ。3Dデジタル映画制作のコミュニティとゲーム開発のコミュニティを融合させることは、非常に重要だと我々は考えている。なぜなら、同じイメージクオリティを、ゲームと映画で実現できるようになるからだ。同じ演算精度なら、開発者は完全に同じシェーダを映画とゲームで使うことができる。例えば、「マトリックス(リローデッド)」の映画とゲームでは、多くのコンテンツを共有している。精度が同じなら、こうしたことがやりやすくなる。

【Q】他のGPUベンダーも24bitは移行期のソリューションだと考えている。

【Kirk】そうだ。今年は、24bitか32bitかが大きな話題だった。しかし、来年には誰も24bitなんて言っていないだろう。誰もが32bit(Pixel Shader)になるからだ。

●Shader 3.0とPCI Express x16への対応を進める

【Q】Microsoftはすでに次世代のShader 3.0を発表している。GeForce FXはすでにShader 3.0の機能の一部は取り込んでいるが、Shader 3.0では、Vertex Shaderにテクスチャアクセスが加わる。Shader 3.0への対応はどうなっているのか。

【Kirk】我々は、Pixel Shader 3.0もVertex Shader 3.0も完全にサポートする。時が来たら、トップツーボトムでサポートするだろう。

【Q】ATI Technologiesは、来年のGDCではShader 3.0がリアルになると言っていた。NVIDIAはどうなのか。

【Kirk】Shader 3.0自体は、もともとDirectX9.1として定義された。だから、我々は前から知っていて、1年前からすでに取りかかっている。

【Q】とすると、NV40なのか?

【Kirk】多分(笑)。

【Q】GeForce FX系はMPEG-2などの動画エンコードもサポートする。これはシェーダプログラムで行なっているのか。

【Kirk】Pixel Shaderのプログラムがビデオのエンコードとデコードの両方を支援する。誰もがGPUで、デジタルビデオレコーディングやタイムシフティング、オーサリングなどをするようになるだろう。

【Q】双方向に広帯域を実現するPCI Express x16は、そうしたGPUの方向に向いている。

【Kirk】そうだ。ビデオの入出力の双方向に帯域を使える。

【Q】PCI Express x16の導入は、Intelのチップセットと同時期か。

【Kirk】まだアナウンスしていない。しかし、サポートする時には、トップツーボトムのフルファミリのGPUでサポートするだろう。

【Q】GPUに要求されるピクセル出力性能は、画面の解像度とDRAM技術である程度制約される。しかし、GPUのプロセッシング性能は上がって行く。将来のGPUは、Shaderプロセッシングパフォーマンスがピクセル出力パフォーマンスを大きく上回るようになって行くのではないのか。

【Kirk】そう思う。これからは、もっともっとシネマティックな品質のシェーダが登場するだろう。映画から来た非常に美しくリアリスティックなシェーダが、何も変更することなくGPUで走るようになるだろう。それは、32bit浮動小数点精度で、じつに多くのオペレーションを要する。映画『ファインディングニモ』のような、最新のCGアニメ映画では、スクリーン上の各ピクセル当たり、何百、何千ものシェーダオペレーションが行なわれている。将来、ゲームではなく映画をプレイ(リアルタイムに操作)できるようにしたいと考えている。

●高次サーフェスのサポートには慎重

【Q】Matrox GraphicsがParheliaで採用した、アダプティブテッセレータ(適用型平面分割ユニット)の搭載は考えていないのか。

【Kirk】アダプティブサブディビジョン機能の話か? 将来の製品がどうなるのかをコメントはできない。しかし、私見を言うと、こうしたテクノロジは開発者にとってユースフルだとは思えない。その理由のひとつは、サブディビジョンのコントロールを(開発者)自分でできないと、ジオメトリを正確に提供することが非常に難しいからだ。もし、サーフェステクノロジやパッチテクノロジが、数学的に正確に実装されていなければ、それは受け入れられないと思う。

　ゲームのイメージクオリティは非常に向上している。常時アンチエイリアシングをかけ、非常に高品質のテクスチャフィルタリングをかけ、高度で面白いピクセルシェーダを使うようになりつつある。そうしたゲームを作る時に、ポリゴンとパッチの間のギャップは受け入れられないだろう。

　私も、将来いつの時点かに、カーブサーフェスとサブディビジョンは重要になるとは思う。しかし、それは、(サブディビジョンやカーブサーフェスが)正確に処理されるようになった時だ。

【Q】MatroxやATIとは異なる見解のようだ。

【Kirk】ああ。

【Q】NURBSのような高次サーフェスはどうなのか。

【Kirk】私は、NURBSも多分、適切な回答ではないだろうと考えている。NURBSは非常に古い技術で、ハードウェアでの実装はそれなりに難しい。私は20年前にソフトウェアでNURBSを実装したことがあるが、その算術は非常に複雑なものだった。

　私としては、よりよい技術があると思う。特に、サブディビジョンサーフェス系はずっといい解だと思う。開発者にとっても扱いやすいし、オーサリングプロセスもずっと容易だ。

　例えば、フェイシャルエクスプレッション(表情)のアニメなどで、サブディビジョンサーフェスをアニメートする場合を見てみよう。それぞれのサーフェスパッチをそのまま維持するなら、コントロールポイントを動かすことで、サーフェス全てを一緒にアニメートできる。しかし、もし同じことをNURBSのようなディスポインティング(パッチのようなコントロールポイントのない)サーフェスでやろうとすると、アニメーションの各フレーム毎に、各パッチを再エディットしなければならない。これは、非常にハードだ。

【Q】GPUはNURBSなどの実装へは向かわないと考えるか?

【Kirk】(NURBSは)ハードウェアでの実装は難しいため、(GPUにとって)バッドチョイスだ。また、デベロッパにも難しいと思う。それに対して、サブディビジョンサーフェスは、(GPUとデベロッパの)どちらにとってもより易しいと思う。

　だから、長期的な将来、ハードウェアでサポートする高次サーフェスは、サブディビジョンサーフェス的な方向になると考えている。

●全てのGPUをモバイルチップに

【Q】NVIDIAはIBMと製造コントラクトを結んだ。GeForce FX 5600後継のNV36はIBMで製造すると聞いている。どうしてTSMCに加えてIBMをファウンドリに選んだのか。

【Kirk】第一に、TSMCとNVIDIAにはなにも問題がない。TSMCとのパートナシップは良好で、今後も強力なビジネスパートナーとして関係を継続する。しかし、我々のビジネスは拡大しており、複数のサプライヤを確保するのが適切になって来た。だから、IBMをセカンドファウンドリとして選んだ。我々は、コストエフェクティブで、将来性のある供給を求めている。IBMは素晴らしい技術を持っている。

【Q】TSMCで製造するプロセッサではLow-k素材がまだ使えないと聞いた。NV35は low-Kを使っているのか。

【Kirk】それについては、なにも発表していない。

【Q】今年2月のIDFの際の、ATIのプレゼンテーションでは、2006年のGPUの消費電力が80Wを超えると示されていた。どう思うか。

【Kirk】可能性としてはあるが、将来を予測するのは非常に難しい。複数の要素があるからだ。我々が先進的なプロセステクノロジへと移って行くと、駆動電圧は下がり、トランジスタサイズは小さくなるため、各トランジスタ当たりの発熱は低くなる。しかし、その一方で、我々はチップをどんどん大きくしている。(消費電力は)クロックレートとチップの大きさ、トランジスタ当たりの消費電力の組み合わせで決まる。その意味では、電力が増える要素もあれば、減る要素もある。

【Q】現行のモバイルGPUはデスクトップGPUの低電圧版だ。しかし、CPUを見ると、モバイルCPUはモバイル専用設計のPentium Mに移行している。同様に、モバイルに特化した低消費電力版GPUは作らないのか。

【Kirk】電力を節約することは、モバイルにだけ適しているわけではない。私は、デスクトップでも同様に電力を節約しようと試みるべきだと考えている。そうすれば、エナジーを節約できるし、ノイズや発熱も減る。つまり、(省電力)技術開発をモバイルに向けて継続するだけでなく、同じ技術をデスクトップにももたらす必要があると考えている。だから、デスクトップとモバイルそれぞれ別なチップを作るというより、多分、全てのチップをモバイル(機能を持った)チップにするという方向になる。

【Q】ライバルメーカーは、年末までに0.11μmテクノロジを使う方向にある。NVIDIAはどうなのか。

【Kirk】それは待ってもらう(wait and see)必要があるな。

【Q】我々は常に待って(waiting)いる。

【Kirk】だが、常に結果も見る(see)ことができている。そうだろう(笑)

□関連記事
【6月12日】【海外】GeForce FXアーキテクチャの秘密を明かす
～NVIDIAキーパースンインタビュー
http://pc.watch.impress.co.jp/docs/2003/0612/kaigai01.htm
【5月22日】【海外】まだまだ疑問が残るGeForce FX 5900のアーキテクチャ
http://pc.watch.impress.co.jp/docs/2003/0522/kaigai01.htm

□バックナンバー

(2003年6月13日)

[Reported by 後藤弘茂(Hiroshige Goto)]

【PC Watchホームページ】

PC Watch編集部 pc-watch-info@impress.co.jp 個別にご回答することはいたしかねます。

■後藤弘茂のWeekly海外ニュース■

Shader 3.0とPCI Express x16への対応を進めるNVIDIA～NVIDIAキーパースンインタビュー2

【PC Watchホームページ】

Shader 3.0とPCI Express x16への対応を進めるNVIDIA
～NVIDIAキーパースンインタビュー2