後藤弘茂のWeekly海外ニュース

NVIDIAインタビュー(上)
~GeForce FXの高クロックと高パフォーマンスの秘密




 次世代GPU「GeForce FX(NV30)」を発表、スポットライトが当たるNVIDIA。同社で、Chief Scientistを務めるDavid B. Kirk(デビッド・B・カーク)氏に、GeForce FXのアーキテクチャや今後の方向性などについて話を伺った。

●アーキテクチャを大きく変えたGeForce FXのVertex Shader

NVIDIA Chief Scientist David B. Kirk氏

[Q] GeForce FX(NV30)のVertex Shader(GPU内でジオメトリ処理を担当する演算ユニット)の数を教えて欲しい。一般的に考えるなら、8本のピクセルパイプに釣り合うVertex Shaderの数は4個になるが。

[Kirk氏] 話はもう少し複雑だ。GeForce FXのVertex Shaderは、マルチスレッド対応の複数の浮動小数点演算プロセッサで構成されている。つまり、Vertex Shaderは完全にパイプラインに分離されているわけではない。従来とは、パイプラインアーキテクチャを大きく変えた。だから、Vertex Shaderが何個あるといった数え方はできない。

[Q] つまり、Vertex Shaderとして、128bit幅のSIMD(Single Instruction, Multiple Data:ひとつの命令で複数データに同じ処理を行なう)演算用ユニットを複数個備えたのではなく、フレキシブルなスカラー演算ユニット群で構成されているということか。3DlabsのP10/P9(Wildcat VP系GPU)アーキテクチャに似ているように思える。

[Kirk氏] 詳細は言えない。マルチスレッド化とパイプライン化がされており、Vertex Shaderの中で多くの頂点処理を同時に同じパイプライン群の中でできるようになっている。

[Q] どの程度の数の頂点処理をオンザフライ(同時並列)で実行できるのか。

[Kirk氏] 私の見積もりでは、12~20頂点程度の処理を同時にできるはずだ。だから、GeForce 4(NV25)の約3倍のパフォーマンスを達成できる。

[Q] パイプラインもかなり深いのか?

[Kirk氏] そうだ、非常に深いパイプラインだ。

[Q] DirectX 9世代のGPUは、ハードウェアT&L(座標変換&ライティング)と固定機能のテクスチャリングユニットは搭載しないと聞いた。GeForce FXもこれらの機能はProgramable Shader(GPU内で処理をプログラマブルに行なう演算ユニット群)で行なうのか。

[Kirk氏] そうだ。固定機能T&Lは、Vertexプログラムとしてインプリメントされている。これは、固定機能T&L処理に最適化されたVertexプログラムで、非常に効率的に走る。シェーダパイプラインも同様だ。DirectX 7や8スタイルの通常のテクスチャ処理は、固定機能的なプログラムが走る。見かけ上は固定機能テクスチャ処理だが、同じようにPixel Shader(GPU内でピクセル処理を担当する演算ユニット)を使う。

●高クロック化はプロセス技術とパッケージ技術で達成

[Q] NV30(GeForce FX)の500MHzというクロックは、NV25(GeForce 4 Ti)と比較して非常に高い。プロセスの微細化による、トランジスタのゲート長の短縮だけでは計算上、500MHzに達しないはずだ。GeForce FXではパイプラインアーキテクチャを高速化に向けて改良したのか。

[Kirk氏] パイプラインチェンジをしたかどうか? いや、していない。純粋にプロセス技術だけで速度は向上している。最大の理由は銅配線だ。TSMCの0.13μmプロセスは銅配線を使う。それによって、配線抵抗が大きく下がったために高クロック化ができた。

[Q] CPUでは配線遅延の低減だけではそこまで高クロック化はしない。

[Kirk氏] その理由はわからないが、GPUでは、銅配線は大きな違いを産んだ。0.13μmで銅配線は、0.18μmでアルミ配線のプロセスよりも140%以上も回路スピードが高速になる。銅配線の利点は高速化だけでなく、低消費電力にもある。高クロック化しても、それほど(配線の)抵抗が増えないからだ。

[Q] 0.13μmは銅配線があるため、立ち上げに苦労した。しかし、それだけの利点はあるということか。

[Kirk氏] そうだ。銅配線のため、これまでより(プロセス移行による)性能の向上の幅は大きい。また、銅配線では配線ピッチを狭くできるため、設計時にも利点がある。我々がGeForce FXの計画を建てたとき、このプロセス技術抜きには不可能だった。これだけパワフルなパイプラインを作ろうとすると、0.15μmプロセスは考えられなかった。

[Q] そこがATIとNVIDIAの見解が分かれたところだ。ATIは早く製品化するために0.15μmを最初の世代では採用した。

[Kirk氏] その通りだ。私は、R300(RADEON 9700)は過去の世代の最後の製品と呼んでいる。新世代の製品には新プロセス技術が必要だ。0.15μmでは、(ダイが)大きくなりすぎ、発熱が多くなりすぎ、クロックは低すぎ、歩留まりも悪すぎる。否定的な要素が多すぎる。

[Q] GeForce FXはパッケージや冷却機構も新しい試みを入れた。

[Kirk氏] GeForce FXはフリップチップ実装を採用した。これは、500MHzの高クロック動作では必要だった。フリップチップ実装や冷却パッケージ技術などの技術も高クロック化に寄与している。つまり、プロセス技術とパッケージ技術などで、500MHzが可能になった。

[Q] そのあたりはCPUと同じなのでわかりやすい。高クロック化しようとすると発熱量が問題になるが、特殊な冷却機構でより多くの発熱量を許容できるようにしたことで、その制約を取ったと理解している。

[Kirk氏] そうだ。熱は大きな制約になっていた。

●DDR IIメモリに最適化したインターフェイス

[Q] 以前会ったときにDDR IIを採用できるようになるには、まだしばらく時間がかかるだろうと言っていた。しかし、GeForce FXはDDR IIサポートで発表された。

[Kirk氏] あの時はまだ言えなかったからぼかした(笑)。しかし、今の時点では(DDR IIの)技術自体は準備ができている。いいタイミングになった。

[Q] 御社はDDR II 1GHzで128bit幅のメモリインターフェイスを取った。しかし、ライバルはDDR 620MHzで256bit幅を採用した。彼らは、メモリ帯域では自分達の製品の方が優れていると言っている。

[Kirk氏] 2つ異なる点がある。まず、我々はデータのほとんどを圧縮できるため、生帯域(理論上のピーク帯域)に対してより多くの実効帯域を得ることができる。もうひとつは、我々のメモリアーキテクチャはメモリの粒度(グラニュラリティ)の点で利点があることだ。我々のメモリは、複数のメモリバンクに分割されていて、各メモリバンク毎にバースト転送ができる。そのため、無駄なくメモリの帯域を使うことができる。確かに、ピーク帯域は広幅のメモリインターフェイスの方が広くなるが、結局は帯域が無駄になることが多い。それに対して、我々はこうしたアーキテクチャであるため実効帯域は十分に高い。さらに、インターフェイスが狭いことで、メモリの容量を減らす構成も可能だ。より自由度が高い。

[Q] DDR IIでは「Posted CAS」などの機能により実効帯域がDDR Iより高くなるが。

[Kirk氏] その通りだ。DDR IIは、非常によく考えられたテクノロジで、グラフィックスに最適だと考えている。

[Q] ATI Technologiesも、同社のGPUのメモリインターフェイスはすでにDDR IIに対応していると言っている。同じDRAMベンダーからDRAMを調達すれば、彼らもDDR IIのベネフィットを得られることになる。

[Kirk氏] DDR IIは徐々に広く使われて行くだろう。

[Q] グラフィックス向けの高周波数のDDR IIメモリでは、今のところはSamsung Electronicsがほぼ独走している。御社はSamsungのDDR IIを採用するのか。

[Kirk氏] Samsungが技術で先行しているのは確かだ。我々もSamsungとDDR IIについては長い間密接に協力してきた。Samsungとの関係は、我々にとって助けになる。もちろん、他のベンダーが、DDR II互換の製品を出してきたら、我々はそれも使うだろう。

[Q] グラフィックス向けDDR IIは、始まったばかりだ。あとどれだけの高速化の余裕があるのか。

[Kirk氏] もちろん、もっと高周波数は行ける。多分、2003年のどこかの時点で現在(1GHz)よりさらに40~50%高速になるだろう。

[Q] グラフィックス向けDDR IIの価格はまだかなり割高だと聞いた。メインストリームに使えるようになるのはいつ頃だと思うか。

[Kirk氏] 予測はちょっと難しいが、DRAMの価格は、生産量が増えるにつれて下がる。DDR IIがシステムメモリとして使われるようになれば、非常に安価になるだろう。

[Q] DDR IIがシステムメモリに来るのは2004年だ。

[Kirk氏] 確かに、しばらくはかかるだろう。すぐにというわけには行かない。

●来年中盤に次のハイエンドGPUを発表予定

[Q] 根本的な疑問なのだが、メモリ帯域は今もグラフィックスのボトルネックなのか。ATIやMatroxは、メモリの帯域を非常に重視している。一方、S3 GraphicsやTrident Microsystemsは、すでにメモリ帯域は制約ではないと言っている。

[Kirk氏] あくまでも現状の話だが、私はメモリ帯域がそんなにボトルネックだとは思わない。バランスとしては、拡張された(今の)メモリ帯域に合わせるには、もっとパワフルなパイプラインを作る必要がある。多分、NV3x、つまり次の世代のハイエンドGPUになるだろうが。

[Q] 次のNV3xは2003年中に出るのか?

[Kirk氏] そうだ。まだ製品計画は発表していない。しかし、NVIDIAの場合、新製品は6カ月毎に投入する。つまり、GeForce FXの次のハイエンドGPUは多分2003年の中盤になる。

[Q] NVIDIAの開発サイクルだと、次のNV3xはGeForce FXの拡張アーキテクチャになるはずだ。そうすると、次の新アーキテクチャNV4xは2004年頭頃を計画しているのか。

[Kirk氏] それはまだ言えない。だが、我々の開発サイクルから推測はできるだろう。

[Q] 7月に会った時、GeForce FX(NV30)のテクノロジをメインストリームデスクトップ、モバイル、バリュー、統合チップセットにも迅速にもたらすと言っていた。メインストリーム製品はいつになるのか。

[Kirk氏] すぐだ。いつも同じ答えで悪いが(笑)。我々は、GeForce FXをファミリで展開する。最初のはビッグブラザ(ハイエンド製品)だが、わりとすぐに(very soon)、次の発表を行なうだろう。

[Q] ハイエンド、メインストリーム、バリューという順番自体は今後も変わらないのか。

[Kirk氏] 我々は、熱狂ファン(enthusiast)に最高の製品を提供することを重視している。だから、最初にハイエンド向け製品となる。通常、アーキテクチャの第2バージョンはメインストリーム向け製品だ。より効率的でコスト効率のいいインプリメントになる。

[Q] これまで、ハイエンドからメインストリーム、そしてバリュー製品へは、それぞれ6~12カ月の間隔が開いていた。今回はこれらのサイクルがいずれも短くなると考えていいのか。

[Kirk氏] 今回はこれまでになく速い(fastest ever, this time)。期待してもらっていい。

●基本機能はハイエンドもメインストリームも共通

[Q] メインストリームマーケットにGeForce FXのアーキテクチャを持ってくるとしたら、どの機能を削るのか。Shaderの命令セットやデータ精度といったアーキテクチャはハイエンドと共通になるのか。

[Kirk氏] コンシューマは、ハイエンド製品と基本的には同じ機能を全て備えた製品をメインストリームでも望んでいると思う。だから、常にそうした製品を提供しようとしている。

[Q] バリュー市場や統合チップセットはどうなのか。コスト重視の市場では機能は削らなければ入らない。この市場でも、同じプログラム性を提供できるのか。

[Kirk氏] 問題は統合製品には性能や機能で非常に低いものが多いことだ。そのため、人々が統合チップセットはひどいと思ってしまっている。我々は、この流れを変えたい。優れた統合チップセットの提供によって。

[Q] だからDirectX 9ベースの統合チップセットも急ぐというわけか。

[Kirk氏] すぐだ(笑)。

[Q] DirectX 9世代のGPUでは、今回、ATIが投入時期ではかなり先行した。GeForce FXが性能差で巻き返せると思うか。

[Kirk氏] 問題はない。競争相手との性能差は明白だ。各ベンチマークの比較をしてみたが、我々の方がはるかに勝っている。

[Q] ATIはNVIDIAがGeForce FXを実際に大量に出してくる時には、彼らも対抗の次期製品(R350)を用意しているという。

[Kirk氏] 確かに、彼らは別な製品を投入して来るだろう。正確にいつかは知らないが。しかし、我々の製品の方が、依然として周波数とShaderの性能ではずっと上になると見ている。さらに、彼らが次の製品を繰り出す時には、こちらもまた次の製品がある。だから、何が起こるかを予測するのは簡単だ。

(下)に続く

□関連記事
【11月21日】【海外】ATIの勝算とNVIDIAの勝算
~GPU戦争の次のフェイズ
http://pc.watch.impress.co.jp/docs/2002/1121/kaigai01.htm
【11月20日】【海外】ついにベールを脱いだNVIDIAの次世代GPU「GeForce FX(NV30)」
http://pc.watch.impress.co.jp/docs/2002/1120/kaigai01.htm
【11月19日】NVIDIAが次世代GPUのNV30をGeForce FXとして正式発表
http://pc.watch.impress.co.jp/docs/2002/1119/comdex04.htm

バックナンバー

(2002年12月11日)

[Reported by 後藤 弘茂]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp 個別にご回答することはいたしかねます。

Copyright (c) 2002 Impress Corporation All rights reserved.