後藤弘茂のWeekly海外ニュース

■後藤弘茂のWeekly海外ニュース■

NVIDIAのPCI Express版GPUの正体

●PCI Expressの安定性を謳うNVIDIA

　NVIDIAよりも数歩先にネイティブPCI Express版GPU群を発表したATI Technologies。それに対して、NVIDIAも、COMPUTEXでPCI Expressソリューションをデモンストレートすることで、対抗した。

　NVIDIAのメッセージは、同社のブリッジチップを「HSI(High-Speed Interconnect)」を使ったソリューションの方が、安定しているという点。NVIDIAのJason Paul氏(Product Manager)は「Intelは、我々のGeForce PCX(PCI Express版のGeForce FX系製品)カードを3000枚購入、同社のPCI Expressラウンチのデモに採用している。これは、IntelがHSIソリューションの方が安定性が高いと認めたことを示している」と主張する。

　HSIは、PCI Express x16をAGP(AGP 16x相当)に変換するチップで、これによってNVIDIAは、同社のAGP版GPUでPCI Expressカードを実現している。HSIでは、GPU-HSI間をAGP 16x相当で接続するため、4GB/secの帯域を実現できる。そのため、片方向だけならPCI Express x16の帯域を活かすことができる。しかし、双方向で8GB/secのPCI Express x16のフル帯域を活かすことはできない。その点は、PCI Express x16のフル帯域を活かすことができる、ATIのネイティブPCI Expressとは大きく異なる。

　NVIDIAが不利を承知でHSIソリューションを選んだのには理由がある。「PCI Expressを分離するHSIの方が、技術上のリスクを軽減できる。実際、我々のPCXの方が順調にテストをパスした」とPaul氏は言う。インターフェイスだけを分離した方が、PCI Expressのような新インターフェイス技術の場合には、設計や検証が容易になるのは確かだ。しかし、PCI Expressの利点を謳うには、やはりネイティブPCI Expressが必要となる。このあたりは、ATIとNVIDIAのどちらの判断が正しかったのかは、評価が難しいところだ。

●COMPUTEXでPCI Express版のNV45が登場

　今回のCOMPUTEXでは、NVIDIAの新しいハイエンドGPU「NV45」が登場した。しかし、COMPUTEXに登場したNV45は、NV40とブリッジチップHSIを、一つのパッケージに統合したGPUだった。つまり、GPUチップ自体は、AGP版のGeForce 6800(NV40)のままだ。NVIDIAは、このNV45をGeForce 6800のPCI Express版として投入しようとしている。

　「COMPUTEXで我々がデモしている、PCI ExpressバージョンのGeForce 6800はNV45と呼ばれているものだ。NV45は、GPUとHSIをひとつのパッケージに統合した製品で、PCI Expressをフルサポートする。NV45とHSIの間はAGP x16で接続しているため、PCI Express x16の4GB/secの帯域と一致する」「(ATIのように)PCI Express版とAGP版の2つのバージョンのGPUを開発するのは、コストがかかる。GeForce 6800ではそれを避けた」とNVIDIAのJason Paul氏(Product Manager)は説明する。

　NVIDIAは、NV40の世代ではパッケージ(サブストレート)上にHSIを統合したバージョンだけを提供する。つまり、NV40とは別にHSIをグラフィックスカード上に配置したデザインガイドは提供していない。

　「同じサブストレートにGPUとHSIを統合したのは、ボードレイアウトを容易にするためだ。2つの異なるサブストレートを配置することは、ボード上の面積を取る。小さなチップなら、面積は少ないので問題は少ない。しかし、(NV40のように)大きなチップの場合は問題になる」とPaul氏はその理由を説明する。

　もっとも、NVIDIAは、ハイエンドGPUのPCI Express版をHSIだけで提供し続けるつもりではない。ネイティブPCI Expressの、ハイエンドGPUソリューションも存在する。

　「我々は、今年後半にトップツーボトムでネイティブPCI ExpressのGPUを提供する。つまり、ハイエンド、ミッドレンジ、メインストリーム&バリューの3層のそれぞれで、ネイティブPCI Expressの製品を用意している。NV45をHSIで投入するのは、タイムツーマーケットでPCI Express製品を導入するためだ。ネイティブPCI Expressはまだ先だが、PCI Expressは一部では必要とされているからだ」(Paul氏)

　つまり、NVIDIAのGPUコア開発計画は次のようになっている。AGP版のNV40コアの次に、ハイエンドクラスGPUのPCI Express版と、ミッドレンジPCI Express版コア、メインストリーム&バリューPCI Express版コアの3つのGPUコアが開発されている。

●コードネームNV45の変遷

　じつは、今回のNV45というコードネームについては、かなりの揺れがある。

　NV45の具体的な情報が出始めたのはちょうど昨夏頃。NVIDIAはNV40の開発を2002年の前半にスタート、NV40のアーキテクチャ定義が終わった段階でミッドレンジ向けのNV41とメインストリーム&バリュー向けのNV42の開発もスタートさせた。そして、NV40から半年遅れの2002年秋に、NV40後継のハイエンドGPUとしてNV45の開発をスタートさせたという。その時点の予定では、NV40は2003年末に、NV41とNV42は2004年早期に、NV45は2004年中盤に登場するはずだった。新アーキテクチャのハイエンドGPU→ミッドレンジGPU/メインストリーム&バリューGPU→マイナーチェンジ版ハイエンドGPUという、NVIDIAの開発の流れは、NV3x世代とほぼ同じだ。

　昨秋になると、NVIDIAはもう少し詳細を説明し始める。その時点でのNV45は、AGP版であるNV40のGPUコアに、PCI Expressインターフェイスを統合した“ネイティブPCI Express”製品で、アーキテクチャと性能レンジはNV40と同等だと言っていたという。NV40は2004年の年明け早々の出荷で、NV45は1四半期ずれて3月～4月の投入とされていた。また、価格レンジはNV40を400ドル以下とハイエンドの中位ランクに抑えて、NV45を499ドルのハイエンド価格で提供する予定だった。この時点で、NV45の時期は、明らかに通常の開発スケジュールより前倒しになっており、この時からNVIDIAは、じつはNV40＋HSIの「NV45」を考えていた可能性もある。

　NVIDIAのスケジュールはその後もどんどん変わり、今年に入った頃には、NV40の発表は第1四半期も終わり頃にずれ込んでいた。一方、NV45は依然としてネイティブPCI Expressになってはいたものの、新たに“NV45のAGP版”が登場していた。そして、NV45の時期も、第2四半期終わりにずれていた。

　そして、最終的にGeForce 6800(NV40)は4月に発表され、6月のCOMPUTEXではHSI版のNV45が登場したわけだ。そして、元々NV45と呼ばれていたGPUは、先送りされた。簡単に言えば、コードネームの方が変化したわけだ。NVIDIAは、最近は頻繁にコードネームを変える。実際、昨夏にNV41/42だったGPUも、何度か名前が変わっている。そのため、現在持っている情報のコードネームが正しいかどうかはわからない。しいて言うなら旧NV41/42だが、今のところ、これらのコードネームはNV4xとしておく。コードネームにはそれほど意味がないからだ。

　しかし、コアの開発計画自体は、おそらく、それほど大きく変えることができない。というのは、GPUコア自体の開発には、アーキテクチャ定義から数えて出荷まで、18～24カ月という長期間がかかるからだ。


NVIDIAの開発サイクル PDF版はこちら	ATI&NVIDIA GPU推定ロードマップ PDF版はこちら

●今年後半のミッドレンジGPUの性能は昨年のハイエンドGPU並

　NVIDIAのNV4x系のミッドレンジGPUとメインストリーム&バリューGPUは、どんなGPUになるのだろう。NVIDIAは、これらのGPUを、今夏中に発表する予定でいる。当初の予定よりは1～2四半期ずれ込んでいるわけだ。

　まず、アーキテクチャ面でのNVIDIAの主張は明快だ。

　「次の世代では、トップツーボトムでShader 3.0とネイティブPCI Expressを実装する。99ドルの(ボード)価格レンジへも、Shader 3.0とネイティブPCI Expressをもたらす」(Paul氏)

　この世代では、NVIDIAもATI同様に、全てのGPUがネイティブPCI Expressになる。AGPへの対応も継続して必要となるため、この世代では、HSIを使ってPCI Express版GPUをAGPインターフェイスに変換する。それによって、ネイティブPCI Express世代のGPUでも、AGPカードを実現する。これはATIと同じソリューションだ。ATIは、今年後半のR4xx世代のミッドレンジ製品では、PCI Express版しか投入しない。そのため、ブリッジチップでAGPカードを実現する。

　NVIDIAはNV40にProgramable Shader 3.0を採用したが、バリューまで同じShader 3.0で統一する。また、Shaderの命令セットアーキテクチャを共通化するだけではなく、Shaderの実装も共通化する。例えば、NV40では、NVIDIAはPixel Shader内部で、いくつかの処理を並列化できるようにしたが、NV4x系のGPUは全て、そうしたShaderの内部アーキテクチャも継承するという。そのため、NV40用に最適化したシェーダプログラムは、原理的にはどのNV4x系GPUでも有効となる。

　もちろん、ハイエンドからバリューまですべてのフィーチャが同じになるわけではない。「多分、いくつかの部分は低コストのために最適化するだろう。しかし、我々はスケーラブルアーキテクチャの方向へと向かっており、パイプ数の違いはあっても、基本的には同じアーキテクチャをトップツーボトムで提供する」とPaul氏は言う。おそらく、NVIDIAはShaderアーキテクチャ&実装は共通化し、それ以外の、例えばラスターオペレーションなどの部分で、GPUによって差をつけるものと思われる。もちろん、メモリ幅は、ハイエンドが256-bit、ミッドレンジ以下が128-bitになると推定される。

　ATIは今年後半にはミッドレンジGPUのピクセルパイプ数を8に引き上げると見られる。つまり、ハイエンドGPUが16パイプ、ミッドレンジが8パイプ、メインストリーム&バリューが4パイプになるわけだ。では、NVIDIAの場合はどうだろう。

　「パフォーマンス面で考えると、これまで、ある世代の499ドルの(グラフィックスカードの)パフォーマンスは、次の世代の199ドルに降りてきた。つまり、ラフに言うと、同じ199ドルの価格ポイントで、性能は世代毎に2倍になってきたわけだ。今回も、GeForce 6800は前世代の499ドルの2倍の性能だ。だから、次の199ドル製品も2倍の性能、つまり、GeForce 59xxクラスの性能になるのが自然だ」とPaul氏は説明する。

　2003年のハイエンドGPUの性能を達成するには、おそらくピクセルパイプ数を増やさなければならない。GPUの動作周波数はCPUのようなペースでは向上していかないからだ。そうすると、NVIDIAも、16パイプ、8パイプ、4パイプの3段構成になる可能性が高い。

　ちなみに、NVIDIAの前世代では、ピクセル性能とジオメトリ性能のバランスが極端だった。GeForce FX 5700(NV36)では、ハイエンドのGeForce FX 5950 Ultra(NV38)と比べてピクセル性能は半分程度なのに、ジオメトリ性能は同等だった。これは、ジオメトリの負担の大きい「DOOM3」などのゲームのためだと、GPUに詳しいライターの西川善司氏は指摘していた。しかし、今回はジオメトリ性能もスケールダウンするようだ。「ミッドレンジ製品では、Vertex Shaderについても、ダイサイズとパフォーマンスのバランスを考える」とPaul氏は言う。

　NVIDIAの場合、ミッドレンジGPUは、ハイエンドGPUと比較して高周波数になると思われる。それは、ハイエンドのNV40/NV45では、消費電力(=熱)の制約のために、それほど高クロックにできないからだ。

　「ハイエンドでは、クロックがやや低くても、多くのパイプを備えているため、全体のパフォーマンスは高くなる。一方、ミッドレンジでは、より高クロックにできても、パイプはより少ないため、全体の性能は低くなる」(Paul氏)

●ビデオプロセッサをメインストリーム&バリューGPUにも搭載

　NVIDIAとATIで大きく異なるのは、ビデオプロセッシングのソリューションだ。ATIのR3xx/4xxではビデオ処理の多くをPixel Shaderで行なうのに対して、NVIDIAのNV4xアーキテクチャでは専用の「Programable Video Processor」だけで処理する。ATIもビデオエンジンを備えるが、NVIDIAほどの機能は備えない。そして、NVIDIAは、このビデオプロセッサを、NV40/45だけでなく、ミッドレンジGPUとメインストリーム&バリューGPUにも搭載する。

　「ビデオプロセッサは、実際のところ、ハイエンド製品より、ミッドレンジ/メインストリーム&バリュー製品の方にずっとフォーカスしている。というのは、メディアセンターの顧客や、一般のコンシューマは、499ドル(のグラフィックスカード)ではなく199ドルや149ドルの製品を買うからだ。彼らはゲームをしたいわけではなく、PCで高品質なビデオを観たい。だから、我々は、GeForce 6シリーズのミッドレンジとメインストリーム&バリュー製品で、ハイエンドと同じ品質のビデオを観ることができるようにするつもりだ」とPaul氏は言う。

　これは、下位のGPUに高度なビデオ機能を持たせようとするならリーズナブルな戦略だ。というのは、主にPixel Shaderでビデオプロセッシングを行なわせると、Pixel Shader性能にビデオ性能も依存してしまうからだ。

　「専用化したビデオプロセッサを使うのは、どのGPUにも一定のパフォーマンスとクオリティのビデオ機能を提供するためだ。メインストリーム&バリューやモバイルでも、ビデオプロセッサのおかげで高水準のビデオ機能を実現できる」(Paul氏)

　もちろん、全ラインのGPUに同等機能のビデオプロセッサを搭載したとしても、ビデオ機能はGPUのコアクロックで変わってしまう。しかし、プロセッシングユニットの数自体は変わらないため、ハイエンドとバリューの間でも機能の差は小さく留まる。

　NVIDIAはこのビデオプロセッサを使って、ビデオのデコードだけでなくエンコード機能も提供する。コーデックにはドライバで対応、アプリケーション側からGPU上でのエンコードを利用できるように、アプリケーションにも働きかけてゆくという。つまり、アプリケーション側が対応すれば、CPUではなくGPU上でMPEG-2/4やDivxなど各種コーデックの処理のかなりの部分をできるようになる。

●トランジスタ数では不利になるNVIDIA

　NVIDIAのソリューションの問題は、ビデオプロセッサを下位のGPUに搭載することで、下位のGPUのトランジスタ数を増やしてしまうことだ。これは、コストと熱に影響する。しかし、Paul氏はビデオプロセッサ自体のダイエリアは非常に小さく、影響は小さいと言う。

　もっとも、ビデオプロセッサが小さかったとしても、ダイ(半導体本体)の問題は残る。というのは、元々NV4xアーキテクチャは非常にトランジスタ数が多くダイが大きいからだ。

　NV3x世代までは、両社のハイエンドGPUのトランジスタ数に決定的な差はなかった。しかし、今回はATIのR420系が1億6,000万トランジスタなのに対して、NVIDIAのNV40は2億2,200万と、はるかにトランジスタ数が多い。そして、NVIDIAはATIとは異なり、同じアーキテクチャをトップツーボトムで持ってくる。これは、ミッドレンジとメインストリーム&バリューでも、相対的にトランジスタ数が多くなることを意味する。

　「興味深いのは、ハイエンド製品でトランジスタ数が多いと、メインストリーム(ミッドレンジ)製品にも問題がそのまま引き継がれることだ。メインストリーム製品でも、彼ら(NVIDIA)の場合は、消費電力とコストがずっと(ATIより)大きくなる。おそらく、そのレベルのコストは、(NVIDIAも)負担することができないだろう」とATIのRick Bergman氏(リック・バーグマン、Senior Vice President & General Manager, Desktop Business Unit)は、今年4月に指摘していた。

　トランジスタ数が多くなることの難点のひとつは、ダイサイズ(半導体本体の面積)が大きくなり製造コストが増えることだ。しかし、NVIDIAはこの点は解決できるという。

　「同じプロセスなら確かにダイは大きくなる。しかし、プロセスをシュリンクすれば、同程度のダイを維持しながらトランジスタ数を増やすことができる」(Paul氏)

　つまり、0.13μmより微細なプロセスを使えばいいというわけだ。実際、ATIはRADEON X300(RV370)でTSMCの0.11μmプロセスを採用、それによってダイサイズを20%減らしている。NVIDIAも、同様にTSMCの0.11μmを使えば、計算上はダイを20～30%減らすことができる。

　「0.11μmプロセスは、歩留まりと製造キャパシティを順調に増やしている。そのため、0.11μmへの移行は、プライスパフォーマンスの向上と、製造量の増大の観点からいい選択になりつつある」とNVIDIAのDavid B. Kirk(デビッド･B･カーク)氏(Chief Scientist)も説明する。

　0.11μmに移行すると、原理的にはNV35と同程度のGPUであっても、NV36と同程度のダイにすることができる。とはいえ、ATIも同様に0.11μmを使ってきた場合には、やはり相対的にダイは大きくなってしまう。

　もちろん、NVIDIAは90nmプロセスの採用を早めることもできる。製造上のリスクを覚悟すれば、早期に次期プロセスを使うことができる。しかし、それにしても今年中盤は早すぎる。というのは、GPUの場合、サンプルが採れるようになってから出荷まで6カ月が必要だからだ。つまり、基本的には新プロセスが量産フェイズに入ってから半年後に、そのGPUが市場に登場することになる。90nmの場合、ファウンドリで量産に入ったばかりなので、製品が出るのは年内ぎりぎりか来年前半になると言われている。

　多いトランジスタ数のもたらす、もうひとつの問題は、消費電力と熱だ。この点でも、NVIDIA製品はATI製品に対して不利になる。ATIの方がファンレスソリューションが容易になる。これは、特に静音化が要求されつつある現在のデスクトップPCでは、不利になりそうだ。

□関連記事
【6月4日】【海外】R423でネイティブPCI Expressレースを先行したATI
http://pc.watch.impress.co.jp/docs/2004/0604/kaigai093.htm
【6月1日】【海外】ATI、PCI ExpressネイティブGPUを投入へ
http://pc.watch.impress.co.jp/docs/2004/0601/kaigai092.htm

□バックナンバー

(2004年6月7日)

[Reported by 後藤弘茂(Hiroshige Goto)]

【PC Watchホームページ】

PC Watch編集部 pc-watch-info@impress.co.jp 個別にご回答することはいたしかねます。