多和田新也のニューアイテム診断室

DirectX 10世代GPU「NVIDIA GeForce 8800」




 NVIDIAは11月8日(米国時間)、開発コードネームG80こと「GeForce 8800シリーズ」を発表した。DirectX 10対応となる本GPUでは統合シェーダユニットを採用しているほか、大幅なスペックの拡張が行なわれている。ここでは、そのスペックやベンチマーク結果を紹介していきたい。

●統合型シェーダユニットを採用

 今回発表されたGeForce 8800シリーズは、上位モデルとなる「GeForce 8800 GTX」と、下位モデルとなる「GeForce 8800 GTS」の2製品。トランジスタ数は6億8,100万個となっており、G71ことGeForce 7900 GTXの2億7,800万から2倍以上へと増えた。ただし、トランジスタ数の増加=ダイサイズ向上による歩留まりの低下を懸念してか、従来どおりTSMCの90nmプロセスで製造されることなる。

 その主なスペックは表1、ブロックダイヤグラムは図1に掲載している。最大の特徴は、ストリーミングプロセッサ(Streaming Processor:SP)と呼ばれる統合型シェーダユニットを採用した点にある。

【図1】GeForce 8800 GTXのブロックダイヤグラム

【表1】GeForce 8800シリーズの主なスペック
製品名 GeForce 8800 GTX GeForce 8800 GTS
コアクロック 575MHz 500MHz
SPクロック 1,350MHz 1,200MHz
SP数 128基 96基
メモリ容量 768MB GDDR3 640MB GDDR3
メモリクロック 1.8GHz(900MHz DDR) 1.6GHz(800MHz DDR)
メモリインターフェイス 384bit 320bit
ROPユニット数 24個 20個
価格 599ドル 449ドル

 これまでのシェーダを利用した3Dレンダリングパイプラインの流れをざっくりまとめると、

・頂点情報を処理するバーテックスシェーダ→
・走査線変換などを行なうトライアングルセットアップ→
・ピクセル処理を行なうピクセルシェーダ→
・アンチエイリアスや深度の処理を行なった上でフレームバッファへと書き込む

といった具合だった。そして、これらの処理を行なうユニットは独立して設けられている。例えば、GeForce 7900 GTXであれば、バーテックスシェーダユニットが8個、ピクセルシェーダユニットが24個、最終段の処理を行なうROPユニット16個、といった具合である。

 この独立型のシェーダの場合、処理自体はレイテンシを抑えて進めることができるが、バーテックス処理が重い描画ではバーテックスシェーダユニットが、ピクセル処理が重い描画ではピクセルシェーダユニットが、それぞれボトルネックになってしまう可能性も持っている。

 これに対し、GeForce 8800シリーズで採用された統合シェーダユニットであれば、処理内容に応じてシェーダの役割を変えることができるので、効率良くシェーダ処理を進めることができるのである。このシェーダの役割はハードウェアによって割り当てが行なわれる。独立型に比べると、多少のロスが発生することはNVIDIAも認めているが、多数の統合シェーダユニットを搭載することで、トータルでは性能が向上するというわけだ。

 また、新しいシェーダ規格となるShader Model 4.0を実装する予定のDirectX 10になると、パイプラインが大きく変わるのも統合シェーダユニットの意義だ。既報の通り、DirectX 10では、1頂点の入出力しかできなかったバーテックスシェーダに加え、複数の頂点情報を扱いプリミティブ単位での処理を実現するジオメトリシェーダや、バーテックス/ジオメトリシェーダから直接フレームバッファへの書き込みを可能とするストリームアウトプット機能など、3Dレンダリングパイプラインに大幅に手が加えられる。

 それに対応させるためには、当然ジオメトリシェーダを処理するユニットが必要となるし、各シェーダユニットがフレームバッファへ高速にアクセスできなければならない。こうした変化に対し、統合型シェーダユニットならば、バーテックス/ジオメトリ/ピクセルというシェーダ処理をアプリケーションに応じて効率よく行なえるわけだ。

 また、独立型シェーダの場合は各シェーダユニットにフレームバッファとのやりとりを行なうメモリコントローラやテクスチャユニットを実装する必要もあるが、統合型ユニットは、これを共有できる。

 このように、今回のGeForce 8800シリーズで採られたアプローチは、DirectX 10への対応を見越したものとなっている。もちろん、従来のDirectX 9までのアプリケーションも問題なく動かせ、その処理もハードウェアで行なわれる。

 表1のスペック表に話を戻すと、統合シェーダユニットであるストリーミングプロセッサを、GeForce 8800 GTXは128個、GTSは96個を搭載する。ストリーミングプロセッサはそれぞれ1.35GHz、1.2GHzのクロックで動作し、テクスチャユニットやROPユニットはGTXが575MHz、GTSが500MHzで動作する。GeForce 7900 GTXでも、バーテックスシェーダのみがコアクロックよりも高いクロックで動作していたが、今回の仕様を従来風に表現するならばバーテックス/ピクセルシェーダの両方がコアクロックの倍以上の速度で動作するということになる。

 ストリーミングプロセッサの数からも分かる通り、ストリーミングプロセッサやテクスチャユニットなどがまとまったブロックを、GeForce 8800 GTSはGTXに対して2つ省略している。よって、テクスチャユニットのフィルレートも異なり、GeForce 8800 GTXは64Pixel/clockの575MHz動作で368億Pixel/secとなり、GTSは48pixel/clockの500MHz動作なので240億Pixel/secとなる。

 GeForce 8800 GTSのROPユニットはGTXから4個削減されている。ブロックダイヤグラムでいうと、青色で表現されたROPと、その横のL2キャッシュのブロック1つずつ省かれている。メモリインターフェイスの違いはここが関係していて、ROPとL2でまとめて64bitのメモリインターフェイスを持たせているので、GeForce 8800 GTXはそれが6バンクで384bitとなり、GTSは320bitとなる。メモリ容量の違いもこの点が関係しているのだが、それは次項で説明したい。

●電源端子2基を搭載するGeForce 8800 GTX

 今回テストに利用するのは、GeForce 8800 GTXのリファレンスボードと、XFXのGeForce 8800 GTS搭載カード「GF 8800GTS 575M 768MB DDR3 DUAL DVI TV」である(写真1、2)。外観も特徴的な箇所が多い製品なので、1つずつ触れてきたい。

 まず、ボード長である。GeForce 8800 GTSはGeForce 7900 GTXと同サイズになっているのだが、8800 GTXはそれよりも4cmほど長いのである(写真3)。フルレングスカードよりは短いものの、ケースを選ぶことになるので要注意である。

 クーラーに関しては、サイズこそわずかに違うものの、両製品とも、GPUと接触する部分の銅とアルミフィン、ヒートパイプを利用したヒートシンクと、ブロアファンを組み合わせたもので、ケース外へ熱を排出させるものだ。化粧パネルにスリットを入れて、クーラー内に熱が籠もらないようにする工夫も見られる。騒音はGeForce 7900 GTXと似たようなもので、ハイエンドGPU向けのリファレンス製品としては際立ったうるささは感じないものだった。

【写真1】GeForce 8800 GTXのリファレンスボード 【写真2】GeForce 8800 GTSを搭載する、XFXの「GF 8800GTS 575M 768MB DDR3 DUAL DVI TV」。リファレンスカードに準拠したデザインだと思われる 【写真3】GeForce 8800 GTXの方が4cmほどボートサイズが長い。GeForce 8800 GTSはGeForce 7900 GTXと同サイズだ

 続いては電源端子だ。両製品ともPCI Express用の電源端子を装着する必要があるのだが、GeForce 8800 GTXはこれを2つ必要とするのだ(写真4、5)。これまで、デュアルGPUボードのGeForce 7800 GX2はこうした仕様だったが、1GPUの製品としては初めてとなる。もっともAGP時代にはGeForce 6800 Ultraがペリフェラル用電源を2つ必要としたわけで、いつかこういう状況が来る可能性はあったといえるだろう。

【写真4】GeForce 8800 GTXはPCI Express用電源端子を2つ必要とする。接続せずに起動すると警告音が鳴り響く 【写真5】GeForce 8800 GTSは従来製品同様、電源端子は1つ。非接続時に警告音が鳴るのはGeForce 8800 GTXと同様だ

 NVIDIAが推奨している電源スペックだが、GeForce 8800 GTXは30Aの12Vラインを持つ450W以上の電源、GeForce 8800 GTSは26Aの12Vラインを持つ400W以上の電源となる。SLIシステムについては、こうした数字は出ていないが、表2のような電源が推奨されている。最低でも750W以上の電源が並んでおり、電源要求が相当に高いことがわかる。

【表2】GeForce 8800 GTX SLI推奨電源
メーカー 型番 850W
Zippy PSL-6850P 850W
Silverstone Zeus ST85ZF 850W
PC Power and Cooling Turbo Cool 1KW-SR 1,000W
Tagan TG900-U96 900W
Tagan TG1100-U96 1,100W
ToPower/EPower TOP-1000W 1,000W
Thermaltake W0131 850W
ETASIS ET-750 750W
ETASIS ET-850 850W

 次はSLIコネクタである。GeForce 8800 GTX/GTSともにSLIをサポートするが、GeForce 8800 GTXはSLIコネクタを2つ備えている(写真6~8)。これは今すぐに何か機能が提供されるというわけではなく、現時点ではどちらか一方のコネクタを利用してSLIを利用することになる。しかし、将来的にはビデオカード複数枚をデイジーチェーンするといった用途を想定しているそうだ。その実現時期などについては明言されていないが、期待して待ちたい。

【写真6】GeForce 8800 GTXは2つのSLIコネクタを備える。将来、デイジーチェーン接続などができるようになる可能性がある 【写真7】現時点ではGeForce 8800 GTXのSLIを構築するときも、ブリッジは1つだけ取り付ければよい 【写真8】GeForce 8800 GTSは従来製品同様、SLIコネクタも1つだ

 続いては裏面のメモリチップに目を向けたい。GeForce 8800 GTXの裏面が写真9、GTSの裏面が写真10で、いずれも12枚のメモリチップを搭載するパターンが用意されている。しかし、よく見るとGeForce 8800 GTSは左下の2枚分が空きパターンとなっている。

 つまり、64bitのメモリインターフェイスに各2枚を接続する格好になっており、GeForce 8800 GTXは512Mbit(16M×32)のメモリチップ12枚で768MB、GTSは512Mbitのメモリチップ10枚で640MBとなっているのである。GeForce 8800 GTSの2枚分のパターンはまったく無駄になるのだが、生産効率のためにパターンが用意されているそうだ。

 メモリはGDDR3を継続して採用。すでにAMD(旧ATI)はRadeon X1950 XTXでGDDR4を採用しているが、それにも関わらずGDDR3を採用した理由としては、価格が非常に高いためとしている。

【写真9】GeForce 8800 GTXの裏面。中央の3辺を囲むようにメモリチップが12枚配置されている。512Mbitチップ×12枚で768MBとなる 【写真10】GeForce 8800 GTSは12枚分のメモリチップを搭載できるパターンを持っているが、左下の2枚分は空きパターンとなっており、512Mbitチップ×10枚で640MBとなる

 最後にブラケット部だが、両製品ともDualLink対応DVI×2基と、HDTV出力対応のビデオ出力端子となっている(写真11、12)。リファレンスカードは両製品とも1ポートが、GPU内のキーを利用したHDCPをサポートしており、市場に登場する製品も多くがHDCPをサポートすることになると思われる。

【写真11】GeForce 8800 GTXのブラケット部。DualLink対応のDVI端子×2とHDTV出力を備える。DVIのうち1ポートはHDCPをサポートする 【写真12】GeForce 8800 GTSのブラケット部。構成や機能はGTXと同じ

 今回のテストで利用したドライバは、GeForce 8800シリーズ対応のForceWare 96.94(シングルビデオカード)、同96.97(SLI構成)である。このドライバは、これまでと大きく変わった部分が2つある。

 1つはアンチエイリアスの設定だ。従来は、「Antialiasing Setting」という1つのドロップダウンメニューから設定を行なえ、アプリケーションに設定させる「Application Controlled」を選ぶか、強制的に働かせるアンチエイリアスのサンプル数を指定していた。

 しかし、今回から「Antialiasing-Mode」というメニューが追加された。ここでは、アプリケーション側で設定を行なう従来と同じ「Application Controlled」、全て強制的にOFFにする「off」、ON/OFFはアプリケーションで決めサンプル数をドライバ側で決める「Enhance the application setting(アプリケーションの設定を拡張します)」、全てをドライバ側で制御する「Override any application setting(アプリケーション設定を変更します)」という4つの方法を選択できるようになった(画面1)。

 サンプル数の設定については、画面2に示したリストから選択でき、8x以上の設定が用意された。2x/4x/8xQでは、従来通りMultiSample Antialiasing(MSAA)が使われ、8x/16x/16xQでは、新しいアンチエイリアス技術であるCoverage Sampling Antialiasing(CSAA)が利用されることになる。

 ただ、今回のドライバと3DMark06のImageQualityを利用してCSAAをテストしてみようとしたのだが、「Enhance the application setting」でも「Override any application setting」でも、ドライバで指定したアンチエイリアスが機能しなかった。正式リリースされるドライバでは、このようなことがないと祈りたいが、ここではこのクオリティを見ることができなかったのは残念だ。

【画面1】新たに追加された「Antialiasing Mode」の欄からは、アンチエイリアシング設定を、アプリケーションとドライバのどちらの設定を利用するかを指定できる 【画面2】ビデオカード1枚で最大16xサンプルのアンチエイリアスが可能。8x/16x/16xQでは、CSAAと呼ばれるアンチエイリアス技術が利用される

 もう1つの大きな変更点が、オーバークロックに関する機能だ。従来のForceWareでは、レジストリにCoolbitsという値を設定することで、NVIDIA Control Panelでオーバークロック機能を利用可能だった。しかし、今回のドライバでは、Coolbitsを立てると「Change Overclock Configration」というメニューが表れるものの、その機能を利用することはできない(画面3)。画面でも分かる通り、同社のチューンナップツールである「nTune」をインストールしなければならなくなったのだ。

 もっとも、nTuneは無償で入手可能であり、オーバークロック機能が提供される点に変わりはない。オーバークロックをするユーザーであれば、nTuneをインストールする人も多いと思われるので、それほど意識する必要はないのかも知れない。

 nTuneをインストールし、両製品の動作クロックを確認してみると、若干の誤差はあるものの、ほぼ定格どおり動作していることを確認できる(画面4、5)。

【画面3】従来とは異なりForceWare単体ではCoolbitsを立ててもオーバークロック機能を利用できなくなった

【画面4】GeForce 8800 GTXの動作クロック。ストリーミングプロセッサのクロックは確認できないが、コアは576MHz、メモリは900MHzと、ほぼ定格で動作している 【画面5】GeForce 8800 GTSの動作クロック。コアは定格より若干高めの513MHz。メモリは逆に定格より若干遅めの792MHzとなっている

●ハイエンドビデオカードのシングル構成をテスト

【写真13】NVIDIAリファレンスデザインのnForce 680i SLI。eVGAから「122-CK-NF68」の製品名で出荷されるようだ

 それでは、GeForce 8800シリーズのパフォーマンスを見てみることにしたい。まずは、ハイエンドビデオカードを単体使用したときのパフォーマンスからチェックする。用意した環境と比較対象は表3の通りだ。

 ここでのテストは、GeForce 8800シリーズと同時発表されたnForce 680i SLIに、Core 2 Extreme QX6700を組み合わせた環境を利用している。マザーボードはNVIDIA設計のeVGA製品を使用(写真13)。このチップセット(というかマザーボード)もオーバークロック機能など注目できる点があるのだが、その検証は次回以降に行なう。

【表3】テスト環境1
  GeForce 8800 GTX(768MB)
GeForce 8800 GTS(640MB)
GeForce 7900 GTX(512MB)
Radeon X1950 XTX(512MB)
VGA Driver ForceWare 96.94 CATALYST 6.7(6.14.10.6631)
マザーボード eVGA 122-CK-NF68(nForce 680i SLI)
CPU Core 2 Extreme QX6700
メモリ PC2-6400 DDR SDRAM 512MB×2(CL=5)
HDD HGST Deskstar T7K250(HDT722525DLA380)
OS Windows XP Professional(ServicePack 2/DirectX 9.0c)

【お詫びと訂正】初出時に、上記表3において、GeForce 7900 GTXをSLIと表記しておりましたが、1枚の誤りです。お詫びして訂正させていただきます。

 では、まずは「3DMark06」の結果から見ていこう。グラフ1にトータルスコア、グラフ2にSM2.0テストの結果、グラフ3にHDR/SM3.0テストの結果を載せている。また、今回は各シェーダユニットの能力を見るため、Featureテストの結果もグラフ4に掲載した。

 まず、GeForce 8800 GTX/GTSが、NVIDIA製品としては初めてHDRバッファへのアンチエイリアシングをサポートしたことに触れておきたい。これまで、NVIDIA製品はGeForce 6200を除くGeForce 6/7シリーズで、16bit浮動小数点バッファのテクスチャリングなどをサポートし、HDR処理が可能だったが、バッファ領域へのアンチエイリアス処理が行えなかった。そのため、3DMark06上ではアンチエイリアスを有効にするとHDR/SM3.0テストが実行できず、トータルスコアも表示されない状態になっていた。

 ということで結果であるが、Radeon X1950 XTXとの比較で、GeForce 8800 GTXのトータルスコアが60~70%強、GTSが25~35%前後の性能向上を見せている。SM2.0とHDR/SM3.0の個別結果を見てみると、やはりRadeon X1950 XTXと比較して、大きいところでは、GeForce 8800 GTXが約90%、GTSが約55%の差をつけている。もちろん、GeForce 7900 GTXに対しても、全ての結果で上回っており、GPU 1個の単体ビデオカードとしては、現時点で最強の性能といえるだろう。

 ただ気になるのは、Radeon X1950 XTXとの性能比で、もっとも差を広げたのはフィルタを何も適用しない状態であるという点だ。つまり、アンチエイリアスを適用すると、多少差が詰まるのである。異方性フィルタはRadeon X1950 XTXの方が下がり幅が大きく、少し差が開くが、フィルタを何も適用しない時に比べると差を詰められている。

【グラフ1】3DMark06 Build 1.0.2
【グラフ2】3DMark06 Build 1.0.2(SM2.0)
【グラフ3】3DMark06 Build 1.0.2(HDR/SM3.0)

 Featureテストの結果についても少し詳細に触れておきたい。大局的にはここでもGeForce 8800シリーズの優位性は現れている。だが、Vertex Shader-Simpleテストにおいては、やや奮わない結果で、GeForce 8800 GTSはGeForce 7900 GTXにも劣る結果となってしまった。

 これはバーテックスシェーダユニットへの負荷が、それほど大きななものではなかったのが影響したのだろう。GeForce 7900 GTXのバーテックスシェーダユニットと、GeForce 8800シリーズのストリーミングプロセッサ1個当たりの性能差が出た可能性があるし、先にも少し触れたシェーダ割り当てのために生じるレイテンシが影響した可能性もある。

 ここで着目したいのが、このテストにおいて、GeForce 8800 GTXはGTSより12%強スコアが良い。GeForce 8800 GTXとGTSのストリーミングプロセッサのクロック比は1.125:1で、スコア差とほぼ一致する。これは、このテストには、ストリーミングプロセッサ数の差がほとんど影響しないようだ。

 Vertex Shader-ComplexテストもGeForce 8800 GTXとGTSの性能差は12%強で先ほどと同じ状況だが、ここではGeForce 8800 GTSがGeForce 7900 GTXなどと性能差を付けている。このテストは先のものよりバーテックス負荷が高く、こういう状況で、バーテックスシェーダ処理に、より多くのストリーミングプロセッサを割り当てられる新アーキテクチャの優位性が示された格好になっている。

 Pixel Shaderのテストにおいては、GeForce 8800 GTSはRadeon X1950 XTXに肉薄されるケースがある。この差はおよそ5%といったところ。当然、Radeon X1950 XTXのピクセルシェーダユニットと、ストリーミングプロセッサの内部構造は違うため、単純にユニット数の論理は通用しないが、GeForce 8800 GTSの96個のストリーミングプロセッサと、Radeon X1950 XTXの48個のピクセルシェーダユニットは、同等レベルのピクセルシェーダ処理性能を持っているようである。

 ただ、バーテックステストと異なり、GeForce 8800 GTXはGTSに対して50%近い差をつけている。DirectX 9世代においては、ピクセルシェーダが処理のボトルネックであると言われ続けてきた。そのために、Radeon X1950 XTXは48個という大量のピクセルシェーダユニットを搭載してきた。この結果はそのことを如実に表わしていると言える。

 もう1つ、GeForce 8800シリーズの優位性が顕著に表れたのが、Shader Particlesテストだ。このテストはバーテックスシェーダがテクスチャフェッチを行なえないとテストが実行できないので、Radeon X1950 XTXはテストがスキップされる。ここで、GeForce 8800 GTX/GTSはGeForce 7900 GTXに対して、各約9倍/約6倍という性能差を付けた。

 このテストは、大量(3DMark06のホワイトペーパーによれば409,600個)のパーティクルを処理するテストで、GeForce 8800シリーズの128個/96個のストリームプロセッサによる並列処理性能が有効に活きたといえる。また、テスト要件であるバーテックスシェーダのテクスチャフェッチの性能も当然ながらスコアに影響を及ぼすが、GeForce 7900 GTXまでとは異なり、バーテックスシェーダ処理を割り当てられたストリーミングプロセッサからもL1キャッシュへアクセスできるといった、メモリアクセス周りの性能差も関係していそうだ。

 最後のPerlin Noiseも、GeForce 8800 GTXの優位性が表れたテストだ。このテストはピクセルシェーダの演算能力とメモリアクセス性能が影響するテストとなる。ここでもGeForce 8800 GTSとRadeon X1950 XTXのスコアは似通っており、先述の通りピクセルシェーダの処理性能のみならず、テクスチャメモリ、テクスチャバッファ間のメモリアクセスも似たような性能であることが伺える。

【グラフ4】3DMark06 Build 1.0.2(Feature Tests)

 続いては「3DMark05」(グラフ5)と「3DMark03」(グラフ6)である。3DMark05はさほど印象のある結果ではなく、順当にGeForce 8800 GTX/GTSが良い成績を収めた。3DMark03では、先にも触れたGeForce 8800 GTX/GTS両製品のアンチエイリアス設定時のパフォーマンス低下が顕著に表れた。GeForce 8800 GTSは、ここでもわずかながらGeForce 7900 GTXに劣る結果が出ているところもある。

【グラフ5】3DMark05 Build 1.2.0
【グラフ6】3DMark03 Build 3.6.0

 次は実際のゲームを利用したベンチマークであるが、現在テスト内容の見直しを行なっている。今回はとりあえず「DOOM3」の取り止めと、「Splinter Cell Chaos Theory」のHDR無効時のテスト、「F.E.A.R.」のSoftShadows有効時のテストを追加した。掲載したグラフは、「Splinter Cell Chaos Theory」(グラフ7、8)、「Call of Duty 2」(グラフ9)、「F.E.A.R.」(グラフ10、11)となる。

 HDRバッファに対するアンチエイリアスがサポートされたGeForce 8800シリーズでは、Splinter Cell Chaos TheoryもHDR有効時にアンチエイリアシングを適用できるようになるはずだ。だが、テスト時点における最新パッチ(1.05)を適用しても、HDRを有効にするとアンチエイリアシング設定メニューが無効になってしまった。また、NVIDIA Controll PanelからOverride settingを施した場合も、フレームレートは下がるのだが描画には差がない状態であったため、HDR有効時のテストは従来通りAA適用なしの場合のみにしている。

 これらの結果はアプリケーションによって多少の傾向差が出ている。とはいえ、描画負荷が高まるにつれGeForce 8800 GTXの強さが際立ってくる点は共通だ。一方、GeForce 8800 GTSは3DMarkシリーズほど良い結果を残せず、F.E.A.R.を除いてはRadeon X1950 XTXに劣るスコアが目立つ。描画負荷が低い状態での強さは目立っているので、ハイエンドより1つ下のランクの製品であることを意識して使用するのが正解なのかも知れない。

【グラフ7】Splinter Cell Chaos Theory(HDR無効)
【グラフ8】Splinter Cell Chaos Theory(HDR有効)
【グラフ9】Call of Duty 2
【グラフ10】F.E.A.R.(Soft Shadows無効)
【グラフ11】F.E.A.R.(Soft Shadows有効)

●マルチビデオカード構成との比較テスト

 続いてはマルチビデオカード構成を加えたテスト結果を紹介したい。シングルビデオカードと項を分けたのは、テスト環境が大きく異なるからだ。環境は表4に示した通り。現時点ではCore 2シリーズの方が3Dゲームにおいても良いパフォーマンスを出す傾向にあり、実際、上記のCore 2 Extreme QX6700+nForce 680i SLIの環境が出しているスコアは、ここから紹介するベンチマークスコアよりもかなり良い結果だ。

 しかし、CrossFire構成時にPCI Express x16×2スロットを利用できるチップセットでCore 2対応のものが現時点で存在しない。そのため、CrossFireとの比較テストを考慮して、ここではAthlon 64 FX-62と、nForce 590 SLI、CrossFire Xpress 3200を組み合わせた環境を利用した次第である。

 なお、GeForce 8800 GTX/GTSのドライバについてであるが、シングルビデオカード構成で利用しているドライバと、SLI対応ドライバのバージョンが異なっている。ただし、ForceWare 96.97は、ForceWare 96.94のSLI対応版であり、パフォーマンスには手が加えられていないそうだ。

 ちなみに、このSLIドライバは、今回の環境でテストしたところ、NVIDIA Control PanelでSLIを有効にした後に再起動するとWindowsが起動しないトラブルがあった。正式リリースドライバは安定したものであることを望みたい。

【表4】テスト環境2
  GeForce 8800 GTX(768MB)×2
GeForce 8800 GTS(640MB)×2
GeForce 8800 GTX(768MB)
GeForce 8800 GTS(640MB)
GeForce 7900 GTX SLI(512MB)×2 RADEON X1950 CFE(512MB)
+RADEON X1950 XTX(512MB)
VGA Driver ForceWare 96.97 ForceWare 96.94 ForceWare 91.47 CATALYST 6.7(6.14.10.6631)
マザーボード ASUSTeK M2N32-SLI Deluxe(nForce 590 SLI) MSI K9A Platinum(CrossFire Xpress 3200)
CPU Athlon 64 FX-62
メモリ PC2-6400 DDR SDRAM 512MB×2(CL=5)
HDD HGST Deskstar T7K250(HDT722525DLA380)
OS Windows XP Professional(ServicePack 2/DirectX 9.0c)

 テストしたベンチマークは、3DMark06のFeature Testを除いて、シングルビデオカードテストと同じで、「3DMark06 トータルスコア」(グラフ12)、「3DMark06 SM2.0テスト」(グラフ13)、「3DMark06 HDR/SM3.0テスト」(グラフ14)、「3DMark05」(グラフ15)、「3DMark03」(グラフ16)、「Splinter Cell Chaos Theory」(グラフ17、18)、「Call of Duty 2」(グラフ19)、「F.E.A.R.」(グラフ20、21)である。

 マルチビデオカード同士の相対的な差は、F.E.A.R.においてCrossFireが低負荷でのスコアを伸ばしている以外は、おおよそシングルビデオカードでの傾向と大差ない。

 シングルビデオカード対マルチビデオカード、という図式で見るとGeForce 8800 GTXは、中程度までの描画負荷であれば、GeForce 7900 GTXのSLIや、Radeon X1950 XTXのCrossFireを上回るスコアを出すことが珍しくない。描画負荷が高い状態においては、従来製品のマルチビデオカード環境に分があるが、Call of Duty 2では、GeForce 8800 GTX 1枚の方が良いフレームレートを出している。GPU1個でここまで性能が出せる点には注目すべきだ。

【グラフ12】3DMark06 Build 1.0.2
【グラフ13】3DMark06 Build 1.0.2(SM2.0)
【グラフ14】3DMark06 Build 1.0.2(HDR/SM3.0)
【グラフ15】3DMark05 Build 1.2.0
【グラフ16】3DMark03 Build 3.6.0
【グラフ17】Splinter Cell Chaos Theory(HDR無効)
【グラフ18】Splinter Cell Chaos Theory(HDR有効)
【グラフ19】Call of Duty 2
【グラフ20】F.E.A.R.(Soft Shadows無効)
【グラフ21】F.E.A.R.(Soft Shadows有効)

 最後にワットチェッカーによるシステム全体の消費電力の比較を行なっておこう。ここでは、従来製品のシングルビデオカードも含めているが、この消費電力はM2N32-SLI Deluxeに装着してテストを行なっている。CrossFireのみマザーボードが異なるのでグラフの色も変えている。

 結果を見ると、GeForce 8800 GTX/GTSとも、ビデオカード1枚でもピーク時に300Wを超えてしまっており、消費電力が大きいと言われてきたRadeon X1950 XTXと同等になっている。GeForce 8800 GTSはRadeon X1950 XTXより若干少ないが、それでも十分、消費電力が大きいと言えるレベルだ。

 GeForce 8800 GTXのSLIでは500Wを超えるという衝撃的な結果となった。ただし、GeForce 8800 GTSのSLIはグラフでCrossFireを上回っているが、CrossFire環境のマザーボードは30Wほど消費電力が小さいことが以前の記事で分かっている。

 また、GeForce 8800両製品は、アイドル時でも消費電力が大きいのも気になる点だ。これは対GeForce 7900 GTXで比較すると分かりやすい。GeForce 7900 GTXのSLIはピーク時こそGeForce 8800両製品よりも消費電力が大きいが、アイドル時は同程度までに抑制できている。この、常に消費電力が大きいという点はGeForce 8800両製品にとっては確実にウィークポイントといえる点であろう。

【グラフ22】各ビデオカード使用時の消費電力

●文句ないパフォーマンスを見せたGeForce 8800 GTX

 ここで、価格に関しても触れておきたいが、表1にも記載したが、GeForce 8800 GTXが599ドル、GeForce 8800 GTSが449ドルとされている。国内価格は推測となるが、GeForce 8800 GTXが8万円半ばぐらいから登場して次第に7万円台後半へ、GeForce 8800 GTSが6万円強ぐらいからスタートして5万円台半ばで落ち着くといったところだろう。

 より良いパフォーマンスの製品が、それまでと同じ価格で買えるという一般的な流れは踏襲されており、ハイエンドビデオカードを求めるユーザーにとっては悪くない価格といえる。

 ウィークポイントは消費電力とドライバだ。このクラスの製品を求める人にとって、電気代のウエイトはあまり重くないのかも知れないが、少ないに越したことはない。それよりも気になるのは、ドライバだ。今回はアンチエイリアス周りとSLIに関して、怪しい動作が見られた。動作が安定しなければ、その性能も宝の持ち腐れになる。ぜひ安定したドライバのリリースを願いたいところだ。

 とはいえ、パフォーマンスに関しては文句のつけようがない素晴らしい性能である。NVIDIAがGeForce 7900 GTXを発表したのは今年の3月9日で、ちょうど8カ月でフラグシップ製品が入れ替わったわけだが、これだけの期間で、これほど性能が向上させられるものかと感心するほどだ。

 GeForce 8800 GTSは、ちょっと苦戦する場面が見られる部分もあるが、価格が抑えられたモデルであることを考えれば十分な性能だろう。もちろんDirectX 10サポートという将来性も加味すべきだ。現時点において、パフォーマンスを求めるユーザーが真っ先に検討すべき製品であることは間違いなく、パフォーマンス競争を牽引していく新たな製品が登場したといえるだろう。

□関連記事
【8月30日】【多和田】GDDR4の採用で進化を遂げた「Radeon X1950 XTX」
http://pc.watch.impress.co.jp/docs/2006/0830/tawada83.htm

バックナンバー

(2006年11月9日)

[Text by 多和田新也]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2006 Impress Corporation, an Impress Group company. All rights reserved.