NVIDIAは6月16日(現地時間)、ハイエンドGPUの新製品「GeForce GTX 200シリーズ」を発表。3月から4月にかけて発表された「GeForce 9800シリーズ」を早々と置き換えるエンスージアスト向けGPUとなり、ブランド名の変更からも印象付けられるように、前世代から大幅な変化を遂げた。ここでは、上位モデルとなる「GeForce GTX 280」のパフォーマンスを見てみたい。 ●第2世代統合型アーキテクチャと銘打つ新設計 まずは、今回取り上げるGeForce GTX 200シリーズの仕様とブロックダイヤグラムを表1、図1に示す。
【表1】GeForce GTX 200シリーズの仕様
GeForce GTX 200シリーズは「GT200」のコード名で開発が行なわれたGPUで、前世代のコアであるG80/92とは異なる設計を持つ。NVIDIAでは、これを「第2世代統合型シェーダアーキテクチャ」と名付けている。TSMCによる製造で、プロセスルールは65nm。トランジスタ数は約14億個で、同じプロセスで7億5,400万個のトランジスタを使っていたG92の倍近くになる大型GPUとなった。 コアの推移を整理するために製品名で話をすると、GeForce 8800はG80の開発コードを持つコアが採用されており、これがNVIDIAにとっては、最初の統合型シェーダアーキテクチャとなる。そして、今年登場したGeForce 9800 GX2/GTXはG92と呼ばれるコアが採用されているが、これはG80の効率を上げたマイナーチェンジ版となる。基本的な設計はG80を踏襲したものだ。 GT200コアは、このG80/92と同じくDirectX10に対応した統合型シェーダアーキテクチャを採用しているが、その設計はまったく異なっている。これはグラフィックパフォーマンスを上げると同時に、GPGPU、つまりGPUによる汎用アプリケーションの実行性能を意識した面も大きい。むしろ、GPGPUの性能向上へ向けた変更がグラフィックパフォーマンスにも有効であったと見る方が正しいほど、GPGPUを強く意識した製品だ。 ただし、冒頭でも記した通り、今回はグラフィックパフォーマンスのテストのみを行なっている。ここでも、その点に特化して話を進めるため、GT200のブロックダイヤグラムのうち、グラフィックに関する部分のみを抜き出したものが図2である。
最上部にあるのが、統合型シェーダへの役割分担などを行なうマネージャ部分だ。この部分はG80/92に比べてレジスタサイズが倍になったことで、複雑なシェーダプログラムも、より効率的、より高速に動作できるようになったとされている。 この次の段が、製品の核となる統合型シェーダユニットである。G80/92は1クラスタに16個のStreaming Processor(SP)を持ち、8クラスタで計128個というものだった。GT200では、1クラスタあたり24個のSPを持ち、10クラスタで計240個となった。 さらに細かくいえば、G80/92では1クラスタ内のSPは8個×2のパーティション構成で配置されていたが、GT200は8個×3個。各パーティションごとに8個のSPで共有できるローカルメモリを持っている。このローカルメモリはGPGPUへの適応に向けた意味が大きいが、シェーダプログラムの処理において、このメモリがまったく利用されないということはなく、グラフィックパフォーマンスへの好影響も期待される部分だ。 このシェーダクラスタにはテスクチャユニットも実装されるが、クラスタ当たりの個数はG80/92と同じで、クラスタ数が10個になったことで計80個へと数を増している。 続くROP部は、図では数が分かりにくいが、1クラスタあたり4本のパイプラインを持ち、計32ユニット。1クロックあたり4ピクセルの処理が可能となっている。前世代から大幅な進化とはいえないが、G92コアではROP部の数が減らされたことで、とくにアンチエイリアス処理時のパフォーマンスの伸び悩みに繋がる面があった。この点の強化は大きな前進といえる。 ビデオメモリインターフェイスは、32bit×16本の計512bitインターフェイスとなった。フルスペックとなる上位モデルのGeForce GTX 280は、16個×512Mbitで計1GBのビデオメモリを標準スペックとしている。GPU 1個で1GBのビデオメモリを持つビデオカードは、ビデオカードベンダーが独自に投入する例は珍しくないものの、GPUメーカーの公式仕様として、このスペックにした点は興味深い。描画クオリティが上がっている昨今の3Dゲーム事情を考えても意味あるスペックといえるだろう。 GeForce GTX 260は、SP/テクスチャユニットのクラスタを8個、ROP部クラスタを7個に制限し、かつ動作クロックを落とした仕様となる。 このほか、このGeForce GTX 200シリーズに関連するグラフィック関連の新しいトピックとして、物理演算エンジンである「PhysX」をGPUで動作させられるようになる点も紹介しておきたい。 PhysXエンジンについては、専用プロセッサを搭載したレビューでも紹介しているが、今年に入ってNVIDIAがPhysXを買収した。このPhysXエンジンを同社のGPGPUプラットフォームである「CUDA」上で動作させる仕組みを構築したのだ。 仕組みの上ではGPGPUに関する話題になるのだが、Unreal Tournament 3や3DMark Vantageで採用されているように、物理演算処理はゲームの分野においても重要なポジションを占めつつある。よりクオリティの高いゲーム環境を実現するにあたって期待を抱かれる読者もいるだろう。7月にも登場予定のGeForce用PhysXドライバがリリースされれば、この処理をGPU側で動作させられるようになる。その際には、改めてこの機能のテスト記事をお届けしたいと考えている。 さて、今回テストする機材であるが、ここでは上位モデルとなるGeForce GTX 280のリファレンスカードを使用する。シングルGPUビデオカードということもあって、外観はGeForce 9800 GTXに近い(写真1)。ボードサイズもほぼ同じだ。実際の製品としては、XFXからも製品投入が予定されており、こちらは化粧カバーにXFX製品らしいシールが貼られている(写真2)。
ただし、GeForce 9800 GTXとは異なり、裏面にもカバーが取り付けられている(写真3)。これは、おそらく裏面にもメモリチップを実装しているからだろう。先にも紹介した通り、本製品は32bitメモリインターフェイスを16本で、計512bitのメモリインターフェイスとなる。今回、分解は避けたのでチェックはできていないが、16個のメモリチップを表面のみに実装している可能性は限りなく低く、表面に8枚、裏面8枚というのが妥当だろう。そのメモリの保護および冷却効率を上げるために裏面にもカバーが取り付けられているものと想像できる。 また、写真3からも分かる通り、SLIコネクタは2個持っている。これは3-way SLIに対応することを示している。GeForce 9800 GX2のように、SLIコネクタ用のカバーが用意されているのも印象的だ。 続いては電源端子周りであるが、本製品は8ピンおよび6ピンのコネクタを備えている(写真4)。GeForce 9800 GX2同様、両コネクタへの接続は必須となっており、Radeon HD 3870 X2などのように6ピン×2個で利用することはできない。起動すらしないので、あらかじめ対応電源を用意することが求められる。電源の目安として、NVIDIAでは40Aの12Vラインを持つ550W以上の電源が推奨されている。なお、GeForce GTX 260は6ピン×2の構成で、36Aの12Vラインを持つ500W電源が推奨される。 GeForce GTX 280の消費電力は、最大で236W(GTX 260は182W)。ただし、G80/92よりも電力管理機能を強化させており、アイドル時にはクロックと電圧を落とすことで消費電力を抑制するようになった。さらに、Blu-ray Discなどのビデオ再生時用のパワーステートも持ち、アイドル時が25W、Blu-ray Discビデオ再生時が35Wといった具合に、段階的な電力調整が行なわれる。 ちなみに、もう1つのパワーステートとして、0W、つまりシャットダウン状態のステートも設けられている。これは言うまでもなくHybrid SLIにおける、HybridPowerを利用したときのものである。本製品のHybrid SLI対応については、HybridPowerのみの対応で、GeForce Boostには対応しない。これはGeForce 9800 GTX/GX2と同様だ。 なお、写真4で示した電源端子の脇には、S/PDIF入力端子が顔をのぞかせているが、リファレンスボードでは端子の実装がなく、パターンのみになっている。ただ、XFX製品はちゃんと端子が実装されており、実際にビデオカードメーカーから出荷されるボードは、端子を実装しているものが多いと想像される(写真5)。 次にブラケット部であるが、これはGeForce 9800 GTXと同じく、DVI×2+TV出力の構成(写真6)。両端子がDualLink DVIをサポートし、DualLink時のHDCP利用もサポートされる。 テストにおいては、本製品のレビュー用ドライバとして配布された、GeForce Release 177.34を使用。NVIDIAのSystem Toolにおける動作クロックは、定格通り設定されていることが分かる(画面1)。 ●デュアルGPUのGeForce 9800 GX2と好勝負を見せる結果 それでは、ベンチマーク結果を紹介していきたい。環境は表2に示した通りで、ここでは前世代のハイエンドビデオカードであるGeForce 9800シリーズの2製品を比較対象とした。 なお、テストに関する機材は、すべてASUSTeKにご協力いただいており、nForce 790i SLI搭載マザーボード「Striker II NSE」、GeForce 9800 GX2搭載ビデオカード「EN9800GX2 TOP/G/2DI/1G」、GeForce 9800 GTX搭載ビデオカード「EN9800GTX TOP/HTDP/512M」を借用している(写真7~9)。 ただし、ビデオカード製品はいずれもオーバークロック製品であるため、NVIDIA System Toolよりクロックを落とし、定格クロックで動作させている。このほか、ビデオカードはすべて2枚ずつ用意。SLI構築時のパフォーマンスについても併せてテストしている。 ドライバについては、GeForce GTX 280用のドライバがGeForce 9800シリーズに対応していなかったため、これらは原稿執筆時点での最新ドライバであるGeForce Release 175.16を使用している。
【表2】テスト環境
では、順に結果を見ていく。「3DMark Vantage」(グラフ1、2)は、いずれもGeForce GTX 280が優れた結果を見せており、G92コアを2つ搭載するGeForce 9800 GX2をも上回る結果だ。Feature Testの結果も非常に優れており、3DMark Vantageのようにシェーダによる演算を多様するタイプのベンチマークでは、GPGPUの性能向上を図ったGT200アーキテクチャによるグラフィック性能への恩恵も非常に大きいのだろう。 SLIの結果も順当にパフォーマンスを伸ばす傾向を見せている。GeForce 9800 GX2の場合、Feature TestのGPU Particlesのように、GPU 2個であることのメリットがなかったり、Quad SLIによるオーバーヘッドの高まりが悪影響を見せる部分もある。GPU 1個で高パフォーマンスを出せることの意味は大きいはずだ。
「3DMark06」(グラフ3~7)の結果は、面白い傾向を示した。シングルビデオカードとしては、GeForce 9800 GX2の良さが目立つが、GeForce GTX 280の2-way SLIと、GeForce 9800 GX2のQuad SLIの比較では、前者の方が良い結果を出す傾向にあるのだ。SM2.0テストに関してはCPUによる頭打ち感もあるが、HDR/SM3.0はグラフィック負荷が高いこともあり、こちらのほうがハッキリした結果といえる。 GPUの数が違うので2-way/Quadのスケーリングに差が出るのは仕方ないが、GPU 1個のパフォーマンスが高いことのメリットを如実に示す結果といえるだろう。 ただ、Feature Testの結果では、GeForce GTX 280が伸び悩んでおり、とくにシェーダユニットの演算能力が大きく関連するPerlin Noiseで性能が伸び悩んだのは意外といえるかも知れない。3DMark Vantageの同名テストではGeForce 9800 GX2を上回るスコアを出しており、3DMark06も最適化によって、さらにパフォーマンスを伸ばす余地があるのではないだろうか。 また、今回はテクスチャフィルレートの結果も掲載している。とくにシングルテクスチャの処理において優れた結果を見せており、GPU 1個のGeForce 9800 GTXとの比較では倍以上、GeForce 9800 GX2との比較においても上回る結果を見せた。ただし、マルチテクスチャとなると差は逆転する。 このあたり、テスクチャ枚数が少ないシンプルな描画であればGT200アーキテクチャにおけるレジスタ数増加などによる効率化が功を奏す一方、テクスチャ枚数が増えて複雑な描画になるとテクスチャユニット数の差が出てしまうのかも知れない。
「Call of Duty 4:Modern Warfare」(グラフ8)の結果も、3DMark06に近い傾向を示している。低解像度ではCPUによる頭打ちが大きいので参考にしづらいが、高解像度ではシングルビデオカードではGeForce 9800 GX2、SLIを構築した場合はGeForce GTX 280が良好な結果を示す。低解像度のテストにおいて、GeForce 9800 GX2のQuad SLIがGeForce 9800 GTXの2-way SLIに劣る結果を見せ、CPU処理のオーバーヘッドが大きいことをはっきり示している。こうした結果は、GPU 1個のGeForce GTX 280のメリットを示す意味では印象に残る結果である。
「Crysis」(グラフ9)も、3DMark06に近い傾向といえるが、GeForce 9800 GX2がわりと健闘している結果だ。DirectX10世代のキラーアプリとしての期待から、ドライバの最適化を重点的に施されたアプリケーションでもあり、GeForce 9シリーズの持ち味がフルに発揮されているのだろう。ほかのアプリケーションの結果と比較しても、GeForce 9シリーズに対してGeForce GTX 280が伸び悩む結果になっており、チューニングの余地があるのではないかと期待を抱いている。
「COMPANY of HEROES OPPOSING FRONTS」(グラフ10)では、1,600×1,200/1,920×1,200ドットのフィルタ適用時に、Quad SLIを構築したGeForce 9800 GX2の環境で完走しなかったため割愛している。その部分以外の結果を見ると、傾向としてはこれまでと似たような点が多い。 ただ、シングルビデオカードでフィルタを適用した状態でGeForce 9800 GX2を上回る結果を見せるのは興味深い。とくに解像度が高い状態において、この傾向は顕著だ。ROPユニットやメモリインターフェイスの強化が好影響をもたらしたと考えられる結果だ。
「World in Conflict」(グラフ11)は、COMPANY of HEROESをさらに顕著にした結果といえる。このアプリケーションにおいて、高解像度かつフィルタを適用すると、ビデオメモリやROPの性能が大きく影響してくることは、過去の本コラムの結果でも触れている通り。GeForce GTX 280において、この点が強化されたことで、パフォーマンスの低下はかなり小さなものとに留まっている。 また、低解像度においてはCPU性能の頭打ちが目立つアプリケーションであり、GPU 1個というメリットがある点もGeForce GTX 280にとっては重要なポイントだ。こうした条件が揃った本アプリケーションの結果は、GeForce GTX 280のグラフィック性能の良いところが表れたものといえる。
「Unreal Tournament 3」(グラフ12)の結果は、かなり負荷の軽いアプリケーションであり、SLI構築時はCPUによる性能の頭打ちも大きい。とくにBotを表示させたときのスコアは参考にしづらいものが多いが、FlyThroughの結果を見ても、フィルタ適用時にスコアが伸び悩む一面を見せている。 シングルビデオカードでGeForce 9800 GX2と同等程度のパフォーマンスを発揮できているし、SLI時のパフォーマンスはかなり優れている。GeForce GTX 280の良さが出たアプリケーションとはいえるが、フィルタ適用時のスコア伸び悩みは少々気になるところである。
「LOST PLANET EXTREME CONDITION」(グラフ13)は、前半のゲームベンチで見せた単体ではGeForce 9800 GX2に劣るが、SLIを組むと上回るという傾向に近い。ただ、SLIにおいても、解像度が高くなるほどGeForce GTX 280のスコアが伸び悩む傾向が色濃くなる。CPU処理が多いCaveの低解像度条件において高いフレームレートを出せているあたりはGPU 1個であるという本製品の魅力の一端を感じることができるが、全般にはもう一歩高いスコアをマークしてほしかったというのが本音である。
最後に消費電力測定の結果である(グラフ14)。今回は、普段の3D描画中のピーク消費電力に加え、Blu-ray Discビデオ再生時の消費電力も測定した。このときの消費電力は、再生タイトルやシーンによる差が極めて小さいものの、ここでは条件を統一するために007/カジノロワイヤルのチャプター8の先頭から約2分間(ここでちょうど開始から1時間となる)まで再生したときのピーク消費電力を見ることにした。 まず、GeForce GTX 280に採用されたアイドル時にクロックおよび電圧を下げる省電力機能は、かなり高い効果を示している。今回テストした3製品中、もっとも低い消費電力に収まっており、意味ある機能になっている。 次に3D描画中の消費電力について触れると、GeForce 9800 GTXに比べると50Wほど増す結果となった。NVIDIAが公表している仕様でいえば、GeForce 9800 GTXは156W、GeForce GTX 280は236Wがピーク消費電力とされているので、意外に差が小さい結果なので余力を残している可能性(SLI時の3DMark06はその典型だろう)はあるが、現状でも単体GPUとしては過去最高レベルの消費電力を持つビデオカードといえるだろう。 一方、GeForce 9800 GX2との比較においては、GeForce GTX 280の方が20W強、消費電力が抑制されている。ここまで見てきたパフォーマンスを考えれば、単体ビデオカードとしては電力とパフォーマンスにおけるバランスが必ずしも良いとはいえない。しかし、SLI構築時には多くの項目でGeForce 9800 GX2のQuad SLIを上回る結果を見せていたわけで、この場合の消費電力も低く抑えられているのは魅力になっている。 Blu-ray Disc再生時の結果については、判断が難しい結果となった。ビデオ再生のアクセラレーションが行なわれているときはシェーダプロセッサも稼働しているという視点で捉えて3D描画中のスコアを基準にすれば、わりと低い電力に抑制されていると見ることもできる。 しかし、アイドル時を基準に考えると、NVIDIAの示す資料では、アイドル時とBlu-ray Disc再生時の消費電力は10Wの違いしかないが、ここでの測定では30Wの消費電力上昇が見られる。もちろんCPUや光学ドライブの消費電力上昇分も勘案する必要はあるわけだが、GeForce 9800 GTXではアイドル時からの上昇が20W未満であることを考えると、強くアピールできるほど目立った効果があるとはいえない結果になっている。
●シングルGPUとしては文句なしの性能、SLI構築で魅力アップ 以上の通り、GeForce GTX 280のグラフィックパフォーマンスをチェックしてきた。単体GPUとしては久々の新設計コアという期待もあったが、それに応える性能を持っているといって差し支えないだろう。本文中では主にGeForce 9800 GX2との比較に言及したが、シングルGPU製品であるGeForce 9800 GTXについては言及の必要を認めないほど格の違うパフォーマンスを見せた。消費電力や価格帯を考えると、GeForce 9800 GTXは別の魅力を持った製品として価値が残るとは思うが、シングルGPUのハイエンド向け製品のポジションは、完全にGeForce GTX 280へと移行することになる。 また、GPU 2個を持つGeForce 9800 GX2と好勝負を見せたことから、極論ではあるが、「フルスペックG92コアの2倍」と言って差し支えない性能を持っていることになる。ただ、単体使用時には、GeForce 9800 GX2に劣る場面を多々見られ、やや心許ない部分も見せている。 しかし、GPU 1個でここまでの性能を出せていることは、SLIにおいて大きなメリットを見せている。NVIDIA CEOのJen-Hsun Huang氏は本製品の説明会において、GT200をGeForce 9800 GX2とは異なるアプローチであるビッグサイズのシングルGPUという方向性にしたことについて、効率を重視したものだと述べた。 もちろん、これは単体でSLIを構築した状態となるGeForce 9800 GX2のオーバーヘッドの大きさを背景にしたコメントだが、GPU 1個単位でスケールアップしていけることも効率という面では大きな意味がある。そして、GPU 2個となるGeForce GTX 280のSLIが、GPU4個のGeForce 9800 GX2のQuad SLIを多くのテストで上回るという結果を示した。 前半に触れた通り、本製品の機能拡張の多くはGPGPUという、GPUの新たな活用に向けて施された面が大きい。しかし、本製品の登場は、GPUのグラフィック性能も確実に一段上に引き上げたものといえる。 □関連記事 (2008年6月17日) [Text by 多和田新也]
【PC Watchホームページ】
|