NVIDIAは3月18日(米国時間)、マルチGPUビデオカード「GeForce 9800 GX2」を発表した。こうしたマルチGPUカードは同社にとって2006年6月に発表した「GeForce 7950 GX2」以来となり、統合シェーダ採用およびDirect X10対応GPUであるGeForce 8シリーズ以降では初めての製品となる。このパフォーマンスをチェックしてみたい。 ●フルスペックのG92コアを2基搭載するビデオカード まずは、GeForce 9800 GX2のスペックについて紹介しておきたい。本製品のスペックは表1にまとめた通りで、使用されているGPUコアはGeForce 8800 GTS 512MB/8800 GTなどでも使われているG92コアである。
【表1】GeForce 9800 GX2の仕様
GeForce 9800 GX2は、このG92が持つStreaming Processor(SP) 128基、4基のROP/メモリインターフェイスクラスタをフルに使用したものを2個搭載した格好となる。イメージとしては、GeForce 8800 GTS 512MBのSLIに近いことになるが、コアクロックおよびSPクロックはGeForce 8800 GT相当にまで落とされている。 ただし、メモリに関してはリッチな仕様になっており、G92コア採用製品では現時点でもっとも高速な、2GHz(1GHz DDR)で動作するようになっている。もっともメモリインターフェイスは256bitなので、384bitメモリインターフェイスを持つG80コア採用製品に対しては、GeForce 8800 Ultraはもちろん、GeForce 8800 GTXよりも狭いことになる。 メモリはGPU 1個当たり512Mbit容量のメモリチップを8枚搭載で512MBを搭載するのが標準的な構成となる。 ●NVIDIA製品では初めて8ピン電源を搭載 今回テストに利用するのは、XFXのGeForce 9800 GX2搭載製品「GF 9800GX2 600M 1GB DDR3 DUAL DVI HDMI PCI-E(PV-T98U-ZHF9)」である(写真1)。画面1の通り定格クロックの製品で、NVIDIAのリファレンスデザインに沿った製品だ。
カードは、フルレングスサイズ、2スロット占有と、非常に大型になっている。そのデザインは特徴的で、表からはPCBがほとんど見えず、全体を直方体の入れ物で覆ったようになっている。クーラーの様子を外から伺うこともできないが、ボード後方のスリットから空気を取り入れ、ブラケット部とカード前方方向にあるスリットから排気されてくる格好となっている。熱を奪った空気の多くがケース内にも逃げる点には注意が必要となる。 騒音は、意外にもそれほど大きくは感じられない。化粧カバーで完全に覆われているからかも知れない。全体を覆うことで熱が逃げにくそうで、GPU温度は高温を推移しそうな印象を受ける。ただ、GPU温度のしきい値は摂氏105度に設定されており、NVIDIAとしてはこれで問題ないレベルと判断したのだろう。 PCI Expressスロットとは反対側の長辺部分には、端子類が配置されている(写真2)。カード後方には、6ピンと8ピンの電源端子、S/PDIF入力端子を搭載(写真3)。電源端子はGeForceシリーズでは初めて8ピンタイプを装着しており、これは両方を正しく接続しないと起動しない。Radeon HDシリーズの8ピン端子搭載製品の場合はシングルビデオカードの定格クロック動作の場合は6ピン×2個の接続でも問題なかったわけで、シングルビデオカードの利用において8ピン電源を必須とするのは初めての製品となる。
リファレンスボードの最大消費電力は197Wとされている。PCI Express x16スロット+6ピン×2で供給可能な電力を下回っているので、6ピン×2という構成でも動作可能にすることはできたのではないかと思うのだが、余裕がないのは事実であるし、SLI構成などを考えると利用可能な電源ユニットをメーカーとして認定しやすい(OEM先に提示しやすい)などの理由があると想像する。 ちなみに、8ピン端子必須という条件もあってか、電源端子部にはLEDによる状態表示機構が備わっている(写真4、5)。正常に接続された状態なら緑色に点灯し、異常がある場合には赤色で示される。また、従来のGeForceシリーズは電源端子を接続しないで起動すると、けたたましいビープ音が鳴り響いたが、本製品はLEDによる状態表示機構を備えたおかげか、ビープ音は短時間だけ鳴る、おとなしいものへと変更されている。
カード前方部に目を向けると、ここにはSLI端子が備えられている。ただし、初期状態ではカバーに覆われており、利用時のみカバーを取り外して利用する(写真6、7)。SLI端子は1個のみとなっており、これは2枚によるSLIが可能であることを示している。合計で4GPUなのでQuad SLIを構築ということだ。ただし、今回はシングルビデオカードのみでの検証とし、Quad SLIに関しては場を改めて紹介することにしたい。
ブラケット部はDVI×2とHDMIの構成である(写真8)。NVIDIA製ビデオカードとしては、初めて初期のリファレンスボードレベルでHDMI端子を備えた製品となる。ただし、GeForce 7950 GX2がそうであったように、GeForce 9800 GX2にも「マルチディスプレイモード」と「マルチGPUモード」の2つがある点に注意を要する(画面2)。
SLIを利用する際にシングルディスプレイしか利用できないことは周知の制限であるが、GeForce 9800 GX2は、2個のGPUによるSLIを1枚のビデオカードで実現しているのと同じである。そのため、パフォーマンスを向上させるために2個のGPUによる並列レンダリングを行なうマルチGPUモードを選択した場合は、1台のディスプレイしか利用できない。 マルチGPUモード時に利用できるのは、写真8の“1”と記されたDVIまたはHDMI端子で、この2つの端子の排他利用となる。一方、マルチディスプレイモードを有効にした場合、パフォーマンスは1GPU分になるが、3つの端子をすべて同時に利用できる。この点の使い勝手は決して良いものではなく、あくまでパフォーマンスを重視する人に特化した製品という見方はできる。 ちなみに、このブラケット部にも利便性を上げるLEDが組み込まれている。写真9に動作中のブラケット部を示したが、左上の青いLEDは“動作可能なHDMIを示す”ものである。1枚のビデオカードを利用する場合は大きな問題にならないが、2枚のGeForce 9800 GX2を用いたQuad SLIを利用する場合、セカンダリ側ビデオカードのHDMI端子は無効になる。その場合にセカンダリ側のHDMI端子脇の青色LEDは消灯することになるわけだ。 もう1つ、左下にあるLEDは電源ステータスLEDである。先に示した電源端子部のLEDに連動しており、正常に電源コネクタが接続されている場合は緑色、異常時には赤色に点灯する仕組みになっている。ケース外部からもチェックが可能になっているわけである。 ●2枚のPCBでクーラーを挟み込むサンドイッチ状の構造
さて、見事に化粧カバーに覆われてしまっているGeForce 9800 GX2であるが、その構造は気になるところである。図1は、NVIDIAの資料より引用したGeForce 9800 GX2の3Dモデルである。これを見ると、中央部に大型のクーラーを搭載し、2枚のPCBで挟み込む格好となっていることが分かる。 2枚のPCBを使うという手法はGeForce 7950 GX2でも同じで、NVIDIAらしい作りと言える。一方、Radeon HD 3870 X2はATI時代のデュアルGPUビデオカードもそうであった通り、1枚のPCBにGPUを2個搭載する手法を採る。実装面積、冷却面、コストなど善し悪しがありそうなポイントであり、このあたりは両メーカーのポリシーなのだろう。 もう少し詳細をチェックするため、分解してみたので紹介しておきたい。ここでは便宜上、2枚のPCBを次のように表現する。 PCB.A:HDMI端子、DVI端子1、8ピン電源端子を備えるボード まず、化粧カバーを取り外した状態が写真10と写真11に示したものだ。この状態では、各PCBに搭載された主要なチップを見ることはできない。つまり、GPUやメモリチップなどを搭載した面は、両PCBともに内側にあることになる。これはクーラーが内側にあるわけだから当然のことだ。PCBの一部が切り抜かれているのは、もちろんクーラーによる空気取り入れのためである。
側面部を見ると、PCI Express端子に近いところにフレキシブルケーブルが接続されている。これを用いて2枚のPCBを接続しているのが分かる。 続いて、PCB.Aをクーラーから取り外したのが写真12の状態である。PCB上は余白も多く、意外にすっきりした印象を残す。GPUは基板中央にある。そして、8枚のメモリチップはいずれも片面側に実装されている。このPCB.Aにはブート可能なDVI端子1とHDMI端子。そして8ピン電源を持っている。 クーラーに目を向けてみると、両面でほぼ対象に近い形状で、GPUと接触する部分は銅製になっているのが分かる(写真13)。ファンの口径は80mmと見られ、ビデオカード用としては大きいファンである印象を受ける。このあたりも騒音があまり大きく感じなかった理由になっているのだろう。 最後にPCB.Bであるが、PCB.A同様にGPUと8枚のメモリチップが搭載されているほか、PCI ExpressスイッチチップおよびPCI Expressインターフェイス、SLI端子、S/PDIF端子などを備える(写真14)。 一見するとPCB.Bのほうが重要な位置を占めているように見えるが、おそらくこちらはセカンダリ側で、ブート可能な映像出力端子を持つPCB.A側がプライマリGPUとして動作すると想像される。 2枚のPCBをつなぐフレキシブルケーブルは1本に見えるかも知れないが、実はここは2本のケーブルで接続されている(写真15)。この間には、PCI Express信号のほか、PCB.B側にあるS/PDIF入力した音声信号、SLI用の信号などが通っているはずである。 最後に搭載されているチップについて紹介しておくと、GPUはA2リビジョンのG92コア、スイッチチップはnForce 200のコードネームである「BR04」が刻印されたもの、メモリチップはSamsungの1ns品となっている(写真16~18)。 ●Radeon HD 3870 X2やGeForce 8シリーズのSLIと比較
それでは、ベンチマーク結果をお伝えしていきたい。テスト環境は表2に示した通り。マザーボードについては補足が必要であろう。今回のテストにおいては、GeForce 9800 GX2と同時に発表された、nForce 790i Ultra SLIを搭載するXFX製のマザーボードを使用している(写真19)。 nForce 790i Ultra SLIは、nForce 780i SLIの後継となるチップセットで、1,600MHz FSBやDDR3 SDRAMのサポートが大きなポイントとなる。DDR3 SDRAMを採用したチップセットはIntel製品以外では初めてとなる点で注目されるだろう。同社製品らしくオーバークロックにもこだわった製品で、同社が提唱する拡張メモリパラメータ「EPP」のDDR3 SDRAM版となる「EPP2.0」も併せて発表されており、最大でDDR3-2000相当へのクロックアップが可能とされている。 また、nForce 780i SLIでは別チップで提供されていたPCI Express 2.0インターフェイスは、SPP側に統合され、2チップのチップセットとなったのも大きな特徴だ。ただ、今回はあくまでこのマザーボードを使ってGeForce 9800 GX2のパフォーマンス評価を行なうに留め、チップセットのポテンシャルについては、近日中に機会を改めて紹介したい。 今回の主題であるGeForce 9800 GX2のドライバは、NVIDIAから提供されたForceWare 174.51を使用した。テスト終了後にForceWare 174.53も届いたのだが、これはマルチGPUモードをデフォルト設定とした点と、「Clive Barker's Jericho」のプロファイルをアップデートしたのみの変更に留まっており、ほかのパフォーマンスには影響しないとのこと。本稿のテスト結果には影響しないので、こちらのドライバはテストしていない。なお、製品発表後に、どのバージョンが提供されるかは不明である。 比較対象には、GeForce 8800 GTXリファレンスボード×2枚、GeForce 8800 GTS 512MB×2製品、Radeon HD 3870 X2リファレンスボードを用意(写真20~23)。GeForce 8800 GTXはシングルビデオカードのテストも行なう。なお、GeForce 8800 GTSはXFX製品がオーバークロック版、ZOTAC製品が定格動作版だが、定格動作によるSLIを構築している。 各製品のドライバは、現時点でWebサイトから得られる最新版を利用。GeForce 8800の各製品はnZoneで提供されているForceWare 169.44、Radeon HD 3870 X2は今月リリースされたCATALYST 8.3となる。
【表2】テスト環境
まずは、「3DMark06」(グラフ1~4)と「3DMark05」(グラフ5)の結果である。Radeon HD 3870 X2は、3DMark05の1,920×1,200ドット/4xAA/8x異方性フィルタの条件で動作しなかったため、結果は省略している。 全般に低解像度ではRadeon HD 3870 X2が優秀なスコアとなるが、描画負荷が高まることで、GeForce 9800 GX2が逆転する傾向となっている。とはいえ、描画負荷が高まると、Radeon HD 3870 X2に対してGeForce勢全体のスコアが良化しており、これはアーキテクチャの違いによるものであろう。 GeForce勢との比較では、GeForce 8800 GTX/GTS 512MBのSLIに対して、一歩劣るスコアとなった。GeForce 8800 GTXのSLIにも劣るスコアとなっているが、Feature Testの各項から、シェーダの処理能力が極端に落ちるということは感じられず、むしろもう少し良いスコアが出て良さそうな印象すら感じる。このあたり、まだドライバの熟成が足りない印象も残す。 一方、GeForce 8800 GTXのシングル構成との差は歴然としている。GPUの数こそ違うが、“NVIDIAのシングルビデオカード”という観点では、数段上のレベルへ引き上げられた格好といえるだろう。
「F.E.A.R.」(グラフ6)の結果も、Radeon HD 3870 X2に対しては描画負荷が高いほど好結果を残す傾向を見せた。しかし、フィルタ類を適用したときにGeForce 8800 GTS 512MBのSLIにも劣る結果はやや残念である。コア/SPクロックが下げられている影響は、メモリ帯域の充実をもってしても克服できていない結果といえる。
「Call of Duty 4:Modern Warfare」(グラフ7)は、GeForce 9800 GX2が良好な結果を見せたアプリケーションだ。CPUへの依存度も大きいアプリケーションではあるが、描画負荷が高いところではGPUの影響も色濃く出ている。GeForce 8800 GTS 512MBは1,920×1,200ドットのフィルタ適用条件においてスコアの低下傾向が見られる一方、GeForce 9800 GX2は全条件においてGeForce 8800 GTXのSLIと並んでトップレベルのフレームレートを出せている。Radeon HD 3870 X2との差も大きい。
「Crysis」(グラフ8)の結果も、GeForce 8800 GTX/GTS 512MBの両SLI構成には一歩劣る結果となった。しかし、SXGAの結果でも十分にGPUへの負荷が高いアプリケーションであり、誤差程度とはいえ両環境と同等以上の結果を出せた意味は大きい。また、Radeon HD 3870 X2との差も大きく、このアプリケーションのマルチGPU動作時におけるNVIDIAのアドバンテージを感じる結果だ。
「COMPANY of HEROES OPPOSING FRONTS」(グラフ9)においては、GeForce 9800 GX2が非常に優れた結果を見せている。全条件において、GeForce 8800 GTX/GTS 512MBのSLI構成を上回るフレームレートを発揮。GeForce 8800 GTX(シングル)との差においては、倍近いフレームレートとなっており、非常に高いパフォーマンスを期待できるだろう。
「World in Conflict」(グラフ10)は、まずまずといった結果である。フィルタをかけたときにGeForce 8800 GTXのSLI構成との差が顕著に表れるが、GeForce 8800 GTS 512MBよりは高い結果を見せている。過去に本稿に示した結果から、このアプリケーションにおいてはフィルタ類を適用するとメモリ容量やアクセス速度の影響が強くでやすい傾向にある。メモリ帯域幅の違いが、フィルタ適用時のスコアの明暗を分けたのだろう。 また、フィルタ類を適用したとき、Radeon HD 3870 X2は大きくスコアを落とす傾向も出ている。Radeon HD 3870 X2のSXGA/フィルタ適用条件の結果が、GeForce 9800 GX2のWUXGA/フィルタ適用条件の結果を下回るほどで、その違いは非常に大きい。
「Call of Juarez DirectX 10 Benchmark」(グラフ11)は、AMD製品が強さを見せるアプリケーションであるが、GeForce 9800 GX2も悪くない結果を見せている。しかし、描画負荷が高まるに連れて、Radeon HD 3870 X2がはっきりと強さを見せるほか、GeForce勢の序列は前半に示したアプリケーションに近くなる。ほかのアプリケーションとは、まったく異なる傾向を見せている。
「Unreal Tournament 3」(グラフ12)は、全般にGeForce 8800 GTXが好結果を残しているが、それほど大きな差は付いていないし、フィルタ適用時にはGeForce 9800 GX2が上回るシーンも見られる。描画負荷が高いシーンにおいてはGeForce 8800 GTS 512MBのSLI構成を上回る傾向にあり、まずまずの結果を見せている。
「LOST PLANET EXTREME CONDITION」(グラフ13)はUnreal 3とは逆に、フィルタを適用しない方がGeForce 8800 GTXのSLI構成よりも良好な結果を見せる。劣っている部分でも、差は誤差程度であり、同等レベルと言って差し支えないだろう。GeForce 8800 GTS 512MBも似たようなスコアになっている。GeForce 9800 GX2が優れた結果を残したアプリケーションの1つである。
最後に消費電力測定の結果(グラフ14)である。シングルビデオカードとしては、GeForce 8800 GTXを超える消費電力になっているが、GPUが2個になったことを考えれば、むしろよく抑制されている印象を受ける。 GeForce 8800 GTX/GTS 512MBの両SLI構成と比較すると明確に消費電力は抑制されている。ただ、GeForce 8800 GTXは90nmプロセス、GeForce 8800 GTS 512MBはコアクロックが高い、とそれぞれ差がつく要素もあり、この結果はシングルビデオカードにまとめたメリットとは言い切れない。 Radeon HD 3870 X2との比較では、アイドル時はPowerPlayの効果もあってRadeon HD 3870 X2が極めて低い消費電力に収まっているが、ピーク時ではGeForce 9800 GX2と同等レベルになる。パフォーマンスではGeForce 9800 GX2が優れる傾向を見せているので、消費電力とパフォーマンスのバランスにおいては、GeForce 9800 GX2がアドバンテージを握った格好だ。
●パフォーマンスはまずまず。消費電力も良好 以上の結果を最後にまとめてみたい。まず、シングルビデオカードという観点で見ると、GeForce 8800 GTXとの差は明確で、非常に大きなパフォーマンス増を示す。これほどの差がついていれば、GeForce 8800 Ultraを上回ることも確実で、NVIDIAのシングルビデオカードとしては最高性能に位置付けられるだろう。 そして、同じマルチGPU搭載のシングルビデオカードであるRadeon HD 3870 X2に対しても、ほとんどのアプリケーションにおいてパフォーマンスで上回る結果となった。特に描画負荷が高まったときにGeForce 9800 GX2がアドバンテージを広げる傾向にあり、このようなハイエンドゲーマーに特化したビデオカード製品において魅力的だ。 ただ、GeForce 8800シリーズのSLI環境に対しては、一長一短の傾向を見せた。特に、GeForce 8800 GTXのSLI環境に対しては一歩劣る印象を否めない。当然、この上のGeForce 8800 Ultraにも劣ることは確実なわけで、デュアルGPU環境の3Dパフォーマンスという視点では、まだまだG80コアの性能は健在だ。 同じG92コアを持ち、コアクロックが高く、メモリクロックが低い、GeForce 8800 GTS 512MBのSLI構成とは、アプリケーションによる善し悪しが出た。全般にGeForce 8800 GTS 512MBが一歩リードしている傾向にはあり、特に古めのアプリケーションでコアクロックが低いことの影響が色濃く出ている。 しかし、新しいアプリケーションにおいてはGeForce 9800 GX2が良好な結果を見せる場面が多い。ただ、あまりにアプリケーションによって傾向が異なり過ぎるという印象も感じており、最近のアプリケーションで揃って良い結果を見せたのは、ドライバの違いが影響した可能性も考えられる。まだまだ改善の可能性はあるのではないだろうか。 価格は8万円台が予想されている。GeForce 8800 GTS 512MBを2枚買ってもやはり8万前後の価格帯になることや、Radeon HD 3870 X2は6万円前後が相場になっていることを考えると、高価な製品であることは間違いない。1ボードに集約されたことによるコストメリットは感じない価格設定であり、この点において本製品のインパクトは大きく下がってしまっている。すでにGeForce 8世代のビデオカードでSLIを構築しているユーザーに対して、積極的な買い換えを促すのは難しいだろう。 しかし、本製品の場合、2GPUを1枚のビデオカードに集約したことで、GeForce 8800 GTS 512MBでは構築不可能なQuad SLIが実現できるというメリットがある。しかもGeForce 8800 GTX/Ultraの3-way SLIよりも安価に収まる。また、大画面TVに出力しやすいようHDMI端子を備えるといった機能面の魅力もある。 消費電力の面でも、デュアルGPUとしては抑制されている印象を受けた。8ピン電源端子を必須とする点で、導入には障害もあるわけだが、単品で強いインパクトがない本製品を購入する人は、最初から導入するか後々拡張するかはともかく、Quad SLIを意識する人が多いと思う。そうなれば、高出力の電源ユニットへの買い換えが必要になるユーザーも少なくないだろう。このタイミングで8ピン端子を持つ電源ユニットを買えば良いわけで、現在では多くの大容量電源が8ピン端子を備えていることを考えれば、ハイエンド製品導入のための妥協すべきポイントといえる。 DirectX 10世代のGeForceとしては唯一Quad SLIを構築できるうえ、3-way SLIよりも高いコストパフォーマンスを持つ可能性があり、とことんハイエンドを追求する層にとっては大きな魅力を持った製品に映るのではないだろうか。 □関連記事 (2008年3月19日) [Text by 多和田新也]
【PC Watchホームページ】
|