今年1月のInternational CESのDellブースでその存在が明らかにされ、3月9日のGeForce 7900/7600シリーズの発表においてNVIDIAからも正式に発表された「Quad SLI」。これまでのSLIが2個のGPUを使うのに対し、Quad SLIは文字通り4個のGPUを利用するマルチGPUシステムとなる。ここでは、このQuad SLIを採用したPCを利用して、そのパフォーマンスを検証してみたい。 ●ボード2枚をPCI Express x48相当で接続 まずは、Quad SLIで利用するビデオカードと、その仕組みを紹介しておきたい。今回の試用機はMCJが販売を行なっている「MASTERPIECE F8500A-QS」で、本製品に搭載されていたビデオカードは、特にメーカー名の記載がないNVIDIAのリファレンスカードと思われるボードである(写真1)。見てのとおり、ボード2枚をスタックした形状になっているのが特徴的で、当然ながら2スロット分を占有する。このボードのブロックダイヤグラムはNVIDIAの資料によると、2個のGPUを専用のチップを用いてPCI Express x48相当で接続している(図1)。
実際のカードを見てみると、2枚のブリッジコネクタを利用して接続していることが分かる(写真2、3)。また、このブリッジ部分のスペースが影響して、最近では珍しいフルサイズ(フルレングス)カードとなっている(写真4)。 ちなみに、このビデオカードはWindows上で「GeForce 7900 GX2」という名称で認識される(画面1)。2枚のボードで1枚のディスプレイアダプタと認識され、1GPUにつき512MBで計1GBのビデオメモリを搭載しているが、ForceWare上では512MBとして認識される。
このGeForce 7900 GX2に搭載されたGPUは、GeForce 7900のコアをベースとしたもので、GeForce 7900 GTX/GTとはコア/メモリの各クロックが異なり、具体的にはコア500MHz、メモリ1.2GHz(600MHz DDR)が定格となる(画面2)。このほか24個のピクセルシェーダ、8個のバーテックスシェーダ、16個のROPといった各ユニット数のスペックは同等である。 GeForce 7900 GX2に搭載されているGPUはPCI Express x48相当のインターフェイスを持っていることになるが、実はGeForce 7900 GTX/GTのGPUも同じなのではないだろうか。NVIDIAから明確にされておらず、あくまで筆者の推測なのだが、GeForce 7900 GTX/GTも実際にはPCI Express x48相当のインターフェイスを持っており、これをPCI Express x16で利用しているだけなのではないかと思われる。 もし、GeForce 7900シリーズとQuad SLI用GPUで別のインターフェイスを持っているとすると、当然GeForce 7900 GTX/GTとQuad SLI用で別のGPUを生産することになる。Quad SLIはエンスージアストと呼ばれる極一部のハイエンドユーザー向け製品であるため出荷数がそれほど多くないはずである。となれば、専用にGPUを生産するのはコスト面でそれに見合うとは到底考えられず、GPU自体は同じでクロックが違うのみ、と見るほうが現実的である。 さて本題に戻ると、Quad SLIは、各ボード(=各GPU)ごとにSLIコネクタが用意され、2個のブリッジコネクタを利用して接続することになる(写真5、6)。図1のダイヤグラムで上下のGPUを結ぶ2本のラインが、このブリッジコネクタに相当するわけだ。
GeForce 7900 GTX/GTはGPU 1つで1個の電源コネクタを備えているが、GeForce 7900 GX2でも電源コネクタはボートごとに備えられており(写真7)、Quad SLIでは計4個のコネクタが必要になる(写真8)。 NVIDIAの公式資料では、GeForce 7900 GX2(つまりGPU2個分)のピーク消費電力は150W、Quad SLI時は300Wとされている。ビデオカードだけで300Wという数字に驚かされる。今回の試用機ではTAO Enterprise製の750W電源が利用されており、このクラスの電源ユニットは必須といえるだろう(写真9)。 今回の試用機でGeForce 7900 GX2を使ったQuad SLI構成と、GeForce 7900 GTXを使ったSLI構成で、ワットチェッカーを使った消費電力比較を行なってみた。結果は、前者がアイドル時250W、3D描画(3DMark06のHDR/SM3.0テスト2)時は410~420Wを中心に推移し、ピークは433W。後者はアイドル時194W、3D描画時は330W前後を推移し、ピークは353Wという結果であった。GPUが2個増えていることを考えれば、意外に差は小さいという印象だが、それでも電源ユニットはSLI構成より100Wは多く見積もる必要があるだろう。 そのほか外見的特徴を挙げておくと、裏面の一部に切り欠きがある(写真10)。2枚のボードは1スロット分の隙間しかなく、下側のボードに取り付けられたクーラーの効率を上げるためだ。 このクーラーはGeForce 7800 GTX(256MB版)などで利用されていたクーラーを一回り大きくしたような形状。起動時などは4個のクーラーが大きな音をたてるものの、ForceWareによって回転数が制御されはじめると、かなり静かである。3D描画を始めてもそれほど回転数は上がらず、4個のGPUを使っているとは思えない静かさが続く。 最後にディスプレイとのインターフェイスだが、DVI×2、TV出力の構成となっている(写真11)。もちろん、GeForce 7900 GTX/GT同様に、2基ともにDualLink DVIに対応している。
●3つのSLIモードと32xアンチエイリアスをサポート SLIでは、1フレームを分割して2つのGPUで描画するSplit Frame Rendering(SPF)と、奇数/偶数フレームそれぞれを2つのGPUで分担して描画するAlternate Frame Rendering(AFR)という2つのレンダリングモードが用意されている。ForceWareには、さまざまなアプリケーションごとにプロファイルを用意し、よりアプリケーションに向いたレンダリングモードを選択して実行している。 Quad SLIも、4個のGPUに分割されるという違いはあるものの、この2つのレンダリングモードを備えている。また、これに加えて、AFR of SPFという独自のモードも持っている(図2~4)。これは、奇数/偶数フレームで分けた上で、各フレームを2分割して2つのGPUで描画するというものだ。現状のSLIで、AFRの効果が高いアプリケーションであれば、フレームごとに別のGPUで描画されるのに加えて、さらに各フレームも2個のGPUで描画が行われるため、より高い性能が期待できる。
ちなみに、従来のSLI同様に、Quad SLIでも各GPUがどのように描画を分散しているかを示すロードバランサーを表示することができるが、これは従来どおり1本の線しか表示されない(画面3)。おそらく、ビデオカード1枚あたりの描画分散を表示しているのだろう。 もう1つ、Quad SLIによって実現される機能として、32xアンチエイリアス(AA)がある。従来のSLIでは、4xAAを2個のGPUで適用する8xSLI AA、8xS AAを2個のGPUで適用する16xSLI AAが利用できたが、これに加えて8xS AAを4個のGPUで適用する32xSLI AAというモードが用意された(画面4)。当然、従来の8xSLI AAと16xSLI AAも、それぞれ2xAA、4xAAを4個のGPUで適用することになる。
画面5~9にAA適用時のスクリーンショットを掲載したが、かなり微妙な差であることが分かる。静止画にしたら判別できる程度といった印象であるのだが、このわずかの違いを堪能したいユーザーには効果がある、といったところだろうか。 ●高解像度や16xSLI AAでのみ見られる効果 それでは、Quad SLIのパフォーマンスをベンチマークソフトや3Dゲームを用いて見ていきたい。使用した環境は先に触れたとおり、MCJの「MASTERPIECE F8500A-QS」だが、HDDのみ本連載でいつも利用しているHGST製品に変更している。そのほか、主なスペックは表に示したとおりである。 ちなみに、Quad SLIの評価に使用しているForceWare 87.25はGeForce 7900 GTXを認識しなかったため、こちらはテスト時点で最新の正式版であるForceWare 84.21を使用した。 また、今回はハイエンドビデオカードのさらにその上のパフォーマンスを持つはずの製品ということもあり、本連載で普段試さない高解像度も検証している。具体的には1,920×1,600ドット、2,560×1,600ドットの2つである。ただし、アプリケーションの設定で指定が可能な場合のみテストに含めている。 ForceWareからのAA適用が可能なアプリケーションでは、両ビデオカードともに適用が可能な16xSLI AAと16x異方性フィルタを適用した場合の条件も追加した。
では、順に結果を見ていきたい。まずは、「3DMark06」(グラフ1~3)である。結果はどちらかというとGeForce 7900 GTXのほうが良い結果といえる。Quad SLIの効果が見られたのは2,560×1,600ドットの場合のみで、とくにSM2.0テストでは、2,560×1,600ドットで、かつAAを適用しなければ優位性が発揮されていない。
さらに顕著な結果を見せたのが、「3DMark05」(グラフ4)で、こちらは、2,560×1,600ドットの4xAA/16x異方性フィルタの条件でのみQuad SLIが若干上回るという程度に留まってしまった。 特に低解像度においてQuad SLIのパフォーマンスが伸び悩む傾向にあるが、その原因の1つとして考えられるのが、GeForce 7900 GTXよりも動作クロックが低い点で、これは間違いなく影響しているはずである。 もう1つ、ベンチマークの結果だけでは確信はできないものの、4個のGPUを使用することによりオーバーヘッドが増大している可能性もある。図1のダイヤグラムで分かるとおり、斜交いのGPU以外は高速なインターフェイスで直結されているとはいえ、多少のオーバーヘッド増大はあり得るだろう。
Quad SLIの効果が比較的良好に発揮されたのが、「3DMark03」(グラフ5)である。テスト条件中、もっとも描画負荷が低い1,024×768ドットのフィルタ適用なしの場合を除いて、いずれもQuad SLIが勝っている。この結果を見る限りでは、プログラマブルシェーダの処理がそれほど複雑でない方が、実はQuad SLIの描画分散が活きやすいのかもしれない。
続いては実際の3Dゲームを利用したテストで、「Splinter Cell Chaos Theory」(グラフ6)、「Far Cry」(グラフ7)、「Call of Duty 2」(グラフ8)、「F.E.A.R.」(グラフ9)、「DOOM3」(グラフ10)の結果を掲載している。 この中で、特徴的な結果を残したのがSplinter Cell Chaos Theoryである。このテストはHDRレンダリングをONにして実施しているが、低解像度の方が良い結果となったのである。同じHDRレンダリングを行なう3DMark06のHDR/SM3.0テストではこうした結果が出ていない。こうした傾向を見せるアプリケーションもあるという一例になる。 そのほかの結果は、細かいところを見れば、Far CryでなぜかHD解像度の方がフレームレートが高い傾向にあるなどの不思議な結果は見られるものの、傾向としては3DMark06のように、低解像度やフィルタの適用が少ない条件ではGeForce 7900 GTX、高解像度や負荷の大きいフィルタを適用した条件でQuad SLIの良さが出る、という結果になっている。
●ディスプレイなどにもお金をかけられる限られたゲーマー向け この通り、Quad SLIの結果をみてみると、Quad SLIなら常に最高のパフォーマンスが得られるというわけではなく、高解像度やアンチエイリアス/異方性フィルタなどを利用して高いクオリティの描画品質で利用した場合にのみ、その効果が期待できるという傾向がはっきりした。 ディスプレイ環境を考えると、アンチエイリアスなどを利用した描画品質向上への期待の方が大きいのではないだろうか。これまで4xAA程度を使っているユーザーが、Quad SLIを導入することで8xAAや16xAAといった、よりサンプル数の多いAAを適用しても、パフォーマンスの低下を抑えられるという点に大きな期待が持てる。 高解像度への期待はどうかというと、1,920×1200ドットの表示ができる液晶ディスプレイを導入しているユーザーは増えつつあるようだが、2,560×1,600ドットとなると、結構な投資が必要となる。 いずれの場合にしても、単にゲームがスムーズに動くだけでなく、より高いクオリティで楽しみたいという贅沢なニーズを満たすアイテムという位置付けといえるが、そうしたニーズを持つユーザーにとっては効果が期待できる製品であるのは間違いない。 □関連記事 (2006年5月2日) [Text by 多和田新也]
【PC Watchホームページ】
|
|