多和田新也のニューアイテム診断室

4個のGPUを使う新SLIシステム「Quad SLI」




 今年1月のInternational CESのDellブースでその存在が明らかにされ、3月9日のGeForce 7900/7600シリーズの発表においてNVIDIAからも正式に発表された「Quad SLI」。これまでのSLIが2個のGPUを使うのに対し、Quad SLIは文字通り4個のGPUを利用するマルチGPUシステムとなる。ここでは、このQuad SLIを採用したPCを利用して、そのパフォーマンスを検証してみたい。

●ボード2枚をPCI Express x48相当で接続

 まずは、Quad SLIで利用するビデオカードと、その仕組みを紹介しておきたい。今回の試用機はMCJが販売を行なっている「MASTERPIECE F8500A-QS」で、本製品に搭載されていたビデオカードは、特にメーカー名の記載がないNVIDIAのリファレンスカードと思われるボードである(写真1)。見てのとおり、ボード2枚をスタックした形状になっているのが特徴的で、当然ながら2スロット分を占有する。このボードのブロックダイヤグラムはNVIDIAの資料によると、2個のGPUを専用のチップを用いてPCI Express x48相当で接続している(図1)。

【写真1】Quad SLIシステムで利用される2枚のGPUを搭載するビデオカード「GeForce 7900 GX2」 【図1】Quad SLIのブロックダイヤグラム。ビデオカード1枚あたりで2個のGPUを搭載し、その間をPCI Express x48相当で接続する。さらに、そのビデオカードを2本のインターフェイスで接続する仕組みだ

 実際のカードを見てみると、2枚のブリッジコネクタを利用して接続していることが分かる(写真2、3)。また、このブリッジ部分のスペースが影響して、最近では珍しいフルサイズ(フルレングス)カードとなっている(写真4)。

 ちなみに、このビデオカードはWindows上で「GeForce 7900 GX2」という名称で認識される(画面1)。2枚のボードで1枚のディスプレイアダプタと認識され、1GPUにつき512MBで計1GBのビデオメモリを搭載しているが、ForceWare上では512MBとして認識される。

【写真2】2枚のブリッジコネクタによって接続される2枚のボード。下側のボードのクーラー下にチップが見えるが、これがPCI Express x48でリンクするためのチップのようだ。PCI Express x16へも、このチップからパターンが伸びている 【写真3】実はもう1カ所、2枚のボードを接続している所がある。現時点で、これに関する回答をNVIDIAから得られていないのだが、電源ON/OFFの同期や温度センサーなど、データインターフェイスとは別の役割があると想像される
【写真4】GeForce 7900 GX2は現在では珍しいフルサイズカードとなっている。写真奥のGeForce 7900 GTXと比較すると、その長さの違いがよく分かる 【画面1】Windows上で認識するビデオカード名は「GeForce 7900 GX2」となる。なお、今回使用するドライバはQuad SLIの評価用に提供されたForceWare 87.25である

【画面2】GeForce 7900 GX2の定格クロックはコア500MHz、メモリ1.2GHz(600MHz DDR)となるが、今回の試用機ではメモリが1.21GHz(605MHz DDR)となっていた

 このGeForce 7900 GX2に搭載されたGPUは、GeForce 7900のコアをベースとしたもので、GeForce 7900 GTX/GTとはコア/メモリの各クロックが異なり、具体的にはコア500MHz、メモリ1.2GHz(600MHz DDR)が定格となる(画面2)。このほか24個のピクセルシェーダ、8個のバーテックスシェーダ、16個のROPといった各ユニット数のスペックは同等である。

 GeForce 7900 GX2に搭載されているGPUはPCI Express x48相当のインターフェイスを持っていることになるが、実はGeForce 7900 GTX/GTのGPUも同じなのではないだろうか。NVIDIAから明確にされておらず、あくまで筆者の推測なのだが、GeForce 7900 GTX/GTも実際にはPCI Express x48相当のインターフェイスを持っており、これをPCI Express x16で利用しているだけなのではないかと思われる。

 もし、GeForce 7900シリーズとQuad SLI用GPUで別のインターフェイスを持っているとすると、当然GeForce 7900 GTX/GTとQuad SLI用で別のGPUを生産することになる。Quad SLIはエンスージアストと呼ばれる極一部のハイエンドユーザー向け製品であるため出荷数がそれほど多くないはずである。となれば、専用にGPUを生産するのはコスト面でそれに見合うとは到底考えられず、GPU自体は同じでクロックが違うのみ、と見るほうが現実的である。

 さて本題に戻ると、Quad SLIは、各ボード(=各GPU)ごとにSLIコネクタが用意され、2個のブリッジコネクタを利用して接続することになる(写真5、6)。図1のダイヤグラムで上下のGPUを結ぶ2本のラインが、このブリッジコネクタに相当するわけだ。

【写真5】図1で示した通り、2枚のGeForce 7900 GX2は2個のブリッジコネクタで接続されることになるため、SLIコネクタも2つ用意されている 【写真6】SLIブリッジを実際に接続した様子。上側のGPU同士、下側のGPU同士がそれぞれ接続される格好だ

 GeForce 7900 GTX/GTはGPU 1つで1個の電源コネクタを備えているが、GeForce 7900 GX2でも電源コネクタはボートごとに備えられており(写真7)、Quad SLIでは計4個のコネクタが必要になる(写真8)。

 NVIDIAの公式資料では、GeForce 7900 GX2(つまりGPU2個分)のピーク消費電力は150W、Quad SLI時は300Wとされている。ビデオカードだけで300Wという数字に驚かされる。今回の試用機ではTAO Enterprise製の750W電源が利用されており、このクラスの電源ユニットは必須といえるだろう(写真9)。

【写真7】GeForce 7900 GX2はボード1枚ごとにGPUとビデオメモリを搭載しているので、一般的なハイエンドビデオカードに匹敵する電力消費が発生する。よって電源コネクタもボード1枚ごとに必要となる 【写真8】奥行きに余裕のないフルサイズカードのため、電源コネクタは横向きに備えられている 【写真9】試用機に使用されていた電源は、TAO Enterpriseの750W電源「TAO-750P7」

 今回の試用機でGeForce 7900 GX2を使ったQuad SLI構成と、GeForce 7900 GTXを使ったSLI構成で、ワットチェッカーを使った消費電力比較を行なってみた。結果は、前者がアイドル時250W、3D描画(3DMark06のHDR/SM3.0テスト2)時は410~420Wを中心に推移し、ピークは433W。後者はアイドル時194W、3D描画時は330W前後を推移し、ピークは353Wという結果であった。GPUが2個増えていることを考えれば、意外に差は小さいという印象だが、それでも電源ユニットはSLI構成より100Wは多く見積もる必要があるだろう。

 そのほか外見的特徴を挙げておくと、裏面の一部に切り欠きがある(写真10)。2枚のボードは1スロット分の隙間しかなく、下側のボードに取り付けられたクーラーの効率を上げるためだ。

 このクーラーはGeForce 7800 GTX(256MB版)などで利用されていたクーラーを一回り大きくしたような形状。起動時などは4個のクーラーが大きな音をたてるものの、ForceWareによって回転数が制御されはじめると、かなり静かである。3D描画を始めてもそれほど回転数は上がらず、4個のGPUを使っているとは思えない静かさが続く。

 最後にディスプレイとのインターフェイスだが、DVI×2、TV出力の構成となっている(写真11)。もちろん、GeForce 7900 GTX/GT同様に、2基ともにDualLink DVIに対応している。

【写真10】GeForce 7900 GX2の裏面。クーラーのブロアファンによる空気の流れをよくするため、裏面に切り欠きが設けられている 【写真11】ブラケット部はGeForce 7900 GTX/GTなどと同じ、いわゆるDual DualLink DVIとビデオ出力となる

●3つのSLIモードと32xアンチエイリアスをサポート

 SLIでは、1フレームを分割して2つのGPUで描画するSplit Frame Rendering(SPF)と、奇数/偶数フレームそれぞれを2つのGPUで分担して描画するAlternate Frame Rendering(AFR)という2つのレンダリングモードが用意されている。ForceWareには、さまざまなアプリケーションごとにプロファイルを用意し、よりアプリケーションに向いたレンダリングモードを選択して実行している。

 Quad SLIも、4個のGPUに分割されるという違いはあるものの、この2つのレンダリングモードを備えている。また、これに加えて、AFR of SPFという独自のモードも持っている(図2~4)。これは、奇数/偶数フレームで分けた上で、各フレームを2分割して2つのGPUで描画するというものだ。現状のSLIで、AFRの効果が高いアプリケーションであれば、フレームごとに別のGPUで描画されるのに加えて、さらに各フレームも2個のGPUで描画が行われるため、より高い性能が期待できる。

【図2】各フレームを四つに分割し4個のGPUで描画するSplit Frame Rendering(SPF) 【図3】4個のGPUが各フレームを順番に描画していくAlternate Frame Rendering(AFR) 【図4】奇数/偶数の各フレームを、さらに2分割して描画するAFR of SFR

 ちなみに、従来のSLI同様に、Quad SLIでも各GPUがどのように描画を分散しているかを示すロードバランサーを表示することができるが、これは従来どおり1本の線しか表示されない(画面3)。おそらく、ビデオカード1枚あたりの描画分散を表示しているのだろう。

 もう1つ、Quad SLIによって実現される機能として、32xアンチエイリアス(AA)がある。従来のSLIでは、4xAAを2個のGPUで適用する8xSLI AA、8xS AAを2個のGPUで適用する16xSLI AAが利用できたが、これに加えて8xS AAを4個のGPUで適用する32xSLI AAというモードが用意された(画面4)。当然、従来の8xSLI AAと16xSLI AAも、それぞれ2xAA、4xAAを4個のGPUで適用することになる。

【画面3】ロードバランサーを表示させてみると、線は1本で二分割しかされていないことが分かる。GPUは4個だが、ビデオカード自体は2枚なので、こうした表現になっているのだろう 【画面4】Quad SLIでは、従来のSLIで提供されていた8xSLI、16xSLIに加え、8xS AAを4個のGPUで適用する32xS AAが追加されている

 画面5~9にAA適用時のスクリーンショットを掲載したが、かなり微妙な差であることが分かる。静止画にしたら判別できる程度といった印象であるのだが、このわずかの違いを堪能したいユーザーには効果がある、といったところだろうか。

【画面5】3DMark03 Game Test4の1665フレーム目。これはAAを適用していない場合 【画面6】GeForce 7900 GX2を使い、8xS AAを適用した場合。これがシングルGPUでも適用可能な最多サンプル数のAAとなる 【画面7】GeForce 7900 GX2を使い、8xSLI AAを適用した場合
【画面8】GeForce 7900 GX2を使い、16xSLI AAを適用した場合 【画面9】GeForce 7900 GX2を使い、32xS SLI AAを適用した場合

●高解像度や16xSLI AAでのみ見られる効果

 それでは、Quad SLIのパフォーマンスをベンチマークソフトや3Dゲームを用いて見ていきたい。使用した環境は先に触れたとおり、MCJの「MASTERPIECE F8500A-QS」だが、HDDのみ本連載でいつも利用しているHGST製品に変更している。そのほか、主なスペックは表に示したとおりである。

 ちなみに、Quad SLIの評価に使用しているForceWare 87.25はGeForce 7900 GTXを認識しなかったため、こちらはテスト時点で最新の正式版であるForceWare 84.21を使用した。

 また、今回はハイエンドビデオカードのさらにその上のパフォーマンスを持つはずの製品ということもあり、本連載で普段試さない高解像度も検証している。具体的には1,920×1,600ドット、2,560×1,600ドットの2つである。ただし、アプリケーションの設定で指定が可能な場合のみテストに含めている。

 ForceWareからのAA適用が可能なアプリケーションでは、両ビデオカードともに適用が可能な16xSLI AAと16x異方性フィルタを適用した場合の条件も追加した。

【表】テスト環境
  GeForce 7900 GX2×2(Quad SLI) GeForce 7900 GTX(SLI)
VGA Driver ForceWare 87.25 ForceWare 84.21
マザーボード MSI K8N Diamond Plus(nForce4 SLI X16)
CPU Athlon 64 FX-60
メモリ PC3200 DDR SDRAM 1GB×2(CL=3)
HDD HGST Deskstar T7K250(HDT722525DLA380)
OS Windows XP Professional(ServicePack 2/DirectX 9.0c)

 では、順に結果を見ていきたい。まずは、「3DMark06」(グラフ1~3)である。結果はどちらかというとGeForce 7900 GTXのほうが良い結果といえる。Quad SLIの効果が見られたのは2,560×1,600ドットの場合のみで、とくにSM2.0テストでは、2,560×1,600ドットで、かつAAを適用しなければ優位性が発揮されていない。

【グラフ1】3DMark06 Build 1.0.2
【グラフ2】3DMark06 Build 1.0.2(SM2.0)
【グラフ3】3DMark06 Build 1.0.2(HDR/SM3.0)

 さらに顕著な結果を見せたのが、「3DMark05」(グラフ4)で、こちらは、2,560×1,600ドットの4xAA/16x異方性フィルタの条件でのみQuad SLIが若干上回るという程度に留まってしまった。

 特に低解像度においてQuad SLIのパフォーマンスが伸び悩む傾向にあるが、その原因の1つとして考えられるのが、GeForce 7900 GTXよりも動作クロックが低い点で、これは間違いなく影響しているはずである。

 もう1つ、ベンチマークの結果だけでは確信はできないものの、4個のGPUを使用することによりオーバーヘッドが増大している可能性もある。図1のダイヤグラムで分かるとおり、斜交いのGPU以外は高速なインターフェイスで直結されているとはいえ、多少のオーバーヘッド増大はあり得るだろう。

【グラフ4】3DMark05 Build 1.2.0

 Quad SLIの効果が比較的良好に発揮されたのが、「3DMark03」(グラフ5)である。テスト条件中、もっとも描画負荷が低い1,024×768ドットのフィルタ適用なしの場合を除いて、いずれもQuad SLIが勝っている。この結果を見る限りでは、プログラマブルシェーダの処理がそれほど複雑でない方が、実はQuad SLIの描画分散が活きやすいのかもしれない。

【グラフ5】3DMark03 Build 3.6.0

 続いては実際の3Dゲームを利用したテストで、「Splinter Cell Chaos Theory」(グラフ6)、「Far Cry」(グラフ7)、「Call of Duty 2」(グラフ8)、「F.E.A.R.」(グラフ9)、「DOOM3」(グラフ10)の結果を掲載している。

 この中で、特徴的な結果を残したのがSplinter Cell Chaos Theoryである。このテストはHDRレンダリングをONにして実施しているが、低解像度の方が良い結果となったのである。同じHDRレンダリングを行なう3DMark06のHDR/SM3.0テストではこうした結果が出ていない。こうした傾向を見せるアプリケーションもあるという一例になる。

 そのほかの結果は、細かいところを見れば、Far CryでなぜかHD解像度の方がフレームレートが高い傾向にあるなどの不思議な結果は見られるものの、傾向としては3DMark06のように、低解像度やフィルタの適用が少ない条件ではGeForce 7900 GTX、高解像度や負荷の大きいフィルタを適用した条件でQuad SLIの良さが出る、という結果になっている。

【グラフ6】Splinter Cell Chaos Theory
【グラフ7】Far Cry
【グラフ8】Call of Duty 2
【グラフ9】F.E.A.R.
【グラフ10】DOOM3

●ディスプレイなどにもお金をかけられる限られたゲーマー向け

 この通り、Quad SLIの結果をみてみると、Quad SLIなら常に最高のパフォーマンスが得られるというわけではなく、高解像度やアンチエイリアス/異方性フィルタなどを利用して高いクオリティの描画品質で利用した場合にのみ、その効果が期待できるという傾向がはっきりした。

 ディスプレイ環境を考えると、アンチエイリアスなどを利用した描画品質向上への期待の方が大きいのではないだろうか。これまで4xAA程度を使っているユーザーが、Quad SLIを導入することで8xAAや16xAAといった、よりサンプル数の多いAAを適用しても、パフォーマンスの低下を抑えられるという点に大きな期待が持てる。

 高解像度への期待はどうかというと、1,920×1200ドットの表示ができる液晶ディスプレイを導入しているユーザーは増えつつあるようだが、2,560×1,600ドットとなると、結構な投資が必要となる。

 いずれの場合にしても、単にゲームがスムーズに動くだけでなく、より高いクオリティで楽しみたいという贅沢なニーズを満たすアイテムという位置付けといえるが、そうしたニーズを持つユーザーにとっては効果が期待できる製品であるのは間違いない。

□関連記事
【3月10日】MCJ、GeForce 7900をQuad SLIで搭載したハイエンドPC
http://pc.watch.impress.co.jp/docs/2006/0310/nvidia.htm
【3月10日】MCJ、GeForce 7900をQuad SLIで搭載したハイエンドPC
http://pc.watch.impress.co.jp/docs/2006/0310/mcj.htm

バックナンバー

(2006年5月2日)

[Text by 多和田新也]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2006 Impress Corporation, an Impress Group company. All rights reserved.