多和田新也のニューアイテム診断室

本格的マルチGPUカード時代の幕を開く
「ATI Radeon HD 3870 X2」




 ATIは1月28日、同社のRadeon HDシリーズのラインナップを拡充。2007年のSpiderプラットフォーム発表時に予告されていた「Radeon HD 3870 X2」を正式にリリースした。すでにいくつかのベンダーが製品を発表しているほか、秋葉原では発売が開始されている。ここでは、本製品のパフォーマンスをチェックしてみたい。

●PCI Expressスイッチを介して2基のGPUを接続

 以前にも、ビデオカードメーカーの独自設計により、1枚のボードに複数のGPUを載せるビデオカードはあった。しかし、GPUメーカーが正式に発表したマルチGPUビデオカードを振り返ってみると、NVIDIAが「GeForce 7950 GX2」を発表した2006年6月が最後になる。さらにAMD(旧ATI)に限定すると、'99年11月に発表された「RAGE Fury MAXX」まで遡ることになる。

 一方で、ATI CrossFireやNVIDIA SLIなど複数のビデオカードを利用して描画を行なう技術は浸透が進んできた。昨今のGPUは大規模化して、消費電力/発熱が問題視されているのは周知の通りだ。今後、GPU 1個当たりのトランジスタの増加を抑え、いよいよ熟成されてきているマルチGPU技術を利用し、複数のGPUで性能を向上させるという方向性が検討され始めている。その先駆けともなる製品が「Radeon HD 3870 X2」である。

 このRadeon HD 3870 X2の主な仕様は表1にまとめた通りであるが、簡単にいえば「Radeon HD 3870を2基搭載し、より高いクロックで動作させたもの」ということになる。とはいえ、いわば“純正マルチGPUビデオカード”とも呼ぶべき製品のわりに、本製品に関する情報が少なかったので、今回はリファレンスカードのクーラーを取り外して様子を見てみることにした。

【表1】Radeon HD 3870 X2の主な仕様
  ATI Radeon HD 3870 X2 ATI Radeon HD 3870
コアクロック 825MHz以上 775MHz以上
SP数 320基×2 320基
テクスチャユニット数 16基×2 16基
メモリ容量 512MB×2 512MB
メモリクロック 1.8GHz(900MHz DDR) 2.25GHz(1.125GHz DDR)
メモリインターフェイス 256bit 256bit
ROPユニット数 16基×2 16基

 その状態が写真1と写真2である。表面にはGPU(Radeon HD 3870)を2基搭載するのに加え、その間に1つのチップが配されている。これは、PLX TechnologyのPCI Expressスイッチチップ「PEX8547」である(写真3)。PEX8547の仕様を見ると、48レーン/3ポートのPCI Expressスイッチとあるので、GPU×2とチップセットでそれぞれPCI Express x16で接続する格好となるようである。

【写真1】Radeon HD 3870 X2リファレンスカードのクーラーを外した表面 【写真2】同じく裏面。こちら側にもメモリが実装されている 【写真3】PCI Express Rev.1.1準拠のPCI Expressスイッチである、PLX Technology「PEX8547」を介して、2基のGPUを接続している

【画面1】CATALYST Control CenterのInfomation画面。現在のバス設定はPCI Express 2.0 x16と表示されている。ほか、コアクロック825MHz、メモリクロック901MHzは、ほぼ定格通り

 ただし、PEX8547は製品情報のWebサイトなどを見ると「PCI Express Revision 1.1に準拠」とある。原稿執筆時点でAMDから得ている情報では、Radeon HD 3870 X2はPCI Express 2.0インターフェイスを持つという記載があるほか、CATALYST Control CenterでもPCI Express 2.0 x16で動作している旨の表示がなされる(画面1)。

 ドライバは単なる表示の問題という可能性もあるが、PCI Expressスイッチの側はPCI Express 2.0に対応していないのは事実で、仕様表記と実際のハードウェアに相違がある。

 PCI Express 1.1インターフェイスをオーバークロック駆動でカバーしているnForce 780i SLIのような例もあるが、これはチップセット間インターフェイスの話でありビデオカードとのインターフェイスはPCI Express 2.0をサポートするnForce 200を搭載している。Radeon HD 3870 X2も同じように倍速駆動などの仕組みでPCI Express 2.0相当で動作させているのかも知れないが、このあたり本製品のPCI Express仕様には疑問が残る。

 もっとも、このPCI Expressスイッチは汎用的なものを使っているというのも大きなポイントで、単純にPCI Express 2.0対応のもの(PLXでいえば、PEX86xxシリーズ)に変えるだけで、PCI Express 2.0対応は可能と思われる。実際、検証などに時間は要するだろうが、第1四半期中にもPCI Express 2.0対応スイッチ搭載品が登場することが明らかにされている。

【写真4】使用されているメモリは、SamsungのGDDR3メモリ「K4J52324QE-BJ1A」

 もう1つ、メモリに関しても触れておきたい。リファレンスボードに搭載されているメモリは、SamsungのGDDR3メモリ「K4J52324QE-BJ1A」(写真4)で、これが表面に8枚、裏面に8枚搭載されている。といっても、それぞれのGPUに接続されるメモリチップが表面に4枚、裏面に4枚搭載されているといった方が適切であろう。各メモリチップは32bitのメモリインターフェイスなので、各GPUが計256bitのメモリインターフェイスを持つ、ということでRadeon HD 3870のスペック通りになる。

 これらをまとめると、Radeon HD 3870 X2は図1に記したような構造になると想像される。マスター/スレーブの表現は便宜的に用いているものだが、2基のGPUでそれぞれレンダリングした結果を、マスター側GPUからディスプレイに出力する格好になる。

 2基のGPUの接続には、汎用的なPCI Expressスイッチを使っているだけで、描画結果のコンポジットなどを行なう専用ハードウェアは実装していない。1枚のボードにまとめてはいるが、仕組みとしては限りなくNative CrossFireに近いことになる。おそらく、GPU内部でもドライバでも、Native CrossFireに近い処理を行なっているのだろう。

【図1】リファレンスボードから推測したRadeon HD 3870 X2の構造

 さて、続いてはリファレンスボードの外観をチェックしていきたい。Rubyのドアップが描かれた化粧カバーを持つクーラーが、ほぼボード全面を覆い、ボード長はRadeon HD 3870に比べて大幅に増した(写真5、6)。ケースの奥行きには注意が必要になるだろうが、GeForce 8800 GTXとほぼ同じ長さなので、それが利用できる実績を調査すれば利用可能なケースの参考になりそうである。

【写真5】Radeon HD 3870 X2のリファレンスカード。余談ではあるが、化粧カバーに描かれているRubyは、どの角度から見ても目がこちらを向いているように見えるのが面白い 【写真6】ボード長の比較。左から順にGeForce 8800 GTX、Radeon HD 3870 X2、Radeon HD 3870に並べている。Radeon HD 3870 X2はGeForce 8800 GTXより1~2mmほど長い程度

 GPUクーラーは化粧カバーに完全に覆われているが、ブロアタイプのファンと、スカイブ加工によって製造されたヒートシンクを各GPUに装着する構造になっている(写真7)。このヒートシンクは、先に示した図で表現するところのマスター側が銅製、スレーブ側がアルミ製になっている。ファンに近い側という点もあるが、その役割の差が発熱量にも違いを及ぼしているのかも知れない。

 ボード末端部には外部電源端子を装備。8ピンと6ピンを1基ずつ搭載する構成で、これはRadeon HD 2900 XT以来ということになる(写真8)。Radeon HD 2900 XTの場合は、シングルビデオカード時は6ピン×2で動作可能で、CrossFire時に6ピンと8ピンを接続する必要があったわけだが、Radeon HD 3870 X2の場合も同様である。

【写真7】Radeon HD 3870 X2のリファレンスカードに搭載されていたGPUクーラー。ヒートシンクはスカイブ加工されたもので、ブラケットに近い側が銅製、もう一方がアルミ製になっている 【写真8】ボード末端に近い箇所には、8ピンと6ピンの外部電源端子を装備。ビデオカード1枚で使用する場合は、6ピン×2を接続すれば動作可能

 ここで、先に消費電力測定の結果をお伝えしておくと、3DMark06実行中に、GeForce 8800 GTXよりも30Wほど多く電力を消費する結果となった(グラフ1)。アイドル時はPower Playの効果もあるのか、GeForce 8800 GTXよりも低い結果となっている。ただ、先に示した画面1でも分かる通り、今回テストに使用したドライバはATI OverDriveに対応しておらず、どこまでクロックが下がっているのかは確認できない。

【グラフ1】消費電力

 ちなみに、8ピン電源コネクタはオーバークロック時やCrossFire構築の際に必要になる。このCrossFireへの対応として、本製品はNative CrossFire端子を1基備えている(写真9)。Radeon HD 3870 X2は2枚を用いたCrossFireに対応しており、これで4 GPUの並列レンダリングが行なえるようになる。今回はビデオカードが1枚しかないためテストは行なえていないが、このパフォーマンスも興味をそそられるものがある。

 ブラケット部はDVI×2とビデオ出力の標準的な構成である(写真10)。この出力の仕様は、Radeon HD 3870と変わっていない。

【写真9】Native CrossFire端子を1つ備えており、2枚使用することで4 GPUによるCrossFire Xを構築できる 【写真10】ブラケット部はDVI×2、ビデオ出力を装備。DVI→HDMIドングルによる映像と音声の出力や、DualLink出力時にHDCPをサポートする点などはRadeon HD 3870と同様

●デュアルGPUによるパフォーマンス増加をチェック

 それでは、ベンチマーク結果を紹介したい。環境は表2に示した通りで、Radeon HD 3870とGeForce 8800 GTXを比較対象とした。Radeon HD 3870とGeForce 8800 GTXは原稿執筆時点で最新の公開ドライバを使用している。

 Radeon HD 3870 X2は検証用に提供されたドライバを2種類試している。1つは2008年1月16日の日付が入ったドライバパッケージで、グラフ中はこれを「OLD」と表記。もう1つは2008年1月23日の日付入った、より新しいドライバパッケージで、こちらは「New」と表記する。

【表2】テスト環境
GPU ATI Radeon HD 3870 X2 ATI Radeon HD 3870 GeForce 8800 GTX
ビデオドライバ Driver Package Version.
【New】8.451.2-080123a-058516E-ATI
【OLD】8.451.2-080116a-057935E-ATI
CATALYST 8.1(Driver Package Version.
8.451-071220a1-0577724C-ATI)
ForceWare 169.25
CPU Core 2 Extreme QX6850
マザーボード ASUSTeK P5K PRO(Intel P35)
メモリ PC2-6400 DDR2 SDRAM(1GB×2/5-5-5-18)
HDD Seagete Barracuda 7200.10(ST3250620AS)
OS Windows Vista Ultimate

 では、まずは「3DMark06」(グラフ2~5)と「3DMark05」(グラフ6)の結果から見ていきたい。結果は1枚のビデオカードとしては見事としか言いようのないスコアを出している。特に解像度やフィルタの条件が厳しくなったり、負荷が大きいHDR/SM3.0テストで、ほかのビデオカードとの差を広げており、高クオリティにおいてもパフォーマンス低下が少ないのが好印象だ。

 また、細かいところでは、Feature TestにおけるVertex Shaderの性能が極めて優れており、GeForce 8800 GTXに対して3倍前後というスコア差をつけている。Radeon HD 3870に対しても2倍以上のスコアを出している箇所が見られており、2基のGPUを連携させることによる相乗効果も出ているようである。

 ただ、全般に、誤差程度ではあるものの、Newドライバのほうがスコアが低めである点は気になるポイントになっている。

【グラフ2】3DMark06 Build 1.1.0
【グラフ3】3DMark06 Build 1.1.0(SM2.0)
【グラフ4】3DMark06 Build 1.1.0(HDR/SM3.0)
【グラフ5】3DMark06 Build 1.1.0(Feature Test)
【グラフ6】3DMark05 Build 1.3.0

 「F.E.A.R.」(グラフ7)も、Radeon HD 3870との比較では大きいところで1.8倍前後のスコアを出しており、2基のGPUが効果的に使用されている印象を受ける。GeForce 8800 GTXとは低解像度でこそ肉薄を許すものの、描画負荷が高まると差を広げる傾向が明確に出ている。

【グラフ7】F.E.A.R.(Patch v1.08)

 「Crysis」(グラフ8)は、ドライバの違いが大きく表れたテストだ。OLDドライバではマルチGPU化の効果があまりなく、GeForce 8800 GTXにも大きく劣る結果となっているが、Newドライバを利用することで、OLDドライバから40%以上の性能アップ。GeForce 8800 GTXに対しても、12~20%程度のアドバンテージを握っている。

 このNewドライバがCrysisに対する最適化を施していることは間違いない。描画負荷が極めて高いCrysisで、より高いパフォーマンスを発揮できることが見て取れるのは好ましい結果といえる。

【グラフ8】Crysis(Patch v1.1)

 「COMPANY of HEROES OPPOSING FRONTS」(グラフ9)は、低解像度でGeForce 8800 GTXが強いが、高解像度でRadeon HD 3870 X2が盛り返しを見せる結果となった。Radeon HD 3870 X2は1,920×1,200ドットの解像度でも落ち込みが小さいのが特徴的といえる。ただ、実用範囲は1,600×1,200ドット辺りで、この辺りのパフォーマンス差は大きくない。

 また、New/OLDドライバの差を見ても、一部で逆転している条件があるものの、おおむねNewドライバのほうが良好な傾向を見せている。特にフィルタ類を適用したときのパフォーマンスの伸びが大きいのが好印象だ。

【グラフ9】COMPANY of HEROES OPPOSING FRONTS(Patch v2.201)

 「World in Conflict」(グラフ10)は、フィルタをかけるとRadeon勢がスコアを大幅に落とすのが印象的な結果となった。Radeon HD系ではアプリケーションによって、フィルタ類をかけることでフレームレートが顕著に落ちる所作を見せることがある。このアプリケーションも、そうした例といえるだろう。

 だが、ほかのアプリケーションの結果から見ると、あまりに落ち込みが大きい印象を受ける。さらにNewドライバでは、この落ち込みが悪化しているのも気になる。もっとも、ドライバによる差が出ているということは、ドライバに依存する部分も小さくないということを示しているわけで、今後は可能な限りの最適化を期待したいところだ。

【グラフ10】World in Conflict(Patch v1.004)

 「Call of Juarez DirectX 10 Benchmark」(グラフ11)は、GeForce 8800 GTXを大きく引き離すスコアを出した。もともとRadeon系が強いアプリケーションではあるが、Radeon HD 3870と比較しても差は大きく、SXGA/UXGAではフィルタを適用したときに2倍を超えるスコアを出しており、GPU 2基の効果が大きく表れている。

 また、ドライバの違いによるスコア傾向の違いも面白い。OLDドライバでは1,280×1,024/1,600×1,200ドットの解像度でフィルタをかけた場合でもスコア低下が小さい反面、1,920×1,200ドットでフィルタをかけた場合は急激にスコアが落ち込んでいる。Newドライバでは、1,280×1,024/1,600×1,200ドットにおけるスコア低下は大きくなっているが、1,920×1,200ドット時も急激な落ち込みがなく、リニアにスコアが下がっている。

 Radeon HD 3870の傾向からみても、Newドライバの方がスコアは自然な感じになっており、このアプリケーションに対してもドライバ側で何らかの対策が施された可能性はありそうだ。

【グラフ11】Call of Juarez DirectX 10 Benchmark

 「Unreal Tournament 3」(グラフ12)は、Radeon系でAAが適用されない状況なので、ここではAAを適用していない。結果はRadeon HD 3870 X2が安定したスコアを発揮しており、特に描画負荷が高いところでスコアを伸ばす傾向がある。Botありのテストにおいて、1,920×1,200ドット時でもフレームレートの低下が小さいのは、実際の利用においても大きなメリットになり得る。

 ただし、Newドライバを利用すると、全体にスコアは下がる傾向が見られる。特にBot表示時にその影響が大きく出ており、改善の余地を感じさせる。

【グラフ12】Unreal Tournament 3(Patch v1.1)

 「LOST PLANET EXTREME CONDITION」(グラフ13)は、このアプリケーションに対するGeForce系の強さが発揮された結果になっている。Radeon HD 3870 X2もRadeon HD 3870との比較では大きくスコアを伸ばしたが、GeForce 8800 GTXに大きく劣る結果になっている。これはNewドライバでも、スコアは大きく変わっていない。

 とはいえ、Radeon HD 3870では、テストで設定しているクオリティでは使用に耐えないと断言できるスコアであるのに対し、Radeon HD 3870 X2は解像度次第では使用できるレベルではある。Radeonシリーズにとって、致命的に苦手なアプリケーションが減ったといえるだろう。

【グラフ13】LOST PLANET EXTREME CONDITION

●ハイエンドビデオカードの再編に期待

 NVIDIAは、2006年11月にGeForce 8800 GTXに発表して以降、2007年5月のGeForce 8800 Ultraや、2007年末のG92版GeForce 8800 GTSの投入など、G80/92ベースのハイエンド向けビデオカードを投入してきた。ここにマイクロアーキテクチャの大きな設計はなく、いまだ最上位製品としては、GeForce 8800 Ultraが発売されている状況である。

 これはライバルがいなかったことが要因の1つだろう。AMDはRadeon HDシリーズ投入以降は、エンスージアスト向け製品を投入してこなかったからだ。しかし、AMDもようやくこのセグメントに帰ってきた。

 GPUを2基使うという方法で、消費電力も大きめではあるものの、ベンチマーク結果ではスコアを伸ばす場面も多く、パフォーマンスに対する消費電力としては、GeForce 8800 GTXに劣る印象を受けない。

 また、パフォーマンスの絶対的な能力では、GeForce 8800 GTXを凌駕するシーンも多く見られる。気になるのは2種類のドライバの傾向差で、NewドライバはCrysisやCompany of Heroesで結果が良化したものの、ほかではスコアが下がる場面も少なくない。まだまだドライバ側で改善できる余地がありそうに思える。逆にいえば、ハードウェアのポテンシャルがフルに発揮されていない可能性もあるとも取れる。今後のドライバ改善に期待したい。

 GeForce勢との比較においても、今回はGeForce 8800 Ultraを比較対象に加えることができなかったが、過去に行なったテスト結果を見る限り、GeForce 8800 GTXに対して、大きくても15%程度の増加といったところであり、Radeon HD 3870 X2が上回るシーンは多いと思われる。

 この製品の登場で、ハイエンドビデオカードの世代交代が始まったのは間違いない。対するNVIDIAも対抗すべく次の世代のハイエンドビデオカードを投入するだろうし、ビデオカード業界もパフォーマンスの頂点を争う動きが活発化しそうだ。

□関連記事
【2007年12月5日】【海外】2個のGPUダイを密接に連携させたデュアルダイGPUが次のステップ
http://pc.watch.impress.co.jp/docs/2007/1205/kaigai405.htm
【2007年11月15日】AMD、世界初DirectX 10.1対応の「Radeon HD 3800」シリーズ
http://pc.watch.impress.co.jp/docs/2007/1115/amd.htm
【2007年5月2日】【多和田】GeForce 8800に最上位モデルを追加「GeForce 8800 Ultra」
http://pc.watch.impress.co.jp/docs/2007/0502/tawada102.htm

バックナンバー

(2008年1月28日)

[Text by 多和田新也]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2008 Impress Corporation, an Impress Group company. All rights reserved.