多和田新也のニューアイテム診断室

　昨年(2006年)11月にNVIDIAがDirect X10対応となるGeForce 8800シリーズを発表したが、遅ればせながらライバルとなるAMD(旧ATI)からも、DirectX 10対応GPUの「Radeon HD 2000シリーズ」が発表された。ここでは、その最上位モデルとなる「Radeon HD 2900 XT」のパフォーマンスを見てみたい。

　今回テストするのは、AMDから借用したRadeon HD 2900 XTのリファレンスボードである(写真1)。AMD製品としては初めての統合型シェーダユニットを採用したモデルで、5基のスーパースカラ演算器を持つシェーダユニットを64個持っており、NVIDIAと同等の言い方をすれば計320基のスーパースカラ演算器を持つことになる。ただ、NVIDIAのアーキテクチャはスカラ演算器がそれぞれ独立してキャッシュメモリにアクセス可能だが、Radeon HD 2000シリーズではシェーダユニット単位でしかアクセスできないので、まったく同等とはいえない。なお、このシェーダユニットは740MHzで動作するが、コアクロックは742MHzとなっている。

　メモリは、Radeon X1800から採用されているリングバス型であるが、4個のリングストップが64bit幅のメモリインターフェイスを2個ずつ持っており、メモリインターフェイスは512bitとなる。また、リングストップ間をつなぐバスも片方向512bit、両方向で1,024bitに拡張されている。メモリはGDDR3が利用され、クロックは1,650MHz(825MHz DDR)、容量は512MBとなっている。

　使用しているメモリはHynixの「HY5RS573225AFP-1」(写真2)。最大1GHz駆動(データレートベースだと2GHz)が可能な1ns品である。メモリを接続するリングストップは64bitのインターフェイスを2個持つので、32bitのメモリである本チップが2×2個の構成で接続される。チップあたりの容量は256Mbitで、リングストップは4カ所あるので16個のメモリチップを持ち、256Mbit×16個で512MBとなる。

　ボードの外観はRadeon X1950 XTXなどと大きく変わってはいない印象を受ける。ボード長はGeForce 8800 GTXよりも短く、実測でほぼ240mm(写真3)。一般的なATXマザーは244mmなので、マザーボードからはみ出すサイズにはなっていない。

　クーラーなどのデザインは、ブロアタイプのファンと銅製のヒートシンクを組み合わせ、その上を赤いクリアパネルで覆うデザインでRadeon X1950 XTXに似通っている。ただし、クリアパネルから覗く銅製のヒートシンクは、Radeon X1950 XTXに比べ小型化されたほか、薄型のフィンを用いたものへと変更されている(写真4)。

　このほか、ファン用の電源コネクタを2つ備えている(写真5)。AMD自身がファンを2基搭載したクーラーを検討しているのか、独自クーラーを搭載するサードベンダー向けの配慮かは不明だが興味深い点である。

　もちろんCrossFireにも対応。Radeon X1950 Pro以降に採用された、ケース内部で基板同士を接続するNative CrossFire方式のコネクタがボート上に用意されている(写真6)。

　いまやミッドレンジでもPCI Express用電源コネクタを利用して、電源を供給する時代。Radeon HD 2900 XTにも電源端子が搭載されているが、これまでの6ピンコネクタに加えて、8ピンの電源コネクタも搭載している(写真7)。このコネクタは、従来の6ピンと同じく12Vを供給するものだが、6ピンタイプは供給できる電力が最大で75Wであるのに対し、8ピンコネクタは150Wを供給できる。つまり、スロットから供給される75Wと合わせて合計300Wが供給可能な仕組みになっているわけだ。

　もちろん、この8ピンコネクタは、従来から利用されているCPU向けの8ピンコネクタとは互換性がない。ただし、PCI Express用6ピンコネクタとは、1ピン側から6ピン分のコネクタ形状に互換性があり、Radeon HD 2900 XTの8ピン電源コネクタに、電源ユニットの6ピンコネクタを接続することは可能となっている。

　そして、このビデオカードをシングルで利用する場合は、6ピン＋6ピンの電源コネクタで大丈夫なようだ。ただし、CrossFireを構築して利用する場合や、CATALYST Control Centerに実装されているオーバークロック機能「ATI OverDrive」を利用する場合には、8ピン＋6ピンの構成で利用する必要がある。なお、今回のテストを行なうにあたって8ピンコネクタを備えるクーラーマスターの「RealPowerPro 1000W」を購入している(写真8、9)。

　そこで、Radeon HD 2900 XTを6ピン×2で利用した場合に、パフォーマンスに影響があるかをチェックしてみた。ここでは、高い描画負荷がかかる3DMark06のWUXGA解像度でのテスト結果を比較している。

　結果はグラフ1に示した通りで、若干6ピン×2の方がスコアが低めに出る傾向はあるものの、誤差ともとれる範囲である。シングルビデオカード時は6ピン×2でも問題はないことが確認できる。ただし、ATI OverDrive時に6ピン×2で不足するということは、定格動作時で75W×3系統による供給にゆとりがないことは想像に難くない。電源ユニットの総出力と12Vラインの出力には気を遣ったほうが良さそうである。なお、後述のベンチマークは8ピン＋6ピンを接続してテストを実施している。

　Radeon HD 2900 XTは出力周りも強化されている。特に大きな特徴といえるのが、サウンド機能をGPUに統合した点である(画面1)。すでに同社製統合型チップセットのAMD 690Gでも同様の方式が採られているが、これは、HDMI出力のためである。

　HDCPキーもGPU内に持っている上、チップ内でビデオとオーディオストリームを完結できるので著作権保護コンテンツに対して有効な手段となる。また、ビデオとオーディオのシンクロについても、さまざまなコーデックとの整合性を考える必要がなくなり利便性向上も期待できるだろう。

　Radeon HD 2900 XTのリファレンスボードにはHDMI端子は搭載されていないが、HDMI出力を利用する場合は、DVI端子に接続するHDMI変換アダプタを利用する(写真10、11)。DVI端子経由でオーディオも出力されるので、このアダプタを接続するだけで完結する。実際にソニーのBRAVIAを利用して出力を試してみたが、Windows側で既定のオーディオデバイスを正しく設定しておけば、TVのスピーカーからPCの音が正しく再生された(画面2、3)。オーディオケーブルを必要としない使い勝手の良さは評価できる。

　もう1つ、Radeon HD 2000シリーズのビデオ周りの機能として、Universal Video Decorder(UVD)にも触れておきたい。これは、NVIDIAがGeForce 8600/8500シリーズで実装してきたビデオプロセッサ(VP2)に似たもので、ビットストリームをGPU側で処理できるようにしたものだ。

　GeForce 8600/8500シリーズのVP2ではビットストリーム処理を行なえるのがH.264に限定されるのに対して、Radeon HD 2000シリーズのUVDはH.264に加えてVC-1でも利用できる点で優位性がある。

　VP2以上の性能を持っており、よりCPU負荷を低く抑えることができるともしている。だが、現状のドライバではUVDに対応しておらず、H.264、VC-1で各方式で収録されたHD DVDを再生した場合、CPU負荷率は90%(Core 2 Duo E6700環境でテスト)前後を維持する状況であった。今後のドライバアップデートに期待がかかる。

　また、このドライバについては、FutureMarkの認証を通っていないため、そのままでは3DMarkシリーズを実行することができないという制限もあった。これは、コマンドプロンプトから、「-nosysteminfo」パラメータを付けて実行することで回避は可能だ。リリースドライバで同様の制限が課されるかは不明だが、購入後ベンチマークを試してみようと思っているユーザーは注意が必要だ。

　ドライバパッケージに含まれるCATALYST Control Centerから動作クロックを確認すると、2D描画時、3D描画時でクロックを変化させていることが分かる。3D描画時のクロックはほぼ定格通りである(画面4)。

　それでは、Radeon HD 2900 XTのベンチマークスコアを見てみたい。テスト環境は表に示した通りで、今回はAMD 580X CrossFire(旧称:CrossFire Xpress 3200)のマザーボードをベースにしてはいるが、とりあえずシングルビデオカード環境でのテストである。

【表】テスト環境

	ATI Radeon HD 2900 XT	NVIDIA GeForce 8800 GTX NVIDIA GeForce 8800 GTS (640MB) OC
VGA Driver	Driver Package Version.8.37.4.2-070509a-047323E-ATI	ForceWare 158.22
マザーボード	ASUSTeK M2R32-MVP
CPU	Athlon 64 X2 6000+
メモリ	PC2-6400 DDR SDRAM 512MB×2 (5-5-5-18)
HDD	Seagete Barracuda 7200.10 (ST3250620AS)
OS	Windows XP Professional (ServicePack 2/DirectX 9.0c)

　比較対象はNVIDIAのGeForce 8800 GTXと同GTS。ただ、機材の都合により、後者は、コアクロック580MHz、メモリクロック1.78GHz(890MHz DDR)で動作するオーバークロックモデルとなっている(写真12)。また、価格帯はGeForce 8800 GTSの方がRadeon HD X2900 XTに近いので、今回はこの比較を中心に言及していきたい。

　まずは、3DMarkシリーズの「3DMark06」(グラフ2～5)、「3DMark05」(グラフ6)、「3DMark03」(グラフ7)の結果から見ていきたい。技術的には古いアプリケーションとなる3DMark03は違う傾向を示しているものの、3DMark06/05に関しては似たような結果になっている。

　具体的には、解像度が上がるとRadeon HD 2900 XTに優位が出るが、異方性フィルタリングを適用した途端にRadeon HD 2900 XTのスコアが落ち込む点が似通っている。3DMark06のHDR/SM3.0 Testでは異方性フィルタを適用した状態でもGeForce 8800 GTSを上回るスコアを出しているが、AAのみを適用した状態よりも落ち込みが大きい点は同様である。

　これはテクスチャユニットの性能差と捉えていいだろう。GeForce 8800 GTSのテクスチャユニットは64bitテクスチャの場合に2x異方性フィルタリングまでを1クロックで処理できるが、資料で分かっている範囲ではRadeon HD 2900 XTは“64bitテクスチャのバイリニアを1クロックで処理できる”とされている。

　8x異方性フィルタリング適用時の詳細な性能は不明なのだが、この部分から判断して、GeForce 8800シリーズが持つテクスチャユニットの方が少ないクロックで処理を進められる可能性がある。また、テクスチャフィルタユニットの個数も、GeForce 8800 GTSは48個、Radeon HD 2900 XTは16個と差があり、根本的に処理のボトルネックになりやすい部位となっているのかも知れない。

　GeForce 8800 GTSと比較した場合、解像度が上がるなどしてテクスチャユニットがボトルネックにならない状況であれば、描画負荷が高いほどRadeon HD 2900 XTの優位性が高まる傾向にあるようだ。HDR/SM3.0 Testの全成績でRadeon HD 2900 XTのスコアが上回ったのはポテンシャルの高さで押し切ったものと想像できる。オーバークロックモデルが相手であることを考えれば、この点は評価できるだろう。

　もう1つ注目すべきはシェーダの性能。グラフ5に示したFeature Testの結果を見ると、Vertex ShaderのテストやPerlin Noise TestではRadeon HD 2900 XTがGeForce 8800 GTXも凌駕する結果となった。しかし、Pixel ShaderテストやShader Particlesのように、最小単位がピクセルという細かい単位での処理が行なわれるテストではRadeon HD 2900 XTのスコアが伸び悩む。5個の演算器を1ユニットとして動作させているスーパースカラアーキテクチャによる影響ではないかと思われる。それでも、GeForce 8800 GTSに対しては全般的に勝る結果となっている。

　続いては実際のゲームを利用したベンチマークを実施してみたい。テストは「Splinter Cell Chaos Theory」(グラフ8、9)、「Call of Duty 2」(グラフ10)、「F.E.A.R.」(グラフ11、12)である。

　ゲームベンチの結果についても、Radeon HD 2900 XTが異方性フィルタリングを適用した時、スコアの落ち込みが大きいという点は、3DMark06/05ほどではないものの、はっきり現われている。

　アプリケーションに関わらず安定して良好なスコアを保てているのはGeForce 8800 GTXといっていいだろう。低解像度条件ではRadeon HD 2900 XTの方が良い結果を出しているケースもあるが、負荷が高まったときは、ほぼGeForce 8800 GTXの完勝といっていい。

　GeForce 8800 GTSとは、良い勝負になっていることになる。しかし、繰り返し述べている通りGeForce 8800 GTSはオーバークロック仕様の製品である。640MBモデルのオーバークロック仕様製品をテストするのは初めてであるが、過去に行なった今回の製品と似たクロックで動作する320MBモデルのオーバークロック仕様製品の結果から見ると、定格モデルと比較して10%を超えるパフォーマンス差が見て取れる。その際は320MBのメモリ容量が不足したためと思われる頭打ちが多少あるが、640MBではそうした頭打ちはないだろう。

　そうした過去のデータから仮定すると、GeForce 8800 GTSの定格動作が相手であれば、Radeon HD 2900 XTの完勝に近い結果になるのではないかという印象を抱いている。今回のテストでは、Splinter Cell Chaos TheoryとF.E.A.R.でやや苦戦も見られるが、ここも同等もしくは逆転できる可能性が高いと見ている。

　さて、最後に消費電力のテストである(グラフ13)。ピーク時の消費電力は、依然としてGeForce 8800シリーズに分がある結果となった。GeForce 8800 GTXは性能面で優位性を堅持しただけでなく、消費電力でも優位性を守ったことになり、問題は価格だけということになるだろう。

　アイドル時の結果については、Radeon HD 2900 XTも健闘している。また、GeForce 8800 GTSが若干高い電力を消費しているのが目に留まる。前者については、先述の通り2D描画時にクロックを下げる仕組みが功を奏しているのだろう。また、後者についてはファンの問題で、テストに使用した機材が4ピンのペリフェラル電源からファンの電源を供給する仕組みであるため、ドライバによるファンコントロールが働かなかったことが影響している。

●同価格帯でのパフォーマンスは悪くないが電源周りに要注意

　以上の通り、Radeon HD 2900 XTのパフォーマンスを見てきた。期待の高かった製品ながら、登場してみれば、対GeForceという観点においてハイエンドモデルの下のクラスとの競合製品という立場になったわけだが、GeForce 8800 GTS 640MBモデルのオーバークロック版と良い勝負になっている。今回オーバークロック仕様の製品しかテストできなかったことが悔やまれるが、同価格帯の製品として、定格動作の同GPU搭載製品が相手であれば、パフォーマンス面では優位性があると考えてよさそうである。

　また、2大GPUメーカーからDirect X10製品が登場した意味は大きく、今後はアプリケーション側もDirect X10対応製品の登場が加速していくのだろう。国内ではカプコンのロストプラネットのDirectX 10対応版が話題になっているが、海外のソフトでも夏に向けていくつか登場する見込みで、タイミングを見計らって、この連載のベンチマークソフトも見直しを行なう予定である。

　本題のRadeon HD 2900 XTであるが、価格帯は399ドルで、まさにGeForce 8800 GTS 640MBと同じセグメントとなる。国内での販売価格は、GeForce 8800 GTS 640MBを参考にすると、5万円後半からの価格帯になるだろう。価格対パフォーマンスに関していえば、良い製品だと思う。また、ビデオプロセッサやHDMI出力のアーキテクチャについてもRadeon HD 2900 XTに圧倒的な優位性がある。

　ただし、電源周りには注意を要する製品だ。最低限6ピン×2が必要になる点はGeForce 8800 GTXとは同じであるが、消費電力が相変わらず大きい。すでに大容量電源を持っているユーザーや、この辺りのパーツは当然の投資と割り切れるユーザーであれば良いのだが、Radeon HD 2900 XTの導入に合わせて電源を購入するとなれば、消費電力が低いうえに、6ピン×1個で済むGeForce 8800 GTSに比べて導入コストに不利が発生し得る。

　こうした注意点があるため、この価格帯で盤石と呼べるほどのインパクトは持てないが、3D描画とビデオ周りの機能のポテンシャルは高く、幅広いニーズに対応できる製品として魅力は大きい。

【編集部注】原稿公開後に、電源についての詳細な仕様が判明したので、該当部分の記述を一部改めました

■多和田新也のニューアイテム診断室■

AMDのDirectX 10対応GPU
「Radeon HD 2900 XT」

【PC Watchホームページ】

■多和田新也のニューアイテム診断室■

AMDのDirectX 10対応GPU「Radeon HD 2900 XT」

【PC Watchホームページ】

AMDのDirectX 10対応GPU
「Radeon HD 2900 XT」