多和田新也のニューアイテム診断室

NVIDIA初のDirectX 11対応GPU「GeForce GTX 480」



 NVIDIAは3月27日(日本時間)、「GeForce GTX 400シリーズ」を発表した。同社初のDirectX 11対応GPUとなるもので、今日の発表ではエンスージアスト向けのハイエンドモデル「GeForce GTX 480」と「GeForce GTX 470」がラインナップされた。ここではNVIDIAより借用したGeForce GTX 480のリファレンスボードを用いて、まずはシングルビデオカード状態での性能をチェックしてみたい。

●Streaming Multiprocessorを1~2クラスタ省略した構成

 GeForce GTX 480/470は、いずれも「GF100」コアを用いたGPUだ。そのアーキテクチャはすでに公開されており、今回は実際の製品が発表され、スペックが明らかになったことがポイントになる。

 その主な仕様は表1に示した。上位モデルのGeForce GTX 480は480基のCUDAコアに、ROP 48基、384bitメモリインターフェイスの構成。下位モデルのGeForce GTX 470はCUDAコアが448基、ROPが40基、320bitメモリインターフェイスの構成となる。

【表1】GeForce GTX 480/470の主な仕様

GeForce GTX 480GeForce GTX 470GeForce GTX 285
プロセスルール40nm55nm
GPUクロック700MHz607MHz648MHz
CUDA Coreクロック1,401MHz1,215MHz1,476MHz
CUDA Core数(SM数)480基(15基)448基(14基)240基(30基)
テクスチャユニット数60基56基80基
メモリ容量1,536MB GDDR51,280MB GDDR51,024MB GDDR3
メモリクロック(データレート)924MHz(3,696MHz)837MHz(3,348MHz)1,242MHz(2,484MHz)
メモリインタフェース384bit320bit512bit
メモリ帯域幅177.4GB/sec133.9GB/sec159.0GB/sec
ROPユニット数48基40基32基
ボード消費電力(ピーク)250W215W183W

 図1にGF100のブロックダイヤグラムを示したが、GF100は32基のCUDAコアで構成されるStreaming Multiprocessor(SM)を16基、計512基のCUDAコアがフルスペックとなる。つまり、CUDAコアとテクスチャユニットについては、GeForce GTX 480は1SM、GeForce GTX 470は2SMを省略した格好だ。ROPおよびメモリインターフェイスについては、GeForce GTX 480はフルスペック、GeForce GTX 470は各1クラスタを省略した仕様となる。

 ちなみにGF100のアーキテクチャでは4SM単位でMini GPUともいえるGPC(Graphics Processing Cluster)を形成するが、GeForce GTX 480はいずれかのGPCが3SMで構成されることになる。GeForce GTX 470もGPCは4クラスタであることは確認できている。よって、3SM×2+4SM×2構成もしくは2SM×1+4SM×3構成のいずれかと見られるが、実際にどちらの構成を採っているかは分からない。この点についてはNVIDIAに問い合わせており返答待ちの状況だ。回答を得られ次第、追記することにしたい。

【図1】GF100のブロックダイヤグラム

 今回テストに用いるのは冒頭でも触れたとおり、NVIDIAのリファレンスボードである(写真1)。ボード長は従来製品となったGeForce GTX 285と同じで、約10.5インチ(約267mm)のボードだ。

 化粧カバーは写真を見て分かるとおり一部に銀色の光沢があるが、これはヒートシンクの一部だ。GeForceの従来製品の化粧カバーはヒートシンクを完全に覆う格好のものだったが、GeForce GTX 480では剥き出しにすることで、ここからの放熱も狙っていると見られる。実際、使用時はこの部分もかなり熱くなる。

 分解して中身を確認したところ、ヒートシンクは5本のヒートパイプを用いたアルミ製のものだった(写真2)。ヒートパイプを直接GPUに触れさせることでフィン側への熱移動を効率良く行なうことを狙ったデザインだ。

 ファンはGeForce GTX 285などと同じくブロアタイプのファンを用い、化粧カバーをダクトのように使って、ブラケット部からケース外へ排気する構造になっている。ファンのノイズは低回転のうちは今回使っているGeForce GTX 285搭載製品よりも静かなぐらいだが、高回転になると少々耳障りな音になる。3Dゲームを長時間やるような利用シーンが珍しくない性格の製品だけに、購入検討のポイントとして気に留めておくべきだろう。

 ブラケット部はDualLink対応DVI-I×2とMini HDMIの組み合わせ(写真3)。同時出力は従来と同じ2系統までとなるが、GeForce GTX 285などで使用されていたコンパニオンチップは搭載していない。そのことはボードの裏面からも見て取ることができる(写真4)。

 ボードの裏面にはメモリチップを搭載していないことも分かる。GeForce GTX 480は384bitメモリインターフェイスなので、32bit接続のメモリチップを12枚搭載することになる。これらはすべて表面に実装されている(写真5)。

 GPU自体は上部がヒートスプレッダで覆われている。表面の印刷からは2010年第6週製造のA3リビジョンと推測できる記述が見られる。

 電源端子は6ピンと8ピンの2つが用意されている(写真6)。GeForce GTX 480の最大消費電力は250Wとされており、この構成は納得できる。下位モデルのGeForce GTX 470はピーク215Wなので、6ピン×2構成となっている。

【写真1】GeForce GTX 480のリファレンスボード【写真2】GeForce GTX 480のリファレンスボードで使用されているヒートシンク。ヒートパイプとGPUと接触させる形状【写真3】ブラケット部はDVI-I×2とMini HDMIの構成。同時出力は2系統までとなる
【写真4】ボード背面には目立ったチップは搭載されていない【写真5】GeForce GTX 480のGPUを囲むように、12枚のメモリチップを備えている【写真6】電源端子は6ピン+8ピンの構成

 実際の動作であるが、NVIDIA Contorl Panelの表示で、定格どおりのクロックで動作していることを確認できる(画面1)。メモリクロックは1,848MHzと表示されているが、データレートの値は正常であり、実クロック表記になっていないだけと見ていいだろう。

 CUDA周りの仕様はをGPU Caps Viewerで確認すると、Compute Capabilityが「2.0」になっている。GeForce GTX 200シリーズはCompute Capability 1.3である。このバージョン2.0がCUDA 3.0をフルサポートするものということだろう。

 MultiProcessorsの欄が「15」となっているのは、先述したSM数の説明のとおりである。レジスタ数、ブロック内のスレッド数などはGeForce GTX 200シリーズから倍増しており、これはFermiアーキテクチャ発表時の情報のとおりだ。

【画面1】NVIDIA Control Panelによるシステム情報【画面2】GPU Caps ViewerによるCUDA関連のスペック

●シングルビデオカードでの比較

 それではベンチマーク結果の紹介へと進みたい。テスト環境は表2に示したとおりで、ここではAMDのシングルGPU/シングルビデオカード最上位モデルとなるRadeon HD 5870をメインの比較対象に据え、合わせて旧世代製品のGeForce GTX 285も試すというスタイルにする。マルチGPU環境については近日中に稿を改めて紹介する予定だ。

 テストに用いた機材は写真7~9のとおり。このうち、GeForce GTX 285を搭載するENGTX285 TOPはオーバークロックモデルであるため、EVGAのPresisionを用い定格クロックへ下げて動作させている。

 ドライバについて補足しておくと、GeForce GTX 480はNVIDIAからレビューワ向けに提供された197.17βを使用。そのほかはテスト時点で最新の正式ドライバを用いている。Radeon HD 5870については、今週CATALYST 10.3がリリースされが、すでにテストを終えていたため、時間の都合もあって再テストは行なえていない。先述のとおりマルチGPU環境を含めた別記事を予定しているので、CATALYST 10.3使用時との比較は、そちらでフォローする。

 テスト解像度は1,920×1,200ドット(WUXGA)と2,560×1,600(WQXGA)ドットの2種類。加えて、それぞれに4xMSAAと16x異方性フィルタリング(AF)を適用した場合の計4パターンで行なう。テストに当たっては、ナナオより30型液晶の「FlexScan SX3031W-H」を借用している(写真10)。描画クオリティは各ゲームタイトルで設定可能な最高クオリティ。

【表2】テスト環境
ビデオカードGeForce GTX 480Radeon HD 5870GeForce GTX 285
グラフィックドライバGeForce Driver 197.17βCatalyst 10.2GeForce Driver 197.13
CPUCore i7-975 Extreme Edition(TurboBoost無効)
マザーボードASUSTeK P6TD Deluxe(Intel X58+ICH10R)
メモリDDR3-1333 2GB×3(9-9-9-24)
ストレージSeagete Barracuda 7200.12×2台 (ST3500418AS,RAID0)
電源KEIAN KT-1200GTS
OSWindows 7 Ultimate x64

【写真7】Radeon HD 5870を搭載する「XFX HD-587A-ZNF9【写真8】GeForce GTX 285を搭載する「ASUSTeK ENGTX285 TOP/HTDI/1GD3
【写真9】Intel X58 Express+ICH10Rを搭載する、ASUSTeK「P6TD Deluxe【写真10】ナナオの2,560×1,600ドット対応30型液晶、「FlexScan SX3031W-H

 まずはDirectX 11対応タイトルからテストを行なう。「BattleForge」(グラフ1)、「Colin McRae: DiRT 2」(グラフ2)、「Unigine Heaven Benchmark 2.0」(グラフ3)の3本。この3タイトルはDirectX 11対応GPUのみをテスト対象とした。

 Unigine Heaven BenchmarkはDirectX 11対応ベンチマークとして知名度の高いものであるが、今週に入って新バージョンとなる2.0がリリースされた。また、AMD、NVIDIA両社がDirectX 11対応GPUをリリースしたというのを機に取り上げることにした。

 BattleForgeの結果はAA&AFを適用しない際には、それほど大きな差ではなく、WUXGAでGeForce GTX 480、WQXGAではRadeon HD 5870がそれぞれ良い結果を出した。AA&AFを適用した際のフレームレートの落ち込みはGeForce GTX 480のほうが小さい傾向が出ており、25~30%ほどと割と大きな差がついている。

 DiRT2はいずれの条件でもGeForce GTX 480が良好。ただ、解像度によって優位性に差が見られ、WUXGAで40%強、WQXGAで20%強と、解像度が高くなることで優位性が薄らぐ結果となった。

 Heaven Benchmark 2.0もGeForce GTX 480の優位性が目立ち、大きいところで90%、小さいところでも60%を超える差がついている。もっとも差がついたのがWUXGAのフィルタ適用なし、もっとも差が小さかったのがWQXGAのAA&AF適用時と、負荷が大きくなるほど優位性が薄らぐ傾向はDiRT2と似通った傾向といえる。

 BattleForgeに比べて、DiRT2やHeaven Benchmark 2.0におけるGeForce GTX 480の優位性が目立つのは、同じDirectX 11タイトルでも後者の2タイトルでテッセレーションを使っているのが理由の1つだろう。

 今回のテストでは、Heaven Benchmark 2.0ではテッセレーションのクオリティを最高のExtreme設定にして実施しているが、GeForce GTX 480はジオメトリ処理を重視したアーキテクチャでもあり、これがHeaven Benchmark 2.0におけるフレームレートの優位性に大きく影響した可能性がある。つまり、クオリティを下げることでRadeon HD 5870との差は小さくなる可能性があり、次回の記事では、Heaven Benchmark 2.0のテッセレーションクオリティの違いによる性能比較も交える予定だ。

【グラフ1】BattleForge
【グラフ2】Colin McRae: DiRT 2
【グラフ3】Unigine Heaven Benchmark 2.0

 さて、引き続きDirectX 10以前のAPIを用いたタイトルをテストしていく。ここからはGeForce GTX 285も比較対象に加える。まずは「3DMark Vantage」の結果から見ていきたい(グラフ4、5)。

 ここでは全体にRadeon HD 5870が良好な結果を出しており、AA&AFを適用したときにGeForce GTX 480が健闘を見せるといった傾向が出ている。

 Feature Testの結果を見ると、GeForce GTX 480はGeForce GTX 285に比べるとピクセルシェーダの性能も良くなっているものの、明らかにバーテックス/ジオメトリ処理やストリームアウトの処理に比重を置いた設計がなされていることが分かる。3DMark Vantageは経験則からピクセルシェーダの性能の良さがスコアに結びつく傾向にあり、Radeon HD 5870の好結果に結びついたと見られる。

【グラフ4】3DMark Vantage Build 1.0.2 (Graphics Score)
【グラフ5】3DMark Vantage Build 1.0.2 (Feature Test)

 「BIOHAZZARD 5 ベンチマーク」(グラフ6)は、GeForce GTX 480の優位性が目立つ。一方で、WQXGAのAA&AF適用を除いては16~18%前後の差があるのに対し、WQXGAのAA&AF適用時のみは10%前後と急激に差が詰まる。この傾向は気になる。

【グラフ6】BIOHAZZARD 5 ベンチマーク

 「Crysis Warhead」(グラフ7)は、それほど大きな差はついていないが、GeForce GTX 480が良好な結果を出した。これも、WUXGAのフィルタ適用なしとWQXGAのAA&AF適用時の差が大きめ、というこれまでとはまったく異なる結果を見せている。

【グラフ7】Crysis Warhead (Patch v1.1)

 「Darkest Days」(グラフ8)の結果は、WUXGA時はGeForce GTX 480、WQXGA時はRadeon HD 5870がよりよいフレームレートを出した。ただ、WUXGAのGeForce GTX 480の優位性は小さく、大局的にはRadeon HD 5870が良好な結果といって差し支えないだろう。本タイトルはGeForce PhysXに対応しているが、当然ながらこれは無効化している。有効時はまた異なる結果になるのだろうが、グラフィックス描画のみでいえば現状ではRadeon HD 5870に向いたタイトルといえる。

【グラフ8】Darkest of days

 「Far Cry 2」(グラフ9)はGeForce GTX 480がかなり良い結果となった。もっとも大きいところで40%を超える差がついており、今回のテストタイトルの中でも際立ったフレームレート差になっている。ちなみにもっとも良い結果となったのはWUXGAのAA&AF適用時である。WQXGA解像度はWUXGAよりフレームレートの差が小さく、これはDirectX 11対応タイトルのテストでも見られた傾向である。

【グラフ9】Far Cry 2(Patch v1.03)

 「Left 4 Dead 2」(グラフ10)は今回のテストタイトルでも負荷が軽い部類に入るタイトルであるが、WUXGAのフィルタ非適用時はCPUバウンドと見ていいだろう。そのほかの結果はDarkest Daysに近い。WUXGAのAA&AF適用時はGeForce GTX 480がまずまずながら、ほかはRadeon HD 5870が好結果を見せている。

【グラフ10】Left 4 Dead 2

 「Unreal Tournament 3」(グラフ11)も負荷が軽い部類のテストといえるが、ここはGeForce GTX 480が良好な結果だ。とくにAA&AFを適用したさいのフレームレートの落ち込みがRadeon HD 5870に比べて小さい。負荷が軽いタイトルだけに、こうした傾向は好印象である。

【グラフ11】Unreal Tournament 3 (Patch v2.1)

 「World in Conflict」(グラフ12)もGeForce GTX 480が全体に良好な結果であり、かつAA&AF時のフレームレートの落ち込みはRadeon HD 5870より抑えられた結果となっている。絶対的なフレームレートは大きく違うが、フレームレートの相対的な差も含めた全体の傾向はUnreal Tournament 3のそれに非常に近い。

【グラフ12】World in Conflict (Patch v1.011)

 最後に消費電力の測定結果である。ピーク250Wが公称されているGeForce GTX 480の環境は、ほかの環境に比べて目立って大きな電力を消費していることが分かる。Radeon HD 5870との差は100W以上になっており、ピーク時消費電力の公称値(250Wと188W)以上の差がついている。なお、GeForce GTX 480はアイドル時の公称電力は提示されていないが、こちらもRadeon HD 5870を上回っている。

【グラフ13】消費電力

●タイトルよってバラツキある結果、消費電力はネック

 とくにハイエンドGPUにおける今回のようなケースでは、後発製品の性能が先発製品を安定して上回ることが少なくないが、GeForce GTX 480は何ともスッキリしない結果となった。Radeon HD 5870に対して40%以上の差を付けることもあれば、逆に下回る結果も珍しくない、とタイトルによってかなりバラツキのある結果となった。

 もっとも、Radeon HD 5870に対して10%を超えて下回ったのは3DMark VantageのFeature Test内のピクセルシェーダ依存度の高いテストのみ、というあたりはGeForce GTX 480のハイエンドGPUとしてのポイントにはなるだろうか。実際のゲームタイトルを用いたテストにおいて、Radeon HD 5870を大きく引き離す性能を見せ、劣るシーンでも差は10%未満に留まるという全体の傾向は、性能にこだわるユーザにとっては1つの指標になるだろう。

 一方で、消費電力は公称値から想定される以上の差が出ていることは気に留めておきたい。100W以上の差となると、要求される電源ユニットは150~200W以上大きなものが必要となる。電力当たりの性能という面では、Radeon HD 5870に魅力を感じる人も少なくないのではないだろうか。

 こうした結果から、GeForce GTX 480とRadeon HD 5870は、同じハイエンド向け製品ではあるものの、異なるニーズを埋める製品という印象を受けている。

 ちなみに価格は499ドルとされている。日本国内での実際の製品は米ドルをそのまま換算すれば5万円未満だが、登場直後は多少の上乗せがあるとしても、高くても6万円未満が妥当な線だと思う。Radeon HD 5870より、やや高い価格帯になる可能性が高い。

 さて、今回はマルチGPU環境の比較、Catalyst 10.3使用時の比較、Heaven Benchmark 2.0を使ったテッセレーションクオリティの違いによる性能への影響、という3つの宿題を作った。近日中にも、これらの結果をお伝えしたい。