「GeForce GTX 680」レビュー
NVIDIAは3月22日、28nmプロセスで製造された新世代のハイエンドGPU「GeForce GTX 680」を発表した。同GPU搭載のリファレンスカードでベンチマークテストを行ない、その性能を探ってみた。
●NVIDIA 28nm世代GPUの先駆けとなる新ハイエンドGeForce GTX 680(以下GTX 680)は、NVIDIA初の28nmプロセス採用GPUであり、新アーキテクチャのKeplerを初めて採用したGPUだ。
Keplerアーキテクチャは、Fermiアーキテクチャの設計を踏襲して再構築された新アーキテクチャだ。GPUコアの変更点としては、従来Fermiアーキテクチャ採用のハイエンドGPUコア(GF110/GF100)では、32基のCUDAコアと4基のテクスチャユニットで構成されていたSM(Streaming Multiprocessor)が、192基のCUDAコアと16基のテクスチャユニットを備えるSMXに変更され、4基のSMを束ねていたGPC(Graphics Processing Cluster)は、2基のSMXを束ねるものへと変更された。また、バスインターフェイスはPCI Express 3.0に対応した。
下掲の図1は、GTX 680が採用するGPUコアのブロックダイアグラムである。これによれば、GTX 680のGPUコアは、4クラスタのGPCとL2キャッシュ、4基のメモリコントローラなどから構成されている。GTX 680の備えるCUDAコアはSMX8基分の1,536基、メモリインターフェイスは256bitであり、ブロックダイアグラムに示された全てのユニットが有効化されていることがわかる。
【表1】GeForce GTX 680の主なスペックGeForce GTX 680 | GeForce GTX 580 | |
アーキテクチャ | Kepler | Fermi |
プロセスルール | 28nm | 40nm |
GPUクロック | 1,006MHz | 772MHz |
Boostクロック | 1,058MHz | ─ |
シェーダークロック | ─ | 1,544MHz |
CUDAコア | 1,536基 | 512基 |
テクスチャユニット | 128基 | 64基 |
メモリ容量 | 2GB GDDR5 | 1,536MB GDDR5 |
メモリクロック(データレート) | 1,502MHz(6,008MHz相当) | 1,002MHz(4,008MHz相当) |
メモリインターフェイス | 256bit | 384bit |
ROPユニット | 32基 | 48基 |
消費電力 | 195W | 244W |
【図1】GeForce GTX 680のブロックダイアグラム |
【図2】Keplerアーキテクチャ、SMXのブロックダイアグラム |
GeForce GTX 680のダイ写真 |
GeForce GTX 580(以下GTX 580)と比較して、CUDAコアの数は3倍、テクスチャユニットが2倍に増加した。また、IntelやAMDのCPUで採用されている自動オーバークロック機能のGPU版「GPU Boost」を新たにサポートした。一方で、メモリインターフェイスやROPユニット数が減少したほか、GeForce 8800 GTX以降、GPUコアとは異なる動作クロックが設定されていたシェーダクロックが廃止され、GPUクロックに統一されている。
GPU-Z 0.6.0で取得したGPU Boostの動作状況。「3DMark11(Extreme Preset)」実行時(左)と「OCCT GPU Test」実行時(右)。3DMark11実行中は、TDP値に対して余裕のある状況で最大約1,100MHzまでGPUクロックが向上しているのに対し、TDP値に対し余裕のないOCCT実行中はベースクロックの1,006MHzで動作している |
GTX 680では、新たなアンチエイリアシング技術「TXAA」をサポートする。TXAA 1は2xMSAAと同程度の負荷で8xMSAA以上のクオリティを実現し、TXAA 2は4xMSAAと同程度の負荷で、8xMSAAやTXAA 1のクオリティを上回るとされている。また、GTX 680では、従来は2つ以上のGPUが必要だった3画面立体視「3D Vision Surround」を1GPUで利用可能となった。また、3D Vision Surroundと同時にゲーム以外の画面を1画面出力可能となり、GTX 680搭載ビデオカード1枚で最大で4画面への出力が可能となった。その他、画面出力関連では、HDMI 1.4aのサポートにより、4K解像度(3,840×2,160ドット)の出力を新たにサポートした。
8xMSAAとTXAAの比較画像。AA無し(左)、8xMSAA適用時(中央)、TXAA適用時(右)。 |
●リファレンスボードの補助電源は6ピン2系統
今回のテストでは、GTX 680のリファレンスボードを利用する。リファレンスボードは2スロット占有の外排気型VGAクーラーを搭載し、基板長は約254mm。補助電源用の電源端子には6ピンコネクタを2系統備え、ブラケット部のディスプレイ出力には、DVI-I、DVI-D、HDMI、DisplayPortを各1系統ずつ備える。
GTX 680のリファレンスボード | ||
ブラケット部のディスプレイ出力 | 電源コネクタは6ピン2系統 | GTX 580搭載カード(上)とのカードサイズ比較 |
●一世代前のハイエンドGTX 580と、AMDの28nm世代ハイエンドHD 7970と性能比較
それではベンチマークテストの結果紹介に移りたい。今回はGTX 680の比較対象として、1世代前のハイエンドGPUであるGTX 580と、2012年1月に発売されたAMDの28nmプロセス採用ハイエンドGPU「Radeon HD 7970」(以下HD 7970)を用意した。
ベンチマークテストに用いたドライバは、GTX 580が最新のWHQL取得ドライバ「GeForce 296.10 Driver」、HD 7970は「Catalyst 12.2」、GTX 680は専用の「GeForce 300.99 Driver」をそれぞれ利用している。
【表2】テスト環境GPU | GTX 680 | GTX 580 | HD 7970 |
CPU | Intel Core i7-3820 | ||
マザーボード | ASUS P9X79 PRO (BIOS:0902) | ||
メモリ | DDR3-1600 4GB×4 (9-9-9-24、1.5V) | ||
ストレージ | Western Digital WD5000AAKX | ||
電源 | Silver Stone SST-ST75F-P | ||
グラフィックスドライバ | GeForce 300.99 Driver | GeForce 296.10 Driver | Catalyst 12.2 |
OS | Windows 7 Ultimate 64bit SP1 |
●DirectX 11対応ベンチマークテスト
まずはDirectX 11対応ベンチマークテストの結果から紹介する。実施したテストは「3DMark 11」(グラフ1、2、3)、「Unigine Heaven Benchmark 2.5」(グラフ4)、「Stone Giant DX11 Benchmark」(グラフ5、6)、「Lost Planet 2 Benchmark DX11」(グラフ7)、「Alien vs. Predator DX11 Benchmark」(グラフ8、9)、「Tom Clancy's H.A.W.X 2 Benchmark」(グラフ10)だ。
テスト結果を確認すると、GTX 680は全てのテストで1世代前のハイエンドGPUであるGTX 580を上回り、テストによっては1.4~1.5倍ほどの差をつけている。同じ28nm世代のハイエンドGPUであるHD 7970に対しても、Radeonが優勢な傾向にある「Alien vs. Predator」以外、GTX 680がHD 7970を上回る結果となった。HD 7970とのスコア差については、一部1.3倍近い差がついている項目もあるが、概ね1割強程度の差となっている。
NVIDIAによれば、GTX 680のSMXが備えるテッセレータのパフォーマンスは、HD 7970に比べ4倍高速であるとしている。実際に「Unigine Heaven」や「Stone Giant」などのテッセレーションを多用するベンチマークでは、HD 7970に比較的大きな差をつけており、テッセレーションを多用するゲームタイトルでの優位性を示した形と言えよう。
●DirectX 9/10対応ベンチマークテスト
続いて、DirectX 9世代とDirectX 10世代のベンチマークテストの結果を紹介する。実施したテストは「3DMark Vantage」(グラフ11、12)、「3DMark06 Build 1.2.0」(グラフ13、14)、「ファイナルファンタジーXIV オフィシャルベンチマーク」(グラフ15)、「MHFベンチマーク 【大討伐】」(グラフ16)、「Lost Planet 2 Benchmark DX9」(グラフ17)、「Unigine Heaven Benchmark 2.5」(グラフ18)だ。
こちらの結果では、GTX 680でもほとんどの項目でGTX 580を上回っているものの、3DMark06のSM2.0 ScoreとFINALFANTASY XIVのLow設定でGTX 580のスコアを下回った。もっとも、どちらも誤差の範疇ともとれるレベルの差であり、負荷設定を重くした際のスコアではGTX 680が上回っていることから、CPUがボトルネックとなってスコアが頭打ちになった結果生じた誤差である可能性が高い。
HD 7970に対しては、GTX 680がHD 7970を上回っている項目数の方が多いものの、DirectX 11系のベンチマークテストに比べると小差にとどまった。また、1,280×720ドット時は1割以上の差をつけて上回りながら、1,920×1,080ドット時に逆転されたMHFベンチマークや、高負荷設定でHD 7970に差を広げられた3DMark06の結果など、一部テストでは負荷が大きくなった際にHD 7970が優勢になるという結果も見られた。そのほか、Unigine HeavenではHD 7970に9~27%程度の差をつけられており、DirectX 9系のベンチマークソフトについては、タイトルによって得手不得手が分かれる形となった。
●消費電力の比較
最後に消費電力の測定結果を紹介する。消費電力はサンワサプライのワットチェッカー(TAP-TST5)を利用して、各テスト実行中の最大消費電力を測定した。
【グラフ19】システム全体の消費電力 |
GTX 680は、アイドル時にRadeon HD 7970より低い91Wを記録したほか、HD 7970より2W高い消費電力を記録したLost Planet 2実行時以外のテストで、比較製品中最も低い消費電力を記録した。GTX 680の消費電力は、一般的なゲーム系ベンチマークテストにおいて、GTX 580に対して27~73W低く、HD 7970にも最大39Wの差をつけている。
GPUに高負荷を掛けるOCCTのGPU Test実行時の電力についても、GTX 680は、GTX 580より91W、HD 7970より48W低い消費電力にとどまる。この結果から、スペック上の195Wという消費電力値が示す通り、ハイエンドGPUとしてはかなり低い消費電力に抑えられていることがわかる。
●ワットパフォーマンスは大幅に向上、ライバルに対抗できるハイエンドGPU以上の結果から、NVIDIA初の28nmプロセス世代GPUとなったGTX 680は、従来のNVIDIA GPUに比べ順当な性能向上と、大幅にワットパフォーマンスの向上を果たしたGPUであることが見えてくる。先に投入されたAMDの28nmプロセス世代のハイエンドGPUであるHD 7970に対しても、互角以上に渡り合える製品だ。
Fermi世代のGTX 400/GTX 500シリーズは同時期のAMD製GPUに対し、ワットパフォーマンスで差をつけられていた印象があったが、今回のGTX 680はそれを覆す製品となった。今後投入されるであろう、ハイエンド以下のNVIDIA 28nm世代GPUへの期待も高まる結果である。
AMDは既に28nmプロセス世代の新アーキテクチャ採用GPUのラインナップを揃えており、いずれもパフォーマンスと消費電力のバランスに優れたGPUとして注目を集めている。新製品の投入で後れを取ったNVIDIAは、しばらくRadeon HD 7000シリーズの引き立て役に甘んじていたが、GTX 680の登場によりいよいよ同世代GPU同士の競争が激化することになりそうだ。
(2012年 3月 22日)
[Reported by 三門 修太]