レビュー

初のHBM搭載ビデオカード「Radeon R9 Fury X」を試す

 AMDは6月24日、VRAMにHBM(High Bandwidth Memory)を採用した新鋭ハイエンドGPU「Radeon R9 Fury X」が発売された。今回、同GPUのサンプルを借用する機会が得られたので、ベンチマークテストを通してAMD最新鋭GPUの性能をチェックする。

ついに登場したAMDのウルトラハイエンドGPU

 Radeon R9 Fury Xは、AMDが6月16日(現地時間)にロサンゼルスで発表した新世代のGPU製品の1つで、シングルGPUモデルの最上位となる。GCN(Graphics Core Next)アーキテクチャを採用し、28nmプロセスで製造された新GPUコア「Fiji」をベースとしており、4,096基のStream Processorと256基のテクスチャユニットを備えている。GPUコアクロックは最大1,050MHz。

 従来のハイエンドGPUコア「Hawaii」より大規模な新GPUコアの採用も大きなトピックだが、Radeon R9 Fury X最大の特徴は、VRAMにGDDR5メモリではなくHBMを採用したことだ。FijiコアのGPUパッケージ上に実装された4枚の1GB HBMは、各1,024bit、合計4,096bitのメモリインターフェイスでGPUコアと接続されている。HBMの動作クロックは1GHz相当なので、これによってRadeon R9 Fury Xは、512GB/secという広大なメモリ帯域幅を確保している。

 Radeon R9 Fury Xの対応APIはDirectX 12、Vulkan、Mantle。一般的なアプリケーションを実行した際にビデオカードが消費する電力であるTypical Board Powerは275W。

Frame Rate Targeting Controlは、最大フレームレートを設定することで、GPUの働き過ぎによる無駄な電力消費を抑制することを目的とした技術だ
GPU-Zの実行結果
【表1】Radeon R9 Fury Xの主なスペック

Radeon R9 Fury X Radeon R9 390X Radeon R9 290X
アーキテクチャ GCN(Fiji) GCN(Hawaii) GCN(Hawaii)
製造プロセス 28nm 28nm 28nm
GPUクロック(最大) 1,050MHz 1,050MHz 1,000MHz
Stream Processor 4,096基 2,816基 2,816基
テクスチャユニット 256基 176基 176基
メモリ容量 4GB HBM 8GB GDDR5 4GB GDDR5
メモリクロック 500MHz(1GHz相当) 1,500MHz(6GHz相当) 1,250MHz(5GHz相当)
メモリインターフェース 4,096bit 512bit 512bit
ROPユニット 64基 64基 64基
Typical Board Power 275W 275W 250W

 以下の写真は、AMDより借用したRadeon R9 Fury Xのリファレンスボードだ。従来型のビデオカードにおいて、基板上の広い面積を占有していたVRAMをGPUパッケージ上に実装したことで、基板サイズを大きく縮小したことに加え、簡易水冷クーラーの採用により基板上の冷却ユニットも小型化。これにより、ビデオカード本体の全長を約195mmという、コンパクトなサイズに抑えた。

 Typical Board Power 275WのRadeon R9 Fury Xの冷却を担う水冷ユニットは、38mm厚のラジエータに25mm厚の120mmファンを搭載したもの。ラジエータとビデオカード本体を繋ぐチューブの長さは約400mm。

Radeon R9 Fury X。冷却に簡易水冷クーラーを採用した
ビデオカード本体表面。GPUだけでなく、電源回路の冷却も水冷ユニットが行なうため、冷却用のファンは備えていない
ビデオカード本体裏面。バックプレートを備えている
ディスプレイ出力端子。3基のDisplayPort 1.2と、1基のHDMI 1.4aを備える
基板上部に設けられた補助電源コネクタ。8ピンコネクタを2系統備える
簡易水冷クーラーのラジエータ。38mm厚ラジエータに25mm厚の120mmファンを搭載。ファンの電源はビデカードから直接給電している

ベンチマーク結果

 それでは、Radeon R9 Fury Xのベンチマークスコアを確認していこう。

 今回は、先日掲載したGeForce GTX 980 Tiレビューで測定したベンチマークスコアから、NVIDIAのハイエンドGPUコア「GM200」を採用する「GeForce GTX 980 Ti」と「GeForce GTX TITAN X」のデータを流用して、Radeon R9 Fury Xのベンチマークスコアと比較する。

【表2】テスト環境
GPU R9 Fury X GTX 980 Ti GTX TITAN X
CPU Intel Core i7-4790K
マザーボード ASUS MAXIMUS VII GENE
メモリ DDR3-1600 8GB×2(9-9-9-24、1.50V)
ストレージ 120GB SSD(Intel SSD 510シリーズ)
電源 Antec HCP-1200(1,200W 80PLUS GOLD)
グラフィックスドライバ 15.15 Beta GeForce 352.90 Driver GeForce 352.86 Driver
OS Windows 8.1 Pro Update 64bit

 今回実施したベンチマークテストは、3DMark(グラフ1、2、3、4、5)、3DMark11(グラフ6)、アサシンクリード ユニティ(グラフ7)、 ファイナルファンタジーXIV: 蒼天のイシュガルド(グラフ8)、ベンチマーク MHFベンチマーク【大討伐】(グラフ9)、PSO2キャラクタークリエイト体験版 ver. 2.0(グラフ10)。

 3DMark Fire Strikeでは、同テストで最も低解像度かつ負荷の低い無印テストにおいて、GeForce GTX 980 Tiに5〜6%程度差をつけられたRadeon R9 Fury Xだが、Extreme(2,560×1,440ドット)では約4%、UHD(3,840×2,160ドット)ではほぼ同スコアと、画面解像度と描画負荷が増すごとに差を詰めている。

 高解像度かつ高負荷になるほどメモリ帯域幅が性能に与える影響は大きくなる。3DMark Fire Strikeの結果は、VRAMの帯域幅が336.5GB/secのGM200コア採用2製品に対し、HBMによって512GB/secもの帯域幅を確保したRadeon R9 Fury Xの優位性が感じられる結果だ。

 一方、Fire Strikeに比べれば描画負荷の低い他のSky Diver、Cloud Gateでは、GeForce GTX 980 Tiに対して劣勢で、3DMark11では1割以上のスコア差をつけられてしまっている。

【グラフ1】3DMark - Fire Strike(1,920×1,080ドット)
【グラフ2】3DMark - Fire Strike Extreme(2,560×1,440ドット)
【グラフ3】3DMark - Fire Strike Ultra(3,840×2,160ドット)
【グラフ4】3DMark - Sky Diver
【グラフ5】3DMark - Cloud Gate
【グラフ6】3DMark11 [Extreme]

 アサシンクリード ユニティでは、1,920×1,080ドットのフルHD解像度でGeForce GTX 980 Tiの86〜88%のフレームレートを記録した一方で、3,840×2,160ドットの4K解像度の描画設定「標準」では、1フレームながらGeForce GTX 980 Tiを逆転している。3DMark Fire Strike同様、HBMによる帯域幅の効果が感じられる結果だ。

 しかし、アサシンクリード ユニティで最も負荷が高い3,840×2,160ドットの描画設定「最高」では、Radeon R9 Fury Xのフレームレートが急落している。この設定を12GBのVRAMを持つGeForce GTX TITAN Xで実行した場合、6GBほどVRAMを占有することから、Radeon R9 Fury Xのフレームレートが急落したのは、VRAMの容量不足が原因であると考えられる。

【グラフ7】アサシンクリード ユニティ

 ファイナルファンタジーXIV: 蒼天のイシュガルド ベンチマークの結果では、GeForce GTX 980 Tiのスコアに対し、DirectX 9版で約92〜94%、DirectX 11版で約76〜88%のスコアを記録。DirectX 11版よりDirectX 9版の方がライバルに近いスコアとなった。

 一方、DirectX 9を利用するベンチマークテストであるMHFベンチマークとPSO2ベンチマークでは、MHFベンチマークの3,840×2,160ドット設定でGeForce GTX 980 Tiに肉薄したものの、その他の条件では差をつけられており、PSO2ベンチマークに至っては3,840×2,160ドットで2.5倍近い差を付けられている。

【グラフ8】ファイナルファンタジーXIV: 蒼天のイシュガルド ベンチマーク
【グラフ9】MHFベンチマーク【大討伐】
【グラフ10】PSO2キャラクタークリエイト体験版 ver. 2.0

 最後に消費電力の測定結果を紹介する。消費電力は、サンワサプライのワットチェッカーを用いて、アイドル時と、各ベンチマーク実行時の最大消費電力を測定した。

 アイドル時の消費電力では、50W台中盤を記録したGM200コア採用の2製品に対し、Radeon R9 Fury Xは76Wという突出して高い数値を記録した。Radeon R9 Fury Xが備える簡易水冷クーラーの消費電力というには、少々大きすぎる差であるため、各種動作設定を見直し、アイドル時にCPUとGPUの動作クロックが下がっていることも確認したが、結果は変わらなかった。

 ベンチマーク実行時の消費電力については、3DMark Fire Strike実行時に記録した375Wで、GeForce GTX 980 Tiを23W上回っているが、それ以外のテストでは比較3製品中もっとも低い数値を記録した。ベンチマークスコアを加味すると、まだ電力対性能比でGM200系の製品を上回るほどの結果ではないが、優れた電力対性能比を誇るMaxwellアーキテクチャとの差を、Radeon R9 Fury Xが一気に縮めたことは間違いない。

【グラフ11】 システム全体の消費電力

性能と電力効率でGM200に迫るRadeon R9 Fury X

 以上の通り、Radeon R9 Fury Xのベンチマークスコアを、ライバルとなるNVIDIAのGM200コア採用ハイエンドGPUと比較してみた。性能が奮わないテストもあったが、Radeon R9 Fury Xが同価格帯のGeForce GTX 980 Tiと競えるだけのポテンシャルを持ったGPUであることは伺える。

 初採用となったHBMについても、3DMark Fire Strikeを始めとするいくつかのテストで、その広いメモリ帯域幅がRadeon R9 Fury Xの性能を押し上げていることが確認できた。ただ、アサシンクリードの4K解像度テストで確認されたように、4GBというメモリ容量は、このクラスのGPUにとって十分とは言い難い。解像度や描画設定を上げれば広帯域が効くが、大量のVRAMが必要となるというのが、Radeon R9 Fury XにとってHBMのジレンマとなりそうだ。

 ともあれ、登場以来ライバル不在であったGM200コア採用GPUに対し、競争力のある製品が登場したことは歓迎したい。また、今後のドライバの成熟やゲーム側の最適化にも期待したいところだ。

(三門 修太)