多和田新也のニューアイテム診断室

アーキテクチャ変更を伴って登場した新ハイエンドGPU「Radeon HD 6900」シリーズ



 AMDは12月15日、最上位GPUとなる「Radeon HD 6900シリーズ」を発表した。10月のRadeon HD 6800シリーズ発表時に予告されていた「Cayman」コアを搭載するモデルで、Radeon HD 6800シリーズとは異なり、マイクロアーキテクチャの変更を行なっているのが特徴となる。その概要とベンチマーク結果を紹介する。

●完全デュアルコア化、VLIW4、PowerTuneなどの新機軸

 今回発表されたRadeon HD 6900シリーズ(以下HD 6900シリーズ)は、「Radeon HD 6970」(以下HD 6970)、「Radeon HD 6950」(以下HD 6950)の2モデル。主な仕様は表1のとおりだ。

 動作クロックは過去の製品と比べて、極端に引き上げられてはいない。同一プロセスを用いた製品であることも影響していると考えられる。ただし、メモリのデータレートは引き上げられ、HD 6970では5.5GHz相当となった。

 また、Radeon HD 5800シリーズ(HD 5800シリーズ)に比べ、SPが減った代わりにテクスチャユニットが増えていることに気が付くと思う。これはアーキテクチャの変更に伴うものだ。

 なお、表中、HD 6900シリーズの消費電力については区別して考える必要がある。ロード時の消費電力は、従来的な表現による最大消費電力ではなく、一般的な利用シーンにおける消費電力を示している。リミットという表現については後述するが、こちらが従来的な考え方による最大消費電力に近い。

【表1】Radeon HD 6900シリーズの主な仕様

Radeon HD 6970 Radeon HD 6950 Radeon HD 6870 Radeon HD 6850 Radeon HD 5870 Radeon HD 5850
コアクロック 880MHz 800MHz 900MHz 775MHz 850MHz 725MHz
SP 1,536基 1,408基 1,120基 960基 1,600基 1,440基
テクスチャユニット 96基 88基 56基 48基 80基 72基
メモリ容量 2GB GDDR5 1GB GDDR5
メモリクロック(データレート) 5.5GHz 5.0GHz 4.2GHz 4.0GHz 4.8GHz 4.0GHz
メモリインタフェース 256bit
ROPユニット 32基
ボード消費電力(アイドル) 20W 19W 27W
ボード消費電力(ロード/リミット) 190/250W 140W/200W 151W 127W 188W 151W

 続いてブロックダイヤグラムを図1に示す。このブロックダイヤグラムにはHD 6900シリーズの1つの特徴がある。それはテッセレータを含むジオメトリ処理関連のエンジンを持つGraphics Engineが2系統に分離されたことだ(図2)。HD 5800シリーズやRadeon HD 6800シリーズはSIMDエンジンは2つに分離された格好になっていたが、Graphics Engineは共有されていた。これを分離することで、セットアップやジオメトリ処理の並列性を高めている。

【図1】Radeon HD 6900シリーズのブロックダイヤグラム
【図2】グラフィックスエンジンが完全に2系統に分かれ、1クロック当たり2プリミティブを処理できるようになった

 SIMDエンジンにも変更が加えられた。AMD(旧ATI)ではユニファイドシェーダデザインになったRadeon HD 2000シリーズ以降、4個の積和算ユニットと1基の積和算&スペシャルファンクションユニットにブランチユニットを備える“VLIW5”というSIMDユニットを採用してきた。

 HD 6900シリーズでは長く使われてきたVLIW5に代わり、スカラユニットを備える“VLIW4”へとアーキテクチャを変更した。各スカラユニットで実行可能な演算も変更されている(図2)。この変更については、高効率化のためと解釈していいだろう。例えばグラフィックス処理であればRGBAの4ピクセルの並列処理が行なえれば十分なわけで、1つのSIMDユニットを4並列とすることは理に適っている。

 SIMDユニット内のユニットは1つ減った結果、最終スペックがどのようになったかというと、Radeon HD 5870(以下HD 5870)では5SP×16SIMDユニット×20SIMDアレイで1,600基のSP(演算ユニット)を持っていたものが、HD 6970では4SP×16SIMDユニット×24SIMDアレイで1,536基のSP、HD 6950では4SP×16SIMDユニット×22SIMDアレイで1,408基のSPを持つことになった。SIMDアレイが増えたことで、そこに含まれるテクスチャユニット数などはHD 5800シリーズよりもリッチなものとなっている。

 VLIW4への変更は汎用コンピューティング用途にも意味あるものとされている。特に、倍精度演算はRadeon HD 6800シリーズ以前では単精度に対して5分の1の性能であったものが、4分の1へと向上する。このほか、非同期のディスパッチを可能にするなどの機能強化も行なわれている。

【図3】SIMDユニットは長く使われたVLIW5からVLIW4へと変更され、効率が増している 【図4】汎用コンピューティングにおいても非同期ディスパッチや倍精度演算/単精度演算比の改善などが行なわれている

 ブロックダイヤグラムから離れたところでは「Power Tune」と呼ばれる新機能によってパフォーマンスアップを図っている。これまでのGPUにおいては、数段階のステート(例えば最大・中間・最低の3段階といった具合)で消費電力とパフォーマンスの制御を行なっていた。しかし、一部のアプリケーションおいて、TDPの余裕があるにも関わらず低いクロックで動作してしまうことがあったり、逆にTDPの枠を超えてしまうことも起こっているという。

 Power Tuneでは、このクロックおよび電圧を細かく監視/制御することで、こうしたパフォーマンスロスやTDPを超えた動作を防ぐという、2つの目的を持った機能である。簡単にいえば、クロック制御を厳密に行なうことで、常に消費電力はTDPの枠内に収まるようにしつつ、その中で最大パフォーマンスを発揮させるよう最適化する機能と言える。表1に示したリミット電力は従来的表現におけるピーク消費電力ということになるが、この枠内でパフォーマンスロスなく、アプリケーションに適した最大クロックで動作させ続けるわけだ。

 またコントロールパネルのATI OverDriveには、「Power Control Serrings」という項が用意された。これはTDPのしきい値をユーザーが任意に調整できるというものだ(画面1)。熱設計などに余裕がある場合に、消費電力のリミットを制御することで、パフォーマンスアップを狙うことができる。ただし、この機能についてAMDは、自己責任としている点には注意が必要だ。

【図5】アプリケーションによって消費電力にはばらつきがある。余裕があるのにクロックを上げ切れていなかったり、逆にTDPを超えてしまうこともある。それを防ぐのがPower Tune機能である 【図6】Power Tuneでは従来のGPUより細かいステップでのクロック/電圧のコントロールを行なう
【画面1】Power Tuneのの設定はATI OverDriveのPower Control Settingsから行なう。-20%〜20%の範囲で指定が可能 【図7】Power Control Settingから消費電力の許容範囲を変更することで、より高いアベレージクロックで動作しパフォーマンス向上を狙える

【お詫びと訂正】初出時の記事で、Power Tuneについて誤った解釈が含まれておりました。お詫びして訂正させていただきます。


●リファレンスデザインにはBIOS切り替えスイッチを搭載

 さて、今回テストに使うのはXFXから借用したHD 6970搭載製品「HD-697A-CNFC」と、HD 6950搭載製品「HD-695A-CNFC」である(写真1、2)。いずれもリファレンスに準拠したデザインのものだ。

 ボードサイズはRadeon HD 6800シリーズよりも長くなっている(写真3)。ちょうど今月発表されたGeForce GTX 570と同じサイズだ。ちなみにリファレンスデザインのヒートシンクはベイパーチャンバーを用いたものとなっており、この点もGeForce GTX 570などと同じである。このあたりは、第2世代DirectX 11(DX11)対応GPUのトレンドといえそうだ。

【写真1】Radeon HD 6970を搭載する、XFXの「HD-697A-CNFC」 【写真2】Radeon HD 6950を搭載する、XFXの「HD-695A-CNFC」 【写真3】左からRadeon HD 6970、同6950、同6870、同6850。HD 6900シリーズの2製品は同サイズである

 ブラケット部は両製品ともDVI×2、HDMI、mini DisplayPort×2の構成(写真4)。HDMIは1.4a準拠。DisplayPort Hubなどを介することで、この標準ボードで最大6ディスプレイへ出力できる点などは、Radeon HD 6800シリーズと同じである。

 電源端子はハイエンド製品らしい構成になっている。上位モデルのHD 6970は8ピン+6ピン、下位モデルのHD 6950は6ピン×2の構成だ(写真5)。いずれのモデルもロード時の消費電力であれば、それぞれ6ピン×2、6ピン×1でまかなえる消費電力であるが、Power Tuneのリミットに合わせた端子構成を採っている。

 CrossFireの端子は2基で、Quad CrossFireへの対応を示している(写真6)。ただ、写真6はCrossFire端子よりも、その脇にある小さなスイッチに注目してほしい。これはBIOS切り替えスイッチである。

 HD 6900シリーズのリファレンスデザインはBIOSを2系統持たせており、1つは標準状態のBIOSが用意される。そして、もう1つはユーザーによるアップデートが可能なBIOSになっている。例えば、ビデオカードメーカーから定格クロックを超えるクロックを適用した“オーバークロックBIOS”などが提供され、ユーザー自身がアップデートを行なう、といったことが想定されているのだ。このBIOSのユーザーアップデートは自己責任であるとはしているが、ハイエンドユーザー向けの製品ということもあり、このあたりをユーザーが理解して利用してくれると考えているのだろう。面白い試みだと思う。

【写真4】HD 6900シリーズの2製品のブラケット部は同一。DVI-I×2、HDMI1.4a、Mini-DisplayPort×2の構成だ 【写真5】電源端子はHD 6970が8ピン+6ピン、HD 6950が6ピン×2の構成となっている 【写真6】CrossFire端子脇にBIOS切り替えスイッチを装備。ユーザーがアップデート可能なBIOS領域を持たせている

●3万円前後〜中盤のビデオカードを比較

 それではベンチマーク結果の紹介へ移りたい。テスト環境は表2に示したとおりで、ここでは3万円前後から3万円台中盤のセミハイエンド層を中心にテストを行なう。比較対象として使用した機材は写真7〜9のとおりだ。

【表2】テスト環境
ビデオカード Radeon HD 6970 (2GB)
Radeon HD 6950 (2GB)
Radeon HD 6870 (1GB)
Radeon HD 5870 (1GB) GeForce GTX 570 (1.28GB)
グラフィックドライバ 8.79.6.2-101206a-109984E Catalyst 10.11 GeForce Driver 263.09β
CPU Core i7-860(TurboBoost無効)
マザーボード ASUSTeK P7P55D-E EVO(Intel P55 Express)
メモリ DDR3-1333 2GB×2(9-9-9-24)
ストレージ Seagete Barracuda 7200.12 (ST3500418AS)
電源 KEIAN KT-1200GTS
OS Windows 7 Ultimate x64

 ドライバはHD 6900の両製品およびRadeon HD 6870(以下HD 6870)は、HD 6900シリーズのレビュー用に配布されたベータドライバを使用。残る2つの製品は、直近記事からテスト結果を流用しており、HD 5870はテスト時点の最新公式ドライバのCATALYST 10.11、GeForce GTX 570(以下GTX 570)はGeForce Driver 263.09βを使用している。

 なお、HD 6900シリーズにおいては、Power Tuneのカスタマイズは行なわず、デフォルト設定でテストを行なっている。

【写真7】Radeon HD 5870を搭載する、XFXの「HD-587A-ZNF9 【写真8】Radeon HD 6870を搭載する、XFXの「HD-687A-ZNFC 【写真9】GeForce GTX 570のリファレンスボード

 それでは、DirectX 11対応タイトルのベンチマーク結果から紹介していく。テストは「3DMark11」(グラフ1)、「Alien vs. Predator DirectX 11 Benchmark」(グラフ2)、「BattleForge」(グラフ3)、「Colin McRae: DiRT 2」(グラフ4)、「Lost Planet 2 Benchmark」(グラフ5)、「Stone Giant DirectX 11 Benchmark」(グラフ6)、「Tom Clancy's H.A.W.X 2 Benchmark」(グラフ7)、「Unigine Heaven Benchmark」(グラフ8)の結果である。

【グラフ1】3DMark11
【グラフ2】Alien vs. Predator DirectX 11 Benchmark
【グラフ3】BattleForge
【グラフ4】Colin McRae: DiRT 2
【グラフ5】Lost Planet 2 Benchmark
【グラフ6】Stone Giant DirectX 11 Benchmark
【グラフ7】Tom Clancy's H.A.W.X 2 Benchmark
【グラフ8】Unigine Heaven Benchmark

 なお、3DMark11については、Entry、Performance、Extremeの各プリセットを実行し、CPUの影響が小さい“Graphics Score”の結果を掲載している。3DMark11の詳細については後日改めて紹介する。

 結果は、比較対象に対して好不調がわかれる結果となった。全般にテッセレーションを多用しているほど、HD 6900シリーズ両製品が旧世代のハイエンドとなったHD 5870に対する優位性を持つシーンが多い。逆にそうでないタイトルでは、HD 6970こそHD 5870を上回る性能を見せるものの、HD 6950がHD 5870を下回る。ただし、それでもアンチエイリアスと異方性フィルタを適用した場合にはHD 6950の方が性能の落ち込みが小さい傾向が見てとれるのは興味深いところ。

 1つ謎なのはH.A.W.X 2のスコアだ。テッセレーション負荷が高めなタイトルなのだが、HD 6970でさえ下位モデルのHD 6870を下回るフレームレートに留まった。ほかのタイトルの結果と比べても不自然な印象を受ける。HD 6970とHD 6950の差が小さいのも気になるポイントである。まだドライバの最適化が不足しているとしか理由が推測できない。

 一方、GTX 570との比較では、3DMark11やAlien vs. Predator DX11 BenchmarkではHD 6970が健闘を見せるものの、ほかのタイトルではGTX 570の優位性が目立つ結果となっている。

 続いては、DirectX 10/9世代のベンチマーク結果を見ていきたい。テストは「3DMark Vantage」(グラフ9、10)、「Crysis Warhead」(グラフ11)、「Far Cry 2」(グラフ12)、「Left 4 Dead 2」(グラフ13)、「Tom Clancy's H.A.W.X」(グラフ14)、「Unreal Tournament 3」(グラフ15)である。

【グラフ9】3DMark Vantage(Graphics Score)
【グラフ10】3DMark Vantage(Feature Test)
【グラフ11】Crysis Warhead
【グラフ12】Far Cry 2
【グラフ13】Left 4 Dead 2
【グラフ14】Tom Clancy's H.A.W.X
【グラフ15】Unreal Tournament 3

 DX11タイトルよりも、こちらのほうがHD 6900シリーズの良さが引き出された印象を受ける結果だ。特にHD 6970は多くのテストでHD 5870を上回る性能を見せているほか、HD 6950がHD 5870を上回るタイトルも多い。HD 5870よりSP数は減ったものの、SIMDアレイの見直しで、並列が高まったこととテクスチャユニットが増したことが、好結果に結びついたと想像される。

 GTX 570との比較ではHD 6970が良い勝負で、Radeonシリーズが得意とするタイトルではGTX 570を上回る。ただ、全般にはややGTX 570が勝っている印象は残る。

 興味深いのは3DMark Vantageの結果だ。Radeonシリーズのみで見た場合、SPの演算性能が問われるPerlin NoiseではHD 5870が好結果を見せる一方、ほかのテストはHD 6900シリーズが好結果となる。Perlin NoiseではおそらくSP数の絶対数の差が響いたのだろう。ただ、Pixel ShaderについてはSIMDアレイが20基から24基へ増したことで並列性が増し、HD 6900シリーズの結果の良さに結びついたと見られる。

 ジオメトリ処理性能の影響が大きいStream Out、メモリ性能の影響が大きいGPU Perticlesの結果はPixel Shaderに比べると差は小さいものの、HD 6950がHD 5870を上回る結果を見せており、アーキテクチャ改善が功を奏していることが分かる。

 最後に消費電力の測定結果だ(グラフ16)。アイドル時はHD 6970とGTX 570が若干高めではあるが、そう大きな差はない。ただ、HD 5870/6950とGTX 570は10W近い差であり、アイドル時の消費電力差としては、昨今の事情を鑑みると大きめの差といっていいだろう。

【グラフ16】消費電力

 むしろ気になるのはピーク時消費電力である。HD 6970はほかのRadeon勢に比べると明らかに消費電力が大きめだ。HD 6950/5870とは60W程度の差が付いており、公称消費電力と比べても大きな差といえる。それでもGTX 570を下回るところは好印象を残す。

 一方、HD 6950の消費電力は“優秀”という表現をつかって差し支えないと考えている。HD 5870と同等レベルの消費電力であるが、この消費電力測定を行なった各テストではHD 5870を上回る性能を見せている。その意味では、同じ消費電力の枠内でより性能を伸ばした、と評価することができる。

●アーキ改善だけでなく純粋に価格性能比向上も喜べる製品

 以上のとおりテスト結果を見てくると、かなり安定してHD 5870を上回る性能を見せる。また、HD 6950はアーキテクチャの改良もあってかHD 5870に比べて多少の得手不得手を見せるものの、特にDX10/9タイトルについては同等以上の性能を持っていると判断できる。消費電力はHD 5870と同等だ。

 HD 6970は新たな最上位モデルとして、これまでの最上位を上回る性能を見せるが、同じプロセスを使って性能向上を図っていることもあって消費電力増というトレードオフは起こっている。より高い性能を目指す人向けだろう。オンライン推奨価格は369ドルで、GeForce GTX 570と同価格帯で販売される可能性が高そうだ。

 HD 6950は、これまでの最上位モデルであったHD 5870を置き換える存在になるだろう。より低い消費電力、(タイトルにもよるが)より高い性能を持つ製品となる。オンライン推奨価格は299ドルとされており、価格面を見ても3万円前後が主流のHD 5870を置き換えることになる。

 同じシリーズにラインナップする製品ではあるが、このように製品の持つ意味合いは多少異なる印象を受ける。いずれにしても、世代が1つ進んで価格性能比が向上し、さらにこれまでの最上位を超える性能を持つ製品がラインナップされたことは間違いない。AMD、NVIDIAともに同じプロセスで着実な進化を見せており、DX11対応GPUは新しいステージへ移行したことを決定付ける製品といえる。