■多和田新也のニューアイテム診断室■
NVIDIAは7月27日(現地時間)、米ロサンゼルスで開催中のSIGGRAPH 2010に合わせ、ワークステーション向けビデオカード「Quadroシリーズ」の新製品を発表した。Quadroシリーズとしては初めてのFermiベースの製品になる。ここでは、そのラインナップの概要と、Quadro 5000のパフォーマンスを紹介したい。
●3モデルすべてでGF100コアを採用Fermiアーキテクチャをベースとした製品は、2009年11月にTesla、2010年3月にGeForceがリリースされ、現状のNVIDIAのブランドで残されたのがQuadroへの投入であった。同社はFermiベースGPUでのレイトレーシングや、シーンマネージメントエンジンの提案を繰り返し行なっている。こうした提案に興味を持つであろうCAD、CAM、CAEを活用する産業/企業に向けて、Quadroの存在は不可欠なものといたわけだが、ようやくそこにおいてもFermiベースの製品が登場することになった。
新Quadroのラインナップは3モデルで、モデル名はQuadro 6000/5000/4000と、キリの良い数字になっているが、これはシリーズ名ではなく、下3桁がゼロのモデル名となる。つまり、千の位の数字が変わっているために分かりにくいが、それぞれの前モデルはQuadro FX 5800/4800/3800ということになる。これに加えてQuadro 6000を2枚とG-Syncボードを内蔵したQuadroPlex7000が投入される(図1、表1)。
【図1】FermiベースのQuadroシリーズ。Quadro 4000は1スロット占有仕様でECCメモリやG-Sync、SLI時に上位モデルで利用可能な一部機能が非サポートとなる |
Quadro 6000 | Quadro 5000 | Quadro 4000 | |
CUDA Core数 | 448基 | 352基 | 256基 |
メモリ容量 | 6GB GDDR5 | 2.5GB GDDR5 | 2GB GDDR5 |
メモリインタフェース | 384bit | 320bit | 256bit |
メモリ帯域幅 | 144GB/sec | 120GB/sec | 89.6GB/sec |
消費電力 | 225W | 152W | 142W |
対応API | DX11(SM5.0)/OpenGL4.0 | ||
Quadro FX 5800 | Quadro FX 4800 | Quadro FX 3800 | |
CUDA Core数 | 240基 | 192基 | 192基 |
メモリ容量 | 4GB GDDR3 | 1.5GB GDDR3 | 1GB GDDR3 |
メモリインタフェース | 512bit | 384bit | 256bit |
メモリ帯域幅 | 102GB/sec | 76.8GB/sec | 51.2GB/sec |
消費電力 | 189W | 150W | 108W |
対応API | DX10(SM4.0)/OpenGL3.3 |
CUDA Core数はそれぞれ448基、352基、256基となっている。GeForceシリーズと比較した場合、上位2モデルはそれぞれGeForce GTX 470、GeForce GTX 465と同じCUDA Coreの数を持つが、Quadro 4000については256基という、これまでにない仕様のFermiベース製品ということになる。
ちなみに、このCUDA Core数はチップがGF100であることも示している。GeForceシリーズにはGF104コアを用いたGeForce GTX 460がリリースされているが、GF104のStreaming Multiprocessorsは48基のCUDA Coreを1単位としている。Quadro 4000の256基という数字は48では割り切れない。一方、GF100は32基のCUDA Coreを1単位としており割り切れる。つまり、Quadro 4000は8基のSMを有効化したGF100チップを用いた製品、ということになるわけだ。
メモリ容量は上位からそれぞれ6GB、2.5GB、2GBとなる。Fermiベースになったことで、GDDR5を使えるようになり、旧世代製品に比べてメモリ帯域幅の全体的な底上げがなされた。また、キャッシュからメモリまですべてのエラー訂正が可能なECCもサポートする(ただしQuadro 4000は非対応)。
ちなみに、Quadro 6000の448 CUDA Core、6GBメモリというスペックは、Teslaの上位モデルであるTesla C2070と同じ仕様。さらに、GeForceシリーズでは制限されてしまった、Fermiの特徴である「倍精度浮動小数点演算が単精度に対して2分の1」という性能も、そのまま有効になっている。こうした仕様は、プロのグラフィックス分野に対するGPUコンピューティングの適用を強く意識したものといえるだろう。
もちろん、10bitカラー、16Kテクスチャ処理など、Quadroらしいグラフィックス用途の機能も盛り込まれている。Quadro FX 5800ではSLI構成が必要だった64xFSAAはボード1枚で実現できるようになっており、SLI構成時には128xFSAAをサポートする。GPUコンピューティングの機能に加え、プロのグラフィックス用途に向けた機能も拡張した製品という意味では、これまでに登場したFermi採用ビデオカードのなかでも、もっとも豪勢な製品といってもいいかも知れない。
今回テストするのは、NVIDIAから借用した「Quadro 5000」のリファレンスボードである(写真1)。2スロットを占有する形状になっているほか、裏面にはヒートシンクも備えている。この裏面のヒートシンクはGeForce GTX 480/470にはないものであるが、Quadro 5000の場合は裏面にもメモリチップが載っている関係で取り付けられているものと見られる(写真2)。
【写真1】Quadro 5000のリファレンスボード | 【写真2】裏面にもヒートシンクとなるパネルが装着されている。PCBの一部にはファンの吸気口が開いている |
メモリはSamsungの1Gbit/0.5ns品である「K4G10325FE-HC05」が、表面に10枚、裏面に10枚、合計して2,560MB分が搭載されている(写真3、4)。ちなみに、メモリのECCを有効にするためには、NVIDIA Control Panelから設定する必要がある(画面1)。ECCを有効にすると、メモリの一部をECCビットの保存領域として利用するため、実際に利用できる容量は減少する(画面2、3)。具体的には、ECCは64bitに対して8bitのECCビットを生成するため、ECCビットの領域はメモリ容量に対して12.5%必要になる。Quadro 5000の場合は、2,560MBのメモリ容量に対して、320MBのECCビット領域が確保されるので、利用可能な容量は2,240MBとなっている。
【写真3】GPUはGF100が使われている。メモリチップは表面に1GbitのGDDR5を10枚装着。2枚分の空きパターンも見てとれる | 【写真4】裏面にも同様に1Gbitのメモリチップを10枚搭載。20枚合計で2,560MBの容量となる |
また、後述のベンチマークテストでは、ECCを有効にすることでパフォーマンスの低下も見て取ることができる。メモリ容量が減少したことも影響があるだろうが、ECCビットの生成やエラーチェックなどの処理が加わることによるインパクトもあるだろう。いずれにしても、ECCを有効にすることによる信頼性向上と、メモリ容量/性能のトレードオフが発生することは認識しておく必要がある。
【画面1】NVIDIA Control PanelにECCの設定が用意され、チェック入れることで有効化される。設定変更時にはシステムの再起動が必要 | 【画面2】ECC無効時のメモリ容量はフルの2,560MBが利用可能 | 【画面3】ECC有効時には一部がECCビットの領域として使われるため、利用可能な容量は2,240MBに減少する |
クーラーは、裏面のヒートシンクのほか、表面にはボード全体を覆っている黒い金属パネルと、GPU冷却用のヒートシンクを備えている(写真5、6)。この黒い金属パネルはPCBの補強の意味合いもあると見られるが、パッシブヒートシンクとしての役割も持っており、表面のメモリチップやVRM部などの冷却にも活用されている。GPUのヒートシンクはGeForce GTX 480のそれに似ており、GPUに直接触れるようになっているヒートパイプとアルミフィンを組み合わせたもの。ただし、外観写真から分かるように、ヒートシンクは化粧カバー内に完全に収まるようになっている。
【写真5】化粧カバー内部はヒートシンクを兼ねる黒い金属パネルと、GPU用のヒートシンクを備えている | 【写真6】GPU用ヒートシンクは、GPUに直接触れる5本のヒートパイプとアルミフィンを組み合わせた構造 |
電源端子はボード末端部に6ピン×1系統を備えるのみとなっている(写真7)。ただ、ボードのピーク消費電力は152Wとなっており、PCI Expressからの供給と合わせて最大150Wを供給可能な6ピン×1系統では、わずかながら不足する。後述のテスト中に電源不足と見られるトラブルは起きていないものの、やや不安の残る仕様になっている。なお、この点についてNVIDIAからは、実使用でこのボード全体のピーク電力値に達することはないので6ピン×1系統で大丈夫、という回答を得ている。
ちなみに、基板上では2系統分のパターンが用意されており、1系統が空きパターンとなっている(写真8)。これは、メモリチップのパターンも24枚分が用意されているところから見ても、上位のQuadro 6000と共通のPCBなのではないかと想像される。
【写真7】ボード末端部に6ピン×1の電源端子を備える | 【写真8】基板上には6ピン×2系統分のパターンが用意されており、Quadro 5000はこのうち1つだけ使っている格好 |
ブラケット部はDVI-I、Display Port×2の構成(写真9)。これはQudaro FX 4800と同じ構成となる。同時出力が2ディスプレイまでとなるのも、NVIDIAの多くの製品と同じ仕様である。また、Quadroの上位モデルらしくSDI(Serial Digial Interface)も備えており、Qudaro FXと共通のオプションを利用することもできる(写真10)。SDIについてはQuadro 6000/5000/4000のいずれも備えるが、G-SyncにはQuadro 6000/5000のみ対応となっている。
【写真9】ブラケット部はDVI-I×1とDisplayPort×2の構成。3D Vision Proのエミッタを接続する3ピンDIN端子も備えている | 【写真10】ボード上部にはSLI端子とSDI/G-Sync用のコネクタを備えている |
ブラケット部には3ピンのDIN端子も備えている。やはりQuadro FX 4800などにも備わっている端子で、3D(ステレオ)表示のコントローラ(赤外線エミッタなど)を接続することができるものだ。
今回、このFermiベースQuadroと同時に、新しい3D Visionのソリューションである「3D Vision Pro」が発表された。標準の3D Visionがエミッタとメガネの間を赤外線で接続するのに対し、3D Vision ProはRFで接続するのが特徴だ。このRF対応のコントローラを、この3ピンDIN端子に接続して利用する。Quadro 4000では3ピンDIN端子はオプション扱いになっている。
3D Vision Proのメリットは2つ挙げられている。1つは到達距離で、赤外線のように遮蔽物があって利用できなくなるといったことがなく、利用可能エリアが広がるという点。到達距離は100フィートとされている。
もう1つはIDでコントローラとメガネを紐付けできることである。赤外線ではとくに紐付けは行なっておらず、通信可能な状態なエリアに入れば自動的に動作するようになっている。コンシューマ用途であれば、この仕組みでとくに困ることはないだろう。だが、コンテンツ制作の現場においては、狭いエリアで複数のコントローラが利用されることも想定される。そのため、赤外線方式では、隣の席にあるエミッタに反応して、本来自分が作業すべき目の前のマシンにつながれたエミッタと通信してくれないといったケースが起こるかも知れない。RF方式の3D Vision Proなら、そうした事態が起こらないというわけである。
【画面4】Quadroのドライバは、ステレオ3D表示の設定がNVIDIA Control Panelの3D設定画面に統合されている |
ちなみに、Quadro用のドライバは、ステレオ表示のディスプレイモードなどの設定が、NVIDIA Control Panelの3Dセッティング画面に統合されているのも特徴的だ(画面4)。また、OpenGLのQuad Buffered StereoをサポートしているのもQuadroシリーズならではの機能となっている。
それでは、Quadro 5000の性能を見るべくベンチマーク結果を紹介していきたい。テスト環境は表2のとおり。Quadro 5000はECC有効時、無効時それぞれでテストを行なう。
比較対象は、前世代モデルのQuadro FX 4800と、その上位モデルとなるQuadro FX 5800をメインにした。合わせて、CUDA Core数などで仕様が近いGeForce GTX 465を加えているが、これは各API、アプリケーションへの適応具合をGeForceと相対的に比較するために用意したものだ。
またAMD製品のFirePro V5800も用意し、やはりAPIやアプリケーションごとの得手不得手の参考にしていきたい。なお、FireProは全般にQuadroと価格に大きな開きがあり、FirePro V5800もQudaro FX 4800やQuadro 5000より安価に入手できる製品であることは付記しておきたい(写真11~14)。
【写真11】Quadro FX 5800のリファレンスボード | 【写真12】Quadro FX 4800のリファレンスボード |
【写真13】GeForce GTX 465を搭載する、MSI「N465GTX Twin Frozr II」 | 【写真14】FirePro V5800のリファレンスボード |
【画面5】Quadro 5000の動作クロック。コア513MHz、シェーダ1,026MHz、メモリ3GHz相当となっている |
なお、Quadro 5000の動作クロックは公式には開示されないが、NVIDIA Control Panelから確認すると、コア513MHz、シェーダ1,026MHz、メモリ3GHz相当で動作している(画面5)。同じCUDA Core構成となるGeForce GTX 465はコア607MHz、シェーダ1,215MHz、メモリ3,206MHz相当となっており、これに比べるとやや低速に動作していることになる。ただし、メモリに関してはインターフェイス幅がQuadro 5000の320bitに対して、GeForce GTX 465は256bitなので、帯域幅は前者が120GB/sec、後者が102.6GB/secとなる。つまり、Quadro 5000はGeForce GTX 465に対して、GPUの動作は遅いが、メモリ帯域幅には優位性がある仕様となっていることになる。
ビデオカード | Quadro 5000 (2.5GB) Quadro FX 5800 (4GB) Quadro FX 4800 (1.5GB) | GeForce GTX 465 (1GB) | FirePro V5800 (1GB) |
グラフィックドライバ | Quadro Driver 258.63 β | GeForce Driver 258.96 | FirePro Software Suite 8.723 |
CPU | Core i7-860(Turbo Boost無効) | ||
マザーボード | ASUSTeK P7P55D-E EVO(Intel P55 Express) | ||
メモリ | DDR3-1333 2GB×2(9-9-9-24) | ||
ストレージ | Seagete Barracuda 7200.12 (ST3500418AS) | ||
電源 | KEIAN KT-1200GTS | ||
OS | Windows 7 Ultimate x64 |
ドライバは、Quadro各製品はNVIDIAから提供されたQuadro 5000に対応した258.63βを使用。NVIDIAの公式サイトではWHQL版のより新しいドライバが提供されており、少し古いバージョンということになる。GeForce GTX 465、FirePro V5800は、各メーカーのサイトからダウンロードしたテスト時点の最新版を使用している。
では、結果を紹介していく。まずは、先に説明したCUDAおよびECCメモリ周りの性能を簡単に見るため、「CUDA-Z」のパフォーマンステストの結果を見てみたい。当然ながらCUDAに対応しないFirePro V5800はテストから省いている。グラフ1はメモリコピーテスト、グラフ2は演算テストである。
まずメモリコピーは、ホスト-デバイス間転送においては、GF100世代の製品とGT200世代の製品で多少のギャップが見られ、GF100が高速な傾向にある。ここはPCI Expressインターフェイスがボトルネックになるテストだが、GF100のメモリ転送効率のほうが良いということだろう。
デバイス内転送では、GPU-ビデオメモリの帯域幅が効いてくる。102GB/secのQuadro FX 5800、102.6GB/secのGeForce GTX 465が似たような結果に落ち着いているところから見ても、120GB/secのQuadro 5000はもっと良い結果になってもいいところである。原因は分からないが、ひとまずQuadro 5000が思ったよりも伸びなかったという見方をするのが妥当だろう。ECCを有効にした場合にはおよそ1割程度の転送速度の低下が発生している。
演算テストは、動作クロックの違いもあるので、絶対的な数値に差があるのは当然である。ただ、ここでは先に述べたFermiベースQuadroで有効になっている単精度に対する倍精度演算の速度低下度合いなど、ビデオカードごとに演算の種類によるクセをチェックしたい。ここでは、テストごとではなく、ビデオカードごとに結果をまとめたグラフとしている。
結果を見ると、まずQuadro 5000の倍精度浮動小数点演算の性能は、単精度浮動小数点に対して約2分の1となっており、Fermiアーキテクチャの理論値に近い数字が出ていることが分かる。GT200ベースのQuadro FX両製品および、Fermiでもこの機能が制限されたGeForce GTX 465では約8分の1の数字に留まっている。
整数演算についても、GT200のALUが24bit整数までの処理に対応していたのに対して、Fermiでは32bit整数まで対応可能となったことから、両テストの結果はほぼ同等。これはGeForce GTX 465も同じ傾向を示している。対するGT200ベースのQuadro FX両製品は32bit整数演算が24bit整数に対して約5分の1の性能に留まっていることが分かる。
先のメモリアクセスの実行速度については不安を見せるが、演算性能に関していえば、Fermiで強化されたGPUコンピューティング関連の機能をフルに使えるビデオカードとしての価値を見せた結果といえる。
【グラフ1】CUDA-Z 0.5.95(Memory Copy) |
【グラフ2】CUDA-Z 0.5.95(GPU Core Performance) |
続いては、ワークステーション向けビデオカードでは定番ベンチマークといえる、「SPECviewperf 11」(グラフ3)、SPECviewperf10(グラフ4)の結果である。Quadro FX 5800と4800の差がそれほどないのに比べ、Quadro 5000はこれらから飛躍的なスコアアップが目立つ結果となった。
viewperf 11はEnSight、Maya、Siemens Teamcenter Visualization Mockup(tcvis)、Siemens NX(snx)あたりの伸びがとくに大きい。一方でLightWaveやPro/ENGINEERは奮わない。一方のviewperf 10は、わりと安定してQuadro 5000が良好な成績で、3ds Maxのみが伸びない結果となった。描くオブジェクトの特性、例えばLightWaveはPro/ENGINEERは頂点数が少ない、といったことも影響していると思われるが、ドライバのチューニング次第では、これらの性能も改善する可能性はあるだろう。このほかには、ECC有効時には若干性能が落ちる傾向も見て取ることができる。
【グラフ3】SPECviewperf 11(1,920×1,080ドット) |
【グラフ4】SPECviewperf 10(1,600×1,200ドット) |
次はUnigineの「Heaven Benchmark 2.1」で、OpenGLでの描画(グラフ5)、DirectX(DX)11での描画(グラフ6)の2パターンを試している。Heaven Benchmark 2.1ではOpenGL 4.0でサポートされたテッセレーションを利用した描画が可能だ。なお、Quadro FX両製品はOpenGL 4.0、DX11ともに対応しないためテストを省略。FirePro V5800も現状のSoftware Suite 8.723ではOpenGL 4.0をサポートしていないので、DX11のみテストを行なっている。
結果はOpenGL、DX11ともにGeForce GTX 465が良好な結果を見せた。ここはコア/シェーダクロックの高さが活きた格好と見ていいだろう。OpenGLでの描画といってもドライバがUnigineのエンジンに最適化されていないことがうかがえる。
Quadro 5000のECC有効時のフレームレート低下については、解像度の変化よりもAA/AF適用時により影響が大きい結果となっている。
【グラフ5】Unigine Heaven Benchmark 2.1(OpenGL) |
【グラフ6】Unigine Heaven Benchmark 2.1(DX11) |
次もUnigineのベンチマークソフトである「Tropics 1.3」を試す。こちらはOpenGL 3.0/DX10世代のグラフィックスを用いたソフトとなる。DX11 APIを用いた描画も可能ではあるが、ここではDX10 APIを使ってテストを行なう。結果はOpenGLでのテストをグラフ7、DX10での結果をグラフ8に示している。
こちらもGeForce GTX 465の結果がOpenGL、DX10ともに良好。Quadro 5000もAA/AFを適用していない状態ではそれに次ぐ性能を見せるものの、AA/AFを適用した場合はQuadro FX 5800のフレームレートを下回る結果となった。Quadro FX 4800に対してもAA/AF適用時に差が詰まる傾向を見せており、Quadro FX 5800のメモリ容量の大きさが活きたとは考えにくい。ROPの性能にしても、理論上はQuadro 5000のほうがリッチな仕様である。ROPやメモリコントローラ周りではなく、シェーダユニット側の処理でなんらかのボトルネックが発生している可能性もありそうだ。
【グラフ7】Unigine Tropics Benchmark 1.3(OpenGL) |
【グラフ8】Unigine Tropics Benchmark 1.3(DX10) |
続いてはCineBench R11.5である(グラフ9)。本コラムでCineBenchを取り上げる際は、CPUによるレンダリングテストを用いることが多いが、ここではOpenGLによる描画である。MAXONのCINEMA 4D用のエンジンを試すベンチマークソフトで、OpenGL 2.0ベースとなる。
ここはQuadro各製品、GeForce GTX 465、FirePro V5800と、スコアが分離した格好になった。ただ、Quadro 5000はQuadro FX両製品に比べ、ややスコアが低い傾向が見られる。このテストでは、ドライバの最適化度合いの影響が大きいと見られるが、FireProのCINEMA 4Dエンジンへの適性の高さを見てとれる結果といえる。
【グラフ9】CineBench R11.5(OpenGL) |
次は「FurMark v1.8.2」を試してみたい(グラフ10)。これもOpenGL 2.0をベースとしたベンチマークソフトとなる。負荷が高いことで知られ、スタビリティソフトとしても利用されるものだ。
結果はここもGeForce GTX 465が良好だが、AA/AF有効時はQuadro 5000がもっとも性能の落ち込みが少ない傾向を見せている。ただ、ECC有効時のスコアの落ち込みが非常に大きく、AA/AF時の落ち込みがより大きい。とくにAA/AF時にフレームバッファへのアクセスが頻繁に起きていると見られる結果といえる。
【グラフ10】FurMark v1.8.2 |
ここからはDXアプリケーションのベンチマーク結果を見ておきたい。テストはDX11アプリケーションでテッセレーションも活用されている「Alien vs. Predator DX11 Benchmark」(グラフ11)、DX10アプリケーションの「3DMark Vantage」(グラフ12、13)、同じくDX10アプリケーションの「バイオハザード5ベンチマーク」(グラフ14)である。AVP DX11 BenchmarkはDX11非対応のQuadro FX両製品ではテストしていない。
ここでは、Quadro 5000と他の製品を比べた場合、各アプリケーションで大局的には目立った差は見られない。GPUの動作クロックの差やDXアプリケーションに対するドライバの最適化度合いによる差が出て、GeForce GTX 465がもっとも良好な傾向だ。
Quadro 5000はECC無効時ならQuadro FX 5800を上回る傾向が強い一方で、ECCを有効にした場合は同等かやや低い結果に留まる。
唯一不思議な結果となったのが3DMark VantageのFeature Testで、Pixel Shaderのフレームレートが伸びない結果となっているが、過去に行なったGeForce GTX 480などにおけるGF100とGT200の差を見ても、それほど不自然な結果ではない。
例えば、環境は異なるものの、GeForce GTX 480のテスト結果は48.29fps、GeForce GTX 285の結果は39.24fpsだった。Quadro FX 5800はGeForce GTX 285とCUDA Core数が同じでクロックが648MHzに対して610MHzとやや低いので、30fps台前半に落ちる。一方のGeForce GTX 480とQuadro 5000は、動作クロックがコア700MHz/シェーダ1,401MHzとコア513MHz/シェーダ1,026MHzと差があるうえ、CUDA Core数も480基と352基という差がある。単純計算では半分近くまで性能が落ち込んでもいいわけで、GeForce GTX 480の48.29fpsに対して、26.24fpsという数値は妥当性がある。
一方でメモリ帯域幅やシェーダユニットの演算性能などが問われる、Feature Testのほかのテストは優位性ある結果となっており、Pixel ShaderでQuadro FX 5800を下回る結果が出たのは、アーキテクチャやポジショニングの違いによって生まれたものと解釈していいだろう。
【グラフ11】Alien vs. Predator DX11 Benchmark |
【グラフ12】3DMark Vantage Build 1.0.2 (Graphics Score) |
【グラフ13】3DMark Vantage Build 1.0.2 (Feature Test) |
【グラフ14】BIOHAZZARD 5 ベンチマーク |
最後に消費電力の測定結果である(グラフ15)。今回はOpenGL系のベンチマークソフト実行時の結果を中心に、同じエンジンでDX11/DX10描画を行なった際の結果も測定した。テストを実施できないものについては結果も省いている。
全体的な傾向として、Qudaro 5000はGeForce GTX 465と同等程度である。公称のピーク消費電力は前者が152W、後者が200W。さらにQuadro 5000については実使用時には150Wを超えないというNVIDIAの言質もある。ボード単体の消費電力を測定しているわけではないので、GeForce GTX 465がピークに対して意外に使っていない、と見るべきか判断しづらい。
Quadro FX両製品との相対的な比較を加えると、さらに公称消費電力がアテにならない傾向が出てくる。公称189WのQuadro FX 5800はアイドル時、ロード時ともにQuadro 5000より消費電力が大きい。大きいところで40W強といったところなので、この両者の相対的比較は妥当性を感じる。一方、Quadro FX 4800は150Wの公称値でQuadro 5000とほぼ同じ数値であるが、こちらは実際の測定結果がかなり低い数値となった。Tropics Benchmarkは近い数字ではあるが、FurMarkは30W以上の差が付いており、公称消費電力との乖離が大きい。
ただ、ピークという数字を出している以上、それを超える消費電力が発生してはシステムに組み込んだ際の冷却設計にも影響が出るし、Quadro FX 4800やQuadro 5000は6ピン×1系統でギリギリの仕様なわけで、これを超えるということは考えにくい。Quadro 5000やQuadro FX 5800は、GeForce GTX 465やQuadro FX 4800に比べると、より公称ピーク消費電力に近い電力を消費しているということだろう。
ちなみに、FirePro V5800についてはアイドル時、ロード時ともに非常に低消費電力に留まっている。性能面ではQuadro FX両製品と得手不得手がある程度の能力をここまでのテストで見せており、電力性能比のバランスは良好な性格を見てとれる。
【グラフ15】各ビデオカード使用時のシステム消費電力 |
●Fermi-GPUの真打ち
以上のとおり、ベンチマーク結果を紹介してきたが、Quadroに関しては各業務に対していかに最適化され、安定して動作するかが重要な製品だけに、大局的な性能評価はあまり意味がないと思う。それを承知でざっくりとまとめると、Quadro FX 4800からは、ほとんどのアプリケーションでより高い性能を見せるだけでなく、前世代の上位セグメントの製品となるQuadro FX 5800に対しても、多くのアプリケーションでより良い性能を発揮した。GF100になったことで、前世代からの性能向上を期待してよい結果といえる。
米国での実売価格はQuadro 6000/5000/4000の順に、4,999ドル、2,249ドル、1,199ドルとなっており、コンシューマ向け製品とは一線を画すが、業務用途においては機能、性能の両面で前世代からの優位性があることで、一定の人気を博すのではないだろうか。
また、GPUコンピューティングに関してもTeslaと同等の機能が提供されるのはGeForceにはない大きなポイントで、NVIDIAが繰り返しアピールしてきたグラフィックス表現の革新が起きるかどうかは、このQuadroの成功にかかっているといっても過言ではないだろう。この点でも興味深い製品が登場したといえる。