コードネームNV30として知られてきたNVIDIAの最新ビデオチップ「GeForce FX」がいよいよ登場する。GeForce FXは、ATIテクノロジーズの「RADEON 9700/9500シリーズ」に続いて、2番目に登場したDirectX 9対応ビデオチップであり、そのパフォーマンスに期待が集まっている。 ここでは、NVIDIAのGeForce FX搭載リファレンスカードを入手したので、早速そのパフォーマンスを検証していきたい。
GeForce FXは、コードネームNV30と呼ばれてきたNVIDIAの最新ビデオチップである。GeForce FXそのものの特徴やアーキテクチャについては、後藤氏や笠原氏の記事を参照してもらうことにして、ここでは、概要を紹介することにとどめたい。 GeForce FXは、8本のピクセルパイプラインと自由度の高いVertex Shaderユニットを備えたDirectX 9完全対応ビデオチップであり、集積されているトランジスタ数は1億2,500万個にもなる。DirectX 9完全対応ビデオチップでは、Pixel Shader 2.0とVertex Shader 2.0をサポートすることが要求される。 DirectX 9完全対応ビデオチップとしては、ATIテクノロジーズのRADEON 9700/9500シリーズがすでに登場しており、GeForce FXはそれに続く製品となる。ただし、RADEON 9700/9500シリーズのPixel ShaderおよびVertex Shaderは、DirectX 9の基本スペックに準拠しているが、GeForce FXのPixel Shader、Vertex Shaderでは、DirectX 9で規定されているPixel Shader 2.0、Vertex Shader 2.0をさらに拡張したものになっており、利用できる命令数などが大幅に増えていることが特徴といえる(Pixel Shader 2.0+、Vertex Shader 2.0+と呼ばれる)。 GeForce FXシリーズの製品ラインアップとしては、コアクロック500MHz、メモリクロック1GHzで動作する「GeForce FX5800 Ultra」とコアクロック400MHz、メモリクロック800MHzで動作する「GeForce FX5800」が用意される。今回入手したのは、GeForce FX5800 Ultra搭載のリファレンスカードである。 下にその写真を示すが、従来のビデオカードとは見た目も大きく違うことがわかるだろう。GeForce FX5800 Ultra搭載リファレンスカードでは、GeForce FXやメモリチップから生じる熱を排熱するために、FX Flowと名付けられた放熱機構が搭載されている。FX Flowは、銅製の大型ヒートシンクとシロッコタイプのファン、プラスチック製カバーから構成されており、高い冷却性能を実現するが、その代わりサイズが大きく、スロット2枚分を占有する。つまり、このカードをAGPスロットに装着すると、その隣のPCIスロットが利用できなくなるわけだ。 FX Flowでは、吸気穴と排気穴が別々に設けられており、プラスチック製の空気整流板によって、効率のよいエアフロー(空気の流れ)を実現している。また、消費電力が増大しているため、AGPスロットからの電源供給だけでなく、光学ドライブなどの電源供給に使われる4ピンコネクタ(ペリフェラルパワーコネクタ)経由でも、電源を供給してやる必要がある。 こうした2スロットを占有するタイプのビデオカードは、ABIT製のGeForce 4 Ti4200搭載ビデオカード「Siluro GF4 Ti4200 OTES」などが存在するが、コンシューマ向け製品としてはやはり珍しい。
やはり、GeForce FXで期待されるのは、そのパフォーマンスであろう。ここでは、以下のテスト環境を用意して、さまざまなベンチマークテストを行なってみた。ベンチマークプログラムとしては、3DMark2001 SE Build 330(以下3DMark2001 SE)、Unreal Tournament 2003、Codecreatures Benchmark Pro、Quake III Arena、3DMark03の5つを用いた(FINAL FANTASY XI Offical BenchMarkも動かしてみたが、解像度が640×480ドット固定で、ハイエンドビデオカードには負荷が軽く差があまり出ないため、ここでは割愛する)。 比較対照用として、GeForce4 Ti4600搭載ビデオカードとRADEON 9700 PRO搭載ビデオカードを用意して、同様にテストを行なった。 ベンチマーク結果を紹介する前に、まず、FX Flowの騒音についてコメントしておきたい。FX Flowは見た目もかなりインパクトがあるが、その騒音レベルもかなりのものである。GeForce FXには、Silent Runningと呼ばれる機能があり、負荷に応じて動的にコアクロックやメモリクロックを可変したり、ファンの回転数を制御することが可能である。 今回テストした環境においては、Windows XPでデスクトップ画面を表示している状態や2Dベースのアプリケーションを動かしている状態なら、FX Flowのファンは停止していた。しかし、3Dベンチマークテストを実行した途端に、ファンが高速で回転をはじめ、かなり大きな騒音が生じる。ベンチマークが終了して、結果表示画面になると、ファンの回転数が落ちていき、やがて停止する。 このあたりのレスポンスは、かなり素早く、的確に制御されていることがうかがわれるが、とにかく、フル回転時の騒音には正直驚かされた。CPUクーラーの中にも高回転タイプのファンを利用した、騒音の大きな製品があるが(もちろん冷却性能はその分高い)、そうしたCPUクーラーと同等以上の騒音であると感じた。 ここでは、具体的な騒音レベルの測定などは行なわなかったが、デジタルカメラで音声付き動画を撮影してみたので、参考にしてほしい。撮影は、マザーボードなどがむき出しの状態で行ない、ビデオカードとの距離は約50cm離れている。
起動時の動画の後半はFX Flowのファンが完全に停止していることがわかるだろう。このときにも、CPUクーラーのファンやチップセットのファン、電源ユニットのファンなどが回っているので、ある程度の騒音は生じているが、それと比較することで、FX Flowのファンの騒音レベルがある程度類推できるであろう。 ただし、ファンの騒音は大きいものの、動作自体は非常に安定しており、長時間にわたって3Dベンチマークを走らせていても、問題なく動作していたことを付け加えておこう。 なお、RADEON 9700 PROの場合は、外部電源コネクタを接続しないと、BIOSレベルで警告メッセージが表示されて起動しないが、GeForce FXでは、警告ウィンドウが表示されるものの、一応は動作する。ただし、その場合、コアクロックやメモリクロックが落ち、パフォーマンスは大きく低下する。 NVIDIAのドライバでは、レジストリにCoolbitと呼ばれるDWORD値を追加することで、クロック変更機能がプロパティに追加されるが、それによってクロックを確認したところ、電源コネクタを外すと、コアクロックは250MHz、メモリクロックは500MHzとなるようだ。また、Perfomance(3Dモード)でのクロックはコアクロック500MHz、メモリクロック1GHzだが、Standard(2Dモード)ではそれぞれ300MHz、600MHzとなっていた。 また、FSAAの設定については、GeForce 4 Ti4600では、「2x」「Quincunx」「4x」「4xS」の4種類の設定が可能だが、GeForce FXでは、さらに「6xS」、「8xS」というモードが追加されていた(末尾にSがつくモードはDirect3D時のみ有効)。
それでは、ベンチマーク結果を紹介する。なお、ビデオドライバのバージョンは、GeForce FXが6.14.01.4268(評価用キットに付属していたバージョン)、GeForce4 Ti4600が6.13.10.4109(NVIDIAのWebサイトで公開されている最新ドライバ)、RADEON 9700 PROが6.14.01.6292(ATIテクノロジーズのWebサイトで公開されている最新ドライバ)である。描画パフォーマンスにかかわるプロパティの設定に関しては、基本的にデフォルトのままであり、FSAAの設定のみを変更している。 【テスト環境】
■ベンチマーク結果
まず、従来のDirectX 8.0/8.1ベースでのベンチマーク結果から見ていこう。3DMark2001 SE(グラフ1)の結果は、やはりGeForce FXが高いスコアを記録している。特に、ビデオチップやメモリ帯域への負荷が高くなる高解像度のFSAA有効時では、GeForce4 Ti4600との差が大きくなり、1,280×1,024ドットFSAA 4X時や1,600×1,200ドットFSAA 4X時では、2倍以上のスコアを記録している。しかし、RADEON 9700 PROとの差はそれほど大きくはない(1,600×1,200ドットFSAA 4X時では、RADEON 9700 PROのほうがGeForce FXよりも高いスコアとなっている。 Unreal Tournament 2003(グラフ2)も、DirectX環境での3D描画性能を計測することができる。こちらの結果も、3DMark2001 SEの結果とほぼ同様であり、GeForce4 Ti4600と比較すると、圧倒的にパフォーマンスは高いが、RADEON 9700 PROとの差はわずかである。 Codecreatures Benchmark Pro(グラフ3)は、DirectX 8.0ベースのベンチマークプログラムだが、描画ポリゴン数が非常に多く、かなり重いテストである。このテストに関しては、GeForce FXとRADEON 9700 PROの差が比較的開いており、1,600×1,200ドットFSAA 4X時では3割程度、GeForce FXのほうが高いスコアを記録している。 Quake III Arenaは、OpenGLベース(グラフ4)の3Dゲームであり、今となってはかなり負荷が軽い部類に属するが、ここでも、GeForce FXは高いパフォーマンスを実現している。GeForce4 Ti4600では、高解像度モードで、FSAAを有効にすると、フレームレートが大きく低下するが、GeForce FXやRADEON 9700 PROでは、その低下幅が小さいことにも注目したい。 以上の結果から、現行のDirectX 8.0/8.1ベースのアプリケーションにおいても、GeForce FXは、現時点でトップのパフォーマンスを実現しているといえる。特に、前世代にあたるGeForce4 Ti4600と比べた際のパフォーマンス向上はかなりのものである。ただし、同じDirectX 9世代のビデオチップであるRADEON 9700 PROとの性能差はそれほど大きくはない。
GeForce FXにしろ、RADEON 9700 PROにしろ、DirectX 9対応ビデオチップであるからには、その真価はやはりDirectX 9ベースのテストで計測するのが妥当であろう。だが、DirectX 9自体、正式版が公開されたのは昨年の12月のことであり、今までDirectX 9対応のベンチマークプログラムはほとんど存在しなかった。しかし、ようやくFutureMarkから、2月12日にDirectX 9対応ベンチマークプログラム「3DMark03」が公開された。3Dmark03については、笠原氏のレポート「FutureMark、初のDirectX 9対応3Dベンチマーク「3DMark03」公開」を参照していただきたい。 結果は、グラフ5に示したとおりである。なお、3DMark03は、DirectX 9対応ベンチマークテストといっても、実際にはDirectX 9の機能が利用されているのは一部のテスト(Game Test 4など)のみである。したがって、DirectX 8.0/8.1世代のGeForce4 Ti4600でも、DirectX 9の機能を利用するテストがスキップされてしまうことを除けば、実行は可能である。ただし、3DMark03の総合スコアである3Dmarksの値は、Game Test 1からGame Test 4までのフレームレートから算出されているため、Game Test 4の値が加算されないので、その分スコアが低くなってしまう(これは、3DMark2001 SEのGame Test 4と同様)。 3DMark03の結果だが、やはりGeForce FXが高スコアを記録していることには変わりがない。Game Test 4がキャンセルされてしまうGeForce4 Ti4600が不利であることは差し引いても、かなりのパフォーマンス向上が見られる。 なお、3Dmark03では、Game Test 2およびGame Test 3がPixel Shader 1.4を利用するので(利用できない場合はPixel Shader 1.1を利用する)、現実の性能指標とは乖離しているという主張がNVIDIAから出されている(RADEON 8500/9000/9500/9700シリーズでは、Pixel Shader 1.4をサポートしているのに対し、GeForce 3/4シリーズでは、Pixel Shader 1.3までのサポートとなっている)。
そこで、もう少し詳しく3DMark03の結果を見てみることにしたい。以下の表は、3DMark03に含まれる個別のテストの結果である。まず、Game Test 1~4までについては、全てGeForce FXがRADEON 9700 PROを上回っている(Pixel Shader 1.4をサポートしていないGeForce4 Ti4600では、Game Test 2と3のスコアがかなり低いことにも注目)。そのため、その総合スコアである3Dmarksも、GeForce FXが上回ることになる。 シングルテクスチャ時のフィルレートについては、RADEON 9700 PROのほうが高いが、マルチテクスチャ時には逆にGeForce FXが大差を付けている。複数のテクスチャを重ねて貼る場合は、GeForce FXが有利なようだ。Vertex Shaderの性能は、RADEON 9700 PROとほぼ互角といってよいだろう(もちろん、GeForce4 Ti4600に比べれば約2倍に向上している)。 ここで問題になるのが、Pixel Shader 2.0のテスト結果である。GeForce FXは、RADEON 9700 PROの3分の1程度のフレームレートしか出ていない。このあたりの事情については、後藤氏のコラム( http://pc.watch.impress.co.jp/docs/2003/0206/kaigai01.htm および http://pc.watch.impress.co.jp/docs/2003/0207/kaigai01.htm )に詳しいので、そちらを参考にしていただきたいが、GeForce FXは、Pixel Sheder 2.0よりもプログラミングの自由度が高い分、単純にPixel Shader 2.0の性能を比べると、RADEON 9700 PROのほうが有利になる可能性があるということだ。 Shaderの実行性能は、シェーダプログラムの最適化によっても変わるので、アーキテクチャが異なる製品を比較するのは難しい。今後GeForce FXに最適化されたアプリケーションが登場すれば、評価が逆転する可能性もあるが、少なくとも3DMark03においては、RADEON 9700 PROのほうがPixel Shader 2.0のパフォーマンスが高いといえる。 【3DMark03の詳細結果】
NVIDIAから鳴り物入りで登場したGeForce FXは、確かに従来のGeForce4 Tiシリーズを大幅に上回る性能を実現しており、現時点最速のビデオカードと呼ぶことができるが、現時点ではそのパフォーマンスをフルに生かせるアプリケーションはほとんどない(DirectX 9への対応という点においては、RADEON 9700 PROでも事情は同じだが)。 また、リファレンスカードに準じたデザインでは、2スロット占有してしまうことと、ファンの高速回転時の騒音が非常に大きいという弱点もある(従来のビデオカードと同様に、1スロットしか占有しない製品が登場する可能性も高い)。 実売価格もアメリカでは399ドルということで、5万円を切る価格が期待されていたが、当初は6万円前後になりそうだ。CPUやメモリ、HDDなどの価格が全体的に下がっている現在、ビデオカードで6万円というのはいくら性能が高いといっても、なかなか気軽に購入できる値段ではない。 近日中に、GeForce FXの廉価版であるNV31(コードネーム)が投入される予定なので、通常のユーザーはNV31のほうが向いているだろう(NV31では、FX Flowのような大がかりな排熱機構は不要となり、コストも大きく下がる)。また、ハイエンドを狙うのなら、やはり近日中に発表が予想されるRADEON 9700 PROの後継チップであるR350(コードネーム)にも期待したい。 と、やや否定的なトーンが続いたが、GeForce FXで採用されたCineFXアーキテクチャは、最新CG映画と同等以上のクオリティの映像をリアルタイムでレンダリングしようという野心的な目標を目指して設計されたアーキテクチャであり、DirectX 9がサポートするShaderに比べて、機能が大幅に強化されている。つまり、真のポテンシャルは、GeForce FX専用アプリケーションでないと、なかなか発揮できないともいえるのだ。評価用キットに含まれていたデモプログラムからもそのポテンシャルの一端を伺うことができる。最後にそのサンプル画面をいくつか挙げておこう。 バックナンバー(2003年2月22日)
[Reported by 石井英男@ユービック・コンピューティング]
【PC Watchホームページ】
|
|