これぞ“至高の性能”を持つビデオチップ?
|
2月のPCパーツに関する最大の話題と言えば、なんといってもGeForce4ファミリーの発表だろう。GeForce4はNV25のコードネームで知られるハイエンド向けのGeForce4 Tiシリーズと、NV17のコードネームで知られるメインストリーム向けのGeForce4 MXシリーズという2種類の製品がリリースされた。
GeForce4 MXに関してはリリースと同時に搭載ビデオカードが出荷開始されたためこのコーナーでも取りあげたが、GeForce4 Tiに関してはやや時間がかかり、3月になってから流通が開始され始めた。今回は、このGeForce4 Ti搭載ビデオカードを取りあげ、そのパフォーマンスに迫っていきたい。
●NV20との大きな違いはバーテックスシェーダの強化
さて、今回取りあげるGeForce4 Tiシリーズには、オフィシャルには3製品が用意されている。それがGeForce4 Ti 4600、Ti 4400、Ti 4200の3モデルだ。注意すべきはTi 4200の存在で、サンフランシスコで開催されたGeForceファミリーの発表会では存在が明らかにされていたのだが、なぜかNVIDIAのWebサイトにはTi 4200に関する記述はないのだ。
Ti 4600のコア | Ti 4400のコア |
OEMメーカー関係者によると、OEMメーカーもTi 4200という存在はかなりギリギリになってから知らされたようで、どうも直前に追加されたモデルであるようだ。このため、Webページなどの準備が整わなかったということではないだろうか。そんな事情もあり、実際に市場に出まわったのはTi 4600とTi 4400の2モデルとなっている。
この2モデルの違いは、コア、メモリのクロックのみで、基本的には同じチップとなっている。CPUで言えばPentium 4 2GHzと1.90GHzの違いのようなものだと考えていいだろう。
さて、このGeForce4 Tiシリーズは、コードネームでNV25と呼ばれるグラフィックスチップが採用されている。NV25は、GeForce3/GeForce3 Ti 500に採用されていたNV20チップの強化版だ(以下GeForce4 TiシリーズをNV25、GeForce3シリーズをNV20と呼ぶ)。
機能面での大きな追加は、NV25ではRAMDACが2つ内蔵されたことだろう。RAMDAC(RAM Digital Analog Converter)とはビデオメモリに書きこまれた描画データを読み込み、そのデジタルデータをアナログデータへと変換して、CRTへ出力するためのユニットだ。NV20まではRAMDACが1つしか搭載されていなかったのだが、NV25では2つ搭載されておりデュアルディスプレイ環境を1枚のビデオカードで簡単に実現できる(NVIDIAではこのような機能をnViewと呼んでいる)。
性能面にあたえる大きな強化点としてはバーテックスシェーダの強化が挙げられる。バーテックスシェーダは、ハードウェアT&Lをより進化させたもので、ポリゴン(物体)の位置を演算する(ジオメトリ演算)などに利用される。
NV20/NV25に搭載されているプログラマブルバーテックスシェーダは、ゲーム側でプログラムして演算を行なうことが可能になっている。プログラマブルバーテックスシェーダはDirectX 8でサポートされた機能で、従来のDirectX 7ベースのハードウェアT&Lにくらべて高度なジオメトリ演算が可能になっている。
NV20ではこのプログラマブルバーテックスシェーダエンジンが1つ搭載されていたのだが、NV25では2つとなり従来にくらべてバーテックスシェーダのパフォーマンスが上がっているのが特徴となっている。
また、細かな改良点として、ビデオメモリのコントローラであるLMA(Lightspeed Memory Architecture)も若干の改良が加えられ、LMA IIへと進化している。LMA IIでは従来のLMAにくらべて効率が改善されており、メモリの帯域幅の実効レートが向上しているという。
また、ビデオメモリが最大で128MBにまで対応した点も見のがせない。これまでの64MBでは、FSAAをオンにした場合、ビデオメモリの容量が足りないため1,600×1,200ドットなどの高解像度では表示できなかったためだ。
●同クロックで比較した場合にはジオメトリ演算系の処理が向上しているのがわかる
こうして見ていくと、NV20とNV25のチップの機能としての違いで大きなものはバーテックスシェーダの強化と考えていいだろう。
実際にはNV25の方がコアクロック、メモリクロックとも高くなっているので、それらの分も加味したものがNV25のアドバンテージと言える。そこで、今回はNV25のクロックをNV20相当にまで下げ、チップそれ自体でどの程度のアドバンテージがあるのかを見てみた。
ただ、今回NV25のビデオカードにはビデオメモリが128MBであったのに対して、NV20では64MBと容量に差があり、実際にはビデオメモリ容量の差も関係していることは指摘しておきたい。そうした意味では厳密に両チップの差を計測したわけではなく、両チップを搭載したビデオカードのクロックを揃えた結果である。
なお、NV25を搭載したビデオカードには実際にはNV20と同じクロックの製品は存在しないので、EnTech Taiwan社( http://www.entechtaiwan.com/ )のツールであるPowerStripを利用してコアクロック、メモリクロックをNV20(実際にはGeForce3 Ti 500)相当の240MHz、500MHzにクロックダウンしテストた。
テストに利用したのは3DMark2001のうち、フィルレートやポリゴン数を計算するテスト、さらにはバーテックスシェーダやピクセルシェーダなどを演算するテストだ。結果は下記の表の通りで、上の結果はNV25を240/500MHzに下げた結果、下の結果はNV25をTi 4600として動作させた場合の結果だ。
NV25(240/500MHzクロックダウン)とNV20を比較した結果からわかるのは、フィルレート(Fill Rate)やピクセルシェーダ(PixelShader)といったいわゆるレンダリング系のテストの性能向上率が大きくても10%程度でしかないのにたいして、ポリゴン数(Polygon Count)やバーテックスシェーダ(Vertex Shader)といったジオメトリ演算系の処理は最大で20~60%も向上しているのがわかる。
こうしたことからも、NV25のチップそれ自体の機能向上はバーテックスシェーダが強化されたことによるジオメトリ演算性能の向上であるということがわかるだろう。なお、実際のクロックでNV25を動作させた場合、フィルレートやピクセルシェーダの性能も向上していることがわかる。つまり、レンダリング周りの性能強化はクロックが上がったことによりもたらされていることがわかるだろう。
【同クロックでのベンチマーク結果】NV25(240/500MHz,128MB) | NV20(240/500MHz,64MB) | 上昇率 | |
---|---|---|---|
Fill Rate(Single Texturing)/M texels/s | 843.3 | 792.9 | 6.4% |
Fill Rate(Multi Texturing)/M texels/s | 1,896.1 | 1,728 | 9.7% |
High Polygon Count(1Light)/M triangles/s | 34 | 22 | 54.5% |
High Polygon Count(8Light)/M triangles/s | 9.6 | 6 | 60.0% |
Bump Mapping Environment/fps | 71.1 | 75.8 | -6.2% |
Bump Mapping DOT3/fps | 52 | 52.8 | -1.5% |
Vertex Shader Speed/fps | 62.3 | 50.4 | 23.6% |
Pixel Shader Speed/fps | 44.3 | 40.8 | 8.6% |
Advanced Pixel Shader Speed/fps | 40.4 | 38.5 | 4.9% |
Point Sprites Speed/M sprites/s | 13.3 | 12 | 10.8% |
NV25(300/550MHz,128MB) | NV20(240/500MHz,64MB)/th> | 上昇率/th> | |
---|---|---|---|
Fill Rate(Single Texturing)/M texels/s | 1,059 | 793.6 | 33.5% |
Fill Rate(Multi Texturing)/M texels/s | 2,364 | 1,729 | 36.8% |
High Polygon Count(1Light)/M triangles/s | 42 | 22 | 90.9% |
High Polygon Count(8Light)/M triangles/s | 12 | 6 | 100.0% |
Bump Mapping Environment/fps | 84.9 | 75.7 | 12.2% |
Bump Mapping DOT3/fps | 65.7 | 52.8 | 24.4% |
Vertex Shader Speed/fps | 77.1 | 50.3 | 53.3% |
Pixel Shader Speed/fps | 54.9 | 40.8 | 34.6% |
Advanced Pixel Shader Speed/fps | 50.2 | 38.5 | 30.4% |
Point Sprites Speed/M sprites/s | 16.6 | 12 | 38.3% |
●現時点では最高性能を実現するGeForce4 Tiシリーズ
NV25がどのような性格のチップであるかは判って頂けたと思うが、それでは具体的にはどの程度の性能を持っているのだろうか? 今回も、3D描画性能を計測する上で事実上の標準となっているMadOnion.comの3DMark2001、id SoftwareのQuake III Arenaを利用して計測してみた。
今回テストに利用したのは、NVIDIAのパートナー企業の1つでもあるLeadTekのWinFast A250 Ultra TD(Ti 4600搭載)とWinFast A250 TD(Ti 4400)搭載の2製品で、どちらも2つのファンを搭載した大型のヒートシンクを搭載しているのが大きな特徴となっている。
LeadTekのGeForce4 Ti 4600搭載カード「WinFast A250 Ultra TD」 |
比較として用意したのは、前世代となるNV20ベースのGeForce3 Ti 500と無印GeForce3、2世代前となるNV15ベースのGeForce2 Ultra(64MB)とGeForce2 GTS(32MB)、さらに競合メーカーであるATI TechnologiesのハイエンドであるRADEON 8500(275/275MHz、64MB)だ。
テスト環境は表の通りで、ビデオカード以外はまったく同じ環境を利用した。ドライバに関しては、両社のホームページで公開されている最新バージョンを利用した。結果はグラフ1、グラフ2で、細かなスコアに関して量が膨大になっているので別ページに掲載しておく。興味がある読者は参照してほしい。
【テストに使用したビデオカード】グラフィックスコア | ビデオメモリ | |||||||
---|---|---|---|---|---|---|---|---|
ドライバ | コアアーキテクチャ | コアクロック | メモリクロック | メモリ | メモリバス幅 | メモリ帯域幅 | メモリ容量 | |
GeForce4 Ti4600 | Detonator XP 28.32 | NV25 | 300MHz | 650MHz | DDR SDRAM | 128bit | 10.4GB/s | 128MB |
GeForce4 Ti4400 | Detonator XP 28.32 | NV25 | 275MHz | 550MHz | DDR SDRAM | 128bit | 8.8GB/s | 128MB |
GeForce3 Ti 500 | Detonator XP 28.32 | NV20 | 240MHz | 500MHz | DDR SDRAM | 128bit | 8.0GB/s | 64MB |
GeForce3 | Detonator XP 28.32 | NV20 | 200MHz | 460MHz | DDR SDRAM | 128bit | 7.4GB/s | 64MB |
RADEON8500 | ATI リファレンス 6.13.10.6037 | R200 | 275MHz | 550MHz | DDR SDRAM | 128bit | 8.8GB/s | 64MB |
CPU | Pentium 4/1.7GHz |
---|---|
マザーボード | Intel D850MD |
チップセット | Intel850 |
メモリ(容量) | Direct RDRAM(256MB) |
HDD | IBM DTLA-307030 |
OS | Windows XP Professional |
グラフ1 | グラフ2 |
結論から言えば、GeForce4 Ti 4600、Ti 4400ともにGeForce3世代はもちろんのこと、RADEON 8500も上まわった。特に、FSAA(フルシーンアンチエリアシング、3D画面にエフェクトをかけることで表示品質を上げる処理、オンにすると処理が重たくなり、よりグラフィックスチップに負荷がかかる)をオンにした場合、RADEON 8500の下落率にくらべて、GeForce4 Tiの下落率は緩やかになっている。
例えば、1,024×768ドット(XGA)/32bitカラーの場合、FSAAなしの場合RADEON 8500は7,703、GeForce4 Ti 4600は8,781となっているが、FSAAオン(4X)の場合RADEON 8500は2,557、GeForce4 Ti 4600は5,411となっている。下落率はRADEON 8500は67%ダウンとなっているのに対して、GeForce4 Ti 4600は38%ダウンに留まっている。
ちなみに、GeForce2 Ultraにおける1,024×768ドットでFSAAをオフにした場合のスコアは4,743となっており、GeForce4 Ti 4600でFSAAオン(4X)時には5,411となっているのだから、それを上まわっている。NVIDIAはGeForce4ファミリーのメリットの1つとしてアンチエリアシング時のパフォーマンスを挙げているが、それに関してはNVIDIAの主張を受けいれてもいいだろう。
また、これまではビデオメモリの制約で表示できなかった、1,280×1,024ドット(SXGA)/32bitカラーのFSAA(4X)、1,600×1,200ドット(UXGA)/32bitカラーのFSAA(2X)および(4X)においても、GeForce4 Ti 4600/4400では描画が可能になっている。これはビデオメモリが128MBに増えた恩恵と言える。この点もGeForce4 Tiシリーズのメリットの1つだ。
Quake III Arenaでは特にFSAAをオンにした計測は行なわなかったが、GeForce4 TiシリーズはいずれもRADEON 8500を上まわっている。
●確かにパフォーマンスは最強だが、価格も最強
以上のように、GeForce4 Ti 4600と4400は非常に強力な3D描画能力を持っており、現存するコンシューマ向け3Dグラフィックスチップとしては最強といっても過言ではないだろう。
ただ、課題もある。というのも、現時点ではこうしたGeForce4 Ti 4600のハイパワーを生かすアプリケーションがさほど多くないことだ。具体的には3Dゲームになると思うが、DirectX 8のプログラマブルバーテック/ピクセルシェーダをバリバリに活用している3Dゲームはあまりないと言ってよく、「AquaNox」( http://www.aquanox.de/index2.htm )など一部のゲームぐらいだ。アンチエリアシングを本当に限界まで使うというゲームも多くない。
ただ、NVIDIAはGeForce4ファミリーの発表会において、今後ゲームベンダがGeForce4ファミリーに最適化したゲームをリリースするだろうという見通しを語った。これは、GeForce4の特徴と言えるアンチエリアシングを有効にしても十分な性能を持つという性格を充たすものとなるようで、今後に期待したい(こうしたハードが先かソフトが先かという議論は新しいビデオチップには付き物だ)。
GeForce4 Tiシリーズの弱点を1つだけ挙げるとすれば、それは価格だ。Ti 4600を搭載した製品が5万円台後半~6万円台前半、Ti 4400が3万円台後半~4万円台前半となっている。やはり「高いなー」というのが正直な感想だろう。RADEON 8500を搭載したビデオカードは、64MB搭載したモデルが2万円台半ば~3万円を切るあたり、128MBを搭載したモデルが4万円を切るあたりとなっている。
ある程度の性能があればよいというユーザーであれば、RADEON 8500の64MB搭載モデルでも十分だろう(あるいは、もっと落としてメインストリーム向けのRADEON 7500やGeForce4 MXでも十分かもしれない)。やはり、GeForce4 Tiシリーズは価格面でも“最強”であり、お薦めできるのはハイエンドゲーマーやマニアユーザーだ。とにかく性能重視で、価格は二の次というユーザーであれば間違いなく買いだといっていいだろう。
□「GeForce4」関連記事リンク集
http://pc.watch.impress.co.jp/docs/2002/link/geforce4.htm
(2002年3月29日)
[Reported by 笠原一輝@ユービック・コンピューティング]