|
統合型チップセットの常識を覆す「nForce」は買いか?
|
nForceを搭載したMSI ComputerのK7N420 Pro |
6月のCOMPUTEX TAIPEIで発表されたチップセット「nForce」を搭載したマザーボードが、ようやっと市場に登場した。nForceはいくつかの点で、これまでの統合型チップセットとはレベルが違うと言ってよい。
1つはこれまでの統合型チップセットが、何世代も前の3D性能がかなり低いグラフィックスコアを内蔵していたのに対して、nForceではGeForce2 MX相当という、最新までとはいかないものの、最新の3Dグラフィックスチップに近い性能を持っているチップを内蔵している点だ。もう1つが2チャネルのDDR SDRAMという高帯域幅を実現したメモリをサポートしている点で、これまでSDRAMが利用されることが常識だった統合型チップセットと比較して、高い性能が実現されている可能性が高いと言ってよい。本記事ではそうしたnForceのパフォーマンスなどについてベンチマークを交えながら考えていきたい。
●2つのパイプライン/テクスチャユニットとハードウェアT&Lエンジンで高い3D描画性能を実現
nForceは、ノースブリッジのIGP(Integrated Graphics Processor)とサウスブリッジのMCP(Media and Communications Processor)の2つから構成されている。IGPとMCPの間は、AMDなどが中心になって推進している「Hyper Transport Technology」のバスが採用されている。バンド幅は800MB/secとなっており、IntelのIntel 8xxファミリーで採用されているハブインターフェイスやVIAのV-Linkの266MB/secに比べて3倍の帯域幅が実現されている。
IGPはシステムバスとしてEV6バスをサポートしており、AMDのAthlon/Athlon XP Duronなどをサポートしている。実際筆者はAthlon XP 1900+(1.6GHz)を利用したが、何の問題もなく利用することができた。IGPの最も大きな特徴はGeForce2 MX相当の高い3Dグラフィックス性能を備えるグラフィックスコアを内蔵していることだ。それでは、具体的に、これまでの世代の統合型チップセットに内蔵されているグラフィックスと性能面でどのくらい違うのだろうか? 以下は、すでに市場に登場している統合型チップセットのスペックを表にしたものだ(市場には登場していない発表ベースのものは省いてある)。
【スペック一覧】
Intel 815/E | ProSavage PM133 | ProSavage PLE133 | SiS630/S | ProSavage KM133 | SiS730S | nForce | |
---|---|---|---|---|---|---|---|
システムバス | P6バス | P6バス | P6バス | P6バス | EV6バス | EV6バス | EV6バス |
グラフィックスコア | Intel752相当 | Savage4 | Prochse | SiS300 | Savage4 | SiS300 | GeForce2 MX |
グラフィックスコアベンダ | Intel | S3 Graphics | Trident Microsystems | SiS | S3 Graphics | SiS | NVIDIA |
3Dパイプライン/テクスチャユニット | 1P/1T | 1P/1T | 1P/1T | 1P/2T | 1P/1T | 1P/2T | 2P/2T |
ハードウェアT&Lエンジン | - | - | - | - | - | - | 内蔵 |
メインメモリ | PC133 SDRAM | PC133 SDRAM | PC133 SDRAM | PC133 SDRAM | PC133 SDRAM | PC133 SDRAM | PC2100×2 |
メモリ帯域 | 1.06GB/sec | 1.06GB/sec | 1.06GB/sec | 1.06GB/sec | 1.06GB/sec | 1.06GB/sec | 4.2GB/sec |
見てわかるように、他の統合型グラフィックスに内蔵されているものと比較して、nForceに内蔵されているグラフィックスは高機能になっていることがわかる。たとえば、nForceに内蔵されているレンダリングエンジンは、CPUでいえばスーパースケーラに相当する2パイプライン構成になっている。これは、レンダリングエンジンが、描画を行なうパイプを2つ備えていることを意味しており、平行して2つの処理を同時に進めることができる。
さらに、各パイプラインは、それぞれ2つのテクスチャユニット(テクスチャの描画を担当する)を備えており、条件が整えば1クロックサイクルで最大4つのテクスチャを処理することができる。これまでの統合型チップセットのレンダリングエンジンはいずれも1つのパイプラインしか備えず、テクスチャユニットも1つとなっている場合が多い(唯一の例外はSiS300コアを内蔵したSiS630/730で2テクスチャユニットを備える)。この場合、1クロックサイクルで1テクスチャということになるので、条件さえ整えば、nForceは従来のグラフィックスコアに比べてレンダリング処理能力が圧倒的に高いことがスペックの点からも予想される。
さらに、nForceはハードウェアT&Lエンジンを備えている。通常3Dの描画は、3Dオブジェクトの位置や光源などの計算を行なうT&L(Transfomation and Lighting)という演算を行なってから、そこに模様などを貼り付けるテクスチャの描画を行なう、レンダリングという処理を経て行なわれる。
初期の3Dグラフィックスチップはレンダリングエンジンのみを内蔵しており、T&Lの処理はCPUが行なっていた。これに対して、最近の3DグラフィックスではT&Lの処理を専門に行なうハードウェアT&Lエンジンを内蔵しており、CPUで演算を行なった場合よりも高い3D描画処理能力を発揮するように設計されている。これまでの統合型グラフィックスチップには、このハードウェアT&Lエンジンを搭載したチップはほとんどなく(実際にはALiとTrident Microsystemsが共同で開発したCyberAladdinやCyberMAGiKには内蔵されているが、モバイル用なのでここではふれない)、本格的なものはnForceが初めてといっていいだろう。
nForceのノースブリッジとなるIGP128 | nForceのサウスブリッジとなるMCP-D |
●高性能のグラフィックスコアの性能を実現する高帯域のメモリインターフェイス
しかし、仮に高性能のグラフィックスコアを内蔵しても、メモリインターフェイスの帯域が十分でなければそのグラフィックスコアの本来の性能を発揮することができない。話をわかりやすくするために、スタンドアローンのグラフィックスチップとビデオメモリの関係で考えてみよう。
グラフィックスチップは、テクスチャの描画などに利用するデータをビデオメモリに展開し、それをグラフィックスチップに読み込みながら3Dの描画を行なっていく。これは、ちょうとCPUが演算を行なうときに、データをハードディスクからメモリに読み込んで処理を行なうのと同じようなものだと考えればよい。仮に、CPUからメモリへのバス帯域幅が十分でない場合、CPUはメモリからデータの読み込みを待たなければならないため、CPUの処理能力は低下する。
それと同じように、グラフィックスチップとビデオメモリ間の帯域幅が十分でない場合、グラフィックスチップは待たされることになるので、グラフィックスチップの描画能力は低下することになる。この問題はデータ量が多くなる高解像度・多色モードで顕著に発生する。各グラフィックスチップベンダーともに、こうした問題が発生することを認識しており、だからこそ、NVIDIAはGeForce3ファミリーでLightSpeed Memory Architecture、ATIはRADEON 8500でHyper ZIIなど、Zバッファの処理を低減するような技術を導入することで、帯域幅の消費を少しでも低減しようと努力をしているのだ。
もちろん、この問題は統合型チップセットに内蔵されている内蔵グラフィックスではさらに深刻な問題となる。なぜならば、統合型グラフィックスに内蔵されている内蔵グラフィックスは、ビデオメモリとしてメインメモリの一部を利用している。CPUが演算を行なっている場合には、CPUもメインメモリの帯域を消費しているため、グラフィックスコアが消費できるのは残された部分ということになる。つまり、CPUとグラフィックスコアでメインメモリの帯域を取り合ってしまう訳だ。このため、たとえばSavage4コアを内蔵しているProSavage PM133などは、スタンドアローンのSavage4ビデオカードを挿した場合に比べて、圧倒的に低いベンチマーク結果しか残せない。その原因はメモリの帯域幅にある。
この問題を解決するには、メインメモリの帯域をあげればよい。これまでの統合型チップセットは、見てわかるようにいずれもメインメモリにSDRAMを採用していた。このため、メモリの帯域幅は1.06GB/sec(133MHz時)で、CPUがAthlon XPのようにシステムバスの帯域が2.1GB/secとなっている場合、そもそもCPUがメモリを占有していたとしても十分とは言えない帯域幅でしかなかった。
そこで、これをDDR SDRAM(2.1GB/sec、266MHz時)、Direct RDRAM(1.6GB/sec、800MHz時)などに変更すれば、高い帯域を実現することができるので、そうした問題を解決できる可能性があると言える。実際、各チップセットベンダは、次世代の統合型チップセットで、メモリインターフェースにDDR SDRAMを採用する。VIAのP4M266、KM333、SiSのSiS745などがその代表といえるだろう。
K7N420 Proのメモリスロット。上から3、2、1で、スロット1とスロット2、ないしはスロット1とスロット3にメモリモジュールを挿した場合、128ビットで動作する |
nForceはそれらのさらに上を行く、2チャネルのDDR SDRAMをサポートしている。nForceでは266MHz、200MHzのDDR SDRAMがサポートされるので、266MHzのDDR SDRAMモジュール、つまりPC2100を利用した場合には1チャネルで2.1GB/secの帯域幅となるので、2チャネルで4.2GB/secという、これまでは考えられないような帯域幅を実現することになる。
Athlon XPのシステムバスが2.1GB/secであるので、仮にCPUが全部を使い切るようなことがあったとしても、まだ2.1GB/secも余っている計算になる。つまり、この分(実際にはCPUが全部を使い切ることはないだろうからそれ以上)を内蔵のグラフィックスコアが利用することになるので、メモリの帯域幅がボトルネックとなり、3D描画能力が低下するというこれまでの統合型チップセットのパターンではないということがわかるだろう。
ただし、2チャネルのDDR SDRAMサポートとしたことで、難しい問題を抱えることになる。
1つはコストの問題だ。DDR SDRAMは64bit幅であるのでデータバスは64bitだが、2チャネル化した場合には倍になるので128bitとなり、メモリの信号線の数が倍になる。このため、チップセットのピン数は勢い増えることになるので、マザーボードのコストが増える可能性がある。実際nForceを搭載したマザーボードの価格は、2万円台半ばと、従来の統合型チップセットの価格と比較してかなり高い価格設定がされている。
また、メモリは常に2枚一組で使うことになる。今回取り上げたMSI ComputerのK7N420 Proの場合、メモリスロット1+メモリスロット2ないしはメモリスロット1+メモリスロット3に挿した場合、メモリは128bit、つまり2チャネルで動作する(1枚のみで利用すると64bit幅、つまり1チャネルとなる)。たとえば256MBのメモリを搭載する場合、128MBを2枚で装着することになる。これはPCメーカーにとっては若干のコストアップを意味している。というのは、256MB1枚の価格と、128MB2枚の価格は同じではなく、基板が少ない分256MB1枚の方が安価であることが多いからだ。こうした高コストとなってしまう点は、問題だと考えることができるだろう。
さて、この他にもnForceは特徴を持っている、それがMCPの多機能さだ。最近ではサウスブリッジにEthernetコントローラやAC'97によるオーディオ機能なども当たり前になっているが、nForceではDirectX 8でサポートされる2D/3Dオーディオ機能が搭載されている。それがAPU(Audio Processing Unit)で、2/4/6スピーカーに対応しているほか、ドルビーデジタルに対応したS/PDIFなども標準でサポートされる(ただし2つあるMCPのうち、MCP-Dのみ)。実際、K7N420 ProにはS/PDIFの出力が付属しており、サウンドカードなどを増設しなくてもドルビーデジタルの5.1チャネルに対応したスピーカーシステムなどが利用可能だ。
なお、nForceには、メモリのチャネル数、APUの有無などで次の4ラインナップが用意されている。
メモリバス幅 | ドルビーデジタル | ||
---|---|---|---|
420D | IGP128+MCP-D | 128bit | あり |
420 | IGP128+MCP | 128bit | なし |
220D | IGP64+MCP-D | 64bit | あり |
220 | IGP64+MCP | 64bit | なし |
このうちK7N420 Proに搭載されるのは420Dということになる。
●外部AGPを利用した場合には性能面でのアドバンテージは小さい
さて、ここまで述べてきたように、nForceがこれまでの統合型チップセットの常識から言えば高い性能を備えているのはおわかりいただけただろう。それでは、実際の性能のほうはどうなのかということをベンチマークテストで調べてみた。テストは2つの可能性に分けて比較してみた。
1つはAthlon XPとしては最高速のAthlon XP 1900+を利用し、内蔵グラフィックス(ぞれぞれメモリインターフェイスを64bitと128bitに設定)、外部AGPカードとしてGeForce3を利用した場合(ぞれぞれメモリインターフェイスを64bitと128bitに設定)、比較としてVIAのApollo KT266A、AMD-760とGeForce3を組み合わせた場合、さらに参考としてPentium 4とIntel850にGeForce3を組み合わせた環境においてテストした。こちらは主に、内蔵グラフィックスがどの程度のパフォーマンスを持っているのか、さらには128bitのメモリの帯域幅が意味を持っているのかにフォーカスを当ててみたい。
もう1つの環境は、Duron 1.2GHzを利用し、KM133、さらには参考としてCeleron 1.2GHzを利用したIntel 815Eのシステムと比較したい。こちらは、純粋にこれまでの統合型グラフィックスに比べてどの程度パフォーマンスが高いのかにフォーカスを当ててみた。
テスト環境は以下の通りである。ベンチマーク結果の量が非常に膨大であるため、今回は別表にしたい。読者の興味に応じて利用してほしい(なお、ベンチマーク結果はあくまで筆者が行なった結果であり、読者の環境すべてにおいて再現されるものでないことをお断りしておく)。
◇Athlon XP 1900+を使ったベンチマーク結果
◇Duron 1.2GHzを使ったベンチマーク結果
【環境1】
nForce+GF3(128bit) | nForce+GF3(64bit) | KT266A+GF3 | AMD-760+GF3 | nForce+内蔵(128bit) | nForce+内蔵(64bit) | P4/2GHz+GF3 | |
---|---|---|---|---|---|---|---|
CPU | Athlon XP 1900+ | Pentium 4 2GHz | |||||
マザーボード | MSI K7N420 Pro | EPoX EP-8KHA+ | GIGA-BYTE GA-7DXR | MSI K7N420 Pro | D850MV | ||
チップセット | nForce 420D | VIA KT266A | AMD-760+GF3 | nForce 420D | Intel 850 | ||
メモリ | PC2100(CL=2.5、266MHz) | PC800 | |||||
チャネル数 | 2チャネル | 1チャネル | 2チャネル | 1チャネル | 2チャネル | ||
メモリ容量 | 256MB | ||||||
ビデオチップ | GeForce3(64MB) | 内蔵(32MB) | GeForce3 | ||||
標準解像度 | 1,024x768ドット/32bitカラー/85Hz | ||||||
ハードディスク | IBM DTLA-307030 | ||||||
OS | Windows XP |
【環境2】
KM133+内蔵 | nForce+内蔵(128bit) | Celeron 1.2+i815 | |
---|---|---|---|
CPU | Duron 1.2GHz | Celeron 1.2GHz | |
マザーボード | MSI MS-6503 | MSI K7N420 Pro | Intel 815EEA2 |
チップセット | VIA KM133 | nForce 420D | Intel 815E Bステップ |
メモリ | PC133 SDRAM(Cl=3) | PC2100(CL=2.5) | PC133 SDRAM(CL=3) |
チャネル数 | 1チャネル | 2チャネル | 1チャネル |
メモリ容量 | 256MB | ||
ビデオチップ | 内蔵(32MB) | 内蔵(32MB) | 内蔵(11MB) |
標準解像度 | 1,024×768ドット/32bitカラー/85Hz | ||
ハードディスク | IBM DTLA-307030 | ||
OS | Windows XP |
グラフ1は環境1におけるSYSmark2001(パッチ3適用済み)の結果だ。これを見てわかるように、同じAthlon XP 1900+であれば、結果にさほど変化はない。nForceの内蔵コアを利用した場合には、若干の性能低下が見られるが、これまでの統合型チップセットのように大幅な性能低下は見られないと言っていいだろう。
グラフ2は環境1における3DMark2001の結果だ。nForceの内蔵コアとGeForce3の3D描画能力の差があるのがわかる。ただし、GeForce3がDirectX 8のファンクションであるバーテックスシェーダやピクセルシェーダに対応しているのに対して、nForceの内蔵コアはそれには対応しておらず、3DMark2001のバーテックスシェーダやピクセルシェーダのテストは行なわれない。
グラフ1 | グラフ2 |
さらに、そもそもクロックも低いため、これは妥当なところだと考えていいだろう。注目したいのは、nForceの内蔵コアを利用した場合には、128bit(2チャネル)、64bit(1チャネル)で若干の差がでているのに対して、外部AGPビデオカードであるGeForce3を利用した場合は128bitと64bitの差はない。
実は、これは他のベンチマークでもそうした傾向がでており、128bitと64bitの差がでるのは内蔵コアを利用した場合だけであると言える。つまり、nForceの2チャネルのメモリバスは内蔵コアを使ってこそ意味があると言える。考えてみれば、これは当たり前で、いくらメモリバスの帯域が増えても、CPU側のシステムバスの帯域が変わらないのだから、外部ビデオカードを利用した時に、64bitでも128bitでも差が出ないのは当然だろう。
グラフ3 | グラフ4 | グラフ5 |
グラフ3は環境2におけるSYSmark2001の結果だ。なお、Duron 1.2GHzではSYSmark2001のInternet Contents Creationがどうしても完走しなかったので、ここでは掲載していない。見てわかるとおり、KM133の倍以上のスコアとなっている。これまでの統合型チップセットが、いかにメモリの帯域幅が原因で本来の持つ性能を発揮できないばかりか、CPUの持つ性能を引き出してこなかったかということがよくわかるだろう。
グラフ4は環境2における3DMark2000のスコアだ。16bitカラーで行なっているのは、Intel 815Eの内蔵グラフィックスが32bitカラーモードをサポートしていないためだ。見てわかるように、これまでの統合型チップセットの4倍以上のスコアをたたき出している。こうしたことからも、nForceはこれまでの統合型チップセットとは比べものにならない、モンスターであるといっていいだろう。
nForceのデバイスマネージャ。IDEのドライバはWindows XP標準のものが使われている |
なお、余談になるが、nForceに対する要望も述べておきたい。K7N420 Proの付属CD-ROMにはnForce用のチップセットドライバが収録されているが、そのドライバにはWindows XP用のIDEインターフェースのドライバが含まれていなかった(MSIにアップデートバージョンと思われるバージョンもあがっていたが、そちらも同様だった)。
実際にZiff-DavisのWinBench99 version 2.0に含まれるディスク系のベンチマーク(Business Disk WinMark、High-End Disk WinMark)=グラフ5を実行してみたところ、nForceの結果はネイティブのドライバが用意されているAMD-760、KT266A、Intel850などを下回った。
そうした意味では、是非とも性能を改善するドライバを用意してほしいところだが、現時点ではNVIDIAのサイトにもそうしたドライバはあがっていない。現在はチップセットベンダのサイトに最新ドライバがあがるのは当たり前になっており、それもチップセットの製品品質の1つと言える。そうした意味では、NVIDIAには自社サイトでリファレンスドライバなどを早期に配布する体制を整えていただきたいものだ。
●とりあえずは“そこそこ”で将来のアップグレードも視野に入れたいユーザーにお勧め
以上のような結果から次のことが言えると思う。
まず、スタンドアローンのチップセットとしての評価だが、残念ながらGeForce3やRADEON 8500などのハイエンドビデオカードと組み合わせるためにわざわざ買うほどではないということができるだろう。ベンチマーク結果を見てもわかるように、nForceの結果はほとんどの結果でKT266Aを下回るか、ほぼ同等。AMD-760とは若干上回るか、ほぼ同等であり、メモリインターフェイスを128bitにした効果はほとんどないと言ってよい。価格面で見れば、KT266Aを搭載したマザーボードが1万円の後半であるのに対して、nForceを搭載したK7N420 Proは2万円台半ばと、S/PDIFが付属していることを考慮に入れても割に合わないとしか言えないだろう。従って、GeForce3やRADEON 8500などとの組み合わせが前提のユーザーが本製品を買うのは得策ではない。
これに対して、統合型チップセットとしては、これまでよりも圧倒的に高い性能を実現しており、“3Dなんてそこそこでよいのよ”というユーザーにはかなり有望な選択肢になる可能性が高い。
特に、これまでGeForce2 MXとKT266Aなどを組み合わせて買っていたユーザーなどにとっては、nForceはほぼ同じような価格で買える有望な選択肢と言えるだろう。しかも、S/PDIFというおまけまで付いてくるわけで、決して高い買い物ではないと言えるだろう。しかも、将来、AGPスロットを利用してより高速なビデオカードにアップグレードもできるので、とりあえず最初はそこそこの性能で、将来的にはビデオカードでアップグレードするようなユーザーモデルが考えられるだろう。
なお、本製品のPCメーカーから見た位置づけだが、値段が高い点が何よりもネックだと言える。PCメーカーにとって統合型チップセット=安価なソリューションであり、その市場に高価なnForceマザーを採用してもらうのはまず難しいだろう。そうした意味では、何かこれまでとは違ったセグメントを作りだすなど、NVIDIA側でも本製品をどのような市場に売り込むのか、それをもう少し明確にする必要があると思う。ただ、たとえばKT266A+GeForce2 MXという構成のPCを販売しているメーカーにとっては、本製品は魅力的なソリューションとなる可能性があり、NVIDIAがどの程度PCメーカーに対して価格的なメリットなり、価格以外の付加価値を見せることができるかが課題と言えるだろう。
□AKIBA PC Hotline!関連記事
【11月17日】nForceチップセットを搭載したMicrostar製Socket Aマザーがデビュー
第一弾はMicrostar製の「K7N420 Pro」、並行輸入品が先行
http://www.watch.impress.co.jp/akiba/hotline/20011117/nforcemb.html
□関連記事
【6月4日】COMPUTEX TAIPEI 2001開幕レポート
NVIDIAがNV-CrushことnForceを発表。Athlon/Duron対応
http://pc.watch.impress.co.jp/docs/article/20010604/comp02.htm
(2001年12月7日)
[Reported by 笠原一輝@ユービック・コンピューティング]