多和田新也のニューアイテム診断室

90nm化でクロックアップしたGeForce 7900
~7600も意外な実力




 NVIDIAは3月9日(現地時間)、同社のハイエンドビデオカードの新製品「GeForce 7900シリーズ」を発表した。「G71」のコードネームで呼ばれた製品で、アーキテクチャの変更こそ見られないものの、90nmプロセスへの移行に伴いコアクロックをアップしているのが特徴となる。さらに、G70世代では初となるメインストリーム向けGPU「GeForce 7600 GT」も発表している。ここでは、これらGeForce 7シリーズの新ラインナップを検証していきたい。

●内部アーキテクチャは変更されずクロックの上昇に留まる

 今回発表されたGPUは、ハイエンド向けとなる「GeForce 7900 GTX」と「GeForce 7900 GT」、メインストリーム向けとなる「GeForce 7600 GT」の3製品である。

 まずGeForce 7900シリーズの内部のアーキテクチャについては、GeForce 7800シリーズからまったく変更されていない(図1)。4個のピクセルシェーダをひとまとめにしたものを6ユニット搭載し、計24個のピクセルシェーダを実装するほか、バーテックスシェーダも8個、レンダバックエンド(ROP)も16個のまま。各シェーダ内部も変更されておらず、従来どおりHDRバッファに対するアンチエイリアスもサポートされない。表1のとおりプロセスのシュリンクと、それにより可能になったコアクロックの上昇のみがGeForce 7900シリーズの変更点となるわけだ。

【図1】G71ことGeForce 7900シリーズのブロックダイヤグラム

 Radeon X1900シリーズのピクセルシェーダユニットがRadeon X1800シリーズの3倍にあたる48個を搭載したことに比べると、いささか地味な進化には感じられるだろう。シェーダユニットを増強することによるトランジスタ増や、それに伴う消費電力の増加やコスト増を避けるためのものとしている。いずれの製品も90nmプロセスルールで製造され、設計の見直しによりトランジスタ数が削減されたこともあって、GeForce 7900のダイサイズは196平方mmと、GeForce 7800やRadeon X1900/X1800が300平方mmを超えるダイサイズであったのに対して、かなり小さく収まっている。

【表1】 GeForce 7900/7800シリーズ比較表
  GeForce 7900 GTX GeForce 7900 GT GeForce 7800 GTX 512MB GeForce 7800 GTX GeForce 7800 GT
プロセスルール 90nm 110nm
トランジスタ数 2億7,800万 3億200万
コアクロック 650MHz 450MHz 550MHz 430MHz 400MHz
メモリクロック 1.6GHz 1.32GHz 1.7GHz 1.2GHz 1GHz
メモリバス幅 256bit
メモリ容量 512MB 256MB 512MB 256MB
バーテックスシェーダユニット数 8
ピクセルシェーダユニット数 24 20
ROPユニット数 16

 ただ、ビデオカード単体の最大消費電力はGeForce 7900 GTXが120W、GeForce 7800 GTX(256MB版)が100~110Wとされており、若干ながら上がっている。また、最近のハイエンドビデオカードについて回る電源ユニットの要件については、シングルビデオカードで利用する場合、GeForce 7800 GTXでは22Aの12Vラインを持つ350W以上の電源を推奨していた。今回のGeForce 7900 GTXでは22~26Aの12Vラインを持つ350~400W以上の電源が推奨されている。プロセスシュリンクの効果がクロック向上やメモリ容量アップなどの要素によって相殺され、消費電力が若干増えてしまったと想像される。

 なお、GeForce 7900 GTの最大消費電力は82W。電源ユニットは20~23Aの12Vラインを持つ300~350W以上の電源が推奨されている。GeForce 7800 GTX(256MB)を若干上回るスペックを持つ本製品であるが、こちらは着実に消費電力を減らしているわけである。

 ちなみに、ピクセルシェーダユニットはRadeon X1900シリーズ、GeForce 7800/7900シリーズともに2個のスカラ型シェーダユニットを搭載しているが、前者には3Dグラフィックで重要となる積和算が可能なALUが片方のシェーダユニットにしか搭載されていない。GeForce 7800/7900シリーズのアーキテクチャではそれぞれのシェーダユニットに積和算が可能なALUを搭載しており、この点では同数という見方もできる。

 また、テクスチャユニットもRadeon X1900シリーズの16個に対し、各Pixel Shader内にテクスチャユニットを搭載するGeForce 7800/7900シリーズでは24個となるわけで、GeForce 7800シリーズのアーキテクチャでも十分にRadeon X1900シリーズと対抗できると見ているわけだ。

 もっとも、Radeon X1900シリーズではテクスチャユニットが完全に分離しているが、GeForce 7800/7900シリーズはピクセルシェーダ内の2つのユニットのうち、1つをテクスチャユニットと共有して利用しており、単純に数の比較は難しい。上記のような論理でアーキテクチャを据え置いたGeForce 7900シリーズではあるが、クロックの上昇という通常進化のみでどこまでパフォーマンスを伸ばすことができるのか、後ほどベンチマークで検証してみたい。

 一方、メインストリーム向けとなるGeForce 7600 GTは「G73」のコードネームで呼ばれた製品で、1年半以上も現役であり続けたGeForce 6600 GTの後継に当たる製品となる。このクラスのGeForce7シリーズを待望していた人も多いのではないだろうか。

 主な仕様は表2にまとめたとおり。基本的にはGeForce 7900シリーズをベースにしており、Cine FX 4.0エンジンやIntelliSample 4.0をサポート。GeForce 7900シリーズからの変更点は、コア/メモリクロックを下げ、各シェーダユニットとROPユニットを削減している格好だ(図2)。また、GeForce 7900シリーズでは2系統のDual Link DVIを持つが、GeForce 7600 GTでは1系統に制限されている点も異なっている。

【図2】G73ことGeForce 7600 GTのブロックダイヤグラム

 ライバル製品となるRadeon X1600 XTと比べると、バーテックス/ピクセルの各シェーダユニットは同数だが、Radeon X1600 XTはテクスチャユニットとROPユニットが各4個という仕様である。さらに、GeForce 7600 GTのピクセルシェーダのALUやテクスチャユニットに関しては前述のGeForce 7900シリーズと同じことが言えるし、ROPユニット数の違いにより最終的な出力の段における性能差もあるだろう。

【表2】 GeForce 7600/6600シリーズ比較表
  GeForce 7600 GT GeForce 6600 GT GeForce 6600
プロセスルール 90nm 110nm
トランジスタ数 1億7,700万 1億4,300万
コアクロック 560MHz 500MHz 300MHz
メモリクロック 1.4GHz 1GHz 500MHz前後
メモリバス幅 128bit
メモリ容量 256MB 256/128MB
バーテックスシェーダユニット数 5 3
ピクセルシェーダユニット数 12 8
ROPユニット数 8 4

 さて、今回使用したのは、各製品のリファレンスカードである。まずGeForce 7900 GTXの外観から見てみると、これはGeForce 7800 GTX 512とほぼ同一の外観で、2スロットを占有するクーラーを搭載する(写真1~2)。

【写真1】GeForce 7900 GTXのリファレンスカード。クーラーは2スロット占有タイプで、GeForce 7800 GTX 512と同一のもの 【写真2】ブラケット部はDual Link対応DVI×2と、HDTV出力に対応するビデオ出力端子を備える

 続くGeForce 7900 GTは1スロットに収まるクーラーを搭載しているが、GeForce 7800 GTXとも異なる新しいクーラーとなっている(写真3~5)。ブロアタイプのファンと銅製のヒートシンクを組み合わせたもので、このクーラーはGeForce 7600 GTと同一のものとなっている。

【写真3】GeForce 7900 GTのリファレンスカード。1スロットのみで収まる小型のクーラーを搭載。ボード末端部には外部電源端子も備える 【写真4】ブラケット部はGeForce 7900 GTX同様、Dual Link DVI×2とビデオ出力端子の構成 【写真5】GeForce 7900 GTのリファレンスカードに使われているメモリは、SAMSUNGのGDDR3メモリ「K4J55323QG-BC14」。1.4GHz(700MHz DDR)動作が可能な256Mbitのチップで、これをボードの表面のみに8枚実装している

 そのGeForce 7600 GTであるが、外部電源入力を必要とせずVRM部がすっきりしていることもあって、GeForce 7900シリーズよりも一回り小さいボードとなっている(写真6~8)。この製品もブラケット部にDVI端子を2基搭載しているが、前述のとおりDual Link対応は1系統となっているので要注意である。

【写真6】GeForce 7600 GTのリファレンスカード。GeForce 7900 GTと同一のクーラーを採用しているが、ボードサイズは一回り小さい 【写真7】ブラケット部はDVI×2とHDTV出力対応のビデオ出力。1系統のみDual Linkをサポートする 【写真8】GeForce 7600 GTのリファレンスカードに搭載されているメモリは、SAMSUNGのGDDR3メモリ「K4J52324QC-BC14」。やはり1.4GHz(700MHz DDR)動作が可能な512Mbitのチップで、ボード表面に4枚搭載する

 なお、実際の動作クロックは画面1~6のとおり。GeForce 7900 GTXのみ2D時にコアクロックが下がる以外は、すべて定格クロックで動作していることが確認できる。

【画面1】GeForce 7900 GTXの3D描画時のクロック。コア650MHz、メモリ1.6GHz(800MHz DDR)と定格どおりに動作している 【画面2】GeForce 7900 GTXの2D描画時のクロック。コアクロックが275MHzに下げられている 【画面3】GeForce 7900 GTの3D描画時のクロック。コア450MHz、メモリ1.32GHz(660MHz DDR)の定格動作
【画面4】GeForce 7900 GTは2D描画時でもクロックは下がらず、定格で動作している 【画面5】GeForce 7600 GTの3D描画時のクロック。コア560MHz、メモリ1.4GHz(700MHz DDR)の定格動作 【画面6】GeForce 7600 GTも2D描画時でクロックは下がらず定格のままである

●GeForce 7900/7600シリーズの性能をベンチマークで検証

 それでは、今回発表された新しいGeForce 7シリーズのパフォーマンスをベンチマークで検証してみたい。まず、ビデオカード単体使用時のパフォーマンスを計測するために、表3の環境を用意している。使用しているビデオカードは写真9~14のとおり。

【表3】 テスト環境(シングルビデオカード)
  GeForce 7900 GTX(512MB)
GeForce 7900 GT(256MB)
GeForce 7600 GT(256MB)
GeForce 7800 GTX 512MB
GeForce 7800 GTX(256MB)
GeForce 7800 GT(256MB)
GeForce 6600 GT(128MB)
RADEON X1900 XTX
RADEON X1600 XT
VGA Driver ForceWare 84.11 ForceWare 81.98 CATALYST 6.2
チップセット nForce4 SLI
マザーボード A8N-SLI Deluxe
CPU Athlon 64 FX-60
メモリ PC3200 DDR SDRAM 512MB×2
HDD HGST Deskstar T7K250(HDT722525DLA380)
OS Windows XP Professional(ServicePack 2,DirectX 9.0c)

 ちなみにGeForce 7900/7600シリーズではForceWare 84.11を使用しているが、原稿執筆中にForceWare 84.17も提供された。テストには間に合わなかったが、本製品発表以降に提供されるであろう正式版は後者のバージョン、もしくはそれ以上のバージョンになる可能性もあるので、ここに記しておきたい。

 また、GeForce 6600 GTについては、3DMark06および3DMark05において、ビデオメモリが128MBあることに起因してメモリ容量不足が発生しているテスト条件があるため、数値が測定できた条件の結果のみ掲載している。また、GeForce 7800 GTX 512の結果については、本連載の前回記事より数値を流用している。

【写真9】GeForce 7800 GTX 512のリファレンスカード 【写真10】GeForce 7800 GTX(256MB)のリファレンスカード 【写真11】GeForce 7800 GTを搭載する、ELSA「GLADIAC 970 GT 256MB」
【写真12】GeForce 6600 GTを搭載するASUSTeK、「N6600GT/TD/128M」 【写真13】Radeon X1900 XTXを搭載する、ASUSTeK「EAX1900XTX/2DHTV/512M」 【写真14】Radeon X1600 XTを搭載する、ASUSTeK「EAX1600XT Silent/TVD/256M」

 では、3DMark06の結果から順に見ていきたい(グラフ1~3)。ちなみに、今回はGeForce 7900/7600が主題のため、トータルスコアとHDR/SM3.0テストの結果からはAA適用時の結果を省いている。

 まずGeForce 7900 GTXについてだが、トータルスコアでは解像度が低い条件ではGeForce 7900 GTX、解像度が上がるに連れRadeon X1900 XTXが互角のスコアを出す結果となった。

【グラフ1】3DMark06 Build 1.0.2
【グラフ2】3DMark06 Build 1.0.2(SM2.0)
【グラフ3】3DMark06 Build 1.0.2(HDR/SM3.0)

 各テストの結果を見てみると、SM2.0テストでは全般にGeForce 7900 GTXが強いが、HDR/SM3.0テストではRadeon X1900 XTXに優位性のある結果となっている。SM2.0テストでも描画負荷が高まるに従ってGeForce 7900 GTXは差を詰められている。ピクセルシェーダ48基という大幅な飛躍を遂げたRadeon X1900 XTXのシェーダ性能の高さを感じるとることができる結果だ。

 GeForce 7900 GTは、今回、対抗となるRadeonシリーズのビデオカードをテストできていないため、同じGeForceシリーズとの比較ということになるが、前モデルとなるGeForce 7800 GTに対しては安定して1割以上の性能向上を見せている。さらに、GeForce 7800 GTX(256MB)を安定して上回る性能を出す点にも着目すべきだろう。

 アーキテクチャが変わっていない以上、スペックで劣るところがないのだから、当たり前の結果ではあるのだが、それでもGeForce 7800 GTX(256MB)は、本来GeForce 7800 GTより1つ上のセグメントに位置付けられていた製品である。半年超を経過して、同レベル以上の性能を持つビデオカードが順当に価格を下げてきた魅力は大きい。

 GeForce 7600 GTについては、GeForce 6600 GTのおよそ倍といって差し支えない程度の性能向上を見せている。Radeon X1600 XTとの差も明確で、差が小さいところで2割強、大きいところでは7割以上もスコアが高い。

 続く、3DMark05(グラフ4)と3DMark03(グラフ5)は、従来よりまったく逆の傾向を持った結果が出ている。前者はRadeon勢のスコアがよく、後者はGeForce勢のスコアが良いという傾向だ。その傾向に大きく変わりはなく、GeForce 7900 GTXがGeForce 7800 GTXから順当にスコアを伸ばした程度に留まる。

【グラフ4】3DMark05 Build 1.2.0
【グラフ5】3DMark03 Build 3.6.0

 ただ、GeForce 7600 GTに関していえば、GeForce勢のアーキテクチャがスコアを伸ばしづらい状況にある3DMark05においても、Radeon X1600 XTのスコアを安定して上回っている点は評価したい。

 残る「AquaMark3」(グラフ6)、「DOOM3」(グラフ7)、「Unreal Tournament 2003」(グラフ8、9)についても、それほど劇的な結果は出ていない。Unreal Tounament 2003の結果から、ForceWare 84.11は若干ながらCPU負荷が増している印象を受ける点が目に留まるが、そのほかのスコアは従来製品とおおまかな傾向は変わらず、順当にスコアを伸ばしたものとなっている。

【グラフ6】AquaMark3
【グラフ7】DOOM3
【グラフ8】UnrealTournament 2003 ~Flyby
【グラフ9】UnrealTournament 2003 ~Botmatch

 さて、最後にGeForce 7900 GTXを利用したSLI環境のパフォーマンスを見ておきたい。GeForce 7800 GTX 512とRadeon X1900 CrossFireのスコアは本連載の前回記事から引用し、環境を揃えて測定したGeForce 7900 GTXの結果と交えて紹介する。

【表4】 テスト環境(マルチビデオカード)
  GeForce 7900 GTX GeForce 7800 GTX 512MB RADEON X1900 CFE+XTX
VGA Driver ForceWare 84.11 ForceWare 81.98 CATALYST 6.2
チップセット nForce4 SLI X16 RADEON XPRESS 3200
マザーボード ASUSTeK A8N32-SLI Deluxe ASUSTeK A8R32-MVP Deluxe
CPU Athlon 64 FX-60
メモリ PC3200 DDR SDRAM 512MB×2
HDD HGST Deskstar T7K250(HDT722525DLA380)
OS Windows XP Professional(ServicePack 2,DirectX 9.0c)

 まずは3DMark06(グラフ10~12)だが、ビデオカード単体の検証では善戦していたGeForce 7900 GTXが、SLI環境では苦戦する結果となっている。これはGeForce 7900 GTXが得意としていたSM2.0でCPU性能に起因すると思われるスコアの頭打ちが発生しており、スコアを伸ばし切れなかったためと見ていいだろう。解像度が上がった条件では、ビデオカードのシェーダ性能がボトルネックになりスコアを持ち直している。

【グラフ10】3DMark06 Build 1.0.2
【グラフ11】3DMark06 Build 1.0.2(SM2.0)
【グラフ12】3DMark06 Build 1.0.2(HDR/SM3.0)

 3DMark05の結果(グラフ13)も、解像度やフィルタなどの条件を厳しくしてもスコアの低下が小さい結果が出ており、頭打ちに近い状態といえそうである。それでもビデオカードごとのスコア差ははっきりついているあたりボトルネックはCPUではなさそうである。いずれかのシェーダユニットまたはROPユニットあたりのGPU内部に起因するものであると想像される。

【グラフ13】3DMark05 Build 1.2.0

 さて、残る3DMark03(グラフ14)、AquaMark3(グラフ15)、DOOM3(グラフ16)については、前回記事では掲載しなかった、ForceWare、CATALYSTから2枚のビデオカードにAA処理を割り振る8xAAを指定した場合のスコアも追加してグラフ化している。

【グラフ14】3DMark03 Build 3.6.0
【グラフ15】AquaMark3
【グラフ16】DOOM3

 結果自体はビデオカード単体時の得手不得手を踏襲した結果で、順当にスコアを伸ばした結果となっている。ただ、興味深いのは8xAAを適用したときのスコアだ。描画負荷が高い条件でとくに顕著だか、明らかにRadeon X1900 CrossFireのほうが、スコアの低下が小さいのである。

 2枚のビデオカードで4xAAを適用し、これを重ね合わせて8xAAにする。このとき、Radeonではそれぞれのビデオカードが作り出した絵をDMSケーブルを通しコンポジットエンジンによって重ね合わせるが、この処理をGeForceの場合ではピクセルシェーダが担当する。このあたりのアーキテクチャの違いが、こうした結果に結び付いた可能性がありそうだ。

●頭一つ抜け出したGeForce 7600 GTに魅力

 以上のとおり、GeForce 7900/7600シリーズのパフォーマンスを見てきた。アーキテクチャ的な変更点がなくパフォーマンスに直結する部分ではクロックを上げただけの変更に留まるGeForce 7900シリーズは、従来製品から安定した性能向上を示した。

 Radeon X1900シリーズに対する後発製品となる本製品には、すべての面で先行製品を上回るスコアを期待する向きもあるかと思うが、そうしたインパクトは受けない結果とはいえるだろう。それでも、最上位のGeForce 7900 GTXはパフォーマンス面ではRadeon X1900 XTXと同等レベルといえる性能で、あとはアプリケーションに対する得手不得手が結果を決めるといった雰囲気である。

 しかも、Radeon X1900 XTXのピーク消費電力は150Wとされているのに比べて、GeForce 7900 GTXのそれは120Wに留まっている。ひたすら消費電力が向上し続けてきた最近のGPUにあって、CPUでも最近注目されている電力当たりの性能という面に目を向けてきた点は評価できる。

 GeForce 7900 GTは日本円で3万後半~5万円前後の買い求めやすいハイエンド製品のラインを埋める製品となる。本文中でも触れたとおり、従来製品であるGeForce 7800 GTX(256MB)を超えるパフォーマンスを、より安く入手できる、コスト対パフォーマンスのバランスのよさがポイントといえる。今後GeForce 7800シリーズは終息に向かうだろうが、この製品の存在があるため、今から積極的に旧シリーズを購入する理由は見出せない。

 また、これら両製品を上回るインパクトを見せたのが、GeForce 7600 GTである。ようやく登場したといった感があるGeForce 7シリーズのメインストリーム向け製品として、このクラスでは頭一つ抜け出したパフォーマンスを発揮できている。

 プライスポイントは199ドルとされており、日本では25,000~3万円程度が相場となるだろう。日本の自作市場でも人気を集めるのは確実と思えるほど、満足度の高い製品に仕上がっている印象を受ける。

□関連記事
【3月2日】【多和田】ATIの最新ハイエンド環境「CrossFire Xpress 3200」&「Radeon X1900 CrossFire」
http://pc.watch.impress.co.jp/docs/2006/0302/tawada70.htm
【1月25日】【多和田】早くもトップ交代、ATI「Radeon X1900 XT」
http://pc.watch.impress.co.jp/docs/2006/0125/tawada67.htm
【2005年12月27日】【多和田】2005年のハイエンドビデオカード二強を試す
~Radeon X1800 CrossFire vs GeForce 7800 GTX 512
http://pc.watch.impress.co.jp/docs/2005/1227/tawada64.htm

バックナンバー

(2006年3月10日)

[Text by 多和田新也]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2006 Impress Corporation, an Impress Group company. All rights reserved.