後藤弘茂のWeekly海外ニュース

NVIDIAの今後を占う新GPU NV36とNV38が登場




●NVIDIAが投入した2つのGPUの位置づけ

 NVIDIAが、秋冬商戦向けのGPUとして、ハイエンド向け「GeForce FX 5950 Ultra(NV38)」とメインストリーム向けの「GeForce FX 5700(NV36)」ファミリを投入してきた。それぞれ、ATI Technologiesの「RADEON 9800XT(R360)」と「RADEON 9600XT(RV360)」に対抗する。

 NV38とNV36は、いずれも既存アーキテクチャのパフォーマンスアップ版である点はATIの2つのGPUコアと同じ。価格レンジはGeForce FX 5950 Ultraが499ドルでRADEON 9800XTと真っ向からぶつかり、GeForce FX 5700 Ultraが199ドルでRADEON 9600XTとぶつかる。

 ただし、NV38とNV36は、同じNVIDIAの新GPUでも、その内容と位置づけは大きく異なる。一言で言ってしまえば、NV38は対ATI&対年末商戦向けの間に合わせの企画品。それに対して、NV36はNVIDIAの将来を占うものだ。というのは、NV36は、NVIDIA最初のIBM Fab製造チップだからだ。NV36は、IBMの0.13μm(銅配線、非SOI、非low-k)で製造される。

 NVIDIAは、従来の製造ファウンドリのTSMCに加えて、IBMともファウンドリ契約をした。現在、TransmetaやCentaur Technology(C3を開発)などいくつかの先端ファブレス半導体メーカーがFabを台湾の大手ファウンドリのTSMCからそれ以外へと移しつつある。それは、TSMCが先端プロセス開発で遅れをとり始めているからだ。

 NVIDIAの戦略意図は明確だ。IBM Fabが良好なら、NV36の0.13μm非オプションから、さらに微細なプロセス(90nmなど)やオプション(SOIなど)へチップを移して行くだろう。IBMがプロセス技術でTSMCに大きくリードできるなら、それだけでTSMCに留まるライバルに水を開けられるというわけだ。より高速で性能当たりの電力消費の少ないトランジスタを使えれば、高速かつ低消費電力のGPUを作ることができる。また、微細化でリードできれば、より多くのトランジスタをGPUに搭載して、機能面でリードできる。

 おそらくNVIDIAは、今後はハイエンド/メインストリームGPUを、IBM Fabの新プロセスへと移して行くものと思われる。しかし、「Fab替えは常にリスキーで、特に従来馴染みのないファウンドリに切り替えた場合にはスムーズに行くかどうかはかなり不安がある」とあるファブレスメーカー関係者は言う。そこでNVIDIAは、まずメインストリームのNV36をIBMの0.13μmへ移し、IBM Fabをテストしていたと推測される。そのため、NV36の仕上がり……性能、ダイサイズ、消費電力、歩留まり……などは、NVIDIAの将来を占う重要な要素になる。

 NV36の開発がスタートしたのはGeForce FX 5900(NV35)プロジェクトのスタート直後、2001年末だったと言われている。そこから逆算すると、製品のテープアウトは今年の第2四半期、そこからマスク製造、サンプル、そしてバリデーションを1~2サイクルとすると、この年末時期に間に合う計算になる。


●ジオメトリ性能を強化したNV36

 シリコンのスペックではNV36の動作周波数は475MHzで、NV31の400MHzよりアップ、RV360の500MHzにはちょっと及ばない。顕著なほど周波数が上がっていないのは、NV38(475MHz)に合わせたためなのかどうかはわからない。カードベンダーがクロックアップしてきた時点で、周波数向上のヘッドルームは見えてくるだろう。

 消費電力は、スペックは明らかになっていないがかなり高い。あるカードベンダーは「予想よりも消費電力が高く苦労した」という。ダイサイズ(半導体本体の面積)もかなり大きめだと言われる。

 メモリインターフェイスはNV31同様に128bit幅と、ハイエンドのNV38やR360の半分。メモリはDDR/DDR2に対応し、リファレンスはDDR2 450MHzで転送レートは900Mtps(transfer per second)となる。DDR2のおかげでメモリ帯域は14.4GB/secと、RV360の9.6GB/secより大幅に広いが、その分コストは上がる。ちなみに、DDR2メモリはNVIDIAが供給しているという。メモリ調達はボードベンダーが行なっているわけではない。

 機能的にはNV36はNV35相当で、ステンシルシャドウを高速化する「UltraShadow」やShader命令の拡張「CineFX 2.0」、「Intellisample HCT」といった機能が加わっている。また、「Vertex Shaderの機能要素を増やすことで、ジオメトリ性能は、GeForce FX 5600(NV31)の3倍になった」とNVIDIAのStephen Sims氏(Senior Product Manager)は語る。

 NV36のジオメトリ部の性能は、356MVertices/sec(475MHz時)。ハイエンドのNV38とメインストリームのNV36で同等だ。つまり、ジオメトリ部の設計は、両者でほぼ同じだと見られる。クロック当たりは0.75Vertices/clockとなる(ATIのR300系は1Triangles/clock)。NV31のクロック当たりのジオメトリ性能は0.25Vertices/clockだったので、確かに3倍となっている。

 今のGPUの場合、ボトルネックはどちらかと言うとPixel Shader側に来ることが多いと言われているが、NVIDIAはNV36ではむしろジオメトリ部を強化している。この設計意図はわからない。

 NV36の生フィルレートは1.9Gpixels/sec。これは4パイプを475MHzで回した時のピーク値。DirectX 9世代GPUになって難しいのは、ピクセル出力性能のスペックであるフィルレートはPixel Shaderの性能を反映していないこと。同周波数でもPixel Shader内部の並列性によってShaderの効率は大きく変わるため、ピクセル部の処理性能はGPUによってかなり変わる。現在のところ、Pixel Shaderの性能の指標はないため、この部分の性能はベンチマーク以外では比較しようがない。

メーカー NVIDIA ATI
名称 GeForce FX 5950 Ultra GeForce FX 5700 Ultra RADEON 9800 XT RADEON 9600 XT
コードネーム NV38 NV36 R360 RV360
コアクロック(最高) 475MHz 475MHz 412MHz 500MHz
サポートするメモリ種類 DDR/GDDR2 DDR/GDDR2 DDR/GDDR2 DDR/GDDR2
メモリ種類 DDR DDR2 DDR DDR
メモリクロック(最高) 475MHz 450MHz 365MHz 300MHz
メモリ転送レート 950MHz 900MHz 730MHz 600MHz
ビデオメモリインターフェイス幅 256bit 128bit 256bit 128bit
メモリ帯域(GB/Sec) 30.4GB/sec 14.4GB/sec 23.4GB/sec 9.6GB/sec
標準搭載メモリ 256MB 128MB 256MB 128MB
ジオメトリ性能 356.0MVertices/sec 356.0MVertices/sec 412.0MTriangles/sec 250.0MTriangles/sec
フィルレート(GigaPexels/sec) 3.80Gtexels/sec 1.90Gpixels/sec 3.30Gpixels/sec 2.00Gpixels/sec
Vertex Shader数 NA NA 4 2
Vertex Shaderバージョン 2.0+ 2.0+ 2.0+ 2.0+
Pixel Shaderバージョン 2.0+ 2.0+ 2.0+ 2.0+
Pixel Shader内部精度 32/16bit 32/16bit 24bit 24bit
ピクセル/クロック 8(4) 4 8 4
DAC周波数 400MHz 400MHz 400MHz 400MHz
AGP 4X/8X 4X/8X 4X/8X 4X/8X
ファウンダリ TSMC IBM TSMC TSMC
製造プロセス技術 0.13μm 0.13μm 0.15μm 0.13μm
製造プロセス技術の特徴 銅配線/非Low-k 銅配線/非Low-k 銅配線/非Low-k 銅配線/Low-k


●マイナーチェンジ版のNV38

 NVIDIAのロードマップには、かなり前からNV36はあったが、じつはNV38はなかった。つまり、NV36は比較的大きな開発チームが長期間取り組んできた製品であるのに対して、NV38はよりマイナーなチェンジだ。製品ブランド名GeForce FX 5950の“50”という半端な数字は、NVIDIAもそれを自覚していることを物語っている。

 NVIDIAは、NV38ではNV35からのアーキテクチャチェンジはなく、基本的には新マスクでの設計最適化+トランジスタ高速化だと説明している。また、OEMにはNV38は、GeForce FX 5800(NV30)開発チームによるNV35の拡張版だとも説明しているという。

 スペック上では動作周波数が450MHzから475MHzに上がり、メモリはDDR 850Mtps(425MHz)からDDR 950Mtps(475MHz)になった。メモリインターフェイス幅は256bitなので、メモリの生帯域は30.4GB/secになる。ジオメトリ性能は356MVertices/sec(475MHz時)とNV36と同様。基本アーキテクチャがNV35と同じだとすると、ノーマルピクセル出力は4Pixels/clockで、従来同様4/8のハイブリッドなパイプ構成と見られる。フィルレートは3.8Gtexels/secで、NVIDIAはここでは注意深くtexelベースの値を使っている。

 NV38で、NVIDIAは再びリファレンスデザインの冷却機構を変更した。NV30では2スロットを使って筐体外から外気を取り入れ、GPUを冷却した排気は筐体外へ排出していた。しかし、熱設計に気を配ったその設計のために、とんでもない騒音が発生してしまった。

 NV38の今回のデザインは、2スロットを使うが、外気を取り込んで、フィンを通し、熱を筺体内へと逃がす仕組みになっている。この設計の結果、ノイズは減るが、その分、筐体内の温度Ta(ambient温度)の上昇を招いてしまう。これは、Taが38度を異常に低く抑えることが要求されるPrescott FMB(Flexible Motherboard)スペックの場合には、かなりリスキーだ。

 それに対してNVIDIAは「そうしたスペックも十分考慮して設計した」(Sims氏)と言うが、システム側のベンダーの声は違う。「100WのCPUで、Taが38度というのは非常に苦しいスペック。NV38は評価していないのでわからないが、GPU側もTDP(Thermal Design Power:熱設計消費電力)が上がりあの設計だとすると、Prescottではかなり注意が必要かもしれない」とある業界関係者は言う。つまり、熱的にはNV30世代のリファレンスの方が望ましいというわけだ。このあたりは難しいところで、ボードベンダー側のソリューションを待つしかない。

 もっとも、ボードベンダーは正直な話NV38に対しては戸惑いがある。というのは、もしNV40が来年の早いタイミングで出てきてしまうとしたら、NV38にそんなに注力しても意味がなくなってしまうからだ。しかし、NV40が遅れるなら、NVIDIAのハイエンドソリューションとして注力する意味がある。そのあたりの見極めは難しい。

デスクトップ向けGPU推定ロードマップ
PDF版はこちら(87KB)

□関連記事
【10月24日】NVIDIA、GeForce FX 5950 Ultra/5700 Ultraを発表
http://pc.watch.impress.co.jp/docs/2003/1024/nvidia.htm

バックナンバー

(2003年10月24日)

[Reported by 後藤 弘茂(Hiroshige Goto)]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp 個別にご回答することはいたしかねます。

Copyright (c) 2003 Impress Corporation All rights reserved.