【後藤弘茂のWeekly海外ニュース】GPUの進化を支えるファウンドリのプロセス技術に変動が

■後藤弘茂のWeekly海外ニュース■

GPUの進化を支えるファウンドリのプロセス技術に変動が

●GPUの進化とプロセス技術のビート

　従来、GPUの発展は1年刻みのビートに支えられていた。プロセス技術のビートで、1年サイクルの微細化が、GPUの1年毎の発展の源となっていた。GPU製造のプロセス技術は2年毎に1世代(70%)微細化し、その間にハーフノードが挟まるため、1年サイクルで80数%ずつプロセスが微細になって来た。

　かつては、これに1年刻みのDirectX APIの進歩のビートが重なっていた。1年置きにプロセス技術が刷新されてチップ当たりのトランジスタ数が増えることが、1年置きのAPI更新で増えるフィーチャのハードウェア実装を支えていた。

GPUトランジスタ数とプロセス技術
PDF版はこちら

　しかし、DirectX 9以降はAPIのビートはスローペースとなり、その結果、プロセスのビートだけが残された。API刷新のペースが遅くなると、GPUアーキテクチャの革新も遅くなった。そのため、最近ではプロセスのビートの重要な役目は、同じアーキテクチャでGPUをファミリ展開させることとなっている。

　プロセス微細化によって、同じアーキテクチャでも、より多くのプロセッサを載せたハイエンドGPUを作る。その一方で、肥大化したハイエンドGPUのアーキテクチャを、微細化で小型チップ化して、下の価格帯へとスライドさせる。

　特に、後者の低価格帯へのスライドは重要で、NVIDIAとかつてのATI(現AMD)は、ともにその方法でGPUファミリを下方展開して来た。例えば、NVIDIAなら、110nmのGeForce 7800 GTX(G70)から90nmのGeForce 7900 GTX(G71)などに、90nmのGeForce 8800(G80)から80nmのGeForce 8600(G84)や65nmのGeForce 8800/9800(G92)などに展開した。プロセス微細化版は、製造コストを下げ、下の価格帯のパフォーマンスGPU製品ライン以下を埋めた。

NVIDIA GPUダイと製品
PDF版はこちら

　これら微細化したパフォーマンス製品群は、GPUメーカーにとって「稼いでくれる孝行息子」(GPU業界関係者)となっていた。GPU製品は、大まかに300ドル以上のエンスージアストGPU(中でも400ドル以上はハードコアGPUとも呼ぶ)、150～299ドルまでのパフォーマンス(ミッドレンジGPUとも呼ぶ)GPU、80～149ドルまでのメインストリームGPU、79ドル以下のバリューGPUに市場が分けられる。カテゴリの価格分けは時代やメーカーによって変動があるが、大まかには、この分け方となる。コンシューマ市場での主戦場はパフォーマンスGPU以下で、そこへの製品展開に、プロセス微細化が欠かせなかった。

GPUのダイサイズと市場
PDF版はこちら

●ファウンドリのプロセスのビートに変動が

　こうしたGPUのファミリ展開を支えてきたのは、GPUの製造を請け負うファウンドリのプロセス技術開発だ。台湾TSMCに代表されるシリコンファウンドリは、2003年にGPU製品が市場に出た130nmプロセス以来、ほぼ1年サイクルでプロセスを約80数%ずつ微細化してきた。つまり、デバイスピッチを毎年80数%ずつ縮めて、トランジスタの密度を約140%ずつ上げてきた。130nm→110nm→90nm→80nm→65nm→55nmといったペースだ。

TSMCプロセスロードマップ
PDF版はこちら

　ところが、その歯車が狂い始めた。ファウンドリ側が、1年刻みのビートを維持できなくなったからだ。新プロセスの開発コストが高騰しているため、余裕がなくなって来たと見られる。プロセス自体の立ち上げでも、苦労するケースが増えている。

　その結果、TSMCは45nmプロセスをスキップして40nmを導入。実際には、この40nmは、もともと45nmと呼んでいたスペックに近いプロセスだが、ノードの数字の上では1ハーフノードをスキップした。さらに、32nmプロセスをスキップして28nmをフルノードにすることにした。これに呼応して大手ファウンドリGLOBALFOUNDRIESなども28nmをバルクプロセスのフルノード的な位置に据えている。つまり、従来の1年刻みのプロセスノードのビートは、ここに来て2年刻みへと変わろうとしている。

　そのため、GPUベンダーは新アーキテクチャのハイエンドGPUを40nmで出して、そのすぐ後に32nmで微細化した低コスト化版を出すことができなくなった。ビートが崩れた影響は大きい。NVIDIAもAMD(旧ATI)も、同じプロセスでGPUファミリのラインナップを広げなくてはならなくなったからだ。

●32nm版のFermiを出せないNVIDIAはGF104でリアーキテクト

　もっとも、AMDは、すでに2世代前から、こうした変化へ対応を済ませていた。Radeon HD 3800(RV670)系から、同じプロセス技術で下の製品ファミリへと迅速に展開する戦略に切り替えている。そのため、AMDにとっては、プロセスのビートが途切れたことは、GPUアーキテクチャの刷新が遅れるという影響に留まる。2010年第4四半期から登場するIslandsファミリは、プロセス微細化の恩恵を受けられないため、必然的にマイナーチェンジにならざるを得ない。パフォーマンスを維持しながらアーキテクチャを改革しようとすると、トランジスタが必要となるため、プロセスを微細化しないと難しい。

AMDのGPUダイサイズ戦略
PDF版はこちら

　プロセスビートの停滞が、製品ファミリ展開へと大きな影響を及ぼしたのはNVIDIA陣営の方だ。

　例えば、プロセスの1年刻みのビートが生きていれば、NVIDIAはFermiアーキテクチャで次のような展開を取ることができた。まず、40nmでハイエンドGPUとして巨大ダイ(半導体本体)のGeForce GTX 480(GF100)を投入。続いて、32nmプロセスに微細化することで、パフォーマンス/コストを引き上げたパフォーマンスGPUとしてGeForce GTX 460(GF104)を投入。プロセスの微細化だけで下へとラインナップを拡充することが可能だった。それなら、GF100をオーバーヘッドの大きなアーキテクチャにしても、微細化だけでコスト削減は、かなりカバーすることができた。

　ところが、GPUベンダーは40nmプロセスで2年間持ちこたえなければならない。そのため、NVIDIAは同じ40nmで、パフォーマンス効率(ダイサイズと電力の両方について)のいいGPUを作らなければならない。NVIDIAが、今回のFermiでパフォーマンスGPUを派生するために、アーキテクチャ革新に踏み切った背景はここにある。

　つまり、GeForce GTX 460(GF104)は、同じプロセス世代で、どうやってパフォーマンスGPUを派生させるかを考えた結果の製品だ。ファウンドリのプロセス技術ビートが、今後2年刻みとなるなら、これからのパフォーマンスGPUは、GF104と似たようなアーキテクチャ改革に頼る度合いが高くなる。GF104は、今後のパフォーマンスGPUのあり方の指標と言える。

GPUダイサイズとプロセス技術
PDF版はこちら

●GF100が遅れたためにGF104が追いつく

　NVIDIAは、GeForce GTX 480を製品出荷してから、わずか数カ月後にはアーキテクチャを大幅改良したGeForce GTX 460(GF104)を投入した。従来のペースからは考えられない急ピッチのアーキテクチャ改良だ。皮肉なことに、この急ピッチのリアーキテクトは、実は新プロセス技術での量産立ち上げがもたついたことで実現した。

　NVIDIAはGF100の量産立ち上げでは、かつてないほど苦労した。本来、2009年後半に出るはずだったGF100は、最終的に6カ月も出荷がずれた。しかし、その結果、アーキテクト陣は、GF104を設計する余裕ができた。GF100がもたついたのは、TSMC側の歩留まりとNVIDIA側の物理設計上の複合した問題(微細化とともに設計上の冗長性が少なくなり欠陥が歩留まりに大きく影響するようになった)だったからだ。論理設計を担当するチームは、2009年春には、すでにGF100から手が離れていたと見られる。

　その結果、NVIDIAのアーキテクトチームは2009年4月からGF104の設計をスタートさせた。GF104の設計を完了させたのは2009年の9～10月だという。通常、物理設計に入ってから、サンプルを出して検証、Fabに戻して再びサンプル出しを行ない、再検証でOKなら最短で2四半期とちょっとで製品出荷ができる。GF104について、計算はピッタリ合う。

　こうして見ると、GF100とリアーキテクト版のGF104の間が詰まっているのは、40nmでのGF100の量産に時間がかかったためであることがよくわかる。大幅なアーキテクチャ拡張を含むGF104をわずか半年で設計したのは、かなりアグレッシブなスケジュールだ。しかし、GF100の設計完了が2009年の後半だったら、GF104は2010年末まで出すことができなかったろう。NVIDIAがGF100の物理設計に手を入れたりしている間に、周回遅れのGF104が追いついてきたわけだ。

G80からGF100ファミリの派生
PDF版はこちら