後藤弘茂のWeekly海外ニュース

CPUコアとプロセス技術の移行を進めるNVIDIAの戦略

2年サイクルのCPUコア開発をARM IPで埋めるピンポン戦略

 NVIDIAは、モバイル/組み込み向けのTegra系列では、CPUコアをSoC(System on a Chip)に統合している。NVIDIAは昨年(2014年)独自マイクロアーキテクチャの新ARMv8 CPU「Denver(デンバー)」を、28nmプロセスのTegra K1に載せて提供した。しかし、今年投入した20nmプロセスのTegra X1に搭載したのは、ARM設計のCortex-A57コアだった。なぜ、DenverではなくCortex-A57を選んだのか。Denverアーキテクチャは継続するのか。

 この疑問に対して、NVIDIAを率いるJen-Hsun Huang(ジェンセン・フアン)氏(Co-founder, President and CEO)は、COMPUTEX時に次のように答えた。

ジェンセン・フアン氏

 「実際のところ、我々のCPU戦略は、『ピンポン戦略』を取っている。我々は、毎年新しいTegraチップを提供できる。しかし、我々は新しいCPUアーキテクチャを作るのに2年かかる。そのため、戦略はピンポンになる。(Tegra製品では)新しいCPUアーキテクチャ、新プロセス技術、新しいCPUアーキテクチャ、新プロセス技術。このように、全てが2年リズムになる。2年毎に新CPU、2年毎に新プロセス技術だ。もちろん、GPUも2年リズムとなっている。Maxwellの登場まで2年かかり、Pascalの登場まで2年かかる」。

 この説明から、2014年に登場したDenver CPUコアの系列の後継コアは、2016年になることが分かる。製品コードネーム上では、次の「Parker(パーカー)」が再びNVIDIA Denver系コアのSoCとなる見込みだ。また、Tegra系列は2016年もGPUコアはMaxwellアーキテクチャが継続されることも示唆されている。

 全体の流れを見ると、自社でマイクロアーキテクチャを開発するDenverは、2年サイクル開発なので、1年サイクルのTegra製品化に合わせるために、ARMのCortex-A57 IPを使ったことになる。プロセス世代で言えば28nmは独自のDenverで、20nmに移行した今年(2015年)は購入IPのCortex-A57となる。Cortex-A57は、ARMがマイクロアーキテクチャを開発して、ソフトウェアマクロとしてライセンスするため、SoCへの実装が迅速に可能だ。成熟したプロセスには開発に時間がかかる独自CPUコアが載り、プロセスが変わると実装が簡単なライセンスCPUコアが載るパターンとなっている。

短命な20nmプロセスはARMのIPで短期間に開発

 Huang氏の説明通りなら、プロセス技術も2年サイクルなので、次のDenver搭載製品は20nmのままとなる。しかし来年(2016年)は、モバイルSoCは16/14nm FinFETプロセスに移行が進むため、Parkerも16/14nm FinFETプロセスである可能性が極めて高い。もっとも、プロセス技術のバックエンドを見ると、20nmと16/14nmプロセスは極めて近く、トランジスタ層だけの違いと考えるなら、20nmと16/14nmは同世代プロセスとなる。

 ただし、20nmプロセスと16/14nmプロセスにおける物理設計は、トランジスタ構造が全く異なるため変わる。コア設計の基本パーツであるスタンダードセル自体を見ても16/14nmのFinFETプロセスで全く設計が違う。そのため、物理設計的には、20nmプレーナトランジスタプロセスと互換性が低い。そして、プロセス世代的には、20nmは1年で交代する短命なプロセスで、16/14nm FinFETは2年以上残る標準的なプロセスになる見込みだ。

 そう考えると、NVIDIAの今回のCPUアーキテクチャ選択の理由も、より見えてくる。コア開発が2年サイクルなのでピンポンで交代するという要素に加え、短命な20nmに合わせた物理設計は、購入したIPで行なった方が手早く合理的という判断と見られる。16/14nm FinFET上での設計なら、その後に改良を加えるにしても、より合理的に設計を流用できる。

 ちなみに、CPUコアについては、NVIDIAのDenverは命令並列化のスケジューリングをソフトウェアで行なうという特殊な事情がある。そのため、DenverはGPUと同じように、ランタイムソフトウェアを更新することによって、同じハードでも性能が変わる。逆を言えば、ランタイムの成熟に時間がかかるアーキテクチャとなっている。そのため、GPUコアと同様に、同一系列のアーキテクチャを継続して、ランタイムを成熟させることが望ましい。

スマートフォン市場から引いたNVIDIA

 Tegra系SoCを継続して拡張するNVIDIAだが、Tegraのターゲットは当初のスマートフォン市場からは離れてしまっている。Huang氏は、NVIDIAにとってのモバイルは車載だと説明する。モバイル(mobile)という言葉の本来の意味は移動性で、自動車(automobile)はモバイルを単語自体に含んでいる。では、スマートフォンやスーパーフォンの市場は、もうNVIDIAは狙わないのか。

 「我々は、電話(スマートフォンなど)はもうこれ以上やらないと決定した。その理由は、私が、電話は、既にほぼ終わっていると考えているからだ。電話は既に日用品となってしまっている。もちろん、私も電話を毎日使う。しかし、その市場に貢献しようという強い欲求は感じない。なぜなら、既にこの市場には強力な競争相手が多数いるからだ。

 そのため、我々の今の電話戦略は、我々が作り上げた世界最上のGPU技術を、誰でも望んでいるメーカーにライセンスすることだ。だが、我々自身が電話を作るべき理由は何もない。また、それが、我々が無線モデム技術開発を止めると決定した理由の1つでもある」。

 Huang氏の説明からは、NVIDIAの戦略のポイントがよく分かる。NVIDIAは、自社の強味を活かすことができ、競合が弱い場所で戦おうとする傾向が強い。企業としては当然だが、スマートフォン向けSoCのように競争が激烈な場所は、利益を出すことが難しい。特に、モデムが絡むと非常にやっかいで、モデム技術を開発するだけなく、各国の認証を通す必要があり、手間が非常にかかる。

 NVIDIAは、一時は、自社でモデムを持てば、スマートフォン市場に食い込めると考え、ソフトモデムベンチャー「Icera(アイセラ)」を買収した。そして、Iceraモデムを統合したTegra 4iでスマートフォン市場を狙った。しかし、現在ではその路線は修正され、モデムベースバンドプロセッサを擁してスマートフォン市場で戦うという苦労の多い道は選んでいない。NVIDIAにとっては、同社のリソースを、より競合の少ない車載などの市場に向けた方が有利と判断したとみられる。転身がスピーディなことは、NVIDIAの特徴だ。

モデム内蔵のTegra 4iはスマートフォンフォーカスだった

プロセスノードの刷新は積極的に継続

 現在、NVIDIAはモバイル製品には20nmプロセス、ディスクリートGPU製品には28nmプロセスを採用している。これは、業界の標準的なプロセス選択だ。

 しかし、NVIDIAなどチップベンダーには、プロセス技術の面で、大きな技術の壁が立ちはだかっている。それは、プロセス技術の複雑化と、それに伴う新プロセスのコスト上昇だ。特に、20nmプロセスからは露光技術にダブルパターニングが導入されたこともあり、配線層のコストが急上昇している。これは、配線層の構成が特殊で、最もピッチ幅が狭い配線を多階層で使うGPUにとって、非常にクリティカルな問題だ。GPUの製造コストが急上昇することを意味しているからだ。

 そして、GPUは来年(2016年)からFinFET 3Dトランジスタプロセスへと移行するため、さらにプロセスは複雑になる。チップの製造コスト増は避けられない状況だ。このことは、今後は、プロセスの微細化=トランジスタ当たりのコスト減による製造コスト低減にならないことを意味している。そのため、製品によっては28nmプロセスに長期間留まる分野が出ることが予想されている。

 しかし、Huang氏は、同社の製品については、製造コストが上昇しても、性能向上が得られるのなら、新プロセスへの移行の意味が充分にあると語る。

 「多くの企業では、一定の機能を満たしたチップを設計し、そのチップのコストを毎年(プロセスの微細化などによって)下げて行く。しかし、NVIDIAの場合は少し違う。なぜなら、我々のチップは、決して機能が充分とはならないからだ。毎年、より高い性能が必ず必要になる。コストを下げるだけではなく、性能が重要だ。そのため、次世代のプロセスノードや、その次のノードでも、我々は依然として性能を向上させるアイデアを追求し続けるだろう」。

 現在のハイエンドGPUは、顧客側の要請がコストよりも性能の方にあり、常に性能向上が求められる。そのため、製造コストの上昇があっても、性能を上げることができれば、充分見合うとNVIDIAは見ていることが分かる。

セグメントと技術の進化
PDF版はこちら

プロセス技術だけに頼らずに性能を向上させる

 この姿勢は、AMDもほぼ同様だ。AMDも、FinFET世代のプロセスでは製造コストが上昇するが、性能と省電力の面で利点があるため、積極的にプロセス移行を進めると説明している。NVIDIAなどのGPUベンダーは、少なくともフラッグシップ製品については、できる限り早いプロセス移行を目指している。ただし、市場セグメントによってプロセス移行についての戦略は異なって行くだろう。

 しかし、GPUの性能の要素はプロセス技術だけでもないと、Huang氏は強調もする。

 「ただし、新プロセスだけに頼るわけではない。我々は、2年でフラッグシップGPUの性能を約3倍に引き上げた。これは、ムーアの法則(近年は2年でトランジスタ数が2倍)より速いペースだ。それが意味するのは、性能の向上は、プロセス技術だけでもたらされるのではなく、優れたアーキテクチャや賢い設計でも実現されるということだ。我々は、新プロセスノードに対して非常に積極的だ。しかし、そうでない場合(プロセスノードの進歩が滞った)でも、必要とする性能を達成することができる」。

 実際に、28nmプロセスからの移行は3年かかり、近年のムーアの法則よりペースは鈍化している。今後のプロセスノードになると、その傾向はさらに強まると見られている。Huang氏の言葉は、プロセス移行が鈍化しつつある状況に対してのコメントだ。

 ただし、アーキテクチャによる性能向上は、実際には限られる。現在の成熟したGPUでは、全体性能を、アーキテクチャだけで一気に引き上げることは難しい。そのためNVIDIAは、例えば16-bitハーフ精度の浮動小数点演算の性能強化など、特定機能の強化によって、性能の向上を持続している。GPUの進化は、全体の性能引き上げと同時に、引き上げやすい部分の強化の組み合わせで続くだろう。

(後藤 弘茂 (Hiroshige Goto)E-mail