後藤弘茂のWeekly海外ニュース
iPhone 6sは性能と効率が大きく向上するFinFETのA9へ
(2014/9/18 06:00)
筐体変更とコアアーキテクチャやプロセス革新が交互に来る
来年(2015年)の“iPhone 6s”(仮)は、チップの消費電力が大幅に減りバッテリ駆動時間が延びる。または、同じバッテリ時間で、性能が伸びる。なぜなら、来年のiPhoneのSoC(System on a Chip)チップ“A9”(仮)は、3Dトランジスタ技術の「FinFET」に移行するからだ。
FinFETでは、リーク電流(Leakage)とアクティブ電力が減り、トランジスタが高速化する。特に、モバイルチップのように低電圧で動作する時に、トランジスタの特性が優れる。そのため、半導体技術面での効用は来年のiPhone 6s/A9 SoCの方が目覚ましくなるだろう。
FinFETの導入によって、半導体技術的に見れば、来年のiPhoneは大きな技術の節目となる。ちょうど、昨年(2013年)のiPhone 5sが、CPUとGPUのマイクロアーキテクチャの大きな節目であったように。
こうして見ると、iPhoneの場合、プロセッサアーキテクチャや半導体技術の転換点と、外観や周辺機能の転換点が交互にやってくるように見える。話題になりやすいディスプレイサイズや筐体の変化は、プロセッサや半導体技術の大きな転換の合間に来る。チップの技術的には、ディスプレイや筐体が変化しない中間世代のiPhoneの方が面白い。
もっとも、今回はプロセス技術面で新味があった。AppleはiPhone 6/6 PlusのSoCチップA8は20nmプロセスで製造しているからだ。AppleのSoCは、A4/A5までが45nm、A6が32nm、A7が28nmだった。今回は20nmとなり、さらに一段微細化が進んだ。また、SoCチップの製造ファウンダリは、従来AppleのAxシリーズを製造して来た韓国のSamsung Semiconductorから、台湾のTSMCに移ったと見られている。
下の図はAppleのAxシリーズの製造プロセス技術の変遷だ。それぞれ、横幅の数字が「Contacted Poly Pitch (CPP)」または「Contacted Gate Pitch」を、縦長の数字が「Metal 1 Pitch」または「Minimum Metal Pitch」を示している。グリーンがゲート、ブルーがメタル配線を象徴している。ロジック回路の面積は、ほぼこの図の数字(=白い点線の四角)と比例している、つまり、下の図の白い四角が小さければ小さいほど、同じトランジスタ数のチップを小さくできるし、同じ大きさのチップにより多くのトランジスタを詰め込むことができる。
図で分かる通り、28nmから20nmへと移行するとゲートピッチ×メタルピッチ(=白い点線の面積)は56%程度に縮小する。それだけ多くのトランジスタをチップに搭載できるようになる。Appleは28nmのA7が102平方mmのダイで約10億トランジスタだったのに対して、20nmのA8はダイが13%小さいにも関わらず、トランジスタ数は約20億だと説明している。この数字が正確なら、縮小率は56%よりも優れているので、A8はトランジスタ密度の高いSRAMや高密度ロジックの比率が高まったと推測される。主要部分のセルライブラリのトラック数が変わった(例えば12トラックから9トラックなど)可能性もある。
PowerVR Series6(Rogue)アーキテクチャは最大の6クラスタ構成に
Appleは、前世代のA7からCPUコアの命令セットアーキテクチャをARMv8へと移行させ、64-bit CPUへと進化させた。A8のCPUコアは64-bit ARMv8の第2世代目となる。Appleによると、CPUは最大25%高速になり、GPUも最大50%性能が向上したという。その一方で電力消費はA7の50%に抑えたとしている。もちろん、これらの数字は実測ではまた変わる可能性があるが、20nmへの微細化と、それに伴うアーキテクチャ拡張によって、性能/電力がアップしたことは確かだ。
CPUコアはデュアルコア構成のままで、動作周波数は1.4GHzに少しだけ向上した。CPU性能のアップ分は、マイクロアーキテクチャ拡張などによると見られる。
GPUが50%アップしたという説明からは、PowerVR Series6(Rogue)アーキテクチャでのプロセッサクラスタが増やされたことが推測される。従来のA7は4個のPowerVR USC(Unified Shading Cluster)を備えていた。A8では、これがPowerVR G6650クラスとなり、6個のUSC構成になったと見られる。
PowerVR Series6アーキテクチャでは、各USCはそれぞれ2個のFMAD(浮動小数点積和演算)ユニットと1個のSuper Function Unit(SFU)を備えている。3ユニットに対して各サイクル最大2命令の発行が可能だ。そのため、6クラスタ構成の場合は合計で192個のFMADをフル操作させることができる。積和算が可能なので、浮動小数点オペレーション数では各サイクル384となる。この数字は、NVIDIAのモバイルSoC Tegra K1と同じだ。
NVIDIAのTegra K1のKeplerアーキテクチャの場合は、192 FMADが最小構成であるのに対して、PowerVR Series6では粒度はその3分の1の64 FMAD。段階的に構成を増やして性能を増すことができるPowerVR系の利点が活かされている。ただし、今のところ、PowerVRのレイトレーシングハードウェア支援ユニットはA8に実装された様子がない。もっとも、AppleがGPUコアも将来は自前で開発しようとしているのなら、Imagination Technologies独自のレイトレーシングソリューションの実装は避けるだろう。
iPhone 6/6 Plusでは、ディスプレイサイズの拡張とともに解像度が上がった。従来は1,136×640ドットだったのが、iPhone 6では1,334×750ドット、iPhone 6 Plusでは1,920×1,080ドットになった。ドット数の比率では、iPhone 6は1.38倍、iPhone 6 Plusは2.85倍に上がったことになる。その分、3Dグラフィックスでは、ピクセルプロセッシング性能が必要となる。
GPUコアの性能が50%向上では、最大2.85倍の解像度の向上にはマッチしないように見える。しかし、実際には前世代でGPU性能が上がったため、解像度とのバランスで言えば、A7ベースのiPadと比較するなら、悪い比率ではない。
20nmの量産ではぎりぎりのタイミングのiPhone 6/6 Plus発表
今回のiPhone 6/6 Plus発表は、半導体的に見ると、ぎりぎりのタイミングだった。何がぎりぎりかと言うとチップの製造だ。Appleは、28nmプロセスだったiPhone 5sのA7から、iPhone 6系のA8では20nmへとチップの製造プロセス技術を変えた。しかし、20nmプロセスは本格的な量産が始ってそれほど経っていない製造技術で、チップはほとんど市場に出ていない。
ファウンダリ各社の20nmプロセスは、当初の予定よりかなり遅れた。本当なら今年(2014年)の頭には20nmプロセスベースの製品が多数市場に出ているはずだった。それが2四半期以上遅れて、今ようやく量産品が市場に登場しつつある。この遅れはAppleにも予想外だったはずで、本来は余裕を持たせたはずの20nmへの移行が、ぎりぎりのタイミングになってしまったと推測される。
iPhoneのような膨大なボリュームの製品が、こうした状態にあるプロセス技術で製造されるのは異例のことだ。生産数量が限られるハイエンドGPUならともかく、数百万のオーダーで製造が要求される人気製品のSoCだ。成熟したプロセス技術の方が、安定してチップを大量生産できる。
逆を言えば、Appleは立ち上がったばかりのファウンダリの20nmプロセスのラインのかなりの部分を押さえたことになる。そして、押さえたラインで作り貯めしたチップが充分な量に揃ったのが、今秋のタイミングだったと推測される。
実際、Appleは初日の予約が400万台だとアナウンスしている。多少出荷遅れが予想されてもいるが、この予約に応えることができるということは、Appleはかなりの数のウェハを押さえて、この夏までにチップを製造したことになる。下の図は、300mmウェハで、80平方mmのダイを製造して、歩留まりが90%程度だった場合の例だ。A8はダイが89平方mm程度なので、下の図よりはウェハ当たりの製造数が少なくなる。また、20nmプロセスの歩留まりはこれより悪い可能性がかなりある。
この比率で予測すれば、Appleは5,000枚以上、もし歩留まりが水準以下なら1万枚近いウェハを押さえたことになる。最近の先端Fabの製造キャパシティは数万WSPM(Wafer-Start-Per-Month)なので、AppleだけでFabのアウトプットのかなりの部分を押さえた計算になる。
TSMCでも、最先端プロセスに流すウェハ数は限られる。A8がTSMC製造だとすれば、Appleは20nmラインのかなりの比率を押さえたことになる。結果として、他のTSMCの顧客の中には、20nmラインでの製造が遅れたりはじき出された例もあったかも知れない。いずれにせよ、これだけの数のウェハを考えると、iPhone 6系のこの時点での発売は、ぎりぎりのタイミングだったと推測される。
20nmプロセスでのコスト上昇はモバイルSoCとGPUで異なる
チップの製造では、20nmプロセスから先はウェハのプロセッシングコストが上昇してしまうため、20nmへの移行に積極的ではないチップベンダーが多いという話があった。しかし、Appleは先陣を切って20nmへと移行している。これは、なぜなのか。そこには、プロセス技術の詳細の話が絡んでいる。
そもそも、20nmでウェハのプロセッシングコストが上がる理由は、配線層にダブルパターニングが導入されるからだ。80nm(40nmハーフピッチ)よりもピッチが狭い微細配線を切るために、20nmプロセスでは各社とも露光プロセスを2回に分けて行なうダブルパターニングを導入している。通常のダブルパターニングでは「LELE(Litho-Etch-Litho-Etch)」で露光とエッチングを2重に行なうため、バックエンドプロセスのスループットがガクっと落ちる。スループットが落ちると、製造コストが上がる。
しかし、この事情は、チップによって度合いが大きく異なる。ディスクリートGPUの場合は、6~8層が最もピッチが狭い配線となるため、その全てにダブルパターニングが必要となる。ダブルパターンになる層数が非常に多く、製造コストが大きく増える。それに対して、一般的なモバイルSoCでは、ダブルパターニングが必要な配線は通常3層なので、コストインパクトはあっても、GPUと比べるとずっと度合いが低い。
こうした事情から、GPUベンダーなどはウェハのコストアップを盛んに指摘するが、モバイルSoCはそれほどではないという違いが発生している。もちろん、それでも20nmでのトランジスタコストの低下のカーブは緩く、経済的な利点は過去のプロセス移行と比べると低い。しかし、それでもモバイルSoCではGPUよりも20nmに積極的になれる。Appleの20nmへの移行は、まさにこうしたトレンドを象徴している。
A9はFinFETベースのプロセスへと移行
来年のA9で、Appleにはプロセス技術の選択ができるようになる。ファウンダリ各社のFinFETプロセスが使えるようになるからだ。来年Appleが使うことができるプロセス技術を織り込んだ図が下だ。可能性は低いがIntelも入れると3社のFinFETプロセスを使うことができる。
多くの報道で、AppleがSamsungとのモバイル市場での軋轢から、Samsungへのチップ製造委託を止めようとしていると伝えている。しかしこれは正しくない。プロセス技術の状況は、そうした企業政治の争いに左右されるほどのどかな状況にはないからだ。各社のプロセス技術を比較し、特性と立ち上がりの面で優れたプロセスを正しく選択しなければ、すぐに競争から脱落してしまう。
Appleが20nmでTSMCを選んだとすれば、その理由はおそらく、それまでのSamsungがプロセス微細化で、TSMCに一歩遅れていたからだ。TSMCが28nmへと移行して行った時に、Appleはまだ32nmに留まっていた。エリアスケーリングでは不利な状況にあった。ところが、20nmではTSMCも全体的にスケジュールがずれ込んだ。となれば、次のプロセスを選ぶ場合に、TSMCにこだわる理由はなくなる。
こうした背景から、AppleがFinFETでは、再びSamsungに戻る可能性も高いと見られる。FinFETプロセスでは、SamsungはTSMCと並んでトップランナーに立っている。しかも、エリアスケーリングではTSMCのFinFET 16nmプロセスより若干Contacted Poly Pitch(CPP)が短く、その分、より多くのトランジスタを詰め込むことができる。さらに、SamsungはGLOBALFOUNDRIESにFinFETプロセス技術を製造しているため、製造をSamsungとGLOBALFOUNDRIESの2社の間で移したり分散させることができる。これは、先端プロセスでの製造キャパシティを安定的に確保したいAppleにとっては大きな魅力だ。
いずれにせよ、Appleは来年はFinFETプロセスに確実に移行するだろう。その結果、来年のiPhoneでは、性能/電力について、大きな伸びを期待することができるようになる。ただし、ファウンダリ各社のFinFETプロセスは、配線層については20nmプロセスの多くを流用する。そのため、A9では、A7からA8への移行のような大幅なトランジスタ数増加は望めない。言い換えれば、CPUコアやGPUコアの数や規模はそれほど変えることができない。だが、同じCPUコアやGPUコアであっても、その性能効率は大幅に向上するだろう。