後藤弘茂のWeekly海外ニュース

チップレベルで大きな進化を遂げたiPhone 4S



●CPUコアが進化したiPhone 4S

 AppleのiPhone 4Sがベールを脱いだ。iPhone 4Sは、型番は“5”ではなく、また、フォームファクタもiPhone 4を継承しているため、マイナーチェンジに見える。しかし、チップレベルで見ると、iPhone 3GSからiPhone 4へのジャンプと同程度に、iPhone 4からiPhone 4Sへのジャンプも大きい。

 最大のポイントは、AppleがiPhone 4Sに「Apple A5」SoC(System on a Chip)を搭載したこと。A5はiPad 2から採用された新しいSoCチップで、CPUコアとGPUコアの数を、iPhone 4/iPadのApple A4の倍にして、メモリを高速化した。iPhone 4SのA5が、iPad 2のA5と完全に同じものかどうかは、まだ明らかにされていない(カンファレンスでは正体不明のダイのイメージが示された)。しかし、スペックを見るとiPad 2のA5と同等クラスと見える。

 そのため、iPhone 4からiPhone 4Sでは、CPUとGPU、そしてメモリの個数やピーク性能が、それぞれラフに言って倍になる。CPUアーキテクチャだけを見ても、iPhone 4のシングルCortex-A8から、iPhone 4SではデュアルCortex-A9へと発展する。2命令デコードのインオーダ実行パイプラインから、アウトオブオーダ実行パイプラインへと進化する。つまり、CPUコアが1から2個に増えた以上に、パフォーマンスのアップが期待できる。

A4からA5へのジャンプ
PDF版はこちら
Cortex-Aファミリの性能
PDF版はこちら
Cortex-A8のブロックダイアグラム
PDF版はこちら
Cortex-A9のブロックダイアグラム
PDF版はこちら

 GPUコアは、PowerVR SGX系コアが1個だったA4から、A5ではデュアルコアへと拡張される。SGX系コアは、最大16浮動小数点演算ユニットのSIMD構成(コントロールフロー制御あり)なので、A5では32ユニットになる。メモリはA4ではx32のデュアルチャネルのLPDDRだったのが、倍速のLPDDR2規格をサポートすると見られる。

 AppleがiPhone 4SにA5を使ったことは、いくつかの重要なことを意味する。まず、2011年後半から2012年のスマートフォンのパフォーマンス標準が、デュアルCPUコア+デュアルGPUコアであることが再確認された。次に、Appleがスマートフォンとタブレットを、ほぼ同レベルのパフォーマンスに保とうとしていることが明瞭になった。そして、今後のスマートフォンは、ピーク負荷のワークロードではバッテリ駆動時間が厳しくなることが予想されるようになった。

●SoCのサイズをPC向けチップクラスに拡大したA5

 実際には、すでにスマートフォンの潮流はデュアルCPUコアに拡張したGPUコアへと向かっている。SamsungのGalaxy S IIなど、デュアルコアのスマートフォンがすでに多数登場している。デバイスベンダー側のSoCロードマップでも、主力はすでにデュアルコアとなっている。業界最大勢力のiPhoneがデュアルコアになったことで、スマートフォンのパフォーマンスの水準は1段階上がった。

 ここでポイントは、デバイスの世代には45/40nmプロセスの世代で、デュアルCPUコア+拡張GPUコアになっていること。これは、32/28nmプロセスへの移行を前提としているが、プロセスの微細化が間に合わないから現行の45/40nmでデュアル化したと推測される。

 例えば、AppleのA4とiPad 2のA5はどちらも45nmプロセスで、プロセッサを倍に増やしたことでダイサイズは53平方mmから120平方mm台へと倍以上に増えてしまった。Cortex-A9は非常にコンパクトだが、それでも、ターゲットとするダイサイズが小さいためデュアル化の影響は大きい。

 下の図はTSMCの40nm GプロセスでデュアルコアCortex-A9の実装だ。スピード最適化ハードマクロ(ターゲット2GHz, 1.9W)の場合は6.7平方mm、電力最適化ハードマクロ(ターゲット800MHz, 0.5W)の場合で4.9平方mmとなっている。これはL1キャッシュやバスインターフェイスまでを含んだデュアルコアのサイズだ。A5のSamsungの45nmでは、これよりさらにサイズが大きく、約9平方mm以上だと推測される。

Cortex-A9の実装
PDF版はこちら

 こうした状況から、45nmでは、シングルコアは組み込みSoCのダイサイズだが、デュアルコアになるとPC向けCPUのサイズに近くなってしまう。チップコスト的に組み込みSoCのレベルに抑えるには、32/28nmプロセスが望ましい。

 32/28nmプロセスへの移行は、まさに今始まっているところで、移行が進む今後は、ますますマルチコア化とGPUコアの拡張に拍車がかかるだろう。ちなみに、Samsungは先週、32nmのスマートフォン向けSoC「Exynos 4212」を発表した。これは、Galaxy S IIに搭載している45nmのExynos 4210を32nmに移行させたチップだ。Qualcommも28nmの「Krait」コアのSnapdragonのサンプル出荷をCOMPUTEX直後から始めている。

●スマートフォンとタブレットの共通化にこだわるApple

 Appleは、前世代のiPadとiPhone 4で、共通のA4チップを心臓部に使った。今回も、その路線を踏襲するように見える。この戦略からは、Appleの思想が見えてくる。スマートフォンとタブレットは、画面サイズも筐体容積も重量もバッテリ容量も大きく異なる。通常なら、チップレベルでのパフォーマンスや構成に差をつけてもおかしくはない。実際、モバイル向けのチップベンダーの中には、タブレット向けに1段高い水準のパフォーマンス製品をロードマップに据えるベンダーもある。

 しかし、Appleは、今のところスマートフォンとタブレットで、パフォーマンスもアーキテクチャも差をつけるつもりはないようだ。これは、Appleがスマートフォンとタブレットを合わせて1つのプラットフォームとして認識していることを意味している。上位のMac OSデバイスとは切り分けた、iOSデバイスのプラットフォームとして均質性をできる限り保とうとしている。

 この切り分けは、Appleの戦略の要であり、各社の思惑が異なる部分でもある。チップ、システム、ソフトウェアのそれぞれの分野で、各ベンダーが異なる戦略を持っている。例えば、MicrosoftはWindows 8をタブレットにももたらすことで、部分的にだがタブレットをPCの延長に位置づけようとしている。Intelは、現時点ではx86 Atom系のフォーカスをタブレットに移し、x86 PCワールドの利点を少しでも活かそうとしている。スマートフォンとPCの2つの世界の間に位置するタブレットを、どうハンドルするかについて、まだ定まった戦略がない。Appleは、iPadをiPhoneの延長でフォームファクタとユーセージが異なるものとして位置づけているようで、そのためにプラットフォームの均質性を維持しようと努めているように見える。

●iPhone 4Sで重要なファウンドリとプロセス技術

 Apple A5についての疑問は、製造ファウンドリとプロセス技術だ。iPad 2のA5のままなら、Samsungがファウンドリで45nmプロセスとなる。A5のファウンドリについては、iPad 2発表の前からTSMCに移るというウワサが盛んに流れていた。理由は当然、AppleとSamsungが世界中で繰り広げている訴訟合戦だ。両社は、スマートフォンとタブレットに関して法廷で戦いを繰り返している。それなのに、iPhone/iPadのコアチップは、SamsungがAppleに提供するという、ねじれた関係になっている。そのため、iPhone 4Sからファウンドリが異なるという可能性も捨てきれない。ただし、現在ではファウンドリを移すとかなりコストと手間がかかるので、通常ならSamsungになる。

 iPad 2のA5は45nmプロセスで、そのためにダイが非常に大きかった。ダイが大きければコストが増える。また、Samsungのプロセスでは、32nmからHigh-k/Metal Gate(HKMG)を採用してリーク電流(Leakage)を抑制するため、45nm世代は電力の面でも不利だ。こうした事情にあるため、iPhone 4S A5のプロセス技術は、かなり重要な問題だ。Samsung 32nmやTSMC 28nmなら、ダイを大幅に縮小し、アクティブ電力をある程度下げ、リーク電流もある程度抑制できる。

 この問題は、iPhone 4Sのバッテリ駆動時間にも絡む。CPUとGPUのコア数を増やすiPhone 4Sでは、3Dゲームなどのピーク時の電力消費が問題になる。増えたロジックの分だけ、アクティブな電力が増えるからだ。待機時や軽いワークロード時、あるいはCPUからオフロードするビデオやオーディオの処理の電力は、減らす手段はいくらでもある。しかし、CPUコアとGPUコアをフルに使う重いワークロードは問題だ。

 これは、現在のスマートフォンに共通する問題だが、パフォーマンスレンジが上がるにつれて、ピーク負荷のワークロードではバッテリ駆動時間が厳しくなってしまう。重い処理では、オフチップのDRAMへのアクセスも増えるので、メモリインターフェイスの電力の消費は増える。ところが、3Dゲームのような重いアプリケーションは、スマートフォンの魅力の1つだ。そもそも、バッテリ容量が大きく異なるスマートフォンとタブレットに、同じチップを載せようとするのだから、電力はどうしても犠牲になる。そのため、スマートフォンでは、より進んだプロセスが望ましいことになる。

メモリの帯域幅
PDF版はこちら

●NANDの大容量化が鈍化した影響が

 iPhone 4Sのストレージは、NANDフラッシュで16GB、32GB、64GBの3ラインナップ。今回、64GBが新たに加わった。32GBから64GBまでは、時間がかかった。

 iPhoneは、初代が2007年に最大8GBで発売され、2008年に16GBになり、2009年のiPhone 3GS時に32GBが加わった。ここまでは、ほぼ1年置きに倍々のペースでストレージ容量が増えて来た。それが、iPhone 4では最大32GBに据え置きで、今回のiPhone 4Sでようやく64GBになった。32GBから64GBまで、2年かかったことになる。

 ストレージ容量の伸びのペースが遅かった背景には、NANDフラッシュ自体の大容量化のペースが鈍化しているという事情がある。下は学会などで発表された数値をベースにした、NANDフラッシュチップの容量とダイサイズのチャートだ。時間軸は、大まかな製造開始時期を示している。

フラッシュのプロセス技術とダイサイズ
PDF版はこちら

 半導体メーカーは、NANDフラッシュを、利益が取れるダイサイズに収めて製造しようとしている。図中のグリーンで示したダイサイズがそれだ。このグリーンのエリアより上だとコストが高くなり、下だとコストが低く安売りに耐えられる。DRAMは価格下落が激しく、現在はダイをひたすら縮小しているが、NANDは、今のところ一定のダイサイズを保っている。

 このチャートを見ると、NANDは8Gbit品までは12~15カ月毎に倍々のペースで大容量化していた。しかし、16Gbit品と32Gbit品への移行はペースが遅くなっていることがわかる。現在はペースが上がっているように見えるが、これは、IntelとMicronのIM Flash Technology(IMFT)が34nmからプロセスの微細化を急加速した(25nmと20nmでもIMFTが早い)ため、業界全体が引っ張られてペースが早まったためだ。全体の傾向としては、ペースは鈍化している。より単純化したのが下の図だ。

NANDフラッシュの容量とプロセス技術
PDF版はこちら

 もちろん、チップの大容量化と価格は必ずしも連動するわけではない。NANDの価格は2009年後半から2010年前半まで比較的高価格だった。現在は、32GbitのMLCのスポット価格が3~4ドル台で推移しており、64Gbitもビット単価で32Gbitを下回ろうとしている。ようやく、ストレージ容量を増やすことができるようになったわけだ。

 スマートフォンの進化は、実は、NANDが牽引した。NORフラッシュをメインメモリ兼ストレージに使う「XIP(eXecute In Plane)」モデルから、NANDとモバイルDRAMの組み合わせに移行したことが、スマートフォンの進化の原動力となった。その意味では、NANDの鈍化は、スマートフォンにとって影響が大きい。