■後藤弘茂のWeekly海外ニュース■
チップサイズを大きくしてパフォーマンスを上げる。PC業界で、何度ともなく繰り替えされてきた手法を、Appleはモバイルデバイスでも採用した。Appleは新iPadの開発に当たって、チップを大型化することで、前世代よりグラフィックス性能を上げた。トレードオフは製造コストの若干の上昇とピーク消費電力の上昇だ。スマートフォン&タブレットのSoC(System on a Chip)も、PCプロセッサと同じ大型化競争の道を辿るのか。
Appleは、2009年のiPhone 3GSまでは、SamsungのモバイルアプリケーションプロセッサSoCを載せていた。iPhone 3GSのSoCは、SamsungのCortex-A8ベースの「S5PC100」で、Samsungの65nmプロセスで製造されていた。Apple設計のSoCになるのは、2010年の初代iPadのA4プロセッサからで、それ以降独自の発想でiPad/iPhoneのSoCを発展させてきた。昨年(2011年)のiPad2/iPhone 4Sで2世代目のA5を投入、先月発売したThe new iPadは、新しいSoC「A5X」を載せた。
S5PC100の機能 |
AppleのSoCの移行図 PDF版はこちら |
Appleの「Ax」シリーズの発展の最大のポイントは、小型ダイで低コスト&超低消費電力というモバイルSoCの枠を越えても、パフォーマンスを追求していることだ。A4/A5系はいずれもSamsungの45nmプロセスで製造されているが、コア数はどんどん増えて、それに伴いダイサイズも大型化して来た。
A4はCortex-A8 CPUコアが1に、PowerVR SGX535 GPUコアが1の構成。それがA5では、Cortex-A9 CPUコアが2と、PowerVR SGX543MP2 GPUコアが2と、CPUとGPUとも倍増した。また、ARM CPUコアアーキテクチャも発展した。A5のマイナーチェンジ版のA5Xでは、CPUコアはそのままで、PowerVR SGX543MP4 GPUコアが4と、グラフィックスプロセッシング能力が2倍に強化された。
Cortex-A8のブロックダイアグラム PDF版はこちら |
Cortex-A9のブロックダイアグラム PDF版はこちら |
●ディスプレイ解像度を4倍にしたことでGPUコアを強化
AppleがA5XでGPUコアを強化した理由は明白で、ディスプレイ解像度を4倍に引き上げたからだ。ピクセル数が4倍になれば、ピクセルシェーダは単純計算で4倍回さなければならない。ピクセル解像度が上がれば、ポリゴン解像度もある程度上げる必要が出る。ノートPCディスプレイを越えるRetinaディスプレイの解像度に合わせて、AppleはGPUのプロセッシングパフォーマンスを引き上げなければならなかった。
ただし、A5XではメモリはLPDDR2のままなので、帯域は解像度に見合うように上がっていないと見られる。その点では、バランスが取れていない。本来なら、GPUのプロセッシング能力の拡張に合わせて、メモリ帯域も上げる必要があるが、メモリの高速化が追いついていない。
もっとも、PowerVRはタイリングアーキテクチャなので、メモリ帯域を節約できる利点がある。タイリングの場合、メモリ帯域を消費するROP(Rendering Output Pipeline)回りの処理は内部メモリを使うため、その分、外部メモリ帯域をセーブできるからだ。
レンダリング方式の比較 PDF版はこちら |
とはいえ、現在のゲームグラフィックスの場合、メモリアクセスで支配的なのはテクスチャフェッチだ。アプリケーションにもよるが、多い場合にはテクスチャだけで、メモリアクセスの大半が埋まってしまう。ゲームグラフィックスがリッチになるに連れて、テクスチャ量が増える。そして、ディスプレイ解像度が高まると、テクスチャ密度を高める必要が増えるため、テクスチャフェッチの量がさらに増えてメモリ帯域を圧迫する。このほか、ポリゴン解像度が上がることでの頂点数の増加もメモリアクセスの増加を招く。
●PCプロセッサ並のサイズのA5/A5XAppleのAxシリーズSoCの機能の拡張は、ダイサイズの大幅な増大を招いた。
初代iPad/iPhone 4のA4プロセッサのダイは53平方mm程度と、組み込みSoCとして一般的なサイズだった。ところが、iPad2/iPhone 4SのA5では、ダイサイズが一気に倍増した。調査会社UBM TechInsightsによる、昨年のESCでのプレゼンテーションではA5のサイズは約122.2平方mmとなっており、A4の2.29倍だ。そして、新iPadのA5Xのダイは163平方mmとさらに1.33倍へと大型化していると言う。
ダイサイズの推移 PDF版はこちら |
組み込みSoCとしてはA5ですら大型ダイであるのに、A5Xではさらにダイを大きくしたため、A5系は、もはやモバイル組み込みSoCの範疇からはみ出すチップになった。これがどの程度大きなサイズかを実感するには、Intelプロセッサと比べるとわかりやすい。下は、A4/A5を同じプロセスのIntel CPU、そして最新の22/32nmプロセスのIntel CPUと比べた図だ。
Intelとのダイサイズ比較 PDF版はこちら |
Intelの45nm世代では、A5にやや近いのはデュアルコアのCore 2(Penryn:ペンリン)で107平方mm。A5Xに近いダイサイズのチップは存在しないが、小容量L2版のPenrynのダイ(81平方mm)を2個同じパッケージに収めたCore 2 Quad(Yorkfield:ヨークフィールド)の合計ダイサイズがA5Xとほぼ同じだ。乱暴な言い方をすれば、A5Xは、同じプロセス世代のCore 2 Quad相当の規模のチップということになる。もちろん、A5系はSoCであるのに対し、この時点のIntel CPUはCPUコアとキャッシュ、FSB(Front Side Bus)だけのプロセッサチップであり、単純に比較はできない。
一方、初代iPadのA4は、45nm世代のAtom系SoCのPineview(パインビュー)のシングルCPUコア版(66平方mm)と比べても小さい。Atom系ではCPUコアとFSBだけの初代AtomのSilverthorne(シルバーソーン)という、24.2平方mmの極小ダイのチップも存在するが、GPUコアやメモリインターフェイスも含めたSoC同士で比較すると、A4の方がAtomよりさらに小さい。ちなみに、A4は、いわゆるPCサウスブリッジチップに当たる機能も統合した完全な(通信系以外)SoCだが、Pineviewはコンパニオンチップが必要な不完全なSoCだ。
こうしてみると、iPadは45nmプロセスの3世代で、Atom SoCより小さなチップからCore 2 Quadのレベルにまで、一気にチップを大型化したことがわかる。
では、Intelの今年(2012年)のラインナップと比較するとどうなるのか。Intelは今年から22nmプロセスのIvy Bridge(アイビーブリッジ)を投入する。Ivy Bridgeは、CPUコアにGPUコア、メモリインターフェイス、PCI Expressを統合したSoCとなっている。Ivy Bridgeでは、クアッドコアの最大のダイのサイズが160平方mm程度。つまり、45nmのA5Xは、同時期のIntelのメインストリームPC向けの22nmクアッドコアCPUと同じレベルのサイズとなる。同様に、A5はIvy Bridgeのデュアルコアとほぼ同じだと見られる。
こうして比較すると、AppleがA5系の開発に当たって、組み込みSoCの枠を越えてPCプロセッサのサイズに足を踏み入れて、パフォーマンスを追求していることがよくわかる。
●Tegra 2/3系と比べてもずっと大きなAppleのA5系では、他のモバイルSoCはどうなのか。AppleのA4/A5系のダイサイズを、他のモバイル向けSoCと比較すると、Appleのチップの肥大化が突出していることがよくわかる。
例えば、NVIDIAのTegra 2のダイサイズは、UBM TechInsightsのESCプレゼンテーションでは約49平方mm程度となっている(調査会社Chipworksでは50.3平方mm)。Tegra 2のCPUはCortex-A9 2コアで、1頂点シェーダプラス1ピクセルシェーダの構成。プロセスはTSMCの40nmプロセスだ。
後継のTegra 3は、調査会社Chipworksのサイトで公開された情報では81.91平方mmとなっている。Tegra 3は、CPUコアをCortex-A9 5コア(同時動作は4コア)に増やし、GPUコアを2ピクセルシェーダに強化した。Tegra 2と同じく40nmプロセスで製造されている。つまり、Tegra 2は組み込みSoCの標準的なサイズで、強化したTegra 3でさえ100平方mm以下の組み込みサイズに留めている。
もちろん、Tegra 2/3系はTSMCの40nmプロセスで、Samsungの45nmと比べるとダイを小さくできる利点がある。しかし、45nmと40nmでのセルサイズの差を考慮しても、A5Xの方がまだ大きい。他のベンダーでは、Texas InstrumentsのOMAP4系のOMAP4430が、やはりデュアルCortex-A9の45nmプロセスで70平方mm以下のダイサイズに抑えている。
モバイルSoCのダイサイズ比較 PDF版はこちら |
こうして概観すると、Apple以外のベンダーは冒険を避けて、堅実なダイサイズに収めようとしていることがわかる。これは、システムベンダーとチップベンダーという立場の違いも反映している。Appleは、iPad/iPhoneというシステムの中で、コストを配分して調整できるため、チップコストが多少増しても対応できる。それに対して、チップベンダーは、チップ自体を販売するため、チップコストをむやみに上げることができない。
Appleは、新iPadの発表では、A5Xのグラフィックスパフォーマンスが、Tegra 3よりはるかに高いと主張したが、ダイが大きなA5Xの方が生パフォーマンスが高いこと自体は不思議ではない。PC市場でのCPU戦争やGPU戦争で、チップメーカーがより大きなダイのチップを作りパフォーマンスを上げるのと同じ手法で、Appleはチップパフォーマンスを上げている。
また、Tegra 3はCPUコアを4コア(物理的には5コア)に増やしてCPUパフォーマンスを重視したが、A5Xはその逆にGPUコアを4コアに増やしてグラフィックスパフォーマンスを重視した設計を取ったという違いもある。ARMのCortex-A9 CPUコアは相対的に小さく、多くのGPUコアの方が大きいため、GPUコアを増やす方はダイサイズをより肥大化させる。ちなみに、Tegra 3が抱える問題は、Appleが指摘する生パフォーマンスより、むしろGPUのマイクロアーキテクチャが古い(G7x世代のアーキテクチャの発展系)という点にあり、NVIDIAは次の世代でその点を一新する見込みだ。