笠原一輝のユビキタス情報局

5つ目のコアが低消費電力マジックの種だったNVIDIAのKal-El
~Tegra 2より低消費電力/高性能を実現



 NVIDIAは20日(現地時間)、ホワイトペーパーを公開し、同社が「Project Kal-El」(カルエル、以降Kal-El)のコードネームで開発してきたARMベースのクアッドコアSoCの詳細データをが明らかになった。

 NVIDIAはこれまで、Kal-ElはデュアルコアのTegra 2よりも低い消費電力を実現していると説明してきたが、その詳細は不明だった。今回の資料によれば、Kal-Elは、「vSMP」(Variable Symmetric Multi Processing)と呼ばれる仕組みが実装されており、メインのクアッドコアと低消費電力で動くコンパニオンコアとを自動で切り換えることで、OSを問わず低消費電力で動作することが可能になっているのだ。

●クアッドコアCortex A9+12コアGeForceという構成になるKal-El

 Kal-Elは、Honeycomb(Android 3.x)搭載のタブレットに多数採用されているTegra 2の後継として開発されている製品で、Tegra 2がCortex A9のARMコアを2つ搭載しているのに対して、Kal-Elは4つ搭載している点が大きな違いとなっている。

 NVIDIAは2月にバルセロナで開催されたMWC(Mobile World Congress)においてKal-Elを初めて公開するとともに、NVIDIAが試作したタブレットを披露した。その時以降に公開された情報をあわせると、Kal-Elのスペックは以下のようになっている。

【表】Kal-ElとTegra 2の比較(NVIDIAなどから公開された情報を元に筆者作成)
 Tegra2KAL-EL
プロセッサコアコア世代Cortex-A9Cortex-A9
コア数24
メモリLPDDR2DDR3L
グラフィックスコア ULP GeForce新GeForceコア
コア数812
3Dステレオ対応未対応対応
最大解像度1,920×1,080ドット2,560×1,600ドット
製造プロセスルール40nm40nm

 Tegra 2からの強化点は2つある。1つはすでに述べたようにプロセッサコアが4つ(クアッドコア)になっていることだ。また、GPUコアも拡張されており、Tegra 2ではGPUの演算ユニットが8個だったのに対して、Kal-Elでは12個に増やされている。

 このように、演算器が増やされていることから容易に想像できることは、Kal-Elのトランジスタ数がTegra 2よりも増えていることだ(NVIDIAはKal-Elのトランジスタ数を公開していない)。Kal-ElもTegra 2と同じTSMCの40nmプロセスルールで製造されるため、トランジスタ数が増えることは、ダイサイズの肥大につながり、常識的に考えればKal-Elの消費電力はTegra 2に比べて増えるはずだ。

 しかし、MWCにおいてNVIDIAモバイルビジネス事業部 事業部長のマイケル・レイフィールド氏は「同じ性能であれば、Kal-ElはTegra 2よりも低消費電力になる」と述べていた。

NVIDIAがMWCで公開したKal-El搭載タブレットこちらはCOMPUTEX TAIPEIでのデモ、Lost Planet 2が動作していた

●HPとLPの2つのプロセス技術をハイブリッドにするvSMP

 半導体の常識に反する説明には、NVIDIAの魔法の種が隠されていた。それがvSMPだ。

 ホワイトペーパーによれば、Kal-Elは実は4コアではなく、5コアなのだという。ただし、5つ目のコアは他の4コアとは別の、コンパニオンコアと呼ばれる特別な扱いとなる。このコンパニオンコアは、低消費電力(LP=Low Power)向けのトランジスタを利用して実装されている。

 半導体のプロセスルールには、性能に特化したHP(High Performance)向けのプロセスルールと、消費電力に特化したLP(Low Power)向けがある。一般論として、半導体の消費電力というのは、常時発生している漏れ電力と、アクティブ時に使用する電力の合計で決まる。HPは漏れ電力は高いが、アクティブ時に利用する電力を大きく増やすことなく周波数(性能)を上げることができる。つまり、アイドル時の電力は高いが、アクティブ時の電力は相対的に低く抑えることができる。これに対してLPは、漏れ電力を低く抑えることができ、アイドル時や低負荷時の電力を抑えることができるが、アクティブ時の電力効率はあまりよくないので、周波数を上げると電力が相対的に高くなってしまう。

 Kal-Elは、このHPとLPの特性をうまく利用する仕組みになっている。5つ目のコンパニオンコアはLP向けのトランジスタで構成し、それ以外の4つのコアはHP向けのトランジスタが割り当てられているのだ。プロセッサへの負荷が低く、1つのコアで十分処理できる場合にはコンパニオンコアを、プロセッサへの負荷が高く、より処理能力を必要とする場合には、クアッドコアに切り換えて処理する。

 これにより、通常のデュアルコアよりも低負荷時やアイドル時には低消費電力になりバッテリが長持ちし、高負荷時には低い消費電力で高い性能を発揮できるのだ。

赤いCPU AはHPのプロセス技術で作ったCPU。漏れ電力は大きくなるが、アクティブ時の消費電力は抑えることができるKal-ElではHPとLPのいいとこ取りを実現コンパニオンコアはクアッドコアから独立して存在している

●コンパニオンコアとクアッドコアの切替はCPUの内部で自動的に行われる

 この5番目のコンパニオンコアと、メインのクアッドコアは排他的に切り換えて利用することになるため、同時に5つのコアすべてを利用することはできない。あくまで、2つのプロセス技術を消費電力の観点から効率的に利用するための仕組みなのだ。なお、こうしたマルチコア時の消費電力低減技術としては、QualcommがSnapdragonシリーズで採用している各コアのクロック、電圧を各々独立して変動させる非同期動作があるが、非同期動作が各コアごとに電圧変換器を用意する必要があるのに対して、vSMPではプロセッサコアには5つのコアに対して電圧変換器は1つで済み、コスト面でも、実装面でも容易になるというメリットがある。

 また、クアッドコアとコンパニオンコアの切替は、CPU内部に用意されているハードウェアとソフトウェアの管理機構が、CPU負荷などを自動で判別し自動で切り換えることになる。このため、OSからは常にクアッドコアのプロセッサとしてのみ認識され、OSがHoneycombであろうが、Windows 8であろうが動作するし、追加のソフトウェアなども必要としない。なお、クアッドコアとコンパニオンコアの切替は2ms以下で行われるので、ユーザーが切り替わったのを意識することはないという。

 コンパニオンコアに切り替わるのは、メールの送受信やハードウェアデコーダを利用してビデオ再生時などプロセッサへの負荷が低い時やアイドル時などで、コンパニオンコアは500MHzまでクロック周波数を動的に変えながら動作する。より負荷が高い処理を行なうと、自動でクアッドコアに切り換えられる。

 これにより、Kal-ElはTegra 2に対して、アイドル時に28%、MP3再生時で14%、HDビデオ再生で61%、ゲーム時で34%の消費電力の削減が実現されているという。同じ世代のプロセスルールを利用して製造されているのに、プロセッサのコアも、GPUのコアも増やしながら、これだけの消費電力削減を実現しているのは賞賛に値するだろう。

CPU負荷に応じて、コンパニオンコアのみや、クアッドコアのの一部あるいはすべてをオンに切り換えるTegra 2とKal-Elの消費電力の比較

●Kal-Elを搭載した製品は年内にも市場に投入される予定

 NVIDIAは同時に1GHzで動作するKal-Elの性能データを初めて公開した。CoreMark Benchmarkの結果では、Qualcomm 8660/1.2GHz(デュアルコア)を1として、その2倍の性能を発揮するという。Tegra 2も含めた他のデュアルコアも概ねQualcomm 8660と同じような性能であるので、現行のデュアルコアプロセッサの倍程度の性能を持っていると考えることができるだろう。このほかにも、Photaf 3D PanoramaというAndroidのパノラマ写真作成ソフトで同じ処理をさせると、Tegra 2で21秒だったのに対してKal-Elでは10秒で終了するという。

 3Dゲームに関しては、CPUだけでなく、演算エンジンが8から12に増やされたGPUの強化も効いてくるので、さらに性能向上が見られる。NVIDIAのデモであるGlowballで、Tegra 2が13fpsであるのに対してKal-Elは35fps、Lost Planet 2で15fpsが32fps、DaVinchiで13fpsが30fpsと大きく性能が向上していることが見て取れる。

 なお、これらの性能はいずれも1GHzのKal-Elで計測された結果だが、NVIDIAがゲーム開発者など向けに公開している資料によれば、Kal-Elは1.5GHzでも動作することが可能なように設計されているという。つまり、まだまだ性能に余力があるということだ。

 現時点ではKal-Elを搭載した具体的な製品の発表などは行なわれていないが、複数のOEMメーカーで開発が進められている。NVIDIAはKal-Elを搭載した製品は「2011年内に搭載製品が登場する」(レイフィールド氏、COMPUTEX Taipei時点)としており、現時点でもその予定に変更はないという。年内にはよりバッテリが長持ちし、かつ強力なタブレットが市場に登場する可能性があるわけで、ぜひとも日本市場にも搭載製品が投入されることに期待したいところだ。

NVIDIAが公開したCoreMark Benchmarkの結果NVIDIAが公開したPhotaf 3D Panoramaでの処理時間NVIDIAが公開した3Dゲームでのベンチマーク結果

バックナンバー

(2011年 9月 21日)

[Text by 笠原 一輝]