イベントレポート
NVIDIA、Tegra 4は競合より高速で低消費電力とアピール
(2013/2/25 08:49)
NVIDIAは1月のInternational CESにおいて、コードネームWayne(ウェイン)の名で開発を続けてきた次世代SoCを「Tegra 4」として発表した。その時点では、ブランド名とアーキテクチャの全体像を明らかにしただけだったが、MWC 2013が現地時間2月25日より開催されるスペインのバルセロナにおいて詳細を公開し、実機によるデモを行なった。
この中でNVIDIAのTegraマーケティング部長マット・ウェブリング氏は、同社が計測したTegra 4のパフォーマンスデータを公開し、Qualcommが1月に発表した「Snapdragon 600」と比較して倍の性能を持つとアピールした。
Cortex-A15への対応と新デザインのGPUを採用しているTegra 4
NVIDIAはCES 2013においてTegra 4の概要を発表した。CPUコアはARMのCortex-A15のIPデザインを採用したクアッドコア、GPUは新しいデザインで72コアを搭載、さらには2011年にNVIDIAが買収したIceraの技術を利用した、ソフトウェアによる定義が可能なモデム「i500」と組み合わせて利用するものだった。また、Computational Photography Architectureという機能を搭載し、写真のHDR(High Dynamic Range)合成がリアルタイム処理で可能になるなど、ハイエンドスマートフォンやタブレット向けの高い処理能力を持っているのが特徴だ。
Tegra 4 | Tegra 4i | Tegra 3 | ||
---|---|---|---|---|
開発コードネーム | Wayne | Grey | Kal-El | |
CPU | アーキテクチャ | Cortex-A15 | Cortex-A9 R4 | Cortex-A9 |
コア数 | 4コア | 4コア | 4コア | |
L1キャッシュ | 32KB(命令)/32KB(データ) | 32KB(命令)/32KB(データ) | 32KB(命令)/32KB(データ) | |
L2キャッシュ | 2MB(共有) | - | 1MB(共有) | |
最高クロック | 1.9GHz | 2.3GHz | 1.7GHz | |
GPU | コア数 | 72 | 60 | 12 |
バーテックスシェーダ | 24(4×6) | 12(4×3) | 4 | |
ピクセルシェーダ | 48(16×4) | 48(24×2) | 8 | |
Chimera Computational Photography Architecture | ○ | ○ | - | |
メモリ | DRAM種類 | DDR3L/LPDDR3 | LPDDR3 | DDR3L/LPDDR2 |
DRAM速度 | 1,866 | 1,866/2,133 | 1,600(DDR3L) / 1,066(LPDDR2) | |
バス幅 | 32bit/デュアルチャネル | 32bit/シングルチャネル | 32bit/シングルチャネル | |
最大容量 | 4GB | 2GB | 2GB | |
ディスプレイ | LCDサポート解像度 | 3,200×2,000ドット | 1,920×1,200ドット | 2,048×1,536ドット |
HDMI出力 | 4K(Ultra HD) | 1080p | 1080p | |
モデム(ベースバンド) | 外付 | 内蔵 | 外付 | |
パッケージ | BGA | 23×23mm | - | 24.5×24.5/14×14mm |
PoP | - | 12×12mm | - | |
FCCSP | 14×14mm | 12×12mm | - | |
プロセスルール | 28nm | 28nm | 40nm |
今回のMWCに先だってNVIDIAはこのTegra 4の詳細を発表した。詳しくは別記事を参照頂きたいが、概要だけ紹介すると、NVIDIAは今回Tegra 3からTegra 4にするにあたり、GPU周りに大きく手を入れている。
従来のTegra 3では12個だったエンジンを、72個に増やしている。エンジンの構造は、PC用GPUがすでにそうであるようにユニファイドシェーダではなく、それぞれバーテックスシェーダ、ピクセルシェーダと機能が分離しており、72個あるコアのうち、バーテックスシェーダに24個、ピクセルシェーダに48個が割り当てられている。ピクセルシェーダは大きく4つのユニットにまとめられており、1つのユニットにつきL1キャッシュ(4KB)と12個の演算器が割り当てられる構造になっている。
より効率の良いデザインを採用したメインストリーム向けTegra 4iのGPU
Tegra 4iのGPUは60個のエンジンが内蔵されており、12個のバーテックスシェーダ、48個のピクセルシェーダに割り当てられている。大きな違いはピクセルシェーダの構成で、Tegra 4が大きく4つのユニットにまとめられているのに対して、Tegra 4iでは2つのユニットに24個の演算器が割り当てられている。L1キャッシュの容量がTegra 4に比べて半分となるので、性能はTegra 4に比べると低下することになるが、その分ダイサイズを抑えられる。また、メモリに関しても32bitシングルチャネルに抑えられている。いずれも価格と消費電力を優先した結果だと考えていいだろう。
また、Tegra 4iの発表時には明らかにされていなかった、Cortex-A9 R4の改良点に関しても明らかになった。NVIDIAによれば、Tegra 4iに採用されているCortex-A9 R4はTLB(Translation Lookaside Buffer)の容量をCortex-A15と同程度に増加させ、履歴バッファの容量を増やすなどして分岐予測の精度を上げ、メモリレイテンシを削減するなどの特徴を備えている。これによりTegra 3のCortex-A9に比べて15~30%の性能向上を期待できる。
なお、NVIDIAが公開した資料によれば、Tegra 4/4iの動画のデコード、エンコード機能は次のようになっている
プロファイル | 解像度/フレームレート | |
---|---|---|
デコード | H.264 HP/MP/BP | 4k×2k 62.5Mbps 24p |
1440p 62.5Mbps 30p | ||
1080p 62.5Mbps 30p | ||
VC1 AP/MP/SP | 1080p 40Mbps 60i/30p | |
MPEG-4 SP | 1080p 10Mbps 30fps | |
WebM VP8 | 1080p 60Mbps 60p | |
1440p 60Mbps 30p | ||
MPEG-2 MP | 1080p 80Mbps 60p/60i | |
エンコード | H.264 HP/MP/BP | 1080p 50Mbps 60p |
1440p 50Mbps 30p | ||
MPEG-4 SP | D1 1M 30p | |
VP8 | 1080p 20Mbps 60p | |
1440p 50Mbps 30fps |
スマートフォンやタブレットで必要とされる動画のデコード機能はもちろん押さえており、H.264で4K×2Kの動画もデコードできるなど、従来製品に比べてより高解像度の動画を再生できるようになるのが大きな強化点と言えるだろう。
Tegra 4の性能はQualcomm Snapdragon 600の倍
NVIDIAはMWCが行なわれている会場近くのホテルで記者説明会を開催し、そこでTegra 4の性能および実機のデモを行なった。
NVIDIAリファレンスデザインのタブレットに搭載されたTegra 4の1.9GHzは、現時点でシングルコア時でもクアッドコア時でも1.9GHzで動作しているという。ウェブリング氏によれば「Tegra 4でもTegra 3の時と同じようなSKU構成になる。現時点では公開できないが、搭載製品が登場する時に明らかになるだろう」とのことで、クロックの違いで複数のSKUのTegra 4が登場することになると説明した。
NVIDIAは今回のMWCで具体的なパフォーマンスデータを公開しており、それによれば、Qualcommが1月のCESで具体的な性能データを公開しているSnapdragon 600(APQ8064T)との比較で、SPECint2000、Sunspider、Web page loadテストのいずれでも2倍を超える性能を実現しているという。QualcommはSnapdragonシリーズのハイエンド製品であるSnapdragon 800シリーズのパフォーマンスデータを公表していないが、NVIDIA側で周波数から計算したデータから想定される性能と比較しても、Tegra 4はSnapdragon 800の性能も上回るのだという。
APQ8064よりも低い消費電力
また、NVIDIAは消費電力のデータに関しても公開した。HTCの「Droid DNA」に搭載されているSnapdragon S4 Pro(APQ8064)と、Tegra 4のリファレンスデザインを比較したデータで、いずれも同じフルHDの液晶ディスプレイを搭載しており、SoC以外の環境はかなり同じに近づけてテストされているという。
APQ8064は、現在Androidスマートフォンのハイエンド製品に搭載されており、例えばNTTドコモから販売されているAndroidスマートフォンのNEXTシリーズ(ソニーのXperia ZやELUGA Xなど)では6製品中3製品でこのAPQ8064が採用されている。従って、ユーザーとしてはそれら現行製品とTegra 4との差が気になるところだろう。
NVIDIAが公開したデータによれば、同じ容量のバッテリを利用して1080pビデオの録画で20%、1080pの再生で24%、Webサイトの閲覧で15%、オーディオの再生で55%、スタンバイで47%ほどTegra 4が長時間駆動することができると確認したという。さらに、NVIDIAがMWCで公開したデモでは、1080pのビデオを再生する場合で、1Wを切る消費電力で再生できる様子を確認することができた(ただし、このデモではモデムが含まれていない)。
ウェブリング氏によれば、Tegra 4を搭載したデバイスは「すでにZTEから発表されており、今後も徐々に発表されることになると思うが、多くは第2四半期になると思う」とのことだが、すでにOEMメーカーの中にはTegra 4の採用を決めているメーカーもあるようで、このMWCの期間中にもTegra 4を搭載したタブレットなどが発表される可能性がありそうだ。