イベントレポート

NVIDIA、Tegra 4は競合より高速で低消費電力とアピール

（2013/2/25 08:49）

　NVIDIAは1月のInternational CESにおいて、コードネームWayne(ウェイン)の名で開発を続けてきた次世代SoCを「Tegra 4」として発表した。その時点では、ブランド名とアーキテクチャの全体像を明らかにしただけだったが、MWC 2013が現地時間2月25日より開催されるスペインのバルセロナにおいて詳細を公開し、実機によるデモを行なった。

　この中でNVIDIAのTegraマーケティング部長マット・ウェブリング氏は、同社が計測したTegra 4のパフォーマンスデータを公開し、Qualcommが1月に発表した「Snapdragon 600」と比較して倍の性能を持つとアピールした。

Cortex-A15への対応と新デザインのGPUを採用しているTegra 4

　NVIDIAはCES 2013においてTegra 4の概要を発表した。CPUコアはARMのCortex-A15のIPデザインを採用したクアッドコア、GPUは新しいデザインで72コアを搭載、さらには2011年にNVIDIAが買収したIceraの技術を利用した、ソフトウェアによる定義が可能なモデム「i500」と組み合わせて利用するものだった。また、Computational Photography Architectureという機能を搭載し、写真のHDR(High Dynamic Range)合成がリアルタイム処理で可能になるなど、ハイエンドスマートフォンやタブレット向けの高い処理能力を持っているのが特徴だ。

【表1】 Tegra 4、Tegra 4i、Tegra 3のスペック比較。色つきの部分が今回のアップデート分(NVIDIAの公表した資料より筆者作成)
		Tegra 4	Tegra 4i	Tegra 3
開発コードネーム		Wayne	Grey	Kal-El
CPU	アーキテクチャ	Cortex-A15	Cortex-A9 R4	Cortex-A9
	コア数	4コア	4コア	4コア
	L1キャッシュ	32KB(命令)/32KB(データ)	32KB(命令)/32KB(データ)	32KB(命令)/32KB(データ)
	L2キャッシュ	2MB(共有)	-	1MB(共有)
	最高クロック	1.9GHz	2.3GHz	1.7GHz
GPU	コア数	72	60	12
	バーテックスシェーダ	24(4×6)	12(4×3)	4
	ピクセルシェーダ	48(16×4)	48(24×2)	8
	Chimera Computational Photography Architecture	○	○	-
メモリ	DRAM種類	DDR3L/LPDDR3	LPDDR3	DDR3L/LPDDR2
	DRAM速度	1,866	1,866/2,133	1,600(DDR3L) / 1,066(LPDDR2)
	バス幅	32bit/デュアルチャネル	32bit/シングルチャネル	32bit/シングルチャネル
	最大容量	4GB	2GB	2GB
ディスプレイ	LCDサポート解像度	3,200×2,000ドット	1,920×1,200ドット	2,048×1,536ドット
ディスプレイ	HDMI出力	4K(Ultra HD)	1080p	1080p
モデム(ベースバンド)		外付	内蔵	外付
パッケージ	BGA	23×23mm	-	24.5×24.5/14×14mm
	PoP	-	12×12mm	-
	FCCSP	14×14mm	12×12mm	-
プロセスルール		28nm	28nm	40nm

Tegra 4のGPU内部構造

　今回のMWCに先だってNVIDIAはこのTegra 4の詳細を発表した。詳しくは別記事を参照頂きたいが、概要だけ紹介すると、NVIDIAは今回Tegra 3からTegra 4にするにあたり、GPU周りに大きく手を入れている。

　従来のTegra 3では12個だったエンジンを、72個に増やしている。エンジンの構造は、PC用GPUがすでにそうであるようにユニファイドシェーダではなく、それぞれバーテックスシェーダ、ピクセルシェーダと機能が分離しており、72個あるコアのうち、バーテックスシェーダに24個、ピクセルシェーダに48個が割り当てられている。ピクセルシェーダは大きく4つのユニットにまとめられており、1つのユニットにつきL1キャッシュ(4KB)と12個の演算器が割り当てられる構造になっている。

より効率の良いデザインを採用したメインストリーム向けTegra 4iのGPU

Tegra 4iのGPU内部構造

　Tegra 4iのGPUは60個のエンジンが内蔵されており、12個のバーテックスシェーダ、48個のピクセルシェーダに割り当てられている。大きな違いはピクセルシェーダの構成で、Tegra 4が大きく4つのユニットにまとめられているのに対して、Tegra 4iでは2つのユニットに24個の演算器が割り当てられている。L1キャッシュの容量がTegra 4に比べて半分となるので、性能はTegra 4に比べると低下することになるが、その分ダイサイズを抑えられる。また、メモリに関しても32bitシングルチャネルに抑えられている。いずれも価格と消費電力を優先した結果だと考えていいだろう。

　また、Tegra 4iの発表時には明らかにされていなかった、Cortex-A9 R4の改良点に関しても明らかになった。NVIDIAによれば、Tegra 4iに採用されているCortex-A9 R4はTLB(Translation Lookaside Buffer)の容量をCortex-A15と同程度に増加させ、履歴バッファの容量を増やすなどして分岐予測の精度を上げ、メモリレイテンシを削減するなどの特徴を備えている。これによりTegra 3のCortex-A9に比べて15～30%の性能向上を期待できる。

　なお、NVIDIAが公開した資料によれば、Tegra 4/4iの動画のデコード、エンコード機能は次のようになっている

【表2】Tegra 4/4iの動画のデコード、エンコード機能(NVIDIAの公表した資料より筆者作成)
	プロファイル	解像度/フレームレート
デコード	H.264 HP/MP/BP	4k×2k 62.5Mbps 24p
		1440p 62.5Mbps 30p
		1080p 62.5Mbps 30p
	VC1 AP/MP/SP	1080p 40Mbps 60i/30p
	MPEG-4 SP	1080p 10Mbps 30fps
	WebM VP8	1080p 60Mbps 60p
	WebM VP8	1440p 60Mbps 30p
	MPEG-2 MP	1080p 80Mbps 60p/60i
エンコード	H.264 HP/MP/BP	1080p 50Mbps 60p
	H.264 HP/MP/BP	1440p 50Mbps 30p
	MPEG-4 SP	D1 1M 30p
	VP8	1080p 20Mbps 60p
	VP8	1440p 50Mbps 30fps

　スマートフォンやタブレットで必要とされる動画のデコード機能はもちろん押さえており、H.264で4K×2Kの動画もデコードできるなど、従来製品に比べてより高解像度の動画を再生できるようになるのが大きな強化点と言えるだろう。

Tegra 4の性能はQualcomm Snapdragon 600の倍

　NVIDIAはMWCが行なわれている会場近くのホテルで記者説明会を開催し、そこでTegra 4の性能および実機のデモを行なった。

　NVIDIAリファレンスデザインのタブレットに搭載されたTegra 4の1.9GHzは、現時点でシングルコア時でもクアッドコア時でも1.9GHzで動作しているという。ウェブリング氏によれば「Tegra 4でもTegra 3の時と同じようなSKU構成になる。現時点では公開できないが、搭載製品が登場する時に明らかになるだろう」とのことで、クロックの違いで複数のSKUのTegra 4が登場することになると説明した。

　NVIDIAは今回のMWCで具体的なパフォーマンスデータを公開しており、それによれば、Qualcommが1月のCESで具体的な性能データを公開しているSnapdragon 600(APQ8064T)との比較で、SPECint2000、Sunspider、Web page loadテストのいずれでも2倍を超える性能を実現しているという。QualcommはSnapdragonシリーズのハイエンド製品であるSnapdragon 800シリーズのパフォーマンスデータを公表していないが、NVIDIA側で周波数から計算したデータから想定される性能と比較しても、Tegra 4はSnapdragon 800の性能も上回るのだという。

NVIDIAが公開したベンチマークデータ。Qualcommが公開しているSnapdragon 600(APQ8064T)との比較データ。いずれのベンチマークでもTegra 4が2倍近く速いという結果になっている

NVIDIAが公開したTegra 4を搭載した試作タブレット。シングルコア時でもクアッドコア時でも1.9GHzで動作している

Quadrantの結果。なんと17,000を超えるスコアを叩き出している、GALAXY Nexusが2,000を少し越える程度なので、8倍以上も高速という結果になる

GLBenchmarkの結果、Egypt HDで6,468という結果

APQ8064よりも低い消費電力

　また、NVIDIAは消費電力のデータに関しても公開した。HTCの「Droid DNA」に搭載されているSnapdragon S4 Pro(APQ8064)と、Tegra 4のリファレンスデザインを比較したデータで、いずれも同じフルHDの液晶ディスプレイを搭載しており、SoC以外の環境はかなり同じに近づけてテストされているという。

　APQ8064は、現在Androidスマートフォンのハイエンド製品に搭載されており、例えばNTTドコモから販売されているAndroidスマートフォンのNEXTシリーズ(ソニーのXperia ZやELUGA Xなど)では6製品中3製品でこのAPQ8064が採用されている。従って、ユーザーとしてはそれら現行製品とTegra 4との差が気になるところだろう。

　NVIDIAが公開したデータによれば、同じ容量のバッテリを利用して1080pビデオの録画で20%、1080pの再生で24%、Webサイトの閲覧で15%、オーディオの再生で55%、スタンバイで47%ほどTegra 4が長時間駆動することができると確認したという。さらに、NVIDIAがMWCで公開したデモでは、1080pのビデオを再生する場合で、1Wを切る消費電力で再生できる様子を確認することができた(ただし、このデモではモデムが含まれていない)。

　ウェブリング氏によれば、Tegra 4を搭載したデバイスは「すでにZTEから発表されており、今後も徐々に発表されることになると思うが、多くは第2四半期になると思う」とのことだが、すでにOEMメーカーの中にはTegra 4の採用を決めているメーカーもあるようで、このMWCの期間中にもTegra 4を搭載したタブレットなどが発表される可能性がありそうだ。

NVIDIAが公開したTegra 4とSnapdragon S4 Pro(APQ8064)を比較したデータ。同じバッテリーならTegra 4の方が長時間駆動できることになる

1080pビデオの再生時の消費電力。モデムは入っていないが、1080p動画の再生が1W以下の0.87Wで出来ていることがわかる

先日発表されたTegra 4iのリファレンスデザイン「Phoenix」。5型の1080pパネルを採用していながら厚さ8mmというスマートフォン

GALAXY S III(NTTドコモのSC-06D)と比較しても遜色のない厚さ、大きさ。これが今後はメインストリーム向け製品のリファレンスデザインとなる

Tegra 4iのパッケージ。上はメモリがPoP(Package On Package)で搭載されたバージョンで、下はメモリを外したPoPのTegra 4i

スマートフォン向けリファレンスデザインボード。右側はTegra 4iで左側がTegra 4。Tegra 4にはモデムがないのが特徴。なお、Tegra 4iはPoPではなく、FCCSP版で搭載されているので、PoPを使って最適化すればさらに小さな基板にすることができそうだ

（笠原一輝）