イベントレポート

NVIDIA、次期モバイルSoC「Tegra X1」のベンチマーク結果を公開

~3DMarkのIce Storm Unlimitedで43,000を叩き出すモンスターSoC

NVIDIAが公開したTegra X1。パッケージサイズやダイサイズなどは未公表

 NVIDIAがTegra K1の後継となるSoCのTegra X1(開発コードネーム:Erista、アレスタ)を発表した。Tegra X1の最大の特徴はGPUがNVIDIAの最新世代GPUとなるMaxwell(マックスウェル)アーキテクチャを採用し、256個のCUDA Coreを持つ強力なGPUを内蔵していることだ。さらに、CPUは8コアの64bit ARMプロセッサ(Cortex-A57のクアッドコア+Cortex-A53のクアッドコア、big.LITTLE対応)を持ち、TSMCの20nmプロセスルールで製造される。

 NVIDIAは同時に、報道関係者向けのセッションを開催し、Tegra X1のベンチマークデータを公開した。3Dベンチマークとなる3DMarkのIce Storm Unlimitedにおいて43,000を超えるスコアで、タブレット向けのSoCとしてはぶっちぎりのスコアを叩き出しており、PC用のCPUである第4世代Coreプロセッサ(Haswell)に内蔵されているGPU(メインストリーム向けのGT2)にも匹敵する高いスコアになっている。

Maxwell GPUとCortex-A57/53のオクタコア64bit ARMプロセッサから構成

 Tegra X1は、開発コードネームErista(アリスタ)で知られるSoCで、2014年のInternational CESで発表されたTegra K1(開発コードネーム:Logan、ローガン)の後継となる製品だ。

【表】Tegra X1とTegra K1の比較(NVIDIAの発表より筆者作成)

Tegra X1Tegra K1(64bit)Tegra K1(32bit)
CPUCortex-A57(4コア)+
Cortex-A53(4コア)
Denver(デュアルコア)Cortex-A15(4コア)
GPUアーキテクチャMaxwellKeplerKepler
SM211
CUDAコア256192192

 最大の特徴は、Tegra K1は内蔵されているGPUがKepler(ケプラー)アーキテクチャだったが、Tegra X1はMaxwellと呼ばれるGeForce GTX 980/970などに採用されているNVIDIAの最新アーキテクチャになっていることだ。

 KeplerがGPGPUなどで最大性能を発揮できるように内部アーキテクチャが設計されているのに対して、Maxwellは電力効率を意識した設計が施されており、1つの演算ユニットがKeplerに比べて小さいものの、実行効率を高めた。電力効率がKeplerに比べて倍になっており、どちらかと言えばモバイル向けの設計になっている。なお、NVIDIA Tegraマーケティング部長のマット・ウェブリング氏によればTegra X1の“X”はMa“x”wellから採っており、“M”でないのは「“X”の方が魅力的だから」だそうだ。

 従来のTegra K1では、192個のCUDAコアを内蔵しているSMと呼ばれるGPUのブロック単位が1つという構成になっていた。これに対して、Tegra X1のMaxwellアーキテクチャでは1つのSMには128個のCUDAコアが内蔵する形に変更されており、Tegra X1ではそのSMが2つ内蔵される。つまりCUDAコアは合計で256個内蔵されていることになる。

 CPUに関しては、Tegra K1からの大きな変更点となる。Tegra K1では、32bit版はARMのCortex-A15がクアッドコア(+1個の隠しコア)、64bit版がデュアルコアDenver(NVIDIA自社設計の64bit ARMプロセッサ)という構成になっていた。ちなみに前者を採用しているのがNVIDIA自身が販売する「SHIELD Tablet」で、後者を採用しているのがGoogleが販売する「Nexus 9」となる。

 これに対して、Tegra X1では、ARMがライセンスしている64bit ARMプロセッサデザインとなるCortex-A57を4コア、同じくARMのCortex-A53を4コアを組み合わせたオクタコア構成となる。ただし、A57とA53はbig.LITTLEと呼ばれるARMが提供する省電力技術を利用して、負荷に応じて切り替えられる仕様になっている(もちろん8コア同時に利用することも設定によっては可能になる)。

 すでに自社デザインのDenverがあるにも関わらず、ARMのIPデザインを利用したことについてウェブリング氏は「自社設計のコアは多大なリソースを必要とする。従ってARMからのIPライセンスを含めて最適なものを採用していく」と述べ、ラインナップを増やすためにも自社設計コアにだけこだわらず、その時々に最適なCPUコアを採用していく方針であると説明した。

 なお、詳細は明らかにされなかったが、Denverプロセッサ+Maxwellという組み合わせの製品もリリースされる可能性を示唆した。NVIDIAはEristaの後継製品としてParker(パーカー)と呼ばれる製品を計画しており、この製品が、その組み合わせになる可能性がかなり高いと言えるのではないだろうか。

 このほか、Tegra X1には60fpsの4K動画をデコード可能なH.264/VP9のデコーダ、エンコーダが内蔵されている(エンコードは30fps)。このデコーダ、エンコーダは固定機能で実現されており、SoCの電力をほとんど消費せずに4K動画のエンコード/デコードが可能になるのが特徴となる。なお、HDCP 2.2/HDMI 2.0にも対応しており、4Kディスプレイに出力して4K動画を再生することも可能になる。

Tegra X1の裏面
Tegra X1のダイイメージ。もちろんイメージで実際のダイ写真ではない。中央にCortex-A57(大きいコア)が4つと、Cortex-A53(小さいコア)が4つ、左右にGPUが256コアある
リファレンスの開発ボード。4GBのLPDDR4メモリ、32GBのeMMCが搭載されている

Core i5-4200Uの内蔵GPUに匹敵する3DMarkのスコアを叩き出す

 NVIDIAはこうしたTegra X1の性能データに関しても公開した。NVIDIAのウェブリング氏は「Tegra X1はMaxwell世代のGPUになることで、1.5~2倍程度の性能向上が認められる。さらに電力効率は大きく改善されており、Appleの「A8X」に比べれば1.7倍の電力効率を実現している」と述べ、その高いGPU性能と電力効率をアピールした。

 実際に公開されていたTegra X1搭載の開発ボードを利用したベンチマークでは、GLBench 3.0 Manhattan 1080p OffScreenが4,077(65.8fps)、3DMark Ice Storm Unlimitedが43,388というスコアを叩き出していた。GLBench 3.0に関しては手元に比較できるデータがなかったが、3DMark Ice Storm Unlimitedに関しては、Tegra K1(32bit)を搭載したSHIELD Tabletが30,072、Core i5-4200U(Haswell、GT2内蔵)を搭載したVAIO Duo 13が42,367になっており、Tegra K1と比較して1.3倍、IntelのGT2内蔵のCore i5と比較して上回るという結果を出していることになる。なお、熱設計はタブレットに入るように、ファンレスでヒートシンクを付けるだけという設定で行なわれており、実際にTegra X1がタブレットに入った時にはこの程度の性能が期待できることになる。

 このほかにも、Appleの「iPad Air 2」に搭載されているA8XとのGPUの消費電力の比較データも公開され、両社を同程度の性能に設定した場合、Tegra X1がA8Xに比べて低い消費電力で動作する様子も公開された。ツールで確認された平均消費電力の数字では、A8XのGPUが2.651Wだったのに対して、Tegra X1のGPUが1.498Wと表示されていた。

NVIDIAが公開したTegra X1とTegra K1、Apple A8Xの比較写真
LightMarkなどはNVIDIAのGPUのみで動作し、A8Xでは動作しない
電力効率を比較するグラフ。同じ消費電力でTegra X1がK1やApple A8Xに比べて高い性能を発揮することが分かる。NVIDIAによれば、Apple A8Xに比べて1.7倍の電力効率を実現していると言う
デスクトップ用のGPUでだけサポートされているようなAPIも、モバイルでもサポート
4K動画のデコード(60fps)やエンコード(30fps)に対応している。GPUやGPUを使わず固定機能で実現しているので、低い消費電力で4K動画デコード、エンコードを実現できる
GLBench 3.0 Manhattan 1080p OffScreenのスコアは4,077(65.8fps)
3DMark Ice Storm Unlimitedが43,388
Basemark Xのスコアは44,303
iPad Air 2に搭載されているA8XとのGPUの消費電力比較。A8Xの平均消費電力は2.651Wだが、Tegra X1のそれは1.498Wだった
Tegra X1(右)で4K動画を再生している様子。Tegra X1が、CPUで再生している左に比べてスムーズに再生できる様子が分かる

(笠原 一輝)