イベントレポート

NVIDIAが発表したTegra X1ってどんなSoC?

（2015/1/6 06:00）

　別記事でも紹介しているように、NVIDIAは開発コードネームErista(アリスタ)で知られる、次世代Tegraを「Tegra X1」として発表し、今年の前半に出荷開始する予定であることを明らかにした。その性能に関しては別記事で触れている通りで、モバイル機器向けの製品でありながらも、PC向けのCPUに内蔵されているGPUに性能で上回るなど、モバイル向けとしては破格な性能を実現しているのが最大の特徴となる。

　本記事ではそうしたTegra X1に関する色々を質問形式で紹介していきたい。具体的にどのようなスペックになのか、前の世代との違いはなんなのか、どのような製品に搭載される可能性があるのかについて紹介していきたい。

Q1:Tegra X1の具体的なスペックを教えて欲しい

　NVIDIAが記者会見後に発表したホワイトペーパーによれば、Tegra X1のスペックは以下のようになっている。

【表】Tegra X1のスペック
		Tegra K1	Tegra X1
CPU	CPU IP	Cortex-A15(32bit版)/Denver(64bit版)	Cortex-A57/A53
	ARM ISA	32bit/64bit	64bit
	コア数	4コア(32bit)/2コア(64bit)	8コア(A57×4+A53×4)
	L2キャッシュ	2MB(32bit)	2MB(A57)+512KB(A53)
GPU	GPUアーキテクチャ	Kepler	Maxwell
	SM	1	2
	CUDAコア	192	256
	演算性能 (FP32、ピーク)	365	512
	演算性能 (FP16、ピーク)	365	1,024
	テクスチャユニット	8	16
	テクスチャフィルレート	7.6GT/sec	16GT/sec
	メモリクロック	930MHz	1.6GHz
	メモリ帯域幅	14.9GB/sec	25.6GB/sec
	対応メモリ	LPDDR3/DDR3	LPDDR4/LPDDR3/DDR3
	ROP	4	16
	L2キャッシュ	128KB	256KB
	Z-cull	256ピクセル/sec	256ピクセル/sec
	Raster	4ピクセル/クロック	16ピクセル/クロック
	Texture	8ビルニアフィルター/クロック	16ビルニアフィルター/クロック
	ZROP	64サンプル/クロック	128サンプル/クロック
動画デコード/エンコード	4K(VP9/H.265)HWデコード	－	60fps
動画デコード/エンコード	4K(VP9/H.265)HWエンコード	－	30fps(H.265)/60fps(VP9)
その他	イメージプロセッサ	2(1.2Gテクセル/sec)	2ISP(1.3Gテクセル/sec)
その他	製造プロセスルール	28nm(TSMC HPM)	20nm(TSMC 20SoC)

Tegra X1のダイ写真

Tegra X1のパッケージ

Tegra X1のリファレンス開発ボード、LPDDR4が搭載されている

　現行製品となるTegra K1との最大の違いはGPUである。Tegra K1世代ではKepler(ケプラー)アーキテクチャが採用されていたが、Tegra X1ではMaxwell(マックスウェル)というKeplerの次世代アーキテクチャが採用されているのだ。KeplerとMaxwellの最大の違いは、電力効率にある。KeplerではSMと呼ばれるGPUの内部構造の1単位の中に192個のCUDAコアと呼ばれる演算器が格納されている仕組みになっていた。これに対してMaxwellではSMの中には128個とCUDAコアの数は減っているのだが、その分命令の実行効率が大幅に改善されている。具体的には同じ性能を実現するのに必要な消費電力は半分と電力効率が2倍になっているのだ。言い換えると、同じ電力なら性能を2倍に、電力を半分にすれば同じ性能を実現することが可能になる。これがTegraのような少ない消費電力で動かす必要があるSoCにMaxwellを採用するメリットになる。

　また、システムメモリとして新たにLPDDR4に対応したことも見逃せないメリットとなる。これにより、少ない電力のままメモリ帯域を引き上げることが可能になる。実際、Tegra X1での最大メモリ帯域は25.6GB/secと、Tegra K1の14.9GB/secに比べて大きく引き上げられている。このこともTegra X1のメリットと言えるだろう。

Q2:GeForce GTX 980もMaxwellベースだが、TDP(熱設計消費電力)が165Wになっており、非常に大きなヒートシンクやファンも付いている。それがとても数WレベルのSoCに入るとは思えないけどうどういうこと?

　NVIDIAのGPUアーキテクチャはスケーラブルな設計が施されている。GPUのデザインは、最大単位がSMというモジュールになっており、そのモジュールの数を増減させることでGPUのダイサイズを小さくしたり、大きくしたりすることが可能になっている。このことはKeplerもそうで、例えばTegra K1はSMが1個だが、HPC向けのTeslaなどではSMが16個になっており、性能はそこそこのTegra K1からスーパーコンピュータにも使われるTeslaのどちらにも対応できるようになっていた。

　Maxwell世代に関してもそれは同様で、GeForce GTX 980ではSMが16個ある構成になっており、128×16=2,048 CUDAコアとなるが、Tegra X1のGPUはSMが2個ある構成で、128×2=256 CUDAコアという構成になっており、かつ製造プロセスルールもGeForce GTX 980がTSMCの28nm(HPM)であるのに対して、Tegra X1は1世代進んだTSMCの20nm(20SoC)へと微細化されている。こうした理由により前者が165WというTDP(ピーク時の電力ではないが、ある程度の指標になる)であるのに対して、Tegra X1は数Wという非常に少ない電力で動くことが可能になっているのだ。

GeForce GTX 980のダイブロックダイアグラム。SM(128個のCUDAコアからなる集合体)が16個ある構造になっている

Tegra X1のGPUブロックダイアグラム。SMが2個しかないことが分かる

Q3:Tegra K1の64bit版はNVIDIA自社設計のDenverなのに、なぜTegra X1はARMの汎用デザインIPを利用しているのか?

　Tegra X1のCPUは、ARM社がライセンスしている汎用の64bit ARMプロセッサのIPデザインとなるCortex-A57が4コア、Cortex-A53が4コアで、合計8コアのいわゆるオクタコアプロセッサとなっている。

　ARMがSoCベンダーに対して付与するライセンスには2つの形態があり、１つはIPライセンスと呼ばれるARM社が自社で設計したCPUのデザインをSoCベンダーに対して提供する形。もう1つがアーキテクチャライセンスと呼ばれるCPUの命令セットを利用する権利をSoCベンダに与えて、CPUの設計自体はSoCベンダーが行なう形だ。

　現在64bitのARMプロセッサでは、ほとんどのベンダーがIPライセンスの形を採っており、ARMの64bit ARMプロセッサのIPデザインとなるCortex-A57(ハイエンド向け)、Cortex-A53(ローエンド向け)を搭載することが一般的だ。

　しかし、NVIDIAは64bit ARMプロセッサではいち早くアーキテクチャライセンスを取得し、自社設計の64bit ARMプロセッサとなるDenver(デンバー、開発コードネーム)を、Tegra K1の64bit版に採用している。このTegra K1の64bit版はGoogleのタブレットである「Nexus 9」に採用されて注目を集めており、CPUの処理速度もARMのIPデザインに比べて高くなっている。

　普通に考えれば、このDenverを次世代製品にも使うと考えるのが常道だが、今回NVIDIAがTegra X1で採用したのは、前述の通りCortex-A57+Cortex-A53の組み合わせになっている。NVIDIA Tegraマーケティング部長マット・ウェブリング氏によれば「我々はチックタック方式のデザインを採用しており、今回はいち早く市場に投入することを最優先にしてARMのIPデザインを採用した」と、自社デザインだけでなくARMデザインのCPUを交互に投入することでラインナップを増やす計画だとした。

　確かに自社CPUデザインは設計に時間がかかり、それだけリソースを投入しなければならない。結果的に製品がリリースされるまで時間がかかってしまうことが多い(現に64bit版のTegra K1は2014年の第4四半期にようやく出荷できた)。このため、既に枯れた技術と言ってもよいARMのCPUを搭載した製品を投入し、その後に自社デザインのCPUを搭載した製品を投入するという二段構えの戦略だと考えることができるだろう。

Tegra X1のブロックダイアグラム。CPUはCortex-A57のクアッドコアと、Cortex-A53のクアッドコアからなるオクタコア構成

Q4:これからもうDenverコアの製品は登場しないってこと?

　NVIDIAのウェブリング氏によれば「もちろんDenverのような自社設計のCPUデザインを採用した製品もやっている。ただし現時点では将来の詳しいロードマップについてはお話しすることができない」とのことで、Denverのような自社設計のARM CPUを搭載したSoCは現在もロードマップにあり、今後それが登場する可能性が高いことを示唆している。

　今回のCESでの記者会見ではそうした将来の話は語られなかったが、NVIDIAは今回発表したEristaことTegra X1の後継製品として開発コードネーム「Parker」(パーカー)があることは、NVIDIAが日本で行なった自動車向けソリューションの説明会の中で明らかにされている(僚誌Car Watchの記事を参照)。Parkerは、元々はTegra K1(開発コードネーム:Logan)の後継とされていた製品だが、2014年の3月に行なわれたGTCでは同社のロードマップからその名前が消えており、代わりにErista(今回発表されたTegra X1)が登場した背景があった。つまり、ParkerはDenver CPU+Maxwellという構成だった可能性が高いが、市場でのニーズなどを考え、ARM IPのCPU製品すなわちEristaが、LoganとParkerの間に挟まれたと考えられるだろう。

Q5:Denverを採用した64bitTegra K1と、Tegra X1とどっちがハイエンドなの?

　今回MaxwellアーキテクチャのGPUを採用したが、CPUはCortex-A57/53になっているTegra X1が登場したことで、CPUはDenverだがGPUはKepler世代というTegra K1の64bit版とどちらがハイエンドな製品なのか、位置付けが曖昧になっている。この点についてNVIDIAのウェブリング氏は「顧客のニーズによる。GPUが必要な顧客であればTegra X1だし、CPUの方を重視したい顧客であればTegra K1の64bit版だ」と、両方が併存していく形になるとの認識を示した。

Q6:Tegra X1はなぜTegra M1ではないの?

　当然の疑問だが、Tegra K1の“K”は“K”eplerから来ていると考えられていたので、それを蹈襲するのであればTegra M1と“M”axwellの“M”から採ると考えるのが自然だろう。にも関わらず、今回はMa“x”wellの真ん中の“X”を採っており、やや無理がある印象は否めない。この疑問対してNVIDIAのウェブリング氏は「MよりもXの方が魅力的だから」と答えており、特に深い理由はないようだ。

Q7:Tegra X1、スマートフォンに乗る可能性はある?モデム統合型製品が出る可能性はある?

　Tegra X1はモデムやWi-Fiコントローラなどを内蔵していない単体SoCと呼ばれる形状になっており、タブレットであろうが、スマートフォンであろうが、必要に応じてWi-Fi/Bluetoothのチップやモデムチップが別途必要になる。もっとも現時点で、モデム統合型のチップをまともに提供できているのはQualcommだけで、NVIDIAもTegra 4世代(Tegra K1の前世代、Tegra X1からは2世代前の製品)で、同社の子会社であるIceraのモデム「i500」を統合した「Tegra 4i」を発表したが、欧州の1社に採用された程度で大きな成功は収められず、現時点に至るまでNVIDIAはその後継製品を発表していない。

　ただ、米国で販売されている同社の自社ブランドタブレット「SHIELD Tablet」のLTE版、さらにはMicrosoftが米国で販売しているSurface 2のLTE版に関しては、Iceraのモデムが採用されており、徐々に採用例が増えている。今後タブレットにTegra X1が採用されるようになれば、そうした例は増えていくだろう。

　しかしながらスマートフォンに関しては、NVIDIA自身もここ最近は積極的に語っていない。2014年3月のGTCで併催されたアナリスト向けの説明会で、NVIDIAのジェン・スン・フアンCEO自身が「低価格のスマートフォンはNVIDIAが力を入れる領域ではない」と発言している。ハイエンドの製品に関しては登場する可能性があるが、、ローエンドやミドルレンジのスマートフォンで出荷数を伸ばす製品が今後リリースされる可能性は低いのではないだろうか。

Q8:Tegra X1はどのような製品に採用されるの? いつ出るの?

　NVIDIAのフアンCEOは記者会見で、リリース時期や、どのような製品に採用されるかは明らかにしなかった。しかし、NVIDIAが発表会後に配布したプレスリリースによれば、Tegra X1の出荷時期は2015年の前半とされており、順当に行けば6月に行なわれるCOMPUTEX TAIPEIのタイミングぐらいには、なんらかの搭載製品がリリースされてもおかしくなさそうだ。

　真っ先に採用が予想されるのはNVIDIA自社ブランドの「SHIELD Tablet」の後継となる製品だ。現在のSHIELD Tabletは32bit版のTegra K1を採用しており、それが次世代製品ではTegra X1になっても何の不思議もないだろう。このほか、現在64bit版のTegra K1が採用されているNexus 9に関しても、後継製品があるとすればそれがTegra X1になっても不思議はない。今後タブレットでは64bit版Android 5.0が急速に進むと考えられており、そうした製品でもTegra X1が採用される可能もある。特にGPU性能の高さは、OEMメーカーがTegra X1を選択する大きな理由になり得る。

Q9:Tegra X1の4Kサポートってどういうこと?

　Tegra X1には、4K解像度の動画をエンコード、デコードする固定機能のハードウェアエンコーダ/デコーダが内蔵されている。ハードウェアエンコーダ/デコーダとは特定の動画形式に特化して、CPU/GPUを利用しなくてもエンコード、デコードを可能にするエンジンのことで、PC向けのCPU/GPUで言うなら、IntelのQSV(Quick Sync Video)やNVIDIAのNVencがハードウェアエンコーダで、IntelのClear Video、NVIDIAのPure Videoがハードウェアデコーダとなる。いずれもCPUやGPUを利用せずにエンコード、デコードが可能になるため、少ない消費電力で処理することができるのが特徴となる。

　Tegra X1に内蔵されているハードウェアデコーダは、H.265/VP9という4Kの動画で一般的に採用される見込みのコーデックに対応しており、将来的にH.265やVP9を利用して圧縮されている60fpsの4K動画配信などを再生する際にも軽々と再生することが可能になり、かつ消費電力は最小限で済ませることができる。Tegra X1には同じようにエンコーダエンジンも内蔵しており、4KのH.265動画にエンコードすることなどが可能だが、エンコードに関しては30fpsまでとなる。

　また、ディスプレイエンジンは2出力に対応しており、HDCP 2.2、HDMI 2.0に対応しているので、端末を4Kディスプレイに接続して4K動画を再生という用途にも対応できる。

Q10:なぜNVIDIAはTegra X1で自動車推しなの?

　NVIDIAは近年自動車向けのソリューションを充実させており、Tegraのビジネスにおいて自動車向けを大きな柱に据えている。自動車向けの半導体というと、IT技術との親和性が高いカーナビゲーションやインフォテインメントシステムをイメージする人が多いと思う。だが、現在自動車向けの半導体で各社が力を入れているのはADAS(先進運転支援システム)と呼ばれる、車が自動で危険を回避してブレーキを掛けたり、自動運転そのものを実現する技術だ。これまでのADASはどちらかと言えばアナログ的に実現されてきたが、本格的な自動運転時代に向けてデジタル技術を利用した処理にティア1と呼ばれる部品メーカー(日本で言えばデンソーなど)や自動車メーカー自身が積極的に取り組んでいる。

　NVIDIAが今回のCESで発表した「DRIVE PX」はまさにそうしたADAS向けに、GPUをプログラマブルに使うCUDAを利用してプログラミングして、物体認識や危険回避などを行なう仕組みを実装するプラットフォームになる。近い将来にはそうしたGPUを利用したADASシステムが自動車メーカーなどから登場することになるだろう。

NVIDIAの記者会見でNVIDIA DRIVE PXのボードを公開するフアンCEO。Tegra X1が2個搭載されており、ADASなどの実現に利用できる開発ボードとなる

（笠原一輝）