イベントレポート

HuaweiのAI内蔵CPU「Kirin 970」はスマホの進むべき道を示す重要な製品だ

笠原一輝

2017年9月4日 06:00

Kirin 970を公開するリチャード・ユー氏

　Huawei Technologiesは、9月1日(独時間)よりドイツ連邦共和国ベルリン市において開催されている世界最大の家電ショーIFAで基調講演を開催。コンシューマビジネス事業本部CEOのリチャード・ユー氏が登壇し、スマートフォンでのAI活用に対応したSoCとなる「Kirin 970」を発表した。

エッジAIに対応したSoCがこれからのスマートフォンには必要

　通常のHuaweiの記者会見は、新製品の発表会であることがほとんどなので、新製品の特徴などを説明していくという内容が多い。しかし、今回の基調講演は、技術説明会のような内容に終始し、IntelやNVIDIAと言った半導体メーカーによる講演や記者会見といった趣で進められた。

　ユー氏は「今日はAIプロセッサを説明する。というのも、これからの10年間でAIはスマートフォンに欠かせないものになると考えているからだ。スマートフォンはスマートだが、まだ十分スマートではない」と述べ、AIをスマートフォンに適用していくことでもっと便利になると説明。その上で、モバイル環境におけるAIは、デバイス上のAIとクラウド上のAIを足したソリューションになると説明し、両方をしっかり実現していくことが重要だと述べた。

AIにはデバイス側とクラウド側がある

デバイス上のAI(エッジAI)とクラウドAIを合わせてモバイルAIに

　現在一般的にAIといわれているソリューションは、おもにクラウドアプリケーションとして提供されることが多い。音声認識はその端的な例で、SiriやCortanaといった音声認識のアプリケーションは、端末でキャプチャした音声をクラウドにアップロードし、クラウドサーバー側で処理をしてその結果を返すようになっている。

　しかし、AIを利用した自動運転自動車で、クラウド側で画像処理を行なおうとすれば、画像をアップロードしている間に車は数十mは進んでしまうので、事故につながりかねない。そうした用途では、エッジ側(Huaweiの言うところのデバイス上)でAI処理を行なう、エッジAIと呼ばれるソリューションが注目を集めている。

エッジAIの実現には4つの課題が

エッジAIを搭載すると3つのメリットがある

　ユー氏は、そうしたエッジAIを実現していくには、知覚(Perception)、認識(cognition)、セキュリティ(Security)、消費電力(Power)という4つの課題があると述べ、現在のスマートフォンに搭載されているSoCでは、いずれもそれらの課題を解決することが難しいため、より高速で低消費電力でセキュアな新しいSoCを設計して投入することにしたと説明した。

CPUは20%の電力効率改善、GPUは20%の性能向上と50%の電力効率改善

　ユー氏がそのAIに最適化された新SoCとして紹介したのがKirin 970だ。KirinブランドSoCは、Huawei子会社のHisilicon Technologiesで設計され、ファウンダリで製造されるオリジナルのSoCとなる。

　従来はローエンドな製品が多かったが、ここ近年の製品はハイエンド相当の製品が増え、たとえば去年発表されたKirin 960は、CPUはCortex-A73(クアッド)＋Cortex-A53(クアッド)、GPUはMali-G71と強力なスペックになっている。

Kirin 970のアウトライン

Kirin 970のパッケージ

10nmプロセスルールを採用している

従来製品との比較

　Kirin 970はそのKirin 960をベースに強化されている。CPUはCortex-A73(クアッド)＋Cortex-A53(クアッド)でA73が最高2.4GHz、A53が最高1.8GHzと基本的には変わっていないが、製造プロセスルールはTSMCの10nmに進化(Kirin 960は16nmプロセスルール)し、電力効率向上を期待できるとユー氏は説明する。

　CPUの電力効率は20%向上。これは10nmに進化した効果だ。CPU性能そのものは大きくは変わらないものの、電力効率が改善している。微細化したことで、20%の微細化効果があり、ダイサイズは40%小さくなった。トランジスタ数は16nmのKirin 960の40億個から37.5%増えて55億個になっている。

TSMCの10nmプロセスルールを採用

CPU性能

　GPUはKirin 960のMali-G71からMali-G72に強化されている。ARMのMali-G72は今年のCOMPUTEX TAIPEIで発表された新しいGPUで、他社に先駆けていち早く採用した。Mali-G72基本的なアーキテクチャはG71と大きな違いはないが、内部の最適化により、前世代に比較して20%性能向上し、電力効率では50%の向上を実現している。

GPU性能

NPUにより圧倒的低消費電力でAIを実現

　そしてユー氏がもっとも時間を割いて説明したのが、同社がNPU(Neural network Processing Unit)と呼んでいる、AI専用のアクセラレータだ。

　ユー氏は「CPUのダイエリアの半分相当のNPUを実装することで、CPUに比べて25倍の性能で、50倍の電力効率でAIの処理ができる。200枚の写真を認識する性能は、CPUに比べて20倍以上で実行できている」と述べ、実際にCPUとNPUで写真の認識を処理する様子をビデオで公開した。

NPUの性能

CPUに比べて写真の認識が20倍高速になっている

性能は25倍だが、ダイサイズはCPU部分の半分に過ぎない

非常に低い消費電力で実行できる

競合他社の製品との比較

　このNPUは、「AI処理を専用に行なうプロセッサ」とだけ表現し、具体的なアーキテクチャに関しては説明しなかったが、写真の認識のデモなどがベンチマークに利用されていることから、NPUは、ディープラーニングの推論を専用に行なうアクセラレータであると考えるのが妥当だろう。

　AIを実装するに使われている計算手法であるディープラーニングは、ざっくり学習と推論という2つの機能に分けられる。学習というのはDNN(Deep Neural Network)と呼ばれる人間の脳を模した多階層のニューラルネットワークにデータを読み込ませてAIを鍛える作業だが、これには強力な汎用プロセッサが必要になる。そのため、NVIDIAのTeslaのようなGPUを複数台接続して演算するのが一般的だ。

　それに対して推論というのは、その学習によって鍛えられたDNNを利用して、画像認識や音声認識などを行なう作業のことで、猫の画像が来たら猫、犬の画像が来たら犬と判別する作業になる。

　近年では、エッジ向けSoCにアクセラレータを搭載するのが一般的になっている。たとえば、NVIDIAは5月のGTCで発表した次世代車載向けSoCとなる「Xavier」(エグゼビア)にDLA(Deep Learning Accelerator)を搭載しており、推論を専用に行なうアクセラレータを搭載している(NVIDIA、70億トランジスタで消費電力が20Wの自動運転車向けSoC「Xavier」参照)。

　推論のアクセラレータを搭載するメリットは、汎用プロセッサであるCPU/GPUに比べて圧倒的に低い消費電力で高い性能で推論を行なえることだ。アクセラレータではあらかじめ決まった処理しかできないが、画像認識などの決まった処理では圧倒的に高性能で、低消費電力で処理ができる。このため、自動運転向けのSoCなどでこうした推論アクセラレータが搭載され始めているが、そのトレンドがスマートフォン向けにもやってきた。

NPUが実現するAIの機能の例

想定されるアプリケーション

　NPUはタスクスケジューリングやメモリアロケーション、UIのグラフィックス処理、画像認識など、幅広くAI一般に柔軟に利用できるよう設計されている。たとえばAIが端末全体の動きを見ながら必要のないタスクをオフにしたり、メモリの割り当てを調節したり、画像認識はもちろんのこと、AIがカメラアプリを操作して、最適なホワイトバランスや露出の設定などを行ないながら撮影できる。

ソフトウェアのモデル

Huaweiからソフトウェア開発キットなどが提供される

　これらのAIアプリは自社ソフトウェアに実装するだけでなく、サードパーティにもSDKを提供する。現在ディープラーニングを応用したソフトウェアの開発で一般的に利用されているTensorflow/Tensorflow Lite、Caffe/Caffe2などのディープラーニングフレームワークを利用して、ソフトウェアの開発ができる。

モデムは下り1.2GbpsとLTEのDSDSに対応

　CPU/GPU、NPUだけでなく、ISP(Image Signal Processor)とモデムも大きく強化されている。

現在のスマートフォンのカメラが抱えている課題

Kirin 970のISPの新機能

　ISPはスマートフォンのCMOSセンサーから入ってきたRAWデータを処理するためのプロセッサで、JPEGに圧縮したり、カメラソフトの設定によりホワイトバランスや露出、ノイズリダクションなどの後処理も担当している。

　Kirin 970には改良されたISPが2つ搭載されている。従来製品に比べて25%スループットが向上し、15%応答時間が向上。フォーカスも速くなっているほか、モーションシューティングも4レベルとなり、動きの速い被写体の画像も撮影しやすくなっている。また、ノイズリダクションが強化されているので、微光な環境でも撮影ができる。

　じっさいにKirin 970とSamsung Galaxy S8を利用して撮影した動きの速い画像を見せ、Kirin 970の端末では動きが速い被写体でもきちんとした画像を撮影でき、夜景などでも大きな効果があるとした。

Kirin 970とSamsung Galaxy S8との比較

微光環境での撮影

AIと組み合わせることでさらにスマートフォンのカメラはよくなる

AIが環境や被写体を判別して最良の設定を選ぶ

　また、複眼カメラに、新しいISP、さらにはNPUにより実現されるAIを加えることで、画質も改善される。具体的には物体認識(犬なのか、猫なのか、人間なのかなど)と、シーン認識(太陽光の下なのか、夜間なのか)をAIに行なわせ、カメラの設定を自動的に最適なものにしたうえで、ISPの機能(ノイズリダクションなど)を活用し、これまでよりも美しい写真を撮影できるようにする。

　ネットワーク周りも強化されている。Kirin 970に内蔵されているのは、LTE-Advancedで規定されているカテゴリ18(Cat.18)のLTEモデムで、4x4 MIMO、256QAMに対応し、3CC CAの組み合わせで下り最大1.2Gbpsを実現できる。

　Cat.18のモデムは、2月末にスペインで行なわれたMWCで、Qualcommが単体モデムとして発表済みだが、SoCに統合された製品としては「世界発だ」とユー氏は誇ってみせた。もっとも、このCat.18は、通信キャリア側が5つの帯域を持っていなければ実現できないので、世界的に見てこれを実現できるキャリアはかなり少ないことを考えると、現実的には大きな意味はないが、技術的にはブレークスルーとは言えるだろう。

ネットワーク環境における課題

Kirin 970はCat.18のLTEモデムを搭載

4x4 MIMO、256QAM、3CC CAで1.2Gbpsを実現

　Kirin 970のモデムはLTEとVoLTEを有効にしたままデュアルSIM、デュアルスタンバイ(DSDS)が実現可能になっている。これにより、W-CDMAには対応していないau/KDDIのLTE SIMとNTTドコモのSIMを利用してDSDSが実現できる。任意のキャリアに対応できるかどうかは端末の実装次第だが、そういう可能性がある。

LTE/VoLTEに対応したDSDSを実現

　同社は、中国のハイスピードレール、ドイツのICE、日本の新幹線などでテストを行ない、高速な鉄道に乗っている時でもハンドオーバーや電波検索を高速にできるようにしている。

高速鉄道のハンドオーバーなどを改善

10月16日に発表されるHUAWEI Mate 10シリーズに搭載

　講演の最後にユー氏は、Kirin 970が同社が10月16日に発表を予定しているMate 10シリーズに搭載されると明らかにした。つまり、今回Kirin 970の機能として紹介されている新機能の多くがMate 10シリーズに搭載されることになる。

Kirin 970のまとめ

搭載製品はMate 10シリーズとして10月17日にミュンヘンで発表

　今回Huaweiが発表したKirin 970は、おそらく将来になって振り返ると、エポックメインキングな製品だったという評価を受ける可能性が高いと筆者は考えている。

　ユー氏が言う通り「スマートフォンはまだ十分にスマートではない」。AIの機能をスマートフォンに実装していくことで、たとえば、バッテリを多く消費しているアプリをAIが自動でオフにしたり、ISO感度、ホワイトバランス、シャッタースピードなどの設定を周囲の状況をAIが判断し、誰でもプロ並の撮影ができるようになる。さらに、クラウド側のAIと連携すれば、予想もしていなかったような機能がスマートフォンに加わることも考えられる。

　その基礎になるSoCとして、Kirin 970は十分に注目に値する。今後競合他社の対応も含めて、スマートフォンのAI対応は大きなうねりとなっていくだろう。