ニュース

5nmプロセス向け。性能が2割向上したArm「Cortex-A78」

~新フラグシップGPU「Mali-G78」なども

今回発表されたCortex-A78、Mali-G78、およびEthos-N78

 アーム株式会社は27日、オンラインで記者説明会を開催し、5nmプロセスをターゲットとしたCPU IP「Cortex-A78」、およびGPU IP「Mali-G78」、NPU「Ethos-N78」を発表した。

 冒頭では、同社代表取締役社長の内海弦氏が挨拶。いまや世界人口の7割がArmの技術を利用しており、Armベースチップの累計出荷数が1,660億個に到達していることを紹介。そのなかでもとくにスマートフォンは人々にとって欠かせないツールとなっていて、そのうえでさらなるデジタル没入感(デジタルイマージョン)の向上が求められているとし、新IP群投入に至ったと紹介した。

人口の70%がArmプロセッサを利用
Armプロセッサの出荷成長率
デジタルイマージョン体験
スマートフォンの日常利用
同社代表取締役社長の内海弦氏
菅波憲一氏

 続いて同社リージョナルマーケティング・ディレクターの菅波憲一氏が、新IP群の特徴について解説した。

次世代スマートフォン向けのプラットフォーム

性能が2割向上したCortex-A78。ユニット増加で性能を3割高めたCortex-X1も

 まずは歴代Cortex-Aシリーズのなかで最高性能を実現した「Cortex-A78」。最新の5nmをターゲットに設計されており、7nmをターゲットとしたCortex-A78と比較した場合、同じ電力(1コアあたり1W)で2割の性能向上を実現できるとした(クロック3GHz対2.6GHzの向上分含む)。その一方で、Cortex-A55と4コアずつのbig.LITTLE構成を構築した場合、ダイエリアを15%縮小でき、面積あたりの効率にも優れるとしている。

 さらに今回、「Arm Cortex-X Custom」プログラムを新たに開始。これからArmのIPを利用してプロセッサを設計するさいに、顧客の要求にあわせて、設計初期のアーキテクチャレベルの段階でカスタマイズを可能とし、さらなる性能向上などを図れるとする。

 このArm Cortex-X Customプログラムを採用した最初のIPが「Cortex-X1」であり、ダイサイズを増加させユニット数や機能を増やすことで、従来のCortex-A77と比較して3割増のピーク性能を実現するとしている。ただし、このCortex-X Customプログラムを使った場合、Arm Cortexブランドが冠されるので、Cortex-X1がどのベンダーと組んで開発されたものなのかは明らかにされていない。

 このCortex-X1も、Cortex-A78やCortex-A55とbig.LITTLE構成(同社がDynamIQと呼んでいる技術)が可能なため、たとえば8コアのうちの1コアのみをCortex-X1とし、3コアをCortex-A78、残る3コアをCortex-A55とすることなども可能だという。仕組み的には、Qualcommの「Snapdragon 865」に採用されているPrime Core(こちらは1コアだけクロックが高い)の構想をさらに一歩進めたものとなる。

Cortex-A78の特徴
5nmをターゲットとし、20%の性能向上と15%のクラスタ全体のサイズダウンを実現
Arm Cortex-X Customプログラム。アーキテクチャレベルからArmに注文可能
第1弾のCortex-X1
8コアのうち1コアだけをCortex-X1に置き換える構想

最大24コアの構成が可能となったMali-G78

 一方GPUに関しても、PCやコンソールゲーム機クラスのゲーミング体験、マシンラーニング、XRなどへの対応を強化するため、Mali-G78を投入する。

 Mali-G78の最大の特徴は、最大GPUコア数が従来の16基から24基に拡張された点と、PC向けGPUで一般的となったAsync技術を採用した点。Asyncについて詳しい説明はなされなかったが、Mali-G78ではGPUコア数が増加しているため、効率よくコアを稼働させるための仕組みという。また、複数の異なるタスクをGPUに割り振るさいに空きリソースの発生を最小限に抑え、電力効率を向上させる狙いもある。

 Mali-G78は従来のG77と比較して全体的な性能が3割向上しているが、これは計算上のピーク性能向上幅であり、実アプリケーションにおいてはもっと処理が複雑なため性能はそこまで上がらない。そこで今回Armはゲーム内における木や煙、草といった細かく複雑なオブジェクトの処理に最適化を施した。これにより、実ゲームでも6~17%の性能向上が実現したという。

 さらに同社はゲーム開発者向けに「Performance Advisor」を提供。ゲーム内で発生している性能のボトルネックがどこにあるのかを可視化することで、性能の最適化を容易にするとした。

 このほか、NPUを別途搭載しないSoCでの利用も考慮し、マシンラーニング性能を15%向上させたという。これは、マシンラーニングでよく使われる処理や命令を解析し、それに向けてGPUを特化することで実現できたとしている。

Mali-G78の特徴
複雑なシーンでの性能を向上
Performance Advisorでゲーム内のボトルネックを特定可能
マシンラーニング性能も向上させた

 なお、Mali-G78は7~24コアまでの構成に対応するが、機能やコアあたりの性能をそのままに、新たに1~6コアの構成に対応させた「Mali-G68」も同時投入する。

 同社はこれまでミドルレンジ向けにはMali-G5xシリーズを投入してきたが、Mali-G5xシリーズは電力と面積効率に重視した設計のため、機能面でMali-G7xシリーズに見劣りする部分があった。しかし市場からはMali-G7xと同等の機能を求める声が多く上がったため、Mali-G68の投入に至ったという。

Mali-G78の機能をすべて継承したMali-G68

適材適所で効率改善のEthos-N78

 一方でNPUの「Ethos-N78」だが、これまで1かたまりだったNPUを、適材適所に分散化させることで電力効率やピーク性能向上を実現したものとなった。

 具体的にいえば、ニューラルネットワーク処理が求められるさまざまなシーンに対し、規模の異なるコアを用意する。たとえば、デバイスがスリープしているさいにマイクから入力された音声の処理は、さほど大掛かりな処理を行なう必要はないが、低消費電力性とリアルタイム性が求められる。一方で動画や写真の分析はピーク性能が求められる。また、音声処理はオーディオプロセッサに近い場所であるほうが電力効率がいいし、画像処理はISPに近い場所にあったほうがいいといった具合だ。

 Ethos-N78はまさにこの「適材適所」の構想を推し進めたNPUで、顧客の要望にあわせて、90以上のコンフィギュレーションを実現する。また、こうした最適化により、ピーク性能は2倍以上、性能効率は25%以上、メモリのバンド幅利用効率は40%向上したという。とくに、これまでアプリケーション開発者がNPUの利用をためらっていた理由の1つにDRAM帯域幅の消費の問題があったとし、今回の改善はNPUの利用促進につながると同社は考えている。

Ethos-N78
異なるマシンラーニングのシステムに対応する幅広いエコシステム