後藤弘茂のWeekly海外ニュース

ARMがハイエンドCPU「Cortex-A72」などを北京で発表

（2015/2/5 06:00）

モバイル急成長の北京でCortex-A72を発表

　ARMは16nm FinFETプロセス世代をターゲットとしたハイエンドCPUコアIP「Cortex-A72」を発表した。Cortex-A72は70番台という型番で分かる通り、従来の50番台のCortex-A50シリーズの次の世代となるCPUコアだ。64-bitをサポートするARMv8命令セットを実装した2世代目のCPUとなる。

　ARMは北京のSheraton Beijing Dong Cheng Hotelで製品発表会を開催。Cortex-A72と、新GPUコア「Mali-T880」、新しいオンチップインターコネクト「CCI-500」、そしてTSMCの改良版16nm FinFET 3Dトランジスタプロセス「16FF+」に対応したPOP(Process Optimization Pack) IPの提供を発表した。国際的な発表イベントの一環の場を中国に設定したのは、もちろん中国市場でのモバイル製品の盛り上がりを受けてのことだ。

ARMが発表会を開催した北京のSheraton Beijing Dong Cheng Hotel

ARMは次世代CPUコアを初めとした製品を発表

　発表会の冒頭で登壇したARMのPete Hutton氏(EVP and President Product Groups, ARM)は、Cortex-A72は大幅な性能アップを、従来のARM CPUコアと同じスマートフォンの電力枠の中で実現したことが重要な点だと強調した。ARMは、自社が提供するCPUコアIPについては、必ずモバイルの電力枠に収まるように設計することをポリシーとしている。Cortex-A72もその枠の中で性能アップを行なった。

　AMDでCPUコア製品を統括するNoel Hurley氏(GM CPU Product Group, ARM)は、Cortex-A72について第2世代のARMv8アーキテクチャであり、命令セット的にはCortex-A57/53と互換だと説明。Cortex-A72では、FinFETプロセスをターゲットとしているだけでなく、マイクロアーキテクチャも改良したことで、Cortex-A57より性能/電力比を大幅に向上させたとした。Cortex-A72については、より詳細が分かった時点でまとめてレポートしたい。

Pete Hutton氏(EVP and President Product Groups, ARM)

Noel Hurley氏(GM CPU Product Group, ARM)

28nmのCortex-A15の3.5倍の持続性能のCortex-A72

　Hurley氏によると、CPUコア自体のサステイン(持続)性能は、28nmのCortex-A15と比較して16nmのCortex-A72では3.5倍に向上するという。また、同じワークロードの実行で使うエネルギーは75%も減って25%ほどになるという。ただし、これはbig.LITTLEを使わない場合の数字で、big.LITTLE構成にすればさらに低負荷時の電力消費を減らすことが可能だ。Cortex-A72では、big.LITTLEのペアにCortex-A53を使うことができるが、将来的にはCortex-A70世代のリトルコアも登場すると見られる。

　これらの数字の中のマジックは、ピーク性能では比較していない点。性能比較も、ピークではなくサステインの数字となっている。これは、FinFETの効果で、Cortex-A72の方が電力効率が高いため、一定の電力枠の中では、持続性能がCortex-A72の方が高くなるためだと見られる。これを数字のトリックと見ることもできるが、実際のエンドユーザーにとって重要な性能は、ピーク性能ではなくサステイン性能であることを考えると、サステイン性能で比較する方が理にかなっている。

　ARMは、北京の発表会で、Cortex-A72について、TSMCの16nm FF+プロセスのPOP IPを提供することも明らかにした。POPはプロセス最適化を容易にしたソリューション。RTLソフトマクロでは特定のプロセス技術への最適化実装は全てライセンスを受けた側が行なわなければならない。ところが、POPを使えば、高いPPA(電力、性能、面積)のコアを比較的容易に設計することができる。

　TSMCは現在、最初のFinFETプロセスである16nm FF系の量産段階に入っている。しかし、16FFを改良した16FF+も、後追いで立ち上げつつある。TSMCのFinFETプロセスは、先行グループが16FFだが、それ以外は16FF+へと流れつつあり、16FF+が事実上の本命となりそうだ。ちなみに、16FFには16FFLLと16FFGLの2種類のプロセスがある。同様に、16FF+にも16FFLL+と16FFGL+がある。ARMは16FFの時と同様に、16FF+でも16FFLL+と16FFGL+の両方にPOPを提供すると見られる。

　ARMv8はまた、Cortex-A72をHiSilicon、MediaTek、Rockchipなどにライセンスしたことも明らかにした。発表会では、HiSiliconやMediaTekの幹部も登壇してパネルディスカッションが行なわれた。

HiSiliconやMediaTek、TSMCなどのパートナーも交えての発表イベント

ALUの数を増やしたGPUコア「Mali-T860」

　Mali-T880はMali-T800ファミリの最高レンジのGPUコア製品。下位のMali-T860が1シェーダコアに2セットのALU(Arithmetic Logic Unit)を持つのに対して、Mali-T880は1コアが3セットのALUを備える。シェーダコアは1個のテクスチャユニットと1個のロード/ストアユニットを備えるため、テクスチャと演算の比率は1対3となる。

　GPUコア全体では最大16個のシェーダコアの構成に拡張することが可能。そのため、最大で48個のALU構成となる。Mali-T880の各ALUは、1個のベクタユニットと1個のスカラユニットを備える。ベクタユニットは128-bitのVec4構成で、演算ユニットを分割することで、16-bit演算などを32-bit演算の2倍のスループットで実行することが可能だ。

　性能レンジでは、Mali-T760の約1.8倍に達する。ただし、プロセス技術とマイクロアーキテクチャの改良によって、電力も40%削減できたという。ARMのPete Hutton氏は、ゲームコンソール並の性能と宣言したが、演算ユニットの数(32-bitコア換算なら192個分)で見るとモバイルGPUのハイエンドグループであることは間違いない。

高い性能でユーザー経験を変えると宣言するARMのプレゼン

　Mali-T800は、従来のARM CPU同様にシェーダコア間はコヒーレンシが保たれているが、CPUとGPUの間はI/Oコヒーレンシとなっている。北京の発表会で、ARMはMali-T880コアについても16FF+のPOPを提供することを明らかにした。この他、ARMはチップ内インターコネクトとしてCCI-500もアナウンスした。これは、サーバー向けのCCN-5xxと同じ世代のインターコネクトになると見られる。

　ARMは、これら新IPスィーツによって、2016年にはモバイル機器の性能が大幅に向上すると見ている。

（後藤弘茂 (Hiroshige Goto)E-mail）