ニュース

Arm、新拡張命令SME2でAI性能を5倍にする「Lumex CSS Platform」。CortexやImmortalisのリブランドも

Armが発表した新しいLumex CSS Platform、最大の特徴はSME2に対応したこと

 英Armは9月10日(日本時間)に報道発表を行ない、同社のCPUやGPUなどのIPライセンスをセットにして提供するCSS(Compute SubSystem)の最新製品となる「Lumex CSS Platform」を発表した。Armは今年の5月にモバイル製品をターゲットにしたプラットフォーム製品のブランド名を「Lumex」に変更したことを明らかにしており、今回のLumex CSS Platformはその第1弾製品となる。

 新しいLumex CSS PlatformではCPU IPのブランド名が従来の「Cortex」から「C」に、GPU IPのブランド名が「Immortalis」から「Mali G」に変更され、さらにその中で世代名を示す数字と「Ultra」「Premium」「Pro」「Nano」などのグレードを示す表記が組み合わせて採用されることになる。

 今回Armはその新しいCPUで、SME(Scalable Matrix Extension)と呼ばれる、行列乗法に最適化された拡張命令セットの第2世代「SME2」に対応した。SME2を利用することでAI処理性能が従来世代に比べて5倍になるとアピールしている。

CPUは「C1」に、GPUは「Mali G1」となったLumex CSS Platform

4つのCPU、C1-Ultra、C1-Premium、C1-Pro、C1-Nano

 Armは、CPU、GPU、メモリコントローラ、チップ間インターコネクト(ファブリック)などの半導体の設計を行ない、その設計データを提供する、あるいは自社開発したISA(命令セット)をライセンス(アーキテクチャライセンスと呼ばれる)するという、いずれかの形でIP(知的財産)の利用権を顧客に提供するビジネスを行なっている。

新しいArmのブランド戦略

 そうしたIPビジネスのうち、近年重視しているのがIPライセンスビジネスだ。特にここ数年は、CPU、GPU、メモリコントローラ、ファブリックなどを1つのセットにして、2023年まではTCS(Total Compute System)として、2024年からはCSSとして提供してきた。

 そして、今年(2025年)から、モバイルはLumex、自動車はZena、サーバーはNeoverseとしてリブランドして提供されることが5月に発表された。そのモバイル向けの最初の製品が、今回発表されたLumex CSS Platformになる。

【表1】Armのモバイル向けプラットフォーム(Armの資料より筆者作成)
プラットフォーム名称Lumex CSS PlatformCSS for ClientTCS23TCS22TCS21
発表年2025年2024年2023年2022年2021年
CPU命令セットArmv9.3-AArmv9.2-AArmv9.2-AArmv9-AArmv9-A
拡張命令(SVE/SVE2)
拡張命令(SME2)----
CPUプライムコアC1-UltraCortex-X925Cortex-X4Cortex-X3Cortex-X2
CPUサブプライムコアC1-Premium----
CPU高性能コアC1-ProCortex-A725Cortex-A720Cortex-A715Cortex-A710
CPU高効率コアC1-NanoCortex-A520Cortex-A520Cortex-A510Cortex-A510
DSUC1-DSUDSU-120DSU-120DSU-110DSU-110
GPU(最高構成)Mali G1-UltraImmortalis-G925Immortalis-G720Immortalis-G715Mali-G10
プロセスノード最適化3nm3nm4nm4nm5nm

 プラットフォームの名称がLumexに変更されたことを受けて、CPU、GPUのブランド名も変更されている。従来Cortexで呼ばれてきたCPUのブランド名はシンプルに「C」となり、世代を示す数字を付けられて呼ばれることになる。今年のLumex CSS Platformであれば「C1」というブランド名がその名称だ。

 さらにその後に、CPUコアの性能の違いで、Ultra、Premium、Pro、Nanoという4つのサブブランドが付けられており、今回の世代ではプライムコアがC1-Ultra、プライムコアの機能限定版がC1-Premium、パフォーマンスコアがC1-Pro、高効率コアがC1-Nanoというブランド名になる。

Lumex CSS Platformの基本構造
GPUのブランド名

 GPUは、従来ハイエンド向けがImmortalis、以前のハイエンドとローエンドなどがMaliとなっていたが、Immortalisブランドは廃止されてMaliブランドに統一され、後ろにGPUを意味するGが付けられ「Mali G」となり、さらにその後ろに世代を示す数字が付けられた。今回のLumexではMali G1となる。性能別に上からUltra(10コア以上)、Premium(6コア~9コア)、Pro(5コア以下)という3つのグレードが用意され、それらがそれぞれ「Mali G1-Ultra」「Mali G1-Premium」「Mali G1-Pro」と呼ばれることになる。

CPUのC1シリーズはすべてがSME2対応、ソフトウェアの対応によりAI処理が最大5倍

C1シリーズはすべてのCPUがSME2に対応している

 LumexのCPUとプライムコアCPUとなるC1-Ultraは、昨年(2024年)用のCSS for Clientで採用されていたCortex-X925の後継となるCPU IPデザイン。主に分岐予測やキャッシュ構造などの改良により、平均して15%のIPC(Instruction Per Clock-cycle、IPCが高ければ高いほどCPUは高効率に演算できる)向上を実現している。

 そのC1-Ultraの機能限定版となるC1-Premiumは、内部演算器やキャッシュサイズなどを減らすことで、35%のダイサイズを削減しながら、下位グレードなどに比べて35%の性能向上を実現する。顧客となる半導体メーカーが、プライムコアで性能とダイサイズでバランスを取りたい時の選択肢として提供する。

 従来のパフォーマンスコア「Cortex-A725」の後継として用意されるのがC1-Proで、従来の高効率コア「Cortex-A520」の後継として用意されるのがC1-Nanoになる。いずれも内部効率などを改善することで、従来製品に比べて性能向上を実現している。

 こうしたC1シリーズは、すべてのCPUコアがArmv9.3-AのISAに対応しているほか、SME2という行列乗法を高効率に行なえる新しい拡張命令セットに対応している。これまでのCortexシリーズでは初代SMEには対応してこなかったため、Arm自身のIPデザインとしては初めてSME系の命令セットに対応したことになる(SMEそのものはAppleがM4シリーズなどで既に対応している)。行列乗法はAI推論処理で多用されるため、AIソフトウェアがSME2に対応することで大きな性能向上を期待することが可能で、ArmによればSME2を利用するとAI処理性能が最大5倍になると説明している。

Mali G1はハードウェアリアルタイムレイトレーシングが第二世代となり、性能が倍になっている

 GPUのMali G1は、従来製品となるImmortalis-G925で導入されたレイトレーシングユニット(RTU)が第2世代に進化しており、第1世代に比較してレイトレーシングの処理性能が2倍に強化されている。また、MMUL.FP16という命令セットに新たに対応し、AIの演算をFP16の精度を利用して演算することが可能になっており、AIの処理にGPUを利用する場合の性能が強化されている。

FPGAを利用して仮想的にLumex CSS PlatformとCSS for Clientを比較する環境
性能比較結果

 Armによれば、こうしたLumex CSS Platformと従来のCSS for Clientを、同じ3nmのFPGA上で動作させた場合、新しいLumex CSS PlatformはGeekbench 6.3のシングルスレッドで25%、マルチスレッドで45%、Webブラウジングで24%、アプリ起動で15%の性能向上を実現。グラフィックスではGFX Bench 5で24%、3DMarkで28%、GPUScoreで37%、Antutu3DBenchで18%の性能向上を実現するという。

 Armによれば、既に顧客となる半導体メーカーのデザインは始まっており、今年中に登場するデバイスなどに採用される可能性があるという。通例ではArmの最新デザインは、主要顧客の1つであるMediaTekのハイエンド製品に採用され、11月から始まる、中国でのハイエンドスマートフォンの発表ラッシュで発表される製品群に搭載されるのが通例。その意味で、今後登場が予想されるMediaTekのDimensity 9400/9400+の後継製品などに採用される可能性が想定される。