笠原一輝のユビキタス情報局

Arm版Windows用の「Snapdragon 8cx Gen 3」の正体と、予想される性能

笠原一輝

2021年12月16日 06:46

Snapdragon 8cx Gen 3はWindows用SoCとしては初めて5nmで製造されるSoC(出典:Qualcomm)

　Qualcommは、11月30日～12月1日(ハワイ時間、日本時間では12月1日～12月2日)の2日間に渡って「Snapdragon Tech Summit」を開催した。Snapdragon Tech Summitは毎年12月にQualcommが翌年にデバイスに搭載されて提供される新しいSoCを発表される場として使われており、今年(2021年)もハイエンドスマートフォン向けの「Snapdragon 8 Gen 1」、Windows 11向けの「Snapdragon 8cx Gen 3」、ゲーミングプラットホーム向けの「Snapdragon G3x Gen 1」などを発表した。

　それぞれの発表概要は発表記事をお読みいただくとして、この記事ではその後の取材などから判明したPC向けのSnapdragon 8cx Gen 3の詳細や、予想される性能などについて解説していきたい。

Snapdragon 8 Gen 1のCPUはCortex-X2が1コア、Cortex-A710が3コア、Cortex-A510が4コア

Snapdragon 8cx Gen 1、Cortex-X2(最大3GHz)が1コア＋Cortex-A710(最大2.5GHz)が3コアと高効率コアになるCortex-A510が4コアという構成になっている(出典：Qualcomm)

　前回の記事では、「Snapdragon 8cx Gen 1」に関するさまざまな解説を加えた。そのフォローアップとなるが、Qualcommへの取材でCPUやファウンダリに関して明らかになったことがあるのでお伝えしておく。

　前回の記事では、Snapdragon 8 Gen 1のCPUに関してはCortex-X2が1コアで、詳細不明のパフォーマンスコアが3コア、同じく詳細不明の高効率コアが4コアという構成だと説明した。

　その後の取材で、パフォーマンスコアは前回の記事で予想したとおりCortex-A710が3コア、高効率コアはCortex-A510が4コアという構成になっていることがわかった。いずれもArmが今年の5月に発表したばかりの最新コアで、Snapdragon 8 Gen 1のCPUは新しいコアIPで固められていることがわかる。

　なお、同じく4nmとだけ発表されていたプロセスルールも、前回の記事の中で予想したとおりSamsung Electronicsの4nmであることがQualcommへの取材で判明した。こちらも想像通りで、Qualcommが依然としてSamsungのプロセスルールを利用しており、TSMCへの乗り換えはしていないことが確定した。

CPUはCortex-X1 4コア+Cortex-A78 4コアという構成になっているSnapdragon 8cx Gen 3

Snapdragon 8cx Gen 3のCPUとなる新Kyro、マルチスレッドでは85%向上(出典:Qualcomm)

　PC向けのSnapdragon 8cx Gen 3は、2018年に発表されたSnapdragon 8cx以来3年ぶりとなる完全フルモデルチェンジの新しいWindowsプラットホーム向けのSoCとなる。

　Snapdragon 8cxはCPUとしてKryo 495を搭載しており、高性能コアとしてCortex-A76が4コア、高効率コアとしてCortex-A55が4コアという8コア構成。Snapdragon 8cxの高クロック版が、「Microsoft SQ1」としてMicrosoftブランドでも提供されており、そのMicrosoft SQ1が「Surface Pro X」の2019年モデルに搭載されている。

　2020年には第2世代となる「Snapdragon 8cx Gen 2」が投入されたが、基本的にこれはクロック周波数を引き上げた高クロック版であり、アーキテクチャ上の大きな変更はなかった(CPU、GPU、DSPなどの構成は同じ)。そしてそのSnapdragon 8cx Gen 2のさらなる高クロック版が「Surface Pro X」の2020/2021年モデルに採用されている「Microsoft SQ2」だ。

表1 PC向けSnapdragonの各製品のスペック
	Snapdragon 8cx Gen 3	Snapdragon 8cx Gen 2(Microsoft SQ2)	Snapdragon 8cx(Microsoft SQ1)	Snapdragon 850	Snapdragon 835
発表年	2021年	2020年	2018年	2018年	2017年
CPUブランド名	新Kryo	Kryo 495	Kryo 495	Kryo 385	Kryo 280
CPUベースデザイン	Cortex-X1(4コア)+Cortex-A78(4コア)	Cortex-A76(4コア)+Cortex-A55(4コア)	Cortex-A76(4コア)+Cortex-A55(4コア)	Cortex-A75(4コア)+Cortex-A55(4コア)	Cortex-A73?(4コア)+Cortex-A53?(4コア)
LLC	14MB	10MB	10MB	2MB?	?
GPUブランド名	新Adreno	Adreno 680	Adreno 680	Adreno 630	Adreno 540
メモリバス幅	8x16bit	8x16bit	8x16bit	4x16bit	4x16bit
メモリ種類/データレート	LPDDR4x/2,133MHz	LPDDR4x/2,133MHz	LPDDR4x/2,133MHz	LPDDR4x/1,866MHz	LPDDR4x/1,866MHz
理論帯域幅	約68.3GB/秒	約68.3GB/秒	約68.3GB/秒	約29.9GB/秒	約29.9GB/秒
DSP	新Hexagon	Hexagon 690	Hexagon 690	Hexagon 685	Hexagon 682
ISP	新Spectra	Spectra 390	Spectra 390	Spectra 280	Spectra 180
モデム	X65/X62/X55(5G)	X24(CAT20, 2Gbps)/X55 5G(別チップ)	X24(CAT20, 2Gbps)	X20(CAT18, 1.2Gbps)	X16(CAT16, 1Gbps)
PCI Expressコントローラ	対応(Gen3?)	Gen3	Gen3	-	-
製造プロセスルール	5nm(Samsung)	7nm(Samsung)	7nm(Samsung)	10nm	10nm

　そうしたSnapdragon 8cx、Snapdragon 8cx Gen 2の後継となるSnapdragon 8cx Gen 3だが、発表概要では具体的なCPUの構成などは明らかになっていなかった。その後のQualcommへの取材で、2種類のコア(高性能コアと高効率コア)のそれぞれのCPUに関して判明した。

　Qualcomm 副社長兼製品担当上席部長ミゲル・ヌネス氏は「高性能コアにはCortex-X1を採用している。なぜX2ではないのかと言えば、今回の製品ではX1を4コアという構成にしたからだ。性能や消費電力とのバランスを考えた結果、X1の方が良いと判断した。今回の製品はあくまでメインストリーム向けの製品であり、競合他社の製品で言えばCore i5に匹敵するような製品だと考えてほしい」と述べ、高性能コアにはCortex-X1を採用し、それを4コアとすることで性能を強化していると説明した。

　通常、特にハイエンド向けのスマートフォンSoCでは、Cortex-Xシリーズを1コア、Cortex-Aの高性能コア向けを3コア、Cortex-Aの高効率コアを4コアという構成にすることが多い。Snapdragon 8 Gen 1がまさにそうで、Cortex-X2が1コア、Cortex-A710が3コア、Cortex-A510が4コアという構成になっている。それに対してSnapdragon 8cx Gen 3では1世代前ではあるが超高性能コアであるCortex-X1(最大3GHz)を4コアとなっているので、おそらくマルチスレッド時の性能はCortex-X2が1コアのSnapdragon 8 Gen 1より高くなるだろう。

　さらに面白いのは高効率コアだ。常識的に考えれば、高効率コアはCortex-A510やCortex-A55などのArmが高効率コアとして用意しているIPデザインを採用するのが一般的だ。しかし、ヌネス氏によれば「高効率コアにはCortex-A78を4コア構成にしている。本来は高効率コアに採用するものだが、性能を重視してそうした設計にしている」とのことで、Cortex-A78(Snapdragon 888に採用されていた高性能コア、最大2.4GHz)を高効率コアとして採用しているというのだ。

　確かにそれだと、アイドル時の消費電力は若干上がることになると考えられるが、それでも性能面でのメリットは見逃せない。特に最近のArmプロセッサは、高性能コアと高効率コアを同時にオンにすることで性能を稼いでいる分が少なくないので、マルチスレッド時の性能は大きく高まる。実際、Qualcommが公表した数字ではマルチスレッド時には85%も高まると説明しており、そのことを裏付けている。

　また、シングルスレッド時の性能も40%向上すると説明している。シングルスレッドの性能を向上させるにはCPUのアーキテクチャのモダン化と同時に、メモリレイテンシを大きく削減する必要がある。今回のSnapdragon 8cx Gen 3では、前世代のCortex-A76から大きく性能を引き上げているCortex-X1に変更したこと、さらにはL3キャッシュが14MBと従来世代の10MBから40%も大きく増やすことで、メモリレイテンシが削減され、シングルスレッド性能を引き上げる要因になっていると考えることができる。

GPUの詳細は不明だが60%性能が向上するとQualcommは主張、AIエンジンは29TOPsに

GPUの性能は60%向上(出典：Qualcomm)

　今回QualcommはCPUに関してはある程度の情報を開示したが、GPU、DSP、ISPなどに関してあまり詳細を明らかにしなかった。いずれも判を押したように「新しいアーキテクチャになっている」と説明するだけで、具体的に何をどのように新しくしたのかなどに関して説明しなかった。

　しかも、今回の世代から、CPU、GPU、DSP、ISPに関して3桁の数字を利用したマーケティングネームを廃止してしまったため、例えばスマートフォン向けのSnapdragon 8 Gen 1に採用されているGPUと、PC用のSnapdragon 8cx Gen 3に採用されているGPU、どちらの方が新しいのか、あるいは、同じなのかなどに関してもわからなくなってしまった。

　Snapdragon 8cx Gen 3に採用されているGPUは、新アーキテクチャになっていることと、APIとして少なくともDirectX 12に対応していること以外は何もわからない。ただ、性能の上がり幅に関しては公開されており、従来製品(Snapdragon 8cx Gen 2)と比較して60%向上しているとQualcommは説明している。

AIエンジン(CPU+GPU+DSPをソフトウエアレベルで異種混合に実行するエンジン)は29TOPsを超える性能を実現(出典:Qualcomm)

従来製品では9TOPsだった性能が29TOPsを超える性能を実現(出典:Qualcomm)

　DSPやISPに関しても状況は同じなのだが、DSPに関してはある程度推測はできそうだ。というのも、DSPを含むAIエンジンの性能は明らかにされているからだ。Qualcommでは、AI推論の処理をCPU/GPU/DSPをソフトウェア的に異種混合で使うAIエンジンの仕組みが導入されている。この仕組みでAI推論を行なった時の性能は29TOPs(Tera Operations Per Second)と明らかにされている。

　この性能は、昨年発表され今年のハイエンドスマホ用であるSnapdragon 888の26TOPsに近いものとなっている。その性能の多くがDSP由来で、CPU/GPUの性能向上分が3TOPS分ぐらいだと考えれば、Snapdragon 888のDSPであるHexagon 780と同等ないしはそれに近いものなのかもしれない。

　なお、Snapdragon 888とSnapdragon 8 Gen 1のDSPの違いは、Tensorアクセラレータの性能が倍になっていることと、ローカルメモリの容量が倍になっていることなので、もう少し性能が上がっていると考えられるので、案外とそのあたりの線かもしれない(ここは完全に推測にすぎない)。

　いずれにせよ、Qualcommに苦言として申しあげたいのは、CPUやGPU、DSPの3桁のマーケティングネームをなくすのはいいが、それならそれで技術的にどこが違っているのか、どう強化しているのか、それを客観的に評価できる情報をきちんと公開してほしいと思う。Intelにせよ、AMDにせよ、そうした情報公開をきちんと行なっており、ITの担当者やプロシューマなどがCPUの性能などを判断するときに参照できるようにしている。Snapdragon 8cx Gen 3をPC用と位置づけるのであれば、ぜひともPC用プロセッサ業界のやり方を見習っていただきたいものだ。

Snapdragon 8cx Gen 3の性能はCore i5に相当

Windows 11からはx64アプリがArm版Windowsでも動くようになった。Windows 10までは32bitのx86アプリだけが動作可能だった(出典：Qualcomm)

　今回Qualcommは具体的なベンチマークスコアなどは公開せず、なんとなく「競合のx86プロセッサよりも高速」という曖昧なグラフしか公開しなかったので、具体的にどんな性能を持っているのかなどに関してはわからない。ただし、Qualcommのヌネス氏は「この製品はあくまでPCのメインストリームをターゲットにした製品だ。競合の製品で言えばCore i5に匹敵するような製品だと思っていただきたい。Core i7やM1をターゲットにしたような製品は、11月に弊社のCEOが言及したロードマップ上にある製品となる」と説明しており、あくまでミッドレンジ向けの製品であり、ハイエンド向けではないというのがQualcommの説明だ。

　今回のQualcommの発表では、前世代(Snapdragon 8cx Gen 2)に比較してCPUのマルチスレッド性能は85%、シングルスレッドは40%、GPUの性能は60%向上というプロセッサ単位での性能向上の上がり幅はわかっている。そこで、現行製品のベンチマークスコアを利用してそれを推定してみようと思う。

　Snapdragon 8cx Gen 2そのものは用意できなかったが、その高クロック版であるMicrosoft SQ2を搭載したSurface Pro X(2020年版)を用意したので、その性能を元にどんな性能を持っているのか考えていきたい。比較対象として用意したのは、IntelのCore i7-1185G7を搭載したシステム(MSI Prestige 14Evo A11M)と、Apple M1を搭載したシステム(13.3インチMacBook Pro)の2つだ。

　テストに関してはCinebench R23、CrossMark、GFXbench 5の3つのテストだ。CrossMarkとGFXBench 5.0は、いずれもx64版Windows 11、Arm版Windows 11、Arm版macOS Montereyにそれぞれ有効に対応しており、それぞれのプラットホームで公平に性能を比較できると考えて採用した。

　なお、Cinebench R23に関してはx64版とmacOS版(Arm、x86)しかないため、Arm版Windows 11が動作しているSurface Pro Xでは、Arm→x64への変換が入って動作することになる。そのため、その分は割り引いて考える必要がある。テスト環境は表2の通りだ。

【表2】テスト環境
	Core i7-1185G7(MSI Prestige 14Evo A11M)	Microsoft SQ2(Surface Pro X)	Apple M1(13.3インチMacBook Pro)
SoC(CPU+GPU)	Core i7-1185G7	Microsoft SQ2	Apple M1
メモリー	16GB	16GB	16GB
ストレージ	512GB(PCIe Gen 4)	256GB(NVMe)	256GB(NVMe)
OS	Windows 11 Pro	Windows 11 Pro	macOS Monterey

【グラフ1】Cinebench R23

　Cinebench R23は、CPUに負荷をかけてその処理能力を測るタイプのベンチマークプログラム。このため、CPU単体(およびメモリレイテンシと帯域)の性能を推測するのに適している。ただし、既に述べたとおり、Cinebench R23はx64(AMD64/Intel64)版のWindowsとx64版とM1版のmacOSにしか対応していないため、Arm版WindowsではWindows 11の新機能であるArm→x64へのバイナリトランスレーション機能を利用して動作する。したがってその分のロスはある程度考慮する必要がある。

　見てわかるように、Microsoft SQ2はシングルスレッドが457、マルチスレッドが2026と、シングルスレッドもマルチスレッドも他の2つに比べて3分の1になっている。仮にQualcommが主張する通りシングルスレッドで40%、マルチスレッドで85%の性能向上があったと仮定すると、それぞれ520.98、3748.1となる。依然としてシングルスレッドは低いが、マルチスレッドに関してはそれなりの数字だ。Core i7-1165G7が4,000台の中盤ぐらいなので、Core i5に近い性能になるというのは十分想定できる。

そして仮にCinebenchにArm版Windows用のネイティブバイナリがでればその分の改善もあると考えられるので、確かに結構追いつけるのではないだろうか(Snapdragon 8cx Gen 3を搭載したPCが出荷される頃には、IntelからノートPC向けの次世代製品が出ているだろうということは置いておくとして)。

【グラフ2】CrossMark

【グラフ3】CrossMark

　BAPCoのCorssMarkは、プラットホームを問わずベンチマークを用意しており、Arm版Windowsのバイナリも用意されており、3つのプラットホーム(Arm版Windows、x64版Windows、M1版macOS)を比較的公平に比較することができる。オフィスアプリでの性能を見る「Productivity」、コンテンツ作成アプリでの性能を見る「Creativity」、応答速度を見る「Responsiveness」の3つの詳細テストが用意されており、それらの合計で総合スコア(Overall)を決定する。

　ネイティブのテストなのだが、Microsoft SQ2のスコアは第11世代Coreにも、M1にも大きく及ばないというスコアになっている。ほとんどのテストはマルチスレッドだと考えられるので、それが85%増しになったと仮定すると、Overallは808.45、Productivityは802.9、Creativityは900.95、Responsivenessは634.55になる。やはり大きく向上することは間違いないが、やはり第11世代のCore i7やM1に追い付くほどではないことがわかる。

【グラフ4】GFXBench 5.0

　GFXBenchはGPUの性能を測るテストで、こちらもクロスプラットホームでバイナリが用意されており、Arm版Windows用のネイティブ版が用意されている。Windows側のAPIはDirectX11をAPIにして計測した。

　M1のGPUの優秀さがよくわかる結果だが、GPUに関してはMicrosoft SQ2も結構頑張っている(ただし、1080p Aztec Ruins/Normal Teirはエラーになってしまいスコアはなかった)。QualcommはGPUの上がり幅を40%と説明しているので、「1440p Aztec Ruins(High Teir) Offscreen(Metal/DirectX11)/fps」は40.59104fps、「1080p Manhattan 3.1.1 Offscreen(Metal/DirectX11)/fps」は210.2688fpsという計算になる。

　GPUに関しては、Intelの第11世代Coreに追い付ける可能性があるし、第12世代CoreのGPUは第11世代から据え置きであることも既に明らかになっているので、第12世代のCoreプロセッサとも良い勝負になる可能性があると言えるだろう。

将来のロードマップにある次世代製品は、他社のハイエンドに匹敵するとQualcommはアピール

Snapdragon 8cx Gen 3の概要

　こうして見て行くと、Snapdragon 8cx Gen 3はCPUに関してはもうひと頑張りというところだが、GPUに関しては十分競争力がある性能を発揮する可能性があると言える。特に第12世代Coreでは内蔵GPU(Xe Graphics)は第11世代から据え置きで、性能向上分はメモリの帯域幅が増える分だけと考えることができるので、そちらに関しては追いつける可能性があると言える。

　その意味でも、Qualcommの本命は、11月のアナリスト向けの説明会で同社のCEOであるクリスチアーノ・アーモン氏が表明した、M1に対抗できるような将来投入されるPC向けのArmプロセッサということになるだろう。それはこのSnapdragon 8cx Gen 3ではなく、将来リリースされる製品になるのだ。

　それがどんな製品であるかは、今はわからないが、1つだけ言えることは、来年(2022年)のSnapdragon Tech Summitで発表される製品がそれになる可能性は高いことだ。そしてそれは2023年に発売されるPCに搭載されることになる。その時には、AppleはM1の後継製品を発表しているだろうし、IntelもMeteor Lakeのリリースに近づいているだろう。

　その意味では、Qualcommが来年のSnapdragon Tech Summitで発表するPC用のArmプロセッサが、そうしたM1の次世代製品や、Intel、AMDの次次世代製品と肩を並べるモノであるのかが、QualcommがPCビジネスでそれらの会社の真の競合となる上で重要になってくるのではないだろうか。