笠原一輝のユビキタス情報局
Arm版Windows用の「Snapdragon 8cx Gen 3」の正体と、予想される性能
2021年12月16日 06:46
Qualcommは、11月30日~12月1日(ハワイ時間、日本時間では12月1日~12月2日)の2日間に渡って「Snapdragon Tech Summit」を開催した。Snapdragon Tech Summitは毎年12月にQualcommが翌年にデバイスに搭載されて提供される新しいSoCを発表される場として使われており、今年(2021年)もハイエンドスマートフォン向けの「Snapdragon 8 Gen 1」、Windows 11向けの「Snapdragon 8cx Gen 3」、ゲーミングプラットホーム向けの「Snapdragon G3x Gen 1」などを発表した。
それぞれの発表概要は発表記事をお読みいただくとして、この記事ではその後の取材などから判明したPC向けのSnapdragon 8cx Gen 3の詳細や、予想される性能などについて解説していきたい。
Snapdragon 8 Gen 1のCPUはCortex-X2が1コア、Cortex-A710が3コア、Cortex-A510が4コア
前回の記事では、「Snapdragon 8cx Gen 1」に関するさまざまな解説を加えた。そのフォローアップとなるが、Qualcommへの取材でCPUやファウンダリに関して明らかになったことがあるのでお伝えしておく。
前回の記事では、Snapdragon 8 Gen 1のCPUに関してはCortex-X2が1コアで、詳細不明のパフォーマンスコアが3コア、同じく詳細不明の高効率コアが4コアという構成だと説明した。
その後の取材で、パフォーマンスコアは前回の記事で予想したとおりCortex-A710が3コア、高効率コアはCortex-A510が4コアという構成になっていることがわかった。いずれもArmが今年の5月に発表したばかりの最新コアで、Snapdragon 8 Gen 1のCPUは新しいコアIPで固められていることがわかる。
なお、同じく4nmとだけ発表されていたプロセスルールも、前回の記事の中で予想したとおりSamsung Electronicsの4nmであることがQualcommへの取材で判明した。こちらも想像通りで、Qualcommが依然としてSamsungのプロセスルールを利用しており、TSMCへの乗り換えはしていないことが確定した。
CPUはCortex-X1 4コア+Cortex-A78 4コアという構成になっているSnapdragon 8cx Gen 3
PC向けのSnapdragon 8cx Gen 3は、2018年に発表されたSnapdragon 8cx以来3年ぶりとなる完全フルモデルチェンジの新しいWindowsプラットホーム向けのSoCとなる。
Snapdragon 8cxはCPUとしてKryo 495を搭載しており、高性能コアとしてCortex-A76が4コア、高効率コアとしてCortex-A55が4コアという8コア構成。Snapdragon 8cxの高クロック版が、「Microsoft SQ1」としてMicrosoftブランドでも提供されており、そのMicrosoft SQ1が「Surface Pro X」の2019年モデルに搭載されている。
2020年には第2世代となる「Snapdragon 8cx Gen 2」が投入されたが、基本的にこれはクロック周波数を引き上げた高クロック版であり、アーキテクチャ上の大きな変更はなかった(CPU、GPU、DSPなどの構成は同じ)。そしてそのSnapdragon 8cx Gen 2のさらなる高クロック版が「Surface Pro X」の2020/2021年モデルに採用されている「Microsoft SQ2」だ。
Snapdragon 8cx Gen 3 | Snapdragon 8cx Gen 2(Microsoft SQ2) | Snapdragon 8cx(Microsoft SQ1) | Snapdragon 850 | Snapdragon 835 | |
---|---|---|---|---|---|
発表年 | 2021年 | 2020年 | 2018年 | 2018年 | 2017年 |
CPUブランド名 | 新Kryo | Kryo 495 | Kryo 495 | Kryo 385 | Kryo 280 |
CPUベースデザイン | Cortex-X1(4コア)+Cortex-A78(4コア) | Cortex-A76(4コア)+Cortex-A55(4コア) | Cortex-A76(4コア)+Cortex-A55(4コア) | Cortex-A75(4コア)+Cortex-A55(4コア) | Cortex-A73?(4コア)+Cortex-A53?(4コア) |
LLC | 14MB | 10MB | 10MB | 2MB? | ? |
GPUブランド名 | 新Adreno | Adreno 680 | Adreno 680 | Adreno 630 | Adreno 540 |
メモリバス幅 | 8x16bit | 8x16bit | 8x16bit | 4x16bit | 4x16bit |
メモリ種類/データレート | LPDDR4x/2,133MHz | LPDDR4x/2,133MHz | LPDDR4x/2,133MHz | LPDDR4x/1,866MHz | LPDDR4x/1,866MHz |
理論帯域幅 | 約68.3GB/秒 | 約68.3GB/秒 | 約68.3GB/秒 | 約29.9GB/秒 | 約29.9GB/秒 |
DSP | 新Hexagon | Hexagon 690 | Hexagon 690 | Hexagon 685 | Hexagon 682 |
ISP | 新Spectra | Spectra 390 | Spectra 390 | Spectra 280 | Spectra 180 |
モデム | X65/X62/X55(5G) | X24(CAT20, 2Gbps)/X55 5G(別チップ) | X24(CAT20, 2Gbps) | X20(CAT18, 1.2Gbps) | X16(CAT16, 1Gbps) |
PCI Expressコントローラ | 対応(Gen3?) | Gen3 | Gen3 | - | - |
製造プロセスルール | 5nm(Samsung) | 7nm(Samsung) | 7nm(Samsung) | 10nm | 10nm |
そうしたSnapdragon 8cx、Snapdragon 8cx Gen 2の後継となるSnapdragon 8cx Gen 3だが、発表概要では具体的なCPUの構成などは明らかになっていなかった。その後のQualcommへの取材で、2種類のコア(高性能コアと高効率コア)のそれぞれのCPUに関して判明した。
Qualcomm 副社長 兼 製品担当上席部長 ミゲル・ヌネス氏は「高性能コアにはCortex-X1を採用している。なぜX2ではないのかと言えば、今回の製品ではX1を4コアという構成にしたからだ。性能や消費電力とのバランスを考えた結果、X1の方が良いと判断した。今回の製品はあくまでメインストリーム向けの製品であり、競合他社の製品で言えばCore i5に匹敵するような製品だと考えてほしい」と述べ、高性能コアにはCortex-X1を採用し、それを4コアとすることで性能を強化していると説明した。
通常、特にハイエンド向けのスマートフォンSoCでは、Cortex-Xシリーズを1コア、Cortex-Aの高性能コア向けを3コア、Cortex-Aの高効率コアを4コアという構成にすることが多い。Snapdragon 8 Gen 1がまさにそうで、Cortex-X2が1コア、Cortex-A710が3コア、Cortex-A510が4コアという構成になっている。それに対してSnapdragon 8cx Gen 3では1世代前ではあるが超高性能コアであるCortex-X1(最大3GHz)を4コアとなっているので、おそらくマルチスレッド時の性能はCortex-X2が1コアのSnapdragon 8 Gen 1より高くなるだろう。
さらに面白いのは高効率コアだ。常識的に考えれば、高効率コアはCortex-A510やCortex-A55などのArmが高効率コアとして用意しているIPデザインを採用するのが一般的だ。しかし、ヌネス氏によれば「高効率コアにはCortex-A78を4コア構成にしている。本来は高効率コアに採用するものだが、性能を重視してそうした設計にしている」とのことで、Cortex-A78(Snapdragon 888に採用されていた高性能コア、最大2.4GHz)を高効率コアとして採用しているというのだ。
確かにそれだと、アイドル時の消費電力は若干上がることになると考えられるが、それでも性能面でのメリットは見逃せない。特に最近のArmプロセッサは、高性能コアと高効率コアを同時にオンにすることで性能を稼いでいる分が少なくないので、マルチスレッド時の性能は大きく高まる。実際、Qualcommが公表した数字ではマルチスレッド時には85%も高まると説明しており、そのことを裏付けている。
また、シングルスレッド時の性能も40%向上すると説明している。シングルスレッドの性能を向上させるにはCPUのアーキテクチャのモダン化と同時に、メモリレイテンシを大きく削減する必要がある。今回のSnapdragon 8cx Gen 3では、前世代のCortex-A76から大きく性能を引き上げているCortex-X1に変更したこと、さらにはL3キャッシュが14MBと従来世代の10MBから40%も大きく増やすことで、メモリレイテンシが削減され、シングルスレッド性能を引き上げる要因になっていると考えることができる。
GPUの詳細は不明だが60%性能が向上するとQualcommは主張、AIエンジンは29TOPsに
今回QualcommはCPUに関してはある程度の情報を開示したが、GPU、DSP、ISPなどに関してあまり詳細を明らかにしなかった。いずれも判を押したように「新しいアーキテクチャになっている」と説明するだけで、具体的に何をどのように新しくしたのかなどに関して説明しなかった。
しかも、今回の世代から、CPU、GPU、DSP、ISPに関して3桁の数字を利用したマーケティングネームを廃止してしまったため、例えばスマートフォン向けのSnapdragon 8 Gen 1に採用されているGPUと、PC用のSnapdragon 8cx Gen 3に採用されているGPU、どちらの方が新しいのか、あるいは、同じなのかなどに関してもわからなくなってしまった。
Snapdragon 8cx Gen 3に採用されているGPUは、新アーキテクチャになっていることと、APIとして少なくともDirectX 12に対応していること以外は何もわからない。ただ、性能の上がり幅に関しては公開されており、従来製品(Snapdragon 8cx Gen 2)と比較して60%向上しているとQualcommは説明している。
DSPやISPに関しても状況は同じなのだが、DSPに関してはある程度推測はできそうだ。というのも、DSPを含むAIエンジンの性能は明らかにされているからだ。Qualcommでは、AI推論の処理をCPU/GPU/DSPをソフトウェア的に異種混合で使うAIエンジンの仕組みが導入されている。この仕組みでAI推論を行なった時の性能は29TOPs(Tera Operations Per Second)と明らかにされている。
この性能は、昨年発表され今年のハイエンドスマホ用であるSnapdragon 888の26TOPsに近いものとなっている。その性能の多くがDSP由来で、CPU/GPUの性能向上分が3TOPS分ぐらいだと考えれば、Snapdragon 888のDSPであるHexagon 780と同等ないしはそれに近いものなのかもしれない。
なお、Snapdragon 888とSnapdragon 8 Gen 1のDSPの違いは、Tensorアクセラレータの性能が倍になっていることと、ローカルメモリの容量が倍になっていることなので、もう少し性能が上がっていると考えられるので、案外とそのあたりの線かもしれない(ここは完全に推測にすぎない)。
いずれにせよ、Qualcommに苦言として申しあげたいのは、CPUやGPU、DSPの3桁のマーケティングネームをなくすのはいいが、それならそれで技術的にどこが違っているのか、どう強化しているのか、それを客観的に評価できる情報をきちんと公開してほしいと思う。Intelにせよ、AMDにせよ、そうした情報公開をきちんと行なっており、ITの担当者やプロシューマなどがCPUの性能などを判断するときに参照できるようにしている。Snapdragon 8cx Gen 3をPC用と位置づけるのであれば、ぜひともPC用プロセッサ業界のやり方を見習っていただきたいものだ。
Snapdragon 8cx Gen 3の性能はCore i5に相当
今回Qualcommは具体的なベンチマークスコアなどは公開せず、なんとなく「競合のx86プロセッサよりも高速」という曖昧なグラフしか公開しなかったので、具体的にどんな性能を持っているのかなどに関してはわからない。ただし、Qualcommのヌネス氏は「この製品はあくまでPCのメインストリームをターゲットにした製品だ。競合の製品で言えばCore i5に匹敵するような製品だと思っていただきたい。Core i7やM1をターゲットにしたような製品は、11月に弊社のCEOが言及したロードマップ上にある製品となる」と説明しており、あくまでミッドレンジ向けの製品であり、ハイエンド向けではないというのがQualcommの説明だ。
今回のQualcommの発表では、前世代(Snapdragon 8cx Gen 2)に比較してCPUのマルチスレッド性能は85%、シングルスレッドは40%、GPUの性能は60%向上というプロセッサ単位での性能向上の上がり幅はわかっている。そこで、現行製品のベンチマークスコアを利用してそれを推定してみようと思う。
Snapdragon 8cx Gen 2そのものは用意できなかったが、その高クロック版であるMicrosoft SQ2を搭載したSurface Pro X(2020年版)を用意したので、その性能を元にどんな性能を持っているのか考えていきたい。比較対象として用意したのは、IntelのCore i7-1185G7を搭載したシステム(MSI Prestige 14Evo A11M)と、Apple M1を搭載したシステム(13.3インチMacBook Pro)の2つだ。
テストに関してはCinebench R23、CrossMark、GFXbench 5の3つのテストだ。CrossMarkとGFXBench 5.0は、いずれもx64版Windows 11、Arm版Windows 11、Arm版macOS Montereyにそれぞれ有効に対応しており、それぞれのプラットホームで公平に性能を比較できると考えて採用した。
なお、Cinebench R23に関してはx64版とmacOS版(Arm、x86)しかないため、Arm版Windows 11が動作しているSurface Pro Xでは、Arm→x64への変換が入って動作することになる。そのため、その分は割り引いて考える必要がある。テスト環境は表2の通りだ。
Core i7-1185G7(MSI Prestige 14Evo A11M) | Microsoft SQ2(Surface Pro X) | Apple M1(13.3インチMacBook Pro) | |
---|---|---|---|
SoC(CPU+GPU) | Core i7-1185G7 | Microsoft SQ2 | Apple M1 |
メモリー | 16GB | 16GB | 16GB |
ストレージ | 512GB(PCIe Gen 4) | 256GB(NVMe) | 256GB(NVMe) |
OS | Windows 11 Pro | Windows 11 Pro | macOS Monterey |
Cinebench R23は、CPUに負荷をかけてその処理能力を測るタイプのベンチマークプログラム。このため、CPU単体(およびメモリレイテンシと帯域)の性能を推測するのに適している。ただし、既に述べたとおり、Cinebench R23はx64(AMD64/Intel64)版のWindowsとx64版とM1版のmacOSにしか対応していないため、Arm版WindowsではWindows 11の新機能であるArm→x64へのバイナリトランスレーション機能を利用して動作する。したがってその分のロスはある程度考慮する必要がある。
見てわかるように、Microsoft SQ2はシングルスレッドが457、マルチスレッドが2026と、シングルスレッドもマルチスレッドも他の2つに比べて3分の1になっている。仮にQualcommが主張する通りシングルスレッドで40%、マルチスレッドで85%の性能向上があったと仮定すると、それぞれ520.98、3748.1となる。依然としてシングルスレッドは低いが、マルチスレッドに関してはそれなりの数字だ。Core i7-1165G7が4,000台の中盤ぐらいなので、Core i5に近い性能になるというのは十分想定できる。
そして仮にCinebenchにArm版Windows用のネイティブバイナリがでればその分の改善もあると考えられるので、確かに結構追いつけるのではないだろうか(Snapdragon 8cx Gen 3を搭載したPCが出荷される頃には、IntelからノートPC向けの次世代製品が出ているだろうということは置いておくとして)。
BAPCoのCorssMarkは、プラットホームを問わずベンチマークを用意しており、Arm版Windowsのバイナリも用意されており、3つのプラットホーム(Arm版Windows、x64版Windows、M1版macOS)を比較的公平に比較することができる。オフィスアプリでの性能を見る「Productivity」、コンテンツ作成アプリでの性能を見る「Creativity」、応答速度を見る「Responsiveness」の3つの詳細テストが用意されており、それらの合計で総合スコア(Overall)を決定する。
ネイティブのテストなのだが、Microsoft SQ2のスコアは第11世代Coreにも、M1にも大きく及ばないというスコアになっている。ほとんどのテストはマルチスレッドだと考えられるので、それが85%増しになったと仮定すると、Overallは808.45、Productivityは802.9、Creativityは900.95、Responsivenessは634.55になる。やはり大きく向上することは間違いないが、やはり第11世代のCore i7やM1に追い付くほどではないことがわかる。
GFXBenchはGPUの性能を測るテストで、こちらもクロスプラットホームでバイナリが用意されており、Arm版Windows用のネイティブ版が用意されている。Windows側のAPIはDirectX11をAPIにして計測した。
M1のGPUの優秀さがよくわかる結果だが、GPUに関してはMicrosoft SQ2も結構頑張っている(ただし、1080p Aztec Ruins/Normal Teirはエラーになってしまいスコアはなかった)。QualcommはGPUの上がり幅を40%と説明しているので、「1440p Aztec Ruins(High Teir) Offscreen(Metal/DirectX11)/fps」は40.59104fps、「1080p Manhattan 3.1.1 Offscreen(Metal/DirectX11)/fps」は210.2688fpsという計算になる。
GPUに関しては、Intelの第11世代Coreに追い付ける可能性があるし、第12世代CoreのGPUは第11世代から据え置きであることも既に明らかになっているので、第12世代のCoreプロセッサとも良い勝負になる可能性があると言えるだろう。
将来のロードマップにある次世代製品は、他社のハイエンドに匹敵するとQualcommはアピール
こうして見て行くと、Snapdragon 8cx Gen 3はCPUに関してはもうひと頑張りというところだが、GPUに関しては十分競争力がある性能を発揮する可能性があると言える。特に第12世代Coreでは内蔵GPU(Xe Graphics)は第11世代から据え置きで、性能向上分はメモリの帯域幅が増える分だけと考えることができるので、そちらに関しては追いつける可能性があると言える。
その意味でも、Qualcommの本命は、11月のアナリスト向けの説明会で同社のCEOであるクリスチアーノ・アーモン氏が表明した、M1に対抗できるような将来投入されるPC向けのArmプロセッサということになるだろう。それはこのSnapdragon 8cx Gen 3ではなく、将来リリースされる製品になるのだ。
それがどんな製品であるかは、今はわからないが、1つだけ言えることは、来年(2022年)のSnapdragon Tech Summitで発表される製品がそれになる可能性は高いことだ。そしてそれは2023年に発売されるPCに搭載されることになる。その時には、AppleはM1の後継製品を発表しているだろうし、IntelもMeteor Lakeのリリースに近づいているだろう。
その意味では、Qualcommが来年のSnapdragon Tech Summitで発表するPC用のArmプロセッサが、そうしたM1の次世代製品や、Intel、AMDの次次世代製品と肩を並べるモノであるのかが、QualcommがPCビジネスでそれらの会社の真の競合となる上で重要になってくるのではないだろうか。