笠原一輝のユビキタス情報局

Qualcommの新しいプレミアムスマホ向けSnapdragon 865の特徴と性能に迫る

Snapdragon 865

 先週、Qualcommは同社の年次イベント「Qualcomm Tech Summit 2019」をアメリカ合衆国ハワイ州マウイ島において行なった。

 Qualcomm Tech Summitでは例年翌年のプレミアムセグメント向けスマートフォン用SoCと、新しいPC向けのSoCも発表される。今年(2019年)も例外ではなく、スマートフォン向けにはプレミアム向けのSnapdragon 865、ミッドレンジ向けのSnapdragon 765/765Gという3つの製品が、そしてPC市場向けにはメインストリーム市場向けのSnapdragon 8cとSnapdragon 7cの2つの製品が発表されている。

 本記事ではそうしたSnapdragonの新しい製品の特徴、そして技術的な詳細などについての解説と、現地で行なうことができたデバイスのベンチマークの結果からSnapdragon 865の性能について迫っていきたい。

モデムチップが外付けになっているSnapdragon 865と内蔵されているSnapdragon 765/765Gの違い

Snapdragon 865はマルチモード5GモデムのSnapdragon X55 5G modemを外付けする構造になっている

 今回スマートフォン向けに発表されたSnapdragon 865、Snapdragon 765/765GでQualcommはそれぞれ設計を変えてきている。その大きな要因は2つある。1つは5Gモデムの実装であり、もう1つがそれぞれの製造に利用するプロセスルールだ。

 5Gモデムの実装に関してだが、Snapdragon 865では、同社が今年の2月にMWC 19で発表したマルチモード5Gモデム(4G以前の互換性を実現した5Gモデム)をシングルチップで実現しているSnapdragon X55 5G modemとの組み合わせで5Gに対応。これに対してSnapdragon 765/765GではSnapdragon X52 5G modemというマルチモード5Gモデムがダイに統合されている。

 スマートフォンをデザインする観点から言えば、モデムもダイに統合されているほうがデザインとしては楽だ。基板に2つのチップを載せると、追加されたチップ分だけ実装面積が必要になるし、配線も必要になり、それなりの実装面積を必要とする。

 ともすればSnapdragon 865でも5Gモデムをダイに統合すれば良いんじゃないと思うところだが、Qualcomm Technologies 上席副社長 兼 モバイル事業本部 事業本部長 アレックス・カトージアン氏は「Snapdragon 865にモデムを実装していないのは性能の問題だ。仮にモデムを統合するとなると、製造上の課題からCPUやGPUのクロック周波数を我々の期待しているとおりには上げることができない。そしてモデム側の性能も妥協が必要になる。であれば、プレミアム市場向けという製品の性格上、2つのチップに分けるのが正解だと考えた」と説明した。

 実際、Snapdragon 765/765Gに内蔵されているSnapdragon X52 5G modemは、Snapdragon X55 5G modemに比べて速度が約半分(X55が下り7.5Gbpsであるのに対して、X52は下り3.5Gbps)になってしまっている。CMOSの製造の特性上、CPUやGPUのような論理回路とモデムのような通信回路を混載して製造する場合にはある程度の妥協が必要になる。

 4Gの世代でも、最初の数世代は別に製造され、ある程度こなれてきたところでSoCに統合されて製造されるようになっていることを考えると、Qualcommがプレミアム向けの865では別チップとしてきたのは納得だ。それに対して765は普及価格帯の役割を担うので、性能を妥協しても5Gを低価格で提供したいというのがQualcommの狙いだ。

865はTSMCのN7P、765はSamsungの7nm EUVと別れた製造プロセスルール

 同じことは製造プロセスルールにも言える。今回QualcommはSnapdragon 865はTSMC、Snapdragon 765はSamsung Electronicsと製造に利用するファウンダリを分けた。これについてカトージアン氏は「これはビジネス的な決断だ。我々はTSMC、Samsung両社とよい関係にあり、10nmの世代ではSamsungを利用してきた。とくに765ではボリュームが必要だと考え、Samsungの7nm EUVを採用した。性能、歩留まりとも満足している」と述べた。

 要するに、TSMCの7nmだけでは十分な製造のキャパシティを確保することが難しかったということだろう。実際、TSMCの7nmのラインは、すでに予約で一杯で今から注文を入れても大分先にならないと製造がされないと業界の関係者は説明する。そういう状況であれば、十分な数を確保するために、プレミアム向けの製品はTSMCで、ボリュームが必要なミドルレンジ向けはSamsungにと分けてきたQualcommの戦略は妥当だ。

 なお、今回QualcommがSnapdragon 865の製造に利用しているTSMCの「N7P」は、TSMCの7nmでもより進んだプロセスルールで、前世代のSnapdragon 855の製造に利用されていた「N7」(エヌセブン)よりもやや進んだプロセスノードになる。N7とN7Pではプロセスノードの進化による性能的なメリットは「1桁台の低いほうの数字」ぐらいしかないそうで、Snapdragon 865の性能向上の理由のほとんどはアーキテクチャ側にある。

 余談になるが、発表の時点では明らかにされていなかったPC用のSnapdragon 8cとSnapdragon 7cのファウンダリだが、前者はTSMCの7nm(7N)、後者はSamsung Electronicsの8nmとなることが、その後の取材で明らかにされた。

CPUも、GPUの内部アーキテクチャに手が入っており、それぞれ25%の性能向上

Snapdragon 865のCPUとなるKryo 585

 今回のSnapdragon 865の強化点を見ると、CPUに関しては正常進化だ。Kryo 585と名付けられたCPUは、前世代のSnapdragon 855に採用されていたKryo 485と比較すると、big.LITTLEのbig側のCPUコアが、Cortex-A76からCortex-A77に進化していることが大きな強化点になる(LITTLE側は同じA55に据え置き)。A77はA76に比べてマイクロアーキテクチャの拡張によりIPC(Instruction Per Clock-cycle、1クロックあたりに実行できる命令数のこと、数字が高ければ高いほどCPUの性能は高くなる)が改善されている。また、L3キャッシュが4MBと前世代に比べて2倍になっている。

 ただし、同じTSMCの7nm世代で製造されているということもあり、クロック周波数はほぼ同じレンジにとどまっており、その意味ではIPCとキャッシュ容量の増加だけが強化点と言え、QualcommによればCPUは平均して約25%の性能向上と説明している。

Adreno 650、詳細は明らかにされていないがQualcommの関係者によればシェーダーユニットが1.5倍になっているという

 GPUに関してはAdreno 650となる。前世代のAdreno 640との差は公式には公開されていないが、Qualcommの関係者によれば、GPUのシェーダーユニットはおおむね50%増しになっているという。これにより、ダイ全体におけるGPUの割合は前世代よりも増えており、それがGPUの性能向上の大きな理由の1つだと言える。

メモリがLPDDR5に対応

 また、メモリがLPDDR5対応となったことで、メモリのデータレートは従来の2,133MHzから2,750MHzに引き上げられている。メモリのバス幅が公式なスペックには書かれていないため、帯域は不明なのだが、従来と同じ4x16ビットだとすれば従来比約1.3倍の約44GB/sという計算になる。GPUの場合には、メインメモリの帯域幅が性能に大きな影響を与えるので、これらも含めてGPUの性能が上がっていると考えることができる。QualcommではGPUの性能は平均して約25%だと説明している。

CPU+GPU+DSPの組み合わせてエッジ推論を実現するQualcommのソリューション

Snapdragon 865のエッジ推論時の理論性能は15TOPSと、Snapdragon 855の7TOPSから約倍の性能を実現している

 そしてもっとも重要なことは、Qualcommはこの世代でもAI、具体的には深層学習のエッジ推論の強化に力を入れていることだ。既報のとおり、Snapdragon 865はエッジ推論の処理能力として15TOPSを実現しているとQualcommは説明しており、競合他社に比べてアプリケーションレベルのベンチマークでも性能を上回るとしている。

 その秘密は2つある。1つはSnapdragon 865に内蔵されているDSP「Hexagon 698」に新しい第2世代のTensorアクセラレータを内蔵していることだ。エッジ推論ではTensor演算が多く行なわれるため、それを専用に行なうTensorアクセラレータを利用すると、処理能力が大きく向上する。

強化された第2世代のTensorアクセラレータを搭載

 QualcommはこのTensorアクセラレータを、専用のアクセラレータとして搭載するのではなく、QualcommがOEMメーカーなどに配布しているランタイムとなる「Qualcomm Neural Processing SDK」で抽象化し、CPU、GPU、そしてDSPを1つのプロセッサとしてアプリケーションから利用できるようにしている。その上で、TensorFlowやPyTorchといった一般的なAIソフトウェア開発のフレームワークを利用して開発されたアプリケーションが動くようになっている。

 この仕組みが優れているのは、CPU/GPU/DSPの世代にかかわらず、アプリケーションから見れば1つのQualcomm Neural Processing SDKのランタイムがあるように見えるので、SoCの世代が新しくなってもアプリケーションはそのまま利用でき、開発者にとっては開発の手間が少なくて済む。

Android NNやTensorFlow Liteなどのランタイムが利用可能になっている。これにより対応アプリはどんどん増えている

 Qualcommは自社のランタイムだけでなく、昨年から「Tensor Flow Lite」、「Android Neural Networks API」というAndroid OS環境で一般的に使われているランタイムからもCPU/GPU/DSPを混合利用できるようにしており、これにより対応アプリは大きく増えているとQualcommは説明している。

Sensing Hub

 また、Snapdragon 865ではSensing Hubというブロックが用意されており、SoC全体がディープスリープに入っている時でも特定の音声をトリガーにして、SoC全体を通常のモードへと起こすことが可能になっている。たとえば、「Alexa」や「Google」などをキーワードにしておけば、スマートフォンのOSがディープスリープモードに入っていてバッテリーをわずかしか消費しないモードに入っていても、ユーザーが音声認識のトリガーをしゃべった時だけ通常モードに戻るという使い方が可能になる。

ベンチマーク結果ではCPU、GPUともに25%というQualcommの主張を裏付けている

Snapdragon 865のQRDデバイス

 こうしたSnapdragon 865だが、実際に現地ではベンチマークテストを行なうことが可能になっていた。提供されたのはSnapdragon 865を搭載したQRD(Qualcomm Reference Design」と呼ばれるリファレンスデザインのデバイスだ。

テスト用なので裏面にはアンテナ用の穴などがあいている

 ベンチマークのデバイス表示の機能を利用して確認したところ、CPUには「KONA」(コナ)と表示されており、これがSnapdragon 865の開発コードネームになる。Snapdragon 865のキャッシュ構造は512KBのL2を持つCPUコアが1つ、256KBのL2を持つコアが3つ、そして128KBのL2を持つコアが4つとなっていた。このL2の構成はSnapdragon 855のKryo 485と同等で、プライムコアと呼ばれる1つのCPUコアだけが大容量のL2キャッシュを備えており、高いクロックで動くという点は同等だ。

 Qualcommがこうしたデザインを採用しているのは、CPUコアを無駄に肥大化させることなく、1つのCPUコアだけ大容量キャッシュ、高クロックで動かすことでシングルコア時の性能を引き上げることを狙ったものだ。なお、L3キャッシュに関しては4MBと、Snapdragon 855から倍になっている。

AnTuTuの表示。CPUのコードネームである「KONA」がCPU名として表示されている。LITTLE側のCPUがCortex-A76と表示されているのはベンチマーク側のデータベースの間違いで、正しくはCortex-A55

 今回はSnapdragon 865の性能をQRDデバイスで確認した。比較対象としては日本で販売されているAndroidスマートフォンのプレミアム向け製品の大多数に搭載されているSnapdragon 855を搭載した、Samsung ElectronicsのGalaxy Note10+(NTTドコモSC-01M)を利用した(フライアウェイの取材だったため、手持ちの私物を応用)。

 利用したベンチマークに関してはいずれもGoogle PlayストアからダウンロードできるAnTuTu、AITuTu、GFXBench、GeekBench 5(CPU RUN)を利用しており、読者の手持ちのデバイスとの比較も可能なので参考にして欲しい。

【表】ベンチマーク結果
Snapdragon 865Snapdragon 855855比
AnTuTu
総合544231462262117.73%
CPU181777137075132.61%
GPU217836171919126.71%
MEM797478189097.38%
UX648717173890.43%
AITuTu
総合470314242351194.06%
Image Classification265620146074181.84%
Object Detection20469496277212.61%
GFXBench
Manhattan OffScreen(ES3.0 1080)127101125.74%
Manhattan OffScreen(ES3.1 1080)8871123.94%
GeekBench 5 CPU
Single-Core Score924745124.03%
Multi-Core Score34172561133.42%

 結論から言えば、確かにSnapdragon 865はCPUが前世代(Snapdragon 855)から25%、GPUが25%というQualcommの主張は間違っていないということがベンチマークから裏付けられている。CPU関連のテストではAnTuTuのCPUが約33%アップ、GeekBench 5のCPUのシングルスレッドが約24%アップ、マルチスレッドが約33%アップという結果で、CPU性能が25%という主張はどちらかと言えば控えめな主張であると言えるだろう。

 GPUも同様でAnTuTuのGPUが約27%アップ、GFXBenchのマンハッタンがES3.0のテストで約26%、ES3.1のテストで約24%のアップとなっており、おおむね25%の性能向上というのは妥当な主張と言える。

 ただ、AnTuTuのメモリ関連のテストでは性能が低下していることは見て取れた。これはメモリがLPDDR5になっていることの影響だと考えられる。LPDDR5ではデータレートはLPDDR4よりも上がっているが、その反面レイテンシは低下している。こうしたメモリ関連のテストではそれが影響している可能性が高い。ただし、データレートが向上することでメモリの帯域が上昇しており、それがGPUの性能向上につながっているので、そこはトレードオフと考えることができるだろう。

別のAIベンチマークをやっているところ、左が855、右が865

 その一方AIのベンチマークとなるAITuTuでは物体認識のテスト(Object Detection)で性能が倍以上になるなど大きく性能が向上していることが見て取れる。こちらもSnapdragon 855に比べて2倍という性能を実現していることが確認できた。

 このように、Snapdragon 865はQualcommが主張するようにCPU、GPUともに前世代に比べて25%の性能向上というのはベンチマークの数字で確認できたほか、AIの性能に関しては倍以上になるなど大きく向上していることが確認できた。繰り返しになるが、今回の世代ではプロセスルールが進化したことの恩恵はほとんどない(同じ7nm世代での進化)ことを考えれば、内部アーキテクチャの見直しだけでこれだけの性能向上を実現できたことは賞賛されていいのではないだろうか。