トピック

Architecture Dayに見た、Intelの底力と変貌【Tiger Lake編】

~XPUという視点から見えてくる次世代CPUの真の姿

Intelが公開したTiger Lakeのダイアグラム(出典:Architecture Day 2020 Presentation Slides、Intel)

 Intelは「Architecture Day 2020」と呼ばれる報道関係者向けのイベントを8月13日(現地時間)に開催。そのなかで「6つの柱」(6ピラー)と呼ばれる戦略を加速していくことを明らかにした。

 その6つの柱とは、製造技術・パッケージング技術、XPU、メモリ、インターコネクト、セキュリティ、ソフトウェア。前回の記事「製造技術編」では製造プロセスルールやパッケージングなど、半導体製品を製造するうえで利用される製造技術について説明したが、今回の記事ではXPUと総称される、CPU、GPU、NPU、VPUなどのプロセッサに焦点を当てる。

XPUというプロセッサ開発戦略は初代Coreが登場した2010年からはじまっていた

 Intelは、2019年にノートパソコン向けに投入した10nmプロセスルールの第10世代Coreプロセッサー(開発コードネーム:Ice Lake)において、新しいCPU、GPU、NPUを導入している。

 昔のCPUは文字どおりCPU(Central Processing Unit)しか内蔵していなかった。CPUは、OSやアプリケーションを起動したり、Officeアプリケーションの処理をしたりといった汎用的な処理を行なう。

 2010年の初代Coreプロセッサー(開発コード名:Clarkdale/Arrandale)からは、GPU(Graphics Processing Unit)がCPUに統合されている。初代Coreはパッケージ上での統合だったが、第2世代Core(開発コードネーム:Sandy Bridge)以降からは、CPUとGPUが1つのダイに統合されている。

 これにより、追加コストと追加電力が必要になる外づけGPUがなくても、グラフィックス処理や、GPUの強みであるベクトル演算と呼ばれる大量のデータを並列処理する演算も、1チップでできるようになった。

 そして、近年注目を集めているのが、NPU(Neural Processing Unit)と呼ばれるAI処理を専門に行なう演算装置。NPUはマシンラーニング/ディープラーニングベースの推論をハードウェアアクセラレーションし、CPU負荷を低減しながらAI処理が行なえるようになった。

 現在のパソコンでは、こうした複数の種類の演算装置を、異種混合(英語ではヘテロジニアスと呼ぶ)にして利用することが一般的だ。パソコンのアプリケーションも、スカラー演算であればCPUを利用し、ベクトル演算であればCPUとGPUの両方を利用する。さらにAIの処理をする必要があれば、CPU、GPU、NPUのすべてを利用する。そうした異種混合の演算装置を示す言葉がXPUなのだ。

XPUにより本格的な異種混合型プロセッサとなった第10世代CoreプロセッサーことIce Lake

Intelが2019年に投入した第10世代Coreプロセッサー(Ice Lake)

 そうしたXPUの概念を取り入れた最新CPUとしてIntelが昨年投入したのが、開発コードネームIce Lakeで知られる第10世代Coreプロセッサーだ。

 IntelはIce Lake世代からプロセッサ開発の手法を大きく変えている。従来は製造技術とCPUの世代が密接に絡み合っており、ある特定の製造技術の世代に向けて、CPU/GPUの設計を実装していく。そうした手法だったため、CPUやGPUを、ほかの世代の製造技術で製造したり、Intel以外の工場で生産したりという柔軟な製品展開は難しかった。

 しかし、Ice Lake世代の開発からは製造プロセスルールが切り離され、CPUやGPUは半導体の設計図と言えるIP(知的所有権)としてデザインされ、それを1つのチップに落とし込んでいく設計手法に転換した。

 2.5Dのパッケージング技術であるEMIB、3Dのパッケージング技術であるFoverosなどを利用する場合には、1チップである必要もなく、複数のチップを1パッケージ内に封入していく手法も利用可能であるため、こうした製造技術とIPが独立している設計手法が有効なのだ。

Intelが2018年のArchitecture Dayで公開したCPUコアロードマップ(出典:2018 Architecture Day Architecture Directions、Intel)

 Ice Lakeに採用されたCPUコアデザインのSunny Cove(サニーコーブ)はそうしたIPデザインベースの最初の事例となる。Sunny Coveを採用したIce Lakeは、4コアと従来と変わらないものの、将来、さらに多いコア数に対応できるような設計になっている。ほかにも、AVX512の拡張命令としてVNNI(Vector Neural Network Instructions)に対応しており、AIの推論を行なう場合に32bit浮動小数点(FP32)を8bit整数(INT8)に置き換えて演算可能になり、高い処理能力を実現できる。

 GPUも大幅に更新されており、名前こそGen 11(第11世代)と、既存のIntel Graphicsの延長線上にある設計となっているが、従来は24基だったEU(実行ユニット)が64基と大幅に増やされて、3Dグラフィックスの描画性能が大きく引き上げられている。このGen 11 GPUでは、フルHDであれば、ゲームで十分なフレームレートを確保できるという。

 そしてIce LakeではNPUとして「GNA」(Gaussian & Neural Accelerator)が搭載された。GNAは継続してCPUを利用して演算するタイプの推論を、CPUからオフロードするAIアクセラレータとなる。オーディオのノイズ抑制などに効果てきめんで、GNAを利用したアプリケーションはすでに登場しつつある(CPUだけでもリアルタイムノイズ除去できるBabbleLabsの「Clear Edge」参照)。

 このように、2019年に登場したIce Lakeは、本格的なXPUになっている。

各プロセッサの各部をさらに強化したTiger Lake

2020年年頭のCES 2020の記者会見でTiger Lakeのパッケージ(左)と搭載システムボード(右)を公開するIntel上級副社長兼クライアントコンピューティング事業本部長のグレゴリー・ブライアント氏

 搭載製品が今年の年末商戦までに登場する予定の次期Tiger Lakeは、そうした「本格的な異種混合型プロセッサ」という路線をさらに推し進める製品となる。

CPUコアのWillow Cove(出典:Architecture Day 2020 Presentation Slides、Intel)

 CPUのIPデザインは、Sunny Coveの延長線上にあるWillow Cove(ウィローコーブ)へと進化する。Willow Coveではキャッシュ階層が大幅に見直される。

 Sunny Coveでは、L1データキャッシュが32KBから48KBに、L2キャッシュが256KBから512KBへと増やされていた。Willow Coveでは、L2キャッシュが512KBから1.25MBへと、さらに増やされている。

Tiger Lakeの概要(出典:Architecture Day 2020 Presentation Slides、Intel)

 また、プロセッサ全体で利用できるLLC(Last Level Cache)もIce Lake世代の8MBから12MB、モデルによっては24MBまで大幅に増量されている。メモリコントローラの強化もされており、Ice Lakeのメモリコントローラは、DDR4ないしはLPDDR4までの対応だったのに対して、最初の製品では対応しないものの、アーキテクチャとしてはLPDDR5という次世代の低消費電力メモリにも対応している。これによりメモリレイテンシの削減と、メモリ帯域幅の増加が期待でき、シングルスレッド時の性能の引き上げや、メモリ帯域に性能が依存するGPU性能の引き上げを期待できる。

 GPUは、Intelが新GPUアーキテクチャとして開発したXe(エックスイー)の低消費電力版となるXe-LPが搭載。Xeは、内蔵するEU(実行ユニット)の数などを増減することで、HPC(High Performance Computing)からノートパソコンまで幅広いレンジをカバーするGPUとして設計されている。

 その最初の製品がXe-LPで、EUを96基内蔵したGPUとなる。アーキテクチャの仕組みが異なるため、単純に数では比較できないが、Ice LakeのGen 11ではEUが64基だったので、演算するリソースは約1.5倍に増えている。じっさい、Architecture Dayのデモでは、Ice Lakeではできなかった詳細な描画できるようになったことが示されている(Intel、ゲーミング向けXeとなるXe-HPGの存在を明らかに参照)。

 GNAもIce Lakeに搭載されているGNA 1.0からGNA 2.0に強化されている。これにより同じ処理で、CPU負荷が20%低減する。

Tiger Lakeのパッケージ

2021年にはCove系コアとAtom系コア両方を搭載したAlder Lakeが登場

2021年にはハイブリッドCPUの技術を性能方向に使ったAlder Lakeが投入される計画

 さらにその先にはAlder Lake(アルダーレイク)の開発コードネームで知られる2021年に投入される次次世代製品も控えている。Alder LakeではSunny Cove/Willow Coveの特徴を受け継ぐ「Golden Cove」のCPUコアと、Atom系コアの特徴を受け継いでいる「Gracemont」という2つのCPUコアが1つのダイに統合される。

 この異種CPU混合は「第10世代Coreプロセッサー with Hybird Technology」(Lakefield)でも使われた手法。Lakefieldではそれが省電力の方向に使われたが、Alder Lakeでは性能向上に用いられる。

 Lakefieldでは、コアは状況によってどちらかに切り替えられるのに対し、Alder Lakeでは全コアが同時利用できるようになり、CPU性能を大幅に引き上げながら、スタンバイ電力などは大幅にカットできる。これにより、省電力が必要なノートパソコンだけでなく、より高性能が必要なデスクトップパソコンもカバーできるようになる。