ニュース

Intel、次期CPU「Alder Lake」に搭載される新コアの詳細を発表

Intelが発表した高効率CPUコア「Gracemont」(出典:Intel Architecture Day 2021)

 Intelは、「Intel Architecture Day 2021」と題したオンラインイベントを開催、クライアント向け次世代SoCとなる「Alder Lake」(アルダーレイク、開発コードネーム)や、データセンター向け次世代Xeon SPとなる「Sapphire Rapids」(サイファイアラピッズ、開発コードネーム)、2022年に投入する計画のゲーミング向けGPU「Intel Arc」などの詳細を発表した。

 Alder LakeのCPUは高効率と高性能の2種類のCPUコアが用意されており、アプリケーションによって切り替えることで、高性能と低消費電力の両方を実現する仕組みになっている。電力効率が高い「高効率コア」がGracemont、性能が高い「高性能コア」が「Golden Cove」となる。本稿ではこれらの新コアについて解説する。

Skylakeと比較して40%高性能な「Gracemont」

昨年のIntel Architecture Dayで示されたCPUアーキテクチャのロードマップ。今回発表されたのが高効率コアのGracemontと、高性能コアのGolden Cove

 Gracemontは、Intelが省電力設計と位置づける「mont」(モント)系のCPUコア設計の流れを組む製品だ。従来こうしたmontがつくCPUコアは、Atom系のプロセッサに採用されてきた。

 その位置付けが大きく変わったのは、Intelが2020年に市場投入した「Intel Core processors with Intel Hybrid Technology」(開発コードネーム:Lakefield)からだ。Core系の高性能CPUが1コア、Tremont(開発コードネーム)という高効率CPUが4コアという構成になっているLakefieldでは、高性能と高効率をシーンに応じて切り替えることで、高性能と低消費電力の両立を実現している。

 今回発表されたGracemontもそうした利用を前提に設計された高効率CPUコアのアーキテクチャになっており、別記事で紹介しているIntelの次世代クライアント・プロセッサとなる「Alder Lake」のハイブリッドCPUの中で、高効率CPUとして採用されるものとなっている。

 そのGracemontは、Intelをして「史上最高に高効率なx86プロセッサ」とのことで、様々な改良により消費電力を抑えながら高性能を実現するCPUコアになる。シンプルに言えば、より高効率に命令を内部命令にデコードすることが可能になり、それをより並列性を高めた実行エンジンで実行し、プロセッサにかかる電圧をできるだけ下げることで実行時の消費電力をより少なくする仕組みだ。具体的には以下のような特徴を持つ。

強化されたフロントエンド

  • 5,000エントリーの分岐ターゲットキャッシュを備え、より正確な分岐予測が実現可能に(Tremontは1,000エントリー)
  • L1データキャッシュが64KB(Tremontは32KB)
  • Intel初のオンデマンド命令長デコーダにより、L1命令キャッシュだけでなくデコード済みの命令を生成可能に
  • 1クロックサイクルで最大6命令がデコード可能なOOO(Out-Of-Order)デコーダ

より並列性を高めたバックエンド

  • 5ワイドアロケーション、8ワイドリタイヤ、256エントリーのOOOウインドウ、17実行ポートを実装
  • 実行エンジンは、4つの整数ALU、2つのロードAGU/ストアAGU、2ジャンプポート、2つの整数ストアデータ、2つの浮動小数点/ベクトルストアベータ、2つの浮動小数点/ベクトルALUに加えて追加のベクトルALU

強化されたキャッシュ/メモリ

  • 32KBのデータキャッシュ
  • 4つのAGU
  • 最大2MBのL2キャッシュ(4つのCPUコアがシェア、64バイト/サイクル)

新しい命令セットへの対応

  • Intel CET(Control-flow Enforcement Technology)に対応
  • Intel VT-rp(Intel Virtulization Technology Redirect Protection)に対応
  • AVXに対応(Haswell世代と同等の256ビットのAVX)

 こうした設計を採用することで、Gracemontでは消費電力の増加に影響する電圧を下げることが可能な設計になっており、2016年のCoreプロセッサに使われていたSkylakeコアと比較して、同じ消費電力であれば40%性能が向上し、同じ性能であれば40%消費電力が削減できるという。

1コアのSkylakeと比較して40%電力効率が高まっており、2コアのSkylakeと4コアのGracemontでは80%高い電力効率

 さらに4コア構成のGracemontは、2コア構成のSkylakeと比較すると、同じ消費電力であれば80%高性能で、同じ性能であれば80%電力を少なくすることができる。Skylakeの2コアとは、2016年に販売されていた薄型ノートPC用のCore i7などに相当する。

デスクトップ版第11世代Coreに比べ19%性能向上の高性能コア「Golden Cove」

Golden Coveの概要

 高性能コアとなる「Golden Cove」は、2019年にIntelが発売したIce Lakeベースの第10世代Coreに採用されたSunny Coveの流れを組むCove系と通称されるCPUコアデザインとなる。2020年にIntelが投入したTiger Lakeベースの第11世代Coreでは「Willow Cove」へと進化し、今回それが第3世代の「Golden Cove」へと進化した形になる。

 Golden Coveの設計は「低レイテンシで高いシングルスレッドを実現する」ことに焦点が当てられており、内部のアーキテクチャもそうしたターゲットを実現する為の設計になっている。具体的にはデコーダ周りとキャッシュ周りに大きく手が入っている。

フロントエンド

 例えばデコーダは、Willow Coveから大きく強化されている。データ長はWillow Coveでは16B長だったのが32B長になり、デコーダの数もWillow Coveでは4だったのが6に、また1クロックあたりにμOpsキャッシュから読み出し可能なμOpsは6から8に、μOpsキャッシュも2.25k μOpsから4k μOpsへと強化されている。

OOOエンジン

 OOO(Out-Of-Order)エンジンも大幅に強化されている。Willow Coveまでの5アロケーションから6アロケーションに、10実行ポートから12実行ポートへと増強されている。またレジスターファイルも、リ・オーダー・バッファーが512エントリーへと強化されている。

ALUが追加されている
FADDの追加、FMAを利用したFP16の処理に対応

 実行ユニットも強化されている。5番目のALU実行ポートが追加されているほか、ベクターエンジンにも新しいFADDが2ユニット追加されるほか、FMAはFP16のデータタイプをサポートし、AVX512命令を実行する場合にFP16をより効率よく演算することが可能になる。

L1キャッシュ

 キャッシュメモリ周りも強化されており、データロードユニットは2から3ポートになり、3x256bit、2x512bitのロードが可能になるほか、ロードバッファ、ストアバッファも強化され、メモリからの読み込みをより並列処理することが可能になっている。そのほかデータTLB(DTLB)が64から96に強化されているなどの強化も加えられている。

L2キャッシュ

 キャッシュ階層そのものは基本的にWillow Coveと同様で、L1やL2キャッシュ(コアあたり1.25MB)は変わっていない。ただし、Golden Coveではサーバーバージョンが用意されており、Sapphire Rapidsで利用されるが、そのバージョンはCPUあたり2MBのL2キャッシュを持つことになる。

AMX

 もう1つの特徴は新しいAMX(Advanced Matrix Extensions)に対応した拡張命令セットと、それに伴ってAMXの演算器が追加されていることだ。AMXはAIをより効率よく実行するための命令セットで、INT8なら2,000、Bfloat16であれば1,000の処理を1クロックサイクルで行なうことが可能になる。Intelはこれ以前の世代でVNNIなどのAIの演算をより効率よく処理する仕組みを入れてきたが、AMXはその延長線上にある拡張命令となる。ただし、このAMXはサーバー向け製品でだけ有効になり、クライアント製品では有効にされない。

Rocket LakeのCPU(CypressCove)と比較してCPUコアだけの比較で19%の性能向上

 こうした改良によりGolden Coveを採用したAlder LakeのデスクトップPC版は、第11世代CoreのデスクトップPC版(Rocket Lake)と比較して、同じ周波数であれば平均して19%の性能向上が認められるという。