笠原一輝のユビキタス情報局

Intel、第10世代Core発表。10nmプロセスで、L1が1.5倍、L2は倍増に

第10世代Coreプロセッサのダイ。10nmプロセスルールで製造される

 IntelはCOMPUTEX TAIPEIの初日(5月28日現地時間)に行なわれた「COMPUTEX Industry Opening Keynote」にIntel 上席副社長 兼 クライアント・コンピューティング 事業本部長 グレゴリー・ブライアント氏が登壇し、同社の新製品や今後の開発方針などを説明した。

 このなかでIntelは同社がIce Lakeの開発コードネームで開発を続けてきた、10nm製造プロセスで製造される最新製品「第10世代Coreプロセッサ」の生産開始を発表した。

 第10世代Coreプロセッサは、Sunny Cove(開発コードネーム)と呼ばれる最新CPUを最大4コア搭載するほか、Gen11と呼ぶIntel設計のGPU、およびUSB4になることが決まっているThunderbolt 3のコントローラを内蔵するといった特徴を備えている。

 Sunny CoveコアのCPUは、IntelのCPUとしては長らく据え置かれていた32KBのデータキャッシュが増やされて48KBに、L2キャッシュも256KBから512KBへと増やされた。L2 TLB、μOpsキャッシュなども増やされており、旧世代に比べTLBなどの増加により分岐予測の精度も向上。実行ポートの増加などと合わせ、CPUの命令実行効率を示すIPC(1クロックサイクルあたりに実行できる命令数)が向上している。

ようやく量産にこぎ着けた10nm世代のCoreプロセッサ

第10世代Coreを製造するのに利用する10nmプロセスルールのウェハ

 今回Intelが発表した第10世代Coreは、10nmの製造プロセスルールの新アーキテクチャとして計画されてきた製品。初期の計画では2017年末の出荷だったが、Kaby Lakeの微細化製品として計画されてきた同じ10nm採用のCannon Lakeがうまく立ち上がらず、結果的に事実上のスキップ(実際にはGPUなし版が細々と出荷されている)になり、2019年にずれ込んでしまうというかたちになってしまった。

ハイレベルの第10世代Coreプロセッサの説明(出典:Blueprint、Intel Corporation)
スペック(出典:Blueprint、Intel Corporation)

 そうした推移を経てようやく発表にこぎ着けた第10世代Coreには、大きく以下の特徴がある。

(1)新しいSunny Coveコア(最大4コア/8スレッド、最大8MBのLLCキャッシュ)
(2)Gen 11のIntel内蔵GPUコア(最大64EU)
(3)LPDDR4-3733ないしはDDR4-3200に対応
(4)Thunderbolt 3コントローラをオンダイに統合
(5)Ice Lake世代のPCH対応(14nm、Wi-Fi 6 GIG+に対応、FIVRを統合)

Yシリーズ向けのType4パッケージを手に持つIntel 副社長 兼 モビリティクライアントプラットフォーム 事業部 事業部長 クリス・ウォーカー氏
Intelのプロセッサの進化、今後数世代の基礎となるのがIce Lake(出典:Blueprint、Intel Corporation)

 Intel 副社長 兼 モビリティクライアントプラットフォーム 事業部 事業部長 クリス・ウォーカー氏は、2011年にGPUをオンダイに統合した第2世代Core(Sandy Bridge)、モダンスタンバイ(当時はConnected Standby)をサポートした第4世代Core(Haswell)、その後数年の製品の基礎となった第6世代Core(Skylake)がそうだったように、今回の第10世代Coreも今後数年のIntelのプロセッサの方向性を示すものだと説明した。

Sunny CoveコアのCPUアーキテクチャを採用、L1/L2キャッシュを強化

Sunny CoveではL1キャッシュ、L2キャッシュが増量される(出典:Blueprint、Intel Corporation)

 第10世代Coreの最も大きな強化点となるのがCPUだ。Intelは昨年(2018年)の12月に行なったIntel Architecture Dayにおいて、第10世代CoreのCPUアーキテクチャであるSunny Coveに関して説明を行なっている(参考記事:Intel、次世代CPUアーキテクチャ「Sunny Cove」の概要を明らかに参照)。

旧世代とのCPUμアーキテクチャの比較(出典:Blueprint、Intel Corporation)

 今回、Sunny Coveのさらなる詳細として、キャッシュの容量が旧世代に比べて増やされていることなどを明らかにされた。Intel CPUのキャッシュは、ここ十年にわたってL1キャッシュが32KB(命令)+32KB(データ)、L2キャッシュが256KBとなっていた。今回の第10世代Coreでは、それぞれのCPUコアのL1のデータキャッシュが48KBと1.5倍に、さらにL2キャッシュは512KBと2倍に増やされている。

IPCが平均18%向上している(出典:Blueprint、Intel Corporation)

 また、L2 TLBは旧世代の1,536から2,048に、μOpsキャッシュも1.5Kから2.25Kに増やされており、キャッシュのヒット率や命令分岐時の予測精度が向上。CPUの命令実行効率を示すIPC(1クロックサイクルあたりに実行できる命令数)が引き上げられ、第6世代Core(Skylake)と比較して約18%ほどIPCが向上しているという。

旧世代とのシングルスレッド時の実性能比較、Ice LakeはBroadwellに比較して約1.5倍(出典:Blueprint、Intel Corporation)

 Intelによれば、15WのCPUを利用してシングルスレッドでの性能を比較した場合、第5世代Core(Broadwell)を1とすると、第6世代Core(Skylake)が約1.1倍、第7世代Core(Kaby Lake)が約1.2倍、第8世代Core(Kaby Lake Refresh)が約1.3倍、第8世代Core(Whiskey Lake)が約1.4倍となっており、第10世代Core(Ice Lake)は約1.5倍弱になると説明した。

AVX512を利用したDL Boostに対応、PCでもDLの推論機能を促進へ

AVX512とVNNIで実現されるDL Boostに対応している(出典:Blueprint、Intel Corporation)

 第10世代Coreでは薄型ノートPC用のCPUとしてははじめて新しい命令セットとしてAVX512に対応している(デスクトップではCore Xが対応済み、Whiskey LakeはAVX2までの対応)。かつ、サーバー向けの第2世代Xeonスケーラブル・プロセッサ(Cascade Lake)でサポートされたVNNI(Vector Neural Network Instructions)にも対応している。

 VNNIはXeon Phiでサポートされた命令セットで、VNNIを利用すると、8bitの整数(INT8)を、CPUのINT32アキュムレータを利用して演算するときに、従来は3クロックサイクルかかっていた処理が1クロックサイクルで済むようになる。ディープラーニング(深層学習)の推論時には、精度が必要ないので、INT8を利用して演算することが多くなっている。そうした時にVNNIを利用して演算することで処理速度を向上させることが可能になる。IntelではVNNIをDL Boost(ディーエルブースト)とブランド名をつけて訴求していく。

Intel Dynamic Tuning 2.0(出典:Blueprint、Intel Corporation)

 また、第10世代CoreにはIntel Dynamic Tuning 2.0という機能が用意されており、DL Boostの機能を利用して機械学習(ML)や深層学習(DL)を行なう上で、性能を動的に調整する。

 通常、ML/DLの演算を行なう場合には、処理が断続的に行なわれるためTurbo Boostで一瞬だけ高クロックに引き上げよりも、最高クロックである時間はそんな長く取る必要はなく、むしろベースクロックに近いところで若干高めのクロックで動かした方が処理能力が高くなる。Intel Dynamic Tuning 2.0は、そうした現在行なわれているワークロードを自動で分析して、そうした動作をCPUが動的に行なえる。

DL BoostによりDL推論時の性能は2~2.5倍に(出典:Blueprint、Intel Corporation)

 こうしたさまざまな仕組みで、ML/DLの推論時性能を引き上げ、PCアプリケーションのDLの推論の活用を促していく。Intelによれば、DLの推論を利用した場合の平均的な性能は前世代に比べて2~2.5倍になっていると説明している。

OpenVINO、WinML、CoreMLに対応(出典:Blueprint、Intel Corporation)
Windows 10の写真ツールが対応(出典:Blueprint、Intel Corporation)
CyberLinkのPhotoDirector 10が写真の霞の除去機能でDL Boostを利用(出典:Blueprint、Intel Corporation)

 開発ツールとしてOpenVINOをすでに提供しているほか、Microsoftが提供する予定のWinML、AppleのCoreMLにも対応する計画だ。Intelによると、MicrosoftのWindows 10の写真ツール(Microsoft Photo)が対応するほか、CyberLinkのPhotoDirector 10が写真の霞の除去機能で使っているとのことで、いずれも実際に動く様子を公開した。

MicrosoftのWindows 10の写真機能を利用した検索のデモ。DL Boostを利用している右側が高速に表示できていることがわかる
PhotoDirector 10を利用したDL Boostのデモ

メモリコントローラはLPDDR4/Xに対応し最大32GBに強化、GPUはGen11に強化

Core i7、Core i5、Core i3が用意され、GPUはGen11ベースに強化(出典:Blueprint、Intel Corporation)

 第10世代Coreが強化されているのはCPU周りだけではない、プロセッサダイに統合されているメモリコントローラとGPUも強化され、さらにThunderbolt 3のコントローラも統合されている。

 メモリコントローラはLPDDR4/LPDDR4X(以下まとめてLPDDR4)とDDR4の両対応になっている。Intelは第4世代Core(Haswell)でLPDDR3対応にして以来、ローパワーのDRAMに関してはLPDDR3に据え置いてきた。第6世代CoreでDDR4には対応したが、LPDDR4への対応はここ数世代見送られてきた。今回ようやくLPDDR4に対応したことで、スマートフォンなどで一般的に利用されているLPDDR4への対応が実現された。

 もちろんDDR4との両対応で、OEMメーカーは目的に応じて好きなメモリを選ぶことができる。省電力優先であればLPDDR4だが、コストが若干高いのと、基板上に実装しなければならない点が弱点になる。DDR4は安価で、DIMMソケットを利用してモジュールでメモリを実装できるため、BTO時などの柔軟性を確保できるが、消費電力の面では不利になる。

 LPDDR4は3,733MHzまで、DDR4は3,200MHzまでの対応になり、LPDDR4時は最大32GBまで、DDR4時は64GBまで対応可能になる。第8世代CoreプロセッサのUシリーズ+LPDDR3を搭載した薄型ノートPCは最大で16GBという製品が少なくなかったが、LPDDR4選択時にも32GBのラインナップを用意することができるようになるのはメリットと言える。これはハイエンドなスペックのノートPCを望んでいるユーザーには朗報だ。

 内蔵GPUも既報のとおりGen11の内蔵GPUに進化している。アーキテクチャには第8世代Coreプロセッサ(Kaby Lake-R、Whiskey Lake)に搭載されていたGen9(第9世代)のIntel内蔵GPUの進化版となるが、最大で64EUまで対応、最大で1.1GHz、内蔵L3キャッシュは3MBと強化されており、FP32で最大1.12TFLOPS、FP16では最大2.25TFLOPSの性能を発揮するとIntelでは説明している(内蔵GPUに関しては別記事[リンク]参照)。

 余談になるが第8世代Core(Kaby Lake-R/Whiskey Lake)や第9世代Core(Coffee Lake-R)のGen9からGen10をスキップしてGen11になっているのは、出荷はされたが内蔵GPUが有効にならなかったCannon Lakeの内蔵GPUがGen10だったからだ。

 Thunderbolt 3のコントローラは、Intelが別チップとして提供してきたTitan Ridge相当の機能がCPUに統合されている。これにより、2ポートのThunderbolt 3/USB 3.1 Gen2相当の機能をCPUだけで実装することができる。これにより、OEMメーカーはThunderbolt 3とUSB 3.1 Gen2に対応したUSB Type-Cポートをほとんど追加コストなしで実装することが可能になる(Thunderbolt 3の実装などはIntel第10世代Coreは、Thunderbolt 3をオンダイ統合参照)。

14nm世代PCHの第2世代となるICL PCHへ強化、FIVRがPCH側に復活

Ice Lake PCH(Intel 300シリーズ・モバイル・チップセット)に強化、FIVRがPCHに搭載(出典:Blueprint、Intel Corporation)

 第10世代CoreではPCH(Platform Controller Hub、CPUの周辺チップとして提供されるチップセットのこと)も強化されている。Intelは昨年発表した第8世代Core(Whiskey Lake)においてPCHをアップグレードしている。業界ではCannon Lake PCH(元々Cannon Lake用に開発されてきたPCHという意味、Intelの正式なコードネームではない)は14nmで製造されており、USBコントローラがUSB 3.1 Gen2対応に強化されたほか、Wi-FiのMACが実装され、Intelから提供されるRF(無線部分)を実装するだけでIEEE 802.11ac(160MHz)を実装可能になっていた。

 第10世代Core向けに提供されるPCHは、そのCannon Lake PCHの強化版で、業界ではIce Lake PCH(Ice Lake向けに開発されてきたPCHの意、Intelの正式なコードネームではない)と呼ばれるPCHになる。なお、製品名はIntel 300シリーズ・モバイル・チップセットとなる。

 Ice Lake PCHはCannon Lake PCHと同じく14nmで製造されるが、大きな違いはFIVR(Fully Integrated Voltage Regulators、完全統合電圧変換器)が内蔵されていることだ。FIVRは、第4世代Core(Haswell)とその微細化版となる第5世代Core(Broadwell)でCPUに統合されたが、効率があまり良くなかったり、実装が難しいという理由で第6世代Core(Skylake)以降の世代では実装されなくなっていた。Ice Lake PCHにはそのFIVRが復活し、PCH上のFIVRがCPUとPCHに対して電圧変換機の役割を果たすことになる。

 これによりOEMメーカーは基板上に実装しなければならないCPUやPCH向けの電圧変換器を搭載する必要がなくなり、電源から電力を供給するだけでよくなる。これにより、基板面積をよりコンパクトにすることが可能になり、ノートPCやタブレットの小型化に大きく貢献する。

 なお、それ以外の機能はIce Lake PCHとCannon Lake PCHはほぼ同等の機能を有している。クアッドコアのオーディオDSP、USB 3.1 Gen2のコントローラが6つ、PCI Express Gen3が16レーン、SATA6が3ポート、eMMC 5.1に対応し、同じくWi-FiのMACを内蔵しており、CNVi 2とIntelが呼ぶ専用インターフェイスを介してRFチップと接続が可能になっている。

Wi-Fi 6対応のRFチップ(AX201)も同時に発表されている(出典:Blueprint、Intel Corporation)
Wi-Fi 6 Gig+(出典:Blueprint、Intel Corporation)

 今回IntelはIEEE 802.11ax、つまりWi-Fi 6に対応したRFとしてAX201を追加した。それを利用することでWi-Fi 6に対応し、かつIntelがWi-Fi 6 GIG+と呼んでいる160MHz幅とOBSSの機能に対応。それらを利用することで、2x2アンテナで2,402Mbps(理論値)の通信速度が実現されている。現行のIEEE 802.11ac/2x2/80MHz幅で867MHz(理論値)に比べて約3倍の通信速度が実現できるとIntelでは説明している。

左がCNVi 2に対応したRFモジュール。従来のM.2のモジュールに比べてコンパクトになっている
RFモジュールの裏面

YシリーズはTDP 9Wに引き上げられるが、薄型パッケージとデザインガイドの提供でより小型化が可能に

UシリーズとYシリーズ(出典:Mobile 10TH Gen Intel Core U-Series and Y-Series Processors Product Brief、Intel Corporation)

 第10世代Coreでは、まずいわゆるUシリーズ・プロセッサ(薄型ノートPC用)とYシリーズ・プロセッサ(ファンレスの薄型ノートPCやタブレット向け)の2つが投入される。

 Uシリーズに関しては従来どおりTDP(熱設計消費電力、OEMメーカーが参照する筐体設計時に考慮すべき電力のこと)が28Wと15Wの2つの製品が投入される。Yシリーズに関しては従来の5.5Wから9Wに引き上げられている。これは、放熱技術が向上したことで、9Wでもファンレスが実現できるようになったことが影響しており、Yシリーズの性能が従来よりも引き上げられることを意味する。

Type3とType4パッケージ(出典:Blueprint、Intel Corporation)
Yシリーズ用のType4パッケージ(左)とUシリーズ用のType3パッケージ(右)

 パッケージはUシリーズとYシリーズで異なっており、UシリーズがType3と呼ばれる50×25×1.3mmで1,526ボールのBGAパッケージ、YシリーズがType4と呼ばれる26.5×18.5×1.0mmで1,377ボールのBGAパッケージとなっている。なお、Type4パッケージ向けにはRiMB(Recess-in-motherboard)と呼ばれるデザインガイドが提供され、OEMメーカーは高さ方向を削減した設計を行なうことが可能になっている。

 第10世代Coreを搭載したPCは、今後OEMメーカーから発表される予定で、IntelではDellが発表する予定の次世代のXPS 13 2-in-1に採用される予定だと説明し、そのマシンを公開した。ただし、現時点では第10世代Coreを搭載しているという以外のスペックは明らかにされていない。

Dellの新XPS 13 2-in-1、第10世代Coreを搭載している

 なお、今回の発表は「第10世代Coreの生産が開始された」という発表になっている。気になる製品の出荷時期だが、Intelのウォーカー氏は「今年の年末商戦には搭載製品が登場するだろう」と述べており、例年のスケジュールだと9月にドイツで開催されるIFAで多くの製品が発表されるだろう。