後藤弘茂のWeekly海外ニュース

AMDが16コアRyzen 9を含むZen 2の概要とアーキテクチャを発表

ゲームショウE3に合わせてZen 2とNaviをお披露目

 AMDは7nmプロセスのZen 2ベースのRyzenブランドCPUの最上位となる、16コア32スレッドの「Ryzen 9 3950X」を投入。その一方で、廉価な「Ryzen 5」ブランドまでZen 2ラインナップを揃える。

 GPUでは、同じく7nmプロセスのNaviベースの「Radeon RX 5700XT」を、9.75TFLOPSの性能レンジで投入する。AMDは、米ロサンゼルスで開催した技術イベント「AMD Next Horizon」で、7nmプロセスのZen 2 CPUとNavi GPUの製品ラインナップの詳細と、アーキテクチャの概要を明らかにした。

 AMDはZen 2とNaviではゲーム性能の向上を謳う。Zen 2とNaviはどちらもアーキテクチャレベルでゲームへの最適化が行われているためだ。Zen 2は「Ryzen 3000」シリーズのCPUとして、Naviは「Radeon RX 5700」シリーズとして7月に発売される。AMDは、両製品のお披露目の場にゲームショウ「E3(Electronic Entertainment Expo)」を選び、E3に合わせてイベントを行なった。

AMDはE3で「Ryzen 3000」シリーズと「Radeon RX 5700」シリーズ
Ryzen

 「われわれの現在のゴールは、ゲームに最上のアーキテクチャを、PCからコンソール、クラウド、モバイルまでもたらすことだ」。AMDを率いるLisa Su(リサ・スー)氏(President and Chief Executive Officer,AMD)はこう宣言する。

 E3では、Microsoftが次世代ゲームコンソール計画「Project Scarlett」を発表。次世代Xboxの心臓となるCPUコアとGPUコアに、それぞれZen 2とNaviを採用することを明らかにした。ソニー・インタラクティブエンタテインメント(SIE)の次世代PlayStationも、Zen 2とNaviを採用することが明らかになっている。さらに、AMDはGoogleのStadiaなどクラウドゲーミングプラットフォームもAMDが制していると強調する。

ゲーミングプラットフォームとして浸透しているAMDアーキテクチャ
次世代PlayStationも次世代XboxもAMDアーキテクチャを採用する
クラウドゲーミングでもAMDのカスタムGPUの採用が決まっている
Lisa Su(リサ・スー)氏(President and Chief Executive Officer,AMD)

16コア/32スレッドのRyzen 9 CPUが登場

 さらに、AMDはE3でサプライズを用意していた。それが、16コアRyzenだ。AMDはZen 2ではチップレットアーキテクチャを取り、8個のCPUコアを搭載したチップレットを、I/Oダイと組み合わせることで、CPUコア数のコンフィギュレーションを容易にしている。

 5月までは、1個のチップレットを使い8 CPUコアまでのコンフィギュレーションが公開されていた。しかし、CPUチップレットの配置は不自然で、2個のチップレットを搭載することが予想されていた。

チップレットアーキテクチャを取るZen 2世代のCPU

 5月のCOMPUTEXは、AMDは2個のチップレットを使った12コア/24スレッドの「Ryzen 9 3900X」を発表した。しかし、2個のチップレット上のCPUコアの合計は16コアであり、Ryzen 9 3900Xでは4コアが無効されていた。

 「COMPUTEXの後、もっともしばしば尋ねられた質問は「(Ryzenの)16コアはどこなのか、なぜ16コアを出さないのか、AMDはすべてのダイを有効にしないのか」というものだった。ある人は、(16コアについて)競合が何か出すまで待つつもりか、と聞いてきた。その答えはノーだ。真実は、われわれは最初から16コアまでのリリースを意図してきた。なぜなら、われわれは、つねにすべての上限まで推し進めるからだ」とSu氏は語る。

 16コア/32スレッドのRyzen 9 3950Xは、3個のダイで構成され、トータル72MBのキャッシュを搭載。ブーストクロックは4.7GHz、ベースクロックは3.5GHzとベースクロックはやや抑えられているものの、高い動作周波数で製品化される。そして、このスペックでTDP(Thermal Design Power:熱設計消費電力)は従来のRyzenハイエンド通り105Wに抑えられる。

 AMDは、Ryzen 9 3950Xを世界最初の16コアゲーミングCPUと位置づける。AM4プラットフォームの互換性も保たれている。

12コアに留まらないAMD
16コア/32スレッドで最高周波数は4.7GHz(ブースト時)、105W TDPのRyzen 9 3950X

CPUのマイクロアーキテクチャも大幅に拡張

 AMDは、7nmプロセスでは、従来は「Threadripper」ブランドの領域だった16コアまでを、Ryzenブランドで、Ryzen系の価格体系の枠内で投入する。従来のハイエンドデスクトップ(HEDT)とデスクトップの領域が曖昧になるような野心的な多コア戦略だ。ただし、16コアのRyzen 9 3950Xの投入は7月ではなく9月となる。

 9月までずれ込むのはなぜか。それは、おそらく16コアRyzenが選別品だからだ。より多くのCPUコアを動作させつつ、TDP(Thermal Design Power:熱設計消費電力)を105Wに押さえ込むには、各コアが低電圧で高周波数動作できなければならない。半導体ではばらつきがあるため、あるダイは平均的なダイよりも低い電圧で規定周波数で動作するといった個体差ができる。そうしたダイを使うと、多くのCPUコアを動作させつつTDPを抑えることが可能となる。

 AMDはE3に合わせて、Zen 2コアのマイクロアーキテクチャの概要も明らかにした。Zen 2では、これまで、SIMD(Single Instruction, Multiple Data)演算パイプが従来の128-bit幅から256-bit幅へと拡張され、浮動小数点演算の性能が2倍になることが明らかにされていた。今回AMDは、より詳細を明らかにし、マイクロアーキテクチャに、かなり手が加えられていることを明らかにした。

 まず、CPUの命令効率のカギとなる分岐予測のアルゴリズムが一新され、「TAGE分岐予測」が導入された。また、デコードしたマイクロOPs命令をキャッシュする「Opキャッシュ」は、2倍容量の4KフューズドuOPsになり、Opキャッシュからの読み出しも最大8フューズドuOPsとなった。Opキャッシュの容量と命令読み出し帯域は、どちらも、IntelのSunny Coveコアを上回る。

 整数パイプではロード/ストアが拡張され従来の2パイプから3パイプとなった。命令スケジューラやリオーダバッファ、物理レジスタも拡張され、より多くの命令をインフライトで制御できるようになった。こうした拡張の結果、クロックあたりの性能の指標であるIPC(Instruction-per-Clock)も15%向上している。また、L1データキャッシュとロード/ストアの間の帯域自体も2倍となっている。キャッシュ階層では、L3キャッシュ容量が2倍に増量されている。

Zen 2マイクロアーキテクチャの概要
整数パイプも強化されている
L1キャッシュからの帯域は2x256-bitロードと1x256-bitストアとなった
Zen 2では、従来のZen+と比べてキャッシュが2倍に、浮動小数点演算性能も2倍に、そして、IPC(Instruction-per-Clock)も15%向上した

2から3個のダイで構成されるRyzen 3000ファミリCPU

 Zen 2でも、CPUのクラスタである「CCX(Core Complex)」の構成は4CPUコアで、キャッシュの増量以外は大きくは変わらない。CCXのダイエリアはL3キャッシュが16MBになったにも関わらず31.3平方mmと、12nmプロセスのZen+(60平方mm)の47%のサイズ。2個のCCXを載せたCPUダイである「CCD」のダイサイズは74平方mm。ダイエリアあたりの性能は2倍近く向上している。

Matisseダイあたりの性能が大幅に向上したZen 2
Zen 2のCCXのレイアウト

 デスクトップ向けのZen 2製品はコードネーム「Matisse(マティース)」。Matisseでは、1個のI/Oダイ「cIOD」が最大2個のCCDを接続できる。CCDとcIODの間は、Infinity Fabricプロトコルを使うGMI2インターフェイスで接続される。また、Windows 10は、May 2019 updateから、Zen系CPUアーキテクチャへの最適化がされ、スレッド割り当てがCCXを意識したふるまいをするなどの拡張が行なわれる。

Maisseの構成
Windows 10もZen系CPUアーキテクチャへの最適化がなされる
Windows 10の最適化による性能の向上

 Zen 2のI/OチップcIODは、デュアルチャネルのDDR4メモリインターフェイスを搭載、定格ではDDR4-3200をサポートする。また、Zen+までとの大きな違いは、新しいPCI Express Gen 4をサポートすること。cIODダイでは合計で32レーンの高速シリアルインターフェイスを備える。

 このうち、24レーンをPCIe Gen 4として使うことが可能で、そのうちx4はチップセットとの接続に使われる。通常は、x16 PCIe Gen 4をグラフィックスに、残り4レーンはx4 NVMeなどの構成が可能だ。また、12基のUSB 3.1(10Gbps)と4基 USB 2.0もI/Oダイに備える。

 対応チップセットはPCI Express Gen4に対応するAMD X570となる。X570の構成は、MatisseのcIODとほぼ同じであり、メモリコントローラが無効されているとみられる。同じダイを使えば、チップの開発と検証、製造のコストを抑えることができる。

Ryzen 3000とX570チップセットの構成

Ryzen 3000ブランドのCPUとしてZen 2を一気に展開

 AMDはZen 2ベースのCPUをRyzen 5/7/9の3ブランドに渡る広い価格帯で一気に展開する。COMPUTEXで発表されていたRyzen 7/9に加えて、E3前後で最上位のRyzen 9 3950Xと、下位のRyzen 5 3000ファミリが発表された。ローエンドのRyzen 5 3600は、6コア/12スレッド、4.3GHzブースト/3.6GHzベースクロックで65W TDP、価格は米国で199ドルとなる。Ryzen 5/6/7のブランドポジショニングは明快で、それぞれIntelのCore i5/7/9ブランドに対抗する。

Zen 2では手頃価格のRyzen 5も投入される
Zen 2 CPU製品ラインナップは7月発売だけでRyzen 5/7/9の5SKU(Stock Keeping Unit=アイテム)となる
Zen 2ベースのRyzenファミリの価格位置づけ

 また、AMDはRyzen 3000ブランドでのAPU(Accelerated Processing Unit)にも新製品を加えた。「Ryzen 5 3400G」で4コア/8スレッドでVega 11グラフィックスを内蔵する。ただし、同じRyzen 3000ブランドでも、APU系は12nmプロセスで、7nmプロセスの世代ではない。

Ryzen 3000シリーズのラインナップ全体。APUの2skuは12nmプロセス

高いシングルスレッド性能と大容量キャッシュがゲームをブーストする

 AMDでは、Zen 2の高いシングルスレッド性能、大容量のキャッシュ、2倍の浮動小数点性能などがゲームにおいて強味を発揮すると説明する。性能効率は高いものの、ゲームPCのCPUとしてはいまいちという評価を受けた従来のZen CPUのイメージを払拭しようとしている。

CINEBENCHベースのシングルスレッド性能とマルチスレッド性能でIntelと打ち負かし、TDPでは大幅に下回る
ゲーム性能でIntelに対する優位を謳うAMD

 E3時のカンファレンスでは、AMDはZen 2アーキテクチャの大容量キャッシュを「ゲームキャッシュ(Game Cache)」と呼び、キャッシュのDRAMレイテンシの隠蔽効果によってゲーム性能が劇的に向上すると説明した。

Zen 2の大容量キャッシュの効果を説明するスライド

 AMDは、とくに差がつくのはゲームをプレイしながらTwitchなどでプレイ画面を配信する場合だと説明。E3時のイベントでは実際にライブデモを行ない、TwitchへのストリーミングでRyzen 9 3900Xは98%以上のフレームを配信できたのに対して、Core i9-9900Kは2.1%にまでフレーム落ちすると示した。

AMDが示したデモ
とくに差がつくのはゲームをプレイしながらTwitchなどでプレイ画面を配信する場合にAMDが有利だと主張する

 AMDは、E3でのお披露目を通じて、Zen 2とNaviにゲーミングのイメージを根付かせようとしている。2大ゲームコンソールでのZen 2とNaviの採用が発表されたタイミングで、AMD製品全体のゲーム市場への浸透を加速しようという狙いだ。