ニュース
AMDの次世代GPUアーキテクチャ「RDNA 2」、ついにハードウェアレイトレーシング対応
~Zen 4までのロードマップ公開。データセンター向けの新GPUアーキテクチャ「CDNA」も
2020年3月6日 12:33
米AMDは5日(現地時間)、投資者向けカンファレンス「Financial Analyst Day」を開催。このなかで、今後のCPU/GPUのロードマップについて刷新し、詳細について説明がなされた。本記事では、おもにCPUとGPUに焦点を当てて紹介する。
冒頭でLisa Su President & CEO氏は、「AMDは2016年より、高性能コンピューティングにフォーカスしたロードマップを敷き、それをロードマップどおりに実行してきた。将来5年に渡っても同じく、高性能コンピューティングに注力し、これをPC、ゲーミング、データセンターに展開していく」と語った。
同社は2019年にデスクトップ向けの第3世代Ryzenでコア数を8から16へ倍増させ、2020年にはノートPC向けの第3世代Ryzen Mobileプロセッサでコア数を4から8へと倍増させた。これにより、業界平均の性能向上率を大きく引き離し、まさに破壊的とも呼べる進化を実現した。
一方、サーバー向けCPUにおいても、第2世代EPYCで従来の32コアから64コアへとコア数を倍増させ、性能を大きく引き上げた。これにより多くのクラウドサービスやエンタープライズへの導入事例が増え、エクサスケールの実現に向けたスーパーコンピュータ業界への再参入を果たした。
GPU向けには、新たにRDNAアーキテクチャを採用し、GCNアーキテクチャから50%の性能電力効率比向上を実現。また、ソニーやMicrosoftのコンソールに採用されており、2020年に投入される予定の次期コンソールゲーム機でも採用が決まっていることなどをアピールした。
年末にもZen 3アーキテクチャを投入
続いて同社のCTO&EVP, Technology & EngineeringのMark Papermaster氏が登壇し、CPUについて解説。2019年は7nmプロセスを採用した製品の立ち上げに成功したことをアピールするとともに、Zen 2アーキテクチャで達成した21%のシングルスレッド性能向上のうち、60%は実行パイプラインの256bit化によるIPC(クロックあたりの命令実行数)の向上、残り40%は7nmプロセスで達成した高クロック/最適化であることを明かした。
そして、2020年内にも同じ7nmプロセスでZen 3アーキテクチャを採用した製品を投入し、2022年までに5nmプロセスで製造されるZen 4アーキテクチャの製品を投入するロードマップを公開した。
また、こうしたプロセス技術のみならず、パッケージング技術についても進化させていく。同社は2015年に「Radeon Fury」で、GPU上にHBMを統合した2.5Dパッケージを投入しているほか、第1世代Ryzen Threadripper/EPYCでマルチチップ構成、第3世代Ryzen Threadripper/第2世代EPYCでチップレット戦略へと進化させてきているが、将来的には2.5Dと3Dを統合した「X3D」パッケージング技術を採用し、性能密度をさらに引き上げるとした。
さらに、CPUとGPUが協調動作するヘテロジニアスコンピューティングの推進のために、相互接続インターフェイスも開発していく。これまでの「Infinity Fabric」は、CPU同士のみの接続に使われていたが、第2世代の「Infinity Architecture」ではCPU同士とGPU同士の各々の接続にも使われるようになる。
そして第3世代のInfinity Architectureでは、ついにCPUとGPU間の接続にも使われるようになり、CPUとGPU同士がコヒーレンシを取れるようにし、CPUがGPUメモリのキャッシュを行なうことが可能になる。さらに、既存のPCI Express 4.0の倍以上の広帯域を実現しつつ、CPUとGPU間のレイテンシを削減できるとのことだった。
こうした新CPUやGPU、アーキテクチャを組み合わせた結果、2021年に納入予定のスパコン「Frontier」では1.5ExaFLOPS以上、2022年に納入予定のスパコン「El Capitan」では2ExaFLOPSを達成するとした。
年内にレイトレーシング対応のRDNA 2を投入へ
続いて同社SVP, Radeon Technologies GroupのDavid Wang氏が、GPUのロードマップについて紹介。現在同社はコンシューマ向けに「RDNA」アーキテクチャのGPUを投入しているが、データセンター向けには「CDNA」アーキテクチャのGPUを新たに投入するとした。
いずれもCGNアーキテクチャを発展させたものなのだが、異なった構成に進化した背景にはそれぞれのニーズの違いがある。ゲーマーにとってみればディープラーニング向けのユニットは無用の長物で無駄な投資になるし、データセンターにとってみればレンダリングやテクスチャ処理を行なうユニットは無駄な投資になるだろう。こうしたそれぞれのドメインに特化することで、AMDと顧客両方がWin-Winの関係になれるため、新たにCDNAアーキテクチャを立ち上げた。
現在開発中のCDNAでは、先述の第2世代Infinity Architectureを採用しており、マシンラーニングやHPCに特化させる。そして将来のCDNA 2アーキテクチャでは、第3世代Infinity Architectureを採用し、エクサスケールに対応させる予定だ。
来るべき第3世代Infinity Architectureが実現するヘテロジニアスコンピューティング時代に向け、ソフトウェア開発環境の充実を図るべく、「Radeon Open Compute Platform(ROCm)」を投入。オープンソースなのが特徴であるほか、NVIDIAのCUDA向けに書かれたコードでも、Platform Agnostic Open APIに準拠したHIPコードに変換すれば、AMDのGPUでも他社のGPUでも動作することができ、マルチGPUのスケーラビリティも確保できるとした。
一方ゲーミング向けのRDNAの後継として、年内に「RDNA 2」アーキテクチャのGPUを投入。IPCの向上に加え、回路の複雑性の解消とスイッチング電力の低減を図り、クロックをさらに向上させることで、RDNAから電力性能比を50%引き上げるとした。
また、待望のレイトレーシングに対するハードウェアアクセラレーションも搭載。Microsoftと緊密に協業して開発し、DXR 1.1に対応する。年内に投入予定の「PlayStation 5」や「Xbox Series X」でもレイトレーシング対応が謳われているが、それらと共通のアーキテクチャのため、開発者はマルチプラットフォームでの展開も容易だとした。
このほか、RDNA 2ではVariable Rate Shadingといった新たな機能も盛り込まれる予定だとした。
年内に「Zen 3」を採用したEPYC「Milan」を投入
一方データセンター/HPC向けのEPYCについて、同社SVP and GM, Data Center and Embedded Solutions GroupのForrest Norrod氏は、すでに既存製品で競合の約2倍のマルチスレッド性能を達成しており、価格あたりの性能も優れている点を挙げつつ、Zen 3アーキテクチャを採用した「Milan」を2020年末に投入し、これまでカバーできなかった一部のクラウドやエンタープライズITのワークロードをカバーできるとした。
また、マシンラーニングによるコンピュート性能へのニーズの高まりに応えるために、近々7nmプロセスで製造されるCDNAアーキテクチャのGPU、そしてさらに進んだプロセスルールで製造されるCDNA 2アーキテクチャのGPUを2022年までに投入するとした。