トピック

第4世代インテルXeonスケーラブル・プロセッサーのキモとなる「アクセラレータ」とは何なのか?

~5Gもクラウドサービスも、社会基盤を広範に支えるインテルCPU

インテルが発表したSapphire Rapidsこと第4世代インテルXeonスケーラブル・プロセッサー。インテルのEMIB技術を採用し、4つのダイが1つのパッケージに統合されている

 先だって発表された第4世代インテルXeonスケーラブル・プロセッサーで、インテルは、リアルワークロード(実際に顧客が実行するアプリケーションの動作)の性能向上、そしてoneAPIなどのオープンな開発環境、さらには電力効率の改善を実現することで、サステナブルなデータセンターの実現を目指すなどのターゲットを掲げている。

 また、そうした特徴を実現するハードウエアを提供することで、顧客となるCSPやエンタープライズといった、従来Xeonスケーラブル・プロセッサーが採用されていた領域だけでなく、近年インテルアーキテクチャの導入が増加している、SDN(Software Defined Network)と呼ばれる仮想化技術を活用した5Gのバックエンド通信機器などにも、普及を目指していく。

インテルのデータセンターソリューションは、リアルワークロード性能、オープンプラットフォーム、サステナブルに要注目

インテル株式会社マーケティング本部本部長の上野晶子氏

 インテル株式会社マーケティング本部本部長の上野晶子氏は、インテルのデータセンタービジネスに関して以下のように語る。「インテルではユーザーが必要とする性能を効率よく実現するため、CPUとアクセラレータをバランスよく実現しており、お客さまのリアルワークロードにおける性能向上を実現する。また、インテルが長年提供してきたソフトウエアの開発環境上にオープンな開発環境として提供しているoneAPIに代表されるような、ベンダーロックインを招かないオープンアーキテクチャ、さらにはアクセラレータや監視機能、制御機能などをフル活用した高い電力効率を実現することでサステナビリティを実現していく」。

 インテルXeonスケーラブル・プロセッサーは、1997年の最初の製品(当時はPentium II Xeonブランド)の出荷から現在に至るまでデータセンターで採用されているCPUとしてトップシェアの製品だ。それだけ多くのユーザーに支持されているのも、リアルワークロードでの性能が支持されているからにほかならない。実際に自社のデータセンターで稼働させると、高性能と消費電力がバランスよく実現される。それがインテルXeonスケーラブル・プロセッサーなのだ。

インテル独自のアプローチ(出典:第4世代インテルXeonスケーラブル・プロセッサー発表、インテル株式会社)

 また、データセンターではシステムで動かすソフトウエアを容易に開発することも重要になる。インテルは各種のソフトウエア開発キットを長年提供してきており、それもデータセンターの顧客に支持される要因の1つになっている。最新の開発キットとなるoneAPIはオープンソースで開発され、インテルアーキテクチャ以外のCPUやGPUにも対応するなど、ハードウェアレベルでもオープンなのが売りになっている。

 そして今、データセンターで最も注目されている要素が電力効率ではないだろうか。ウクライナ危機に端を発したエネルギー危機の中で、データセンターの電力効率を改善し、高い性能を実現しながら消費電力を抑えることに注目が集まっている。データセンターの電力効率を改善して持続可能なクラウドサービスの提供を行なっていきたいクラウドサービスプロバイダー(CSP)やエンタープライズにとって、今の性能を落とさずに電力効率を改善できるソリューションが期待されているのだ。

EMIBなど革新的な製造技術が導入。8ソケットまでの高い柔軟性を実現

 インテルが提供するデータセンター向けCPUとなるインテルXeonスケーラブル・プロセッサーの最新製品として、1月に発表されて投入されたのが、第4世代インテルXeonスケーラブル・プロセッサーだ。

 第4世代インテルXeonスケーラブル・プロセッサーは、2021年に発表されて投入された第3世代の後継となる製品で、Sapphire Rapidsの開発コードネームで開発されてきた。第4世代インテルXeonスケーラブル・プロセッサーは、いくつかの点でハードウエアが拡張されており、第3世代インテルXeonスケーラブル・プロセッサーと比較して性能が大きく向上している。

 1つめの大きな特徴は、インテルが開発したEMIB(Embedded Multi-die Interconnect Bridge)と呼ばれる、いわゆるチップレット技術の導入だ。チップレットというのは、簡単に言うとCPUのサブ基板上に複数のダイを実装する実装方式。複数のダイを1つのサブ基板上に搭載し、ソケット1つあたりのCPUコアの数を増やすことができる。

 EMIBでは、ダイとダイの間をシリコンベースの小さなサブ基板で接続することにより、低コストかつ高性能に、複数のダイを実装することが可能になる。第4世代インテルXeonスケーラブル・プロセッサーでは、EMIBを利用して4つのダイを1つのチップに封入できるようにしており、1ソケットで最大60コアという製品を実現している。

第4世代インテルXeonスケーラブル・プロセッサーのハイレベルな特徴(出典:第4世代インテルXeonスケーラブル・プロセッサー発表、インテル株式会社)
インテルのEMIB技術を応用したチップレット技術を採用(出典:第4世代インテルXeonスケーラブル・プロセッサー発表、インテル株式会社)

 また、プラットフォーム面でも高い柔軟性を備えている。この第4世代インテルXeonスケーラブル・プロセッサーでは1ソケット、2ソケット、4ソケット、そして最大8ソケットの構成までサポートできる。そのため、1つのサーバーで最大480コア(60コア×8ソケット)という巨大なCPUコア数を構成することも可能であり、小規模から大規模まで、さまざまなニーズに幅広くこたえられるのも特徴となっている。

第4世代インテルXeonスケーラブル・プロセッサーでは新しいCPUソケット(LGA-4677)が投入され、1ソケットから8ソケットまでスケーラブルに対応する

アクセラレータの機能を統合することでCPUの処理を解放し、かつ2.9倍の電力効率を実現する

 第4世代インテルXeonスケーラブル・プロセッサーの最大の特徴は、アクセラレータと呼ばれる特定の処理を高速化する演算器を複数内蔵していることにある。

 CPUは汎用プロセッサで、ソフトウエアと組み合わせることで、どのような処理も行なえる柔軟性が特徴と言える。そうした柔軟性を持っているメリットは、新しいイノベーションをいち早く実現できるというところにあり、IT業界が短期間に急速に発展してきた最大の理由と言える。

 そうした汎用プロセッサの性能が日々向上し、その向上した性能を活用するようなソフトウエアが登場する――、それがCPUとソフトウエア発展の歴史と言える。ただ、その反面、汎用プロセッサの弱点と言えるのが消費電力で、高い汎用性を実現するためのトレードオフとして消費電力が増大してきたというのがこれまでの歴史だ。

 そうした中で、消費電力を下げる取り組みというのはこれまでも行なわれてきたが、今再び注目を集めている手法がある。それが今回の第4世代インテルXeonスケーラブル・プロセッサーに搭載されているアクセラレータだ。

 アクセラレータとは、簡単に言えば、汎用プロセッサで行なわれている処理のうち、特定の処理だけを行なう固定処理を行なうプロセッサとなる。汎用プロセッサと違い、ある特定の処理だけに特化したハードウエアが構成されるため、無駄を排除することが可能になり、同じ処理をさせても圧倒的に低い消費電力で同じ処理を行なえる。

 つまり、CPUを活用して同じような処理をずっとやらせているような処理は、アクセラレータとして実装すると、その処理をCPUからオフロードしてCPUの処理能力を他の処理に使え、システム全体の性能を引き上げられ、同じ処理をさせた場合アクセラレータなしの場合に比較して電力効率を大幅に改善することが可能になるのだ。

 第4世代インテルXeonスケーラブル・プロセッサーでは、そうしたアクセラレータが4つ、さらにアクセラレータのように活用できる新しい命令セットが2つ搭載されている。具体的には、アクセラレータとしてQAT(Quick Assist Technology)、DLB(Dynamic Load Balancer)、DSA(Data Streaming Accelerator)、IAA(In-memory advanced Analytics Accelerator)が搭載され、拡張命令としてAMX(Advanced Matrix eXtensions)、Advanced Vector Extensions for vRANの2つが追加された。

アクセラレータを内蔵しており、アクセラレータを活用することで電力効率を改善(出典:第4世代インテルXeonスケーラブル・プロセッサー発表、インテル株式会社)

 このうち、QATは暗号化と復号を行なうアクセラレータで、ネットワークのパケット処理などに利用するとCPUの処理をオフロードできるようになる。QATは既に初代インテルXeonスケーラブル・プロセッサーの時に導入されたアクセラレータだが、従来はチップセット側に実装されていた。今回はそれがCPU側に実装されるようになり、より電力効率が高まっているのが大きな特徴となっている。

 拡張命令のAMXは、今回の第4世代インテルXeonスケーラブル・プロセッサーの目玉機能の1つと言ってよく、新しい演算器となるTMUL(Tile Matrix multiply Unit)を利用して行列演算を効率よく行なえる。昨今ではChat GPTのような自然言語処理を利用したチャットボットなどが話題を呼んでいるが、一般的にAIの推論処理の多くはデータセンターにあるCPUの上で処理されることが多く、AMXを活用することで、そうした推論のアプリケーションを処理する時の性能を向上させることができる。

 こうしたQATなどのアクセラレータやAMXなどの新命令セットに対応することで、第4世代インテルXeonスケーラブル・プロセッサーは従来世代と比較して大きな性能向上と電力効率の改善を実現している。例えばIAAアクセラレータを有効にしたインメモリデータベース(RockDB)では2.93倍、AMXを利用したAI推論(SSD-RN34)で10倍という性能を実現しており、アクセラレータの効果が非常に大きいことがよくわかる。さらに電力効率も大きく改善されており、アクセラレータなどを活用することで従来世代に比べて2.9倍高効率な電力効率になっているとインテルは説明している。

インテルXeonスケーラブル・プロセッサーの前世代との性能比較、AIで10倍に、インメモリデータベースで2.9倍などアクセラレータを活用することで高い性能を実現している。また電力効率は約2.9倍になっている(出典:第4世代インテルXeonスケーラブル・プロセッサー発表、インテル株式会社)

通信向け第4世代インテルXeonスケーラブル・プロセッサーはvRANブースト内蔵で、従来より2倍の性能

 第4世代インテルXeonスケーラブル・プロセッサーは、クラウドサービスプロバイダー(CSP)が提供するようなパブリッククラウドサービスだけでなく、さまざまな社会基盤にも利用されるようになっている。ワイヤレス通信の通信キャリアが提供している5G(第5世代移動通信システム)を裏で支えているのも、実はインテルXeonスケーラブル・プロセッサーだ。

 2月27日からスペイン王国バルセロナ市で開催された通信関連の展示会「MWC 2023」では、多くの機器ベンダーがインテルアーキテクチャに基づいた5G向けのコアネットワーク(契約者情報などを処理する機器)、RAN(Radio Access Network、基地局を含む端末とやりとりを行なう無線通信網)など、5G通信を裏側で支えるネットワーク機器の展示やデモを行なった。

 現在ワイヤレス通信業界では、従来型の固定機能を持つハードウエアを、汎用プロセッサ+ソフトウエアで置きかえるSDN(Software Defined Network)と呼ばれる取り組みへのシフトが急務となっている。その背景には5Gの本来の性能を発揮させるため、4G/LTE世代のハードウエアを一部使用するNSA(Non Stand Alone)方式から、SA(Stand Alone)方式への移行が進んでいるという事情がある。SA方式では5Gに対応したコアネットワークが必要になるため、その導入を機に従来の固定機能のハードウエアからSDNへと移行する通信キャリアが少なくないのだ。

 インテルは2010年代の半ばから、こうしたコアネットワークやRANのSDN化に向けて、NFV(Network Functions Virtualization)、あるいはNFVI(Network Functions Virtualization Infrastructure)などと呼ばれているソリューションの採用を訴え続けてきた。NFVは仮想化技術を利用して、その上で動作するOSやアプリケーションを抽象化する技術で、CSPのデータセンターやエンタープライズのオンプレミスのデータセンターなどで一般的に利用されている、インテルVTが活用されている。

 今回のMWCではインテルXeonスケーラブル・プロセッサーを利用したコアネットワーク、仮想化されたRANとなるvRANのソリューションが多数展示されていた。特にvRANに関しては、既に商用利用を行なっている通信事業者のほぼ100%がインテルベースになっていると、インテルはプレスリリースの中で発表しており、同社ブースでは、auブランドのKDDIと楽天モバイルが、vRANの構築にインテルXeonスケーラブル・プロセッサーを活用していること、さらにNTTドコモが採用する計画があることを明らかにした。

 このほか、このMWCでインテルは、vRANに対応した新しい製品として「vRANブースト内蔵第4世代インテル Xeon スケーラブル・プロセッサー」(以下vRANブースト内蔵第4世代インテルXeonスケーラブル・プロセッサー)を発表している。

 この製品は、通信事業者にとって必要になるレイヤ1のパケット処理をオフロードするためのアクセラレータがCPUに内蔵されている点が大きな特徴となる。このアクセラレータは、従来はACC100という型番でPCI Expressカードとして提供されていたもの。それがCPUに内蔵されたことで、消費電力の観点からも、サーバーの物理的なスペースという意味でも、大きなメリットを通信事業者に提供できる。インテルによれば、従来のソリューション(第3世代インテルXeonスケーラブル・プロセッサー+ACC100)に比較して2倍の処理能力を実現しながらも、消費電力は25%削減可能になっているとのことだ。

vRANブースト内蔵第4世代インテル Xeon スケーラブル・プロセッサーの展示。外付けレイヤ1アクセラレータ+従来世代と比較して、レイヤ1アクセラレータを内蔵しているvRANブースト内蔵第4世代インテルXeonスケーラブル・プロセッサーは2倍の性能を発揮

 今後インテルは、さらなる消費電力の削減にも取り組んでいく。MWCの会場では「Intel Infrastructure Power Manager for 5G core reference software」という省電力削減ツールを提供することを明らかにしており、そのツールを利用すると、コアネットワークの電力を30%削減できるとアピールしていた。

Intel Infrastructure Power Manager for 5G core reference software、約30%の電力を削減できる

通信キャリアなどの新しい領域を切り開いていく第4世代インテルXeonスケーラブル・プロセッサー

 インテルは今後も強力なロードマップを敷いており、今後もこうしたデータセンター向けのソリューションを多数計画している。インテルのデータセンター向けのロードマップでは、現在の第4世代インテルXeonスケーラブル・プロセッサーの後継となるEmerald Rapidsを2023年の後半に、そして、そのさらなる後継となる製品のGranite Rapidsを2024年に投入すると明らかにしている。

 Granite Rapidsは、現在の第4世代インテルXeonスケーラブル・プロセッサーの製造に利用されているIntel 7から2世代分微細化される、Intel 3という製造技術を利用して製造される予定になっており、さらなる性能の向上と電力効率の改善が期待できる。

 さらに同じ2024年には、クライアントPCではE-cores(Efficiencyコア、高効率コア)と呼ばれているCPUコアのデザインだけで構成されるデータセンター向けのCPUとして、「Sierra Forest」も計画されている。こちらは電力効率とコア数の密度にフォーカスしたソリューションになり、大量のデータを並列に処理しながら消費電力を抑えることが可能になるとみられている。こちらもIntel 3の製造技術で製造するとインテルでは説明している。

インテルのデータセンター向け製品ロードマップ(出典:第4世代インテルXeonスケーラブル・プロセッサー発表、インテル株式会社)

 このように、インテルのインテルXeonスケーラブル・プロセッサーは、世界中のCSP、エンタープライズのデータセンター、そして今や携帯電話の通信キャリアにまで世界中のデータセンターで採用されるようになっている。第4世代インテルXeonスケーラブル・プロセッサーでは、アクセラレータを搭載することでさらに電力効率が改善され、サステナブルなデータセンターの構築に寄与するようになっており、データセンターの今後を検討する上で、第4世代インテルXeonスケーラブル・プロセッサーは見逃せない製品だ。