ニュース

Intel、Pコア/Eコア両対応の新拡張命令セット「AVX10」

各命令セットの機能一覧。右側が新たなAVX10

 Intelは、Pコア+Eコアのハイブリッドアーキテクチャに対応する新命令セット「AVX10」を発表した。

 AVX10は、既存のAVX-512のすべての機能を網羅しつつ、PコアとEコアでシームレスな動作が可能なよう設計された次世代の新命令セット。両コアで動作する設計により、サーバーとクライアントの両分野の製品を最適にサポートできるとしている。

 PコアとEコアの両方で最大256bitのベクタ長をサポートするほか、Pコアでは512bitのベクタ長もオプションでサポート。将来のPコアベースのXeonプロセッサにおいてもAVX-512命令を引き続き利用可能とすることで、レガシーアプリケーションが継続して実行できることを保証するとしている。

 性能面でもメリットがあるとしており、AVX2でコンパイルされたアプリケーションの場合では、AVX10に再コンパイルすることでソフトウェアのチューニングなしで性能が向上するという。

 ベクタレジスタへの負荷に敏感なアプリケーションの場合では、16の追加ベクタレジスタと新命令により性能が引き上がる。さらに、高度にスレッド化されベクトル化が可能なアプリケーションは、より高い総スループットを達成できる可能性があるとしている。

 また、既存のAVX-512アプリケーションの多くはすでに最大256bitのベクタ長を使用しているが、同じベクタ長でAVX10/256にコンパイルした場合、同等の性能が得られるとしている。

 加えて、機能の対応状況をチェックする際に利用されているCPUIDの機能フラグについても、フラグ数を減らしバージョンで管理する新たなスキームをサポートした。

細かい機能フラグを減らし、バージョンで管理へ

 AVX10は、Graphite Rapids世代のXeonプロセッサにて、バージョン1となるAVX10.1が利用可能となる見込み。このバージョンはAVX-512からAVX10への移行用となるもので、XeonのPコアのみで動作し、新しい命令は含まれない。

 続くバージョン2(AVX10.2)から本格的な実装となり、PコアおよびEコアの両方をサポートし、新命令が利用可能となる。具体的には、埋め込み丸め処理に対応した256bit命令フォーム(現在は512bitのみ)、新しいAIデータ型および変換/移動に最適化した命令をサポートする。

 今後の開発では、サーバーとクライアントの両分野の製品を最適にサポートし、リッチで柔軟性が高く、一貫性のある環境を提供し続けていくとしている。