ニュース

Qualcomm、最大48コアのサーバー向けSoC「Centriq 2400」

~業界初の10nmプロセス採用サーバーCPU

 米Qualcommは21日(現地時間)、2016年に発表したハイエンドサーバー向けARMコアSoC「Centriq 2400」シリーズの詳細を発表した。

 Centriq 2400は世界初の10nm FinFETプロセス技術にもとづくサーバー向けのSoC。CPUコアには独自開発の「Falkor」を採用。ARMv8命令に対応し、幅広いデータセンターの需要に応える高性能と低消費電力を実現したという。

 FalkorはフルカスタムのARM CPUコアで、完全な64bitアーキテクチャを採用。“Falkor core duplex”と呼ばれるモジュールに、2個のFalkor CPUと共有L2キャッシュ、そして共有バスインターフェイスを内包し、Qualcomm System Busと呼ばれるリングバスでクラスタを接続する。このモジュラー構成を採用することで、最大で48コアのCPUデザインを可能にした。

 CPUコアはパイプラインは4イシュー/8ディスパッチのヘテロジニアスパイプラインを採用し、性能電力比を最適化した。また、パイプライン長は可変であり、スループットを最大化するとともに、アイドル状態のハードウェアを最小化している。

 アウトオブオーダー実行およびリネームリソースは、命令実行がクリニカルパスにならないようにサイズが決められ、複数の実行エンジンを無制限に利用可能。分岐予測アルゴリズムやキャッシュ階層などのマイクロアーキテクチャも最先端技術を駆使している。

 電力面では、CPUコアやL2各々にP-ステートコントロールを備えており、低消費電力状態に入る、あるいは出るためのハードウェアステートマシンにより、状態遷移やハードウェア状態の保持などを超高速に行なえるとしている。

 64KBのL1命令キャッシュを補完する、1サイクル/低消費電力の24KB “L0”命令キャッシュを備えている点も特徴。この分割命令キャッシュにより、大きな命令フットプリントに対応できる。合計88KBになるこの低遅延な命令キャッシュは、排他的に管理されている。一方、L1キャッシュもロード/ユーズの遅延を3サイクルに抑え、システム条件に動的に適応するマルチレベルハードウェアプリフェッチエンジンによって強化されている。

マルチテナントといった仮想化ワークロードにも対応し、ARMの実行レベルおよびTrustZoneによるセキュア実行環境にも対応。さらに暗号化やセキュアハッシュ操作のアクセラレーション機能を備え、httpsプロトコルの処理に好適とする。RASメカニズムも備える。

 さらに、低レイテンシ/広帯域のリングバスや、大容量L3キャッシュ、マルチメモリコントローラも内包。L3 Quality of Service拡張により、共有リソースを効率よく管理し、メモリのバンド幅を効率的に使えるとしている。

 Centriq 2400の詳細については、8月22日~24日に米国・カリフォルニアで開かれる高性能チップに関する国際会議「Hot Chips」で明らかにされる。