ニュース

Qualcomm、Xeonよりも省電力な「Centriq 2400」でサーバー市場に殴り込み

~サーバー向け初の10nmプロセス/48コアArmプロセッサ

Qaulcomm Centriq 2400のパッケージ

 Qualcommはアメリカ合衆国カリフォルニア州サンノゼで11月8日(現地時間)に記者会見を開催し、Armベースのデータセンター向けSoCとなる「Centriq 2400」を発表した。

 現在のデータセンター向け市場は、ほとんどの市場をIntelのXeonプロセッサが抑えている寡占市場になっており、Armプロセッサ陣営が虎視眈々と参入機会を狙っている状況。Armプロセッサを製造するトップメーカーのQualcommがこの市場に参入する意義は大きく、その動向には注目が集まっていた。

 今回Qualcommが発表したCentriq 2400は、64bitのArm命令が実行できるArmプロセッサを48コア内蔵。6チャネルのDDR4メモリコントローラ、32レーンのPCI Express 3.0などのスペックになっており、高い性能を備えながら省電力を実現しているのが大きな特徴となる。

48のFolkerコア内蔵のCentriq 2400

 今回発表されたCentriq 2400は以下のようなスペックになっている。Centriq 2400に関しては、8月に行なわれたHotChipsなどで詳細が説明されており、そのときの情報および今回発表された内容などをまとめると以下のようになる。

【表】Centriq 2400のスペック
CPU
CPUコアデザインQualcomm Folkerコア
命令セットArm v8(AArch64のみ)
コア数最大48コア(24クラスタ、1クラスタ=2コア)
クロック周波数2.2GHz(通常時)/2.6GHz(ピーク時)
L0キャッシュ24KB(命令)
L1キャッシュ64KB(命令)+32KB(データ)
L2キャッシュ512KB(クラスタあたり)
L3キャッシュ60MB(12×5MB、共有キャッシュ)
メモリコントローラ
DRAMDDR4
チャネル数6チャネル
I/O
PCI Express3.0(32レーン)
SATAGen3(8ポート)
Gigabit Ethernet2
SD/SPI4
USB
SPI
UART
I2C
その他
TDP最大120W
製造プロセスルール10nm FinFET(Samsung)
パッケージ55×55mm FCLGA

 CPUはQualcommが新規に開発した独自コアとなるFolkerで、Armv8に対応したArmプロセッサになる。ただし、Armv7以前の従来の32bitのArm命令が実行できるモード(AArch32)には対応しておらず、64bitのArm命令だけを実行できるモード(AArch64)のみに対応している。

 CPUは2つのCPUコアで1つのクラスタを構成しており、2つのCPUコアで512KBのL2キャッシュを共有するかたちになっている。Centriq 2400ではこのクラスタが24あり、最大で48コア構成が可能になっている。

 CPUコア全部で共有しているL3キャッシュは、5MBのモジュールが12個搭載されており、SoC全体で60MBとなっている。また、各CPUコアにはL0キャッシュとして24KBの命令キャッシュ、L1キャッシュとして64KBの命令キャッシュと32KBのデータキャッシュが用意されている。

Centriq 2400のハイレベルの概要を説明するスライド

 ArmのTrustZoneや、Arm Execution State Exception levels(EL0-EL3)に対応しており、Armv8に対応した仮想化ソフトウェアを実行できる。

Centriq 2400のパッケージ。左に比較に置いたのはレンズ口径62mmのレンズキャップ
パッケージの裏側

 Centriq 2400はI/Oまですべて1チップに統合したSoCになっており、シングルソケット構成のみが可能。メモリコントローラは6チャネル構成になっており、メインメモリはDDR4。32レーンのPCI Express 3.0、8ポートのSATA、2ポートのGigabit Ethernet、4ポートのSD/SPIなどをサポート。

 製造プロセスルールはSamsung Electronicsの10nm FinFETで、パッケージは55x55mmのFCLGA。TDPは最大120Wとなっている。

x86からArmという流れがデータセンター向けにも

 サンノゼ市内の会場で行なわれた発表会の会場では、常勤会長兼取締役会会長のポール・ジェイコブス氏、上席副社長兼Qualcomm Datacenter Technologies 事業本部長のアナンド・チャンドラシーカ氏が登壇し、Qualcommのデータセンター向け製品のビジョンなどについての説明を行なった。

Qualcomm常勤会長兼取締役会会長のポール・ジェイコブス氏

 ジェイコブス氏は「Qualcommは30年にわたりモバイルの技術をリードしてきた。携帯電話がスマートフォンになっていくという大きな変革を遂げてきたが、それが今データセンターへ波及しようとし、業界が大きく変わろうとしている。これから5G、AIや自動運転などの普及により、クラウドへの要求はさらに加速していく」と述べた。

 5G、AIや自動運転などの新しいアプリケーションによりクラウドの必要性がさらに高まり、半導体に必要とされるニーズも変わっていくということだ。

5G、AI、自動運転などでデータセンターへのニーズが高まる

 その上で「ここ数年のArm対x86という観点で見れば、Armがすでに1兆デバイスを越えているのに対して、x86はあまり増えていない」と述べ、昨年(2016年)Armを買収したソフトバンク代表取締役社長 孫正義氏のビデオレターを紹介した。

 そのなかで孫社長は「現在は転換期にきている、今こそArmがデータセンターに入るべきときだ」と述べ、データセンター市場にArm製品が採用されるように努力していくとした。

Arm対x86ではArmが優勢
Armを買収したソフトバンク 代表取締役社長 孫正義氏がビデオレターで登場

 ジェイコブス氏は「オンプレミスとクラウドの比率は大きく変わりつつあり、直近のデータでクラウドが40%、2020年にはクラウドが50%になる。また、PCとスマートフォンの出荷数でもPCの台数が変化がないのに対して、スマートフォンは伸び続けている。そして、スマートフォンには最新のプロセスルールが利用されている。この流れがデータセンター向けの製品にも来ることになる、それがCentriq 2400だ」と述べた。

 Qualcommは、同社がモバイルにも利用しているSamsung Electronicsの10nm FinFETの製造プロセスルールを使い、Centriq 2400を製造し、Intelのデータセンター向け製品よりも先に10nm世代のプロセスルールを採用していることをアピールしている(Intelの最新製品となるSkylake-SPは14nm)。

最新のプロセスルールはPCよりもモバイルに先に利用されるようになっている

IntelのXeonに比べて効率や電力あたりの性能で勝るCentriq 2400

 ジャイコブス氏についで登壇したチャンドラシーカ氏は「Centriq 2400は市場に大きなインパクトを与える製品になる」と述べ、これまでIntelの独擅場となっていたデータセンター市場に一石を投じる製品だとアピールした。

Qualcomm上席副社長兼Qualcomm Datacenter Technologies 事業本部長のアナンド・チャンドラシーカ氏

 チャンドラシーカ氏によれば、Centriq 2400はSnapdragon 835を製造するのに利用しているSamsung Electronicsの10nm FinFETプロセスルールで製造しているとのことで、180億トランジスターを398平方mmのダイサイズで実現できているという。

 そして、「こうした最新のプロセスルールを利用して製造することで、電力効率に優れ、高密度かつ低コストな製品を提供することが可能だ」と述べ、競合となるIntelが14nmプロセスルールに留まっているのに対して、Qualcommは性能面で優位に立てると説明した。

最新プロセスルールはまずモバイルに
最新のデザインに最新のプロセスルールを組み合わせる
Centriq 2400の特徴

 チャンドラシーカ氏が公開したベンチマークデータによれば、Centriq 2400の最上位モデルとなるCentriq 2460(48コア/48スレッド/TDP 120W)と、Intel Xeon Platinum 8160(24コア/48スレッド/TDP 150W)を比較すると、SPECint_rate2000で7%、SPECfp_rate2000で13%ほどCentriq 2460が優れているという(比較はいずれもシングルソケット構成、Centriqはシングルソケットのみのため)。

SPECint_rate2000とSPECfp_rate2000の比較データ

 また、Centriq 2460(48コア/48スレッド/TDP 120W)とXeon Platinum 8180(28コア/56スレッド/TDP 205W)、Centriq 2452(46コア/46スレッド/TDP 120W)とXeon Gold 6152(22コア/44スレッド/TDP 140W)、Centriq 2434(40コア/40スレッド/TDP 110W)とXeon Silver 4116(12コア/24スレッド/TDP 85W)の3つの組み合わせでの比較データも公開された。

両者の比較に利用されたSKU
スレッドあたりの性能、絶対性能ではXeonに劣るが、効率で勝っているとアピール

 スレッドあたりの性能では、Centriq 2460とXeon Platinum 8180はほぼ同じというデータが公開された。ただし、これはスレッドあたりの性能であり、チャンドラシーカ氏によればCPUソケット全体とすると、実際にはXeon Platinum 8180が15%ほど速いという(CPUをデュアル構成もありとすれば、差はさらに開くだろう)。

 Qualcommとしては今回のCentriq 2400では絶対性能よりは効率を重視しており、その点でXeonを上回っていることをアピールする狙いがあるものと思われる。

電力効率の比較、TDP 1Wあたりの性能
TDPは120Wだが、平均消費電力は65Wとほぼ半分になっている

 そうしたCentriq 2400の特徴をよく示しているのが、電力効率の比較だ。TDP 1Wあたりの計算すると、Centriq 2460とXeon Platinum 8180では45%、Centriq 2452とXeon Gold 6152では32%、Centriq 2434とXeon Silver 4116では31%ほどCentriq 2400シリーズの製品が上回っているという。

 なお、このTDPには、Intelのサウスブリッジの分は含まれておらず、実際にはさらにCentriq 2400のほうが電力効率では上回っていることになるという。

 チャンドラシーカ氏は、「われわれの製品は平均消費電力が少ない、SPECint_rate2000の平均消費電力はTDPの約半分になる65Wに過ぎず、C1のアイドル時消費電力も8Wと競合他社に比べて圧倒的に少ない電力で動かすことができる」と述べ、電力を少なくできることから、ラックあたりに格納できるCPUの密度を高められ、総合的に性能を上げていくことが可能だと説明した。

ダイサイズあたりの性能比較
価格あたりの比較

 また、リストプライスベースのコスト比較では1ドルあたりのSPECint_rate2000では、Centriq 2460とXeon Platinum 8180では約4倍、Centriq 2452とXeon Gold 6152では約3倍、Centriq 2452とXeon Gold 6152ではでは約2倍のコストパフォーマンスを実現できていると説明した。

HPEがクラウド向けのサーバー製品で採用予定

 チャンドラシーカ氏は、「データセンター向け製品では性能だけでなく、エコシステムがきちんと構築されていることが重要になる」と述べ、Centriq 2400に対応した製品を開発しているパートナーなどを紹介。

 MicrosoftのAzure、Arm、HPEの担当者などが登壇したが、とくにHPE CTOのミラン・シャッティ氏は同社のクラウドデータセンター向けの製品「HPE Cloudline Platform」でCentriq 2400を採用する予定であると明らかにした。

HPEがCentriq 2400を搭載したクラウド向けサーバー製品を計画

 最後にチャンドラシーカ氏は、同社のロードマップにふれ「すでに次世代の開発ははじまっている。次世代製品のコードネームは「Firetail」で、新しい「Saphira」というコードネームのカスタムCPUを搭載している」と述べた。

 チャンドラシーカ氏は、今回発表されたCentriq 2400は、データセンター向けのCPUとしてはローエンドだけになっているが、将来的にはハイエンドなどの製品にも広げいく意向であるという。

QualcommのCentriqシリーズのロードマップ、次世代製品のコードネームはFiretail、Saphiraというコードネームの次世代カスタムCPUを採用

 なお、今回Qualcommは記者会見のなかでCentriq 2460(48コア/TDP 120W)、Centriq 2452(46コア/TDP 120W)、Centriq 2434(40コア/TDP 110W)という3つのSKUを明らかにしたが、これ以外にどのようなSKUがあるのかに関しては現時点ではわからない。

 Centriq 2460の価格は1,995ドル。それ以外のSKUの価格は明かされていないが、すでに量産出荷が開始されている。