ニュース

Intel、8ソケット対応の24コアプロセッサXeon E7 v4シリーズ

~Xeon E7 v3と比較して約1.3倍の性能

 米Intelは6日(現地時間)、「Broadwell-EX」のコードネームで開発を続けてきたデータセンター(サーバー)向けプロセッサとなるXeon E7 v4ファミリーを発表した。Xeon E7 v4ファミリーは、同社の4ソケット超製品となるXeon E7としては初めて14nmプロセスルールで製造され、前世代となるXeon E7 v3ファミリー(開発コードネーム:Haswell-EX)が18コアだったのに対して24コアに強化されている。

 Intelによれば、Xeon E7 v4はXeon E7 v3に比べて概ね1.3倍程度の性能を実現しており、5年前の2011年に投入された初代Xeon E7の4ソケットサーバー100台分と同じ性能を、33台分で実現でき、ランニングコストも削減可能だという。

E7は8ソケットまで対応

 Intelのデータセンター向けプロセッサは、サブブランドで分類するとXeon E7、Xeon E5、Xeon E3の3種類があり、以下のような違いがある。

【表1】Intelのデータセンター向けプロセッサの3つのサブブランド
現行製品ソケット数GPUターゲット市場
Xeon E7 v4(Broadwell-EX)4~8-ミッションクリティカル、大規模サーバー
Xeon E5 v4(Broadwell-EP)2~4-メインストリームサーバー
Xeon E3 v5(Skylake)1有り/なしエントリーサーバー

 一番ローエンドになるE3シリーズは、シングルソケットサーバー向けと位置付けられている。クライアントPCと同じダイが採用されており、内蔵GPUが無効にされているSKUと、そのまま有効にされているSKUがあり、後者はGPUのトランスコードハードウェアを利用して動画の高速変換も可能になっている。現時点ではクライアントPC向けの第6世代Coreプロセッサと共通のダイとなるSkylake(開発コードネーム)が採用されており、先日台湾で行われたCOMPUTEX TAIPEIでは、その最新製品となるXeon E3-1500 v5(別記事参照)が発表されている。

 E5シリーズはメインストリームサーバーと位置付けられる2ソケットサーバー向けの製品となる。現状日本で一般的にサーバーと呼ばれているのはこの2ソケットのE5シリーズのことを指しており、エンタープライズサーバーや、データセンターのクラウドサーバーなどにはこのE5シリーズが利用されることが多い。現在の最新製品は3月31日(米国時間)に発表された、Xeon E5 v4(別記事参照)になる。

 そして、新しく発表されたのが、Xeon E7 v4。E7シリーズは、Intelの自社チップセットでは4ソケットまで、サードパーティのチップセットであれば8ソケットまでの大規模構成に対応し、ミッションクリティカルサーバーやインメモリデータベースなどの大規模データベースサーバー向けと位置付けられいる。昨年(2015年)発表されたXeon E7 v3(開発コードネーム:Haswell-EX)を置き変えることになる。

Xeon E5 v4と同じダイを利用しつつ、最大24コアで拡張機能も実装

 Xeon E7 v4は、CPUのダイそのものはXeon E5 v4に使われているBroadwell-EPと同じだ。Broadwell-EPのダイの特徴などに関しては、先の別記事で詳しく解説しているので、そちらをご参照頂きたい。

Xeon E7 v4
CPUソケットは従来と同じSocket R1(LGA2011)

 ただし、Xeon E7 v4では、Xeon E5 v4では無効にされていたいくつかの機能が有効にされている。具体的には、以下の3つの点。

  1. CPUコアが最大24コアまで(Xeon E5 v4では22コアまで)
  2. RAS機能
  3. SMIによる大容量メモリの搭載が可能に

 Xeon E5 v4、Xeon E7 v4共通に使用されているBroadwellのLCC(Large Core Count)と呼ばれる最大構成のダイには、24コアが内蔵されている。しかし、Xeon E5 v4では最大構成でも2つのコアが無効にされ、22コア構成になっている。一方、Xeon E7 v4では最大24コア構成のSKUが用意されており、HT(Hyper Threading)テクノロジを有効にした場合には、最大48論理コアで利用できる。最大で8ソケット構成が可能になるので、1台で192コア/384スレッドというマシンを構築できる。

Xeon E5 v4のLCCと同じ最大24コア構成。Xeon E5 v4では22コアまでだが、Xeon E7 v4は24コアフルのSKUが用意される(出典:Intel Xeon Processor E7 v4 Family Architecture Review、2016年、Intel Corporation)

 また、Xeon E5 v4では無効になっていた、RAS(Reliability Availability Serviceability、信頼性/可用性/管理性)機能が有効になっている。RASは、エラーなどをチェックして対処する機能で、ミッションクリティカルなサーバーに利用されるXeon E7シリーズには必須とも言える機能。Intelでは同社のRAS機能を「Intel RunSure Technology」と総称している。

 このRAS機能は、毎世代機能が追加おり、前世代ではエンハンスドMCA Gen.2、アドレスレンジメモリミラーリング、複数のランク、スペアリング、DDR4コマンド/アドレスパリティエラーリカバリなどの機能が追加。Broadwell-EX世代では、OSやISVが機能をソフトウェアに取り込むことができるように拡張されているほかは、基本的には前世代と同じ機能が搭載される。

 メモリ周りにも違いがある。Xeon E7では、SMIと呼ばれるバッファを外付けで装着し、その先にDIMMモジュールを装着する形でメモリを搭載する。Xeon E7 v4でもと同じく、Intel SMI Gen.2と呼ばれる第2世代のSMIコントローラを利用して、バッファ1つにつき6枚のDIMMを装着できる。そのバッファを4つ装着可能なので、1ソケットあたりに最大24枚のDIMMを装着できる。

 Xeon E7 v4では新しく128GBの3DS LR-DIMMがサポートされる。これを利用した場合には、4ソケットのシステムでは、24(1ソケットあたり24DIMM)×4×128GBで12TB、8ソケットのシステムでは24TBという膨大な量のメインメモリを利用することが可能になる。なお、メモリの動作クロックなどは、Xeon E7 v3と同じだ。

メモリ周りはXeon E7 v3と基本的に同じだが、新たに128GBの3DS LR-DIMMがサポートされる。8ソケットの場合は24TBまでメモリを増設できる(出典:Intel Xeon Processor E7-8800/4800 v4 Product Family Performance UPDATE、2016年、Intel Corporation)

 また、従来は2構成でのみサポートされていた、キャッシュスヌープの新方式COD(Cluster on Die)に関して、4ソケット構成でも対応する。CODは、プロセッサ内部を2つのクラスタに分割し、2つあるホームエージェントにあるディレクトリキャッシュと呼ばれる14KBのキャッシュテーブルをまず参照し、そこでヒットしない場合にのみホームエージェントがスヌープを行なうという仕組みだ。これにより、LLC(Last Level Cache)のヒット率を上げ、かつメモリレイテンシの低減、メモリ帯域の効率的な利用もできる。

CODの機能が4ソケットでも利用できるようになる(出典:Intel Xeon Processor E7 v4 Family Architecture Review、2016年、Intel Corporation)

 なお、Xeon E7 v4(Broadwell-EX)、Xeon E7 v3(Haswell-EX)、Xeon E7 v2(Ivy Bridge-EX)の3世代の機能やスペックは以下の通りだ。CPUソケットは、従来と同じSocket R1(LGA2011)になる。

【表2】 Xeon E7 v4、Xeon E7 v3、Xeon E7 v2の仕様の比較
Xeon E7 v2Xeon E7 v3Xeon E7 v4
ソケットSocket R1
プラットフォームコードネームBrickland
プロセス技術22nm14nm
CPUコア最大15最大18最大24
最大TDP165W
AVXAVX1(8DP FLOPS/クロック/コア)AVX2(16DP FLOPS/クロック/コア)AVX2(16DP FLOPS/クロック/コア)
VT-x新機能未対応対応対応
FMA未対応対応対応
TSX未対応対応対応
QPI3xQPI 1.1(最大8GT/sec)3xQPI 1.1(最大9.6GT/sec)3xQPI 1.1(最大9.6GT/sec)
LLC最大37.5MB最大45MB最大60MB
スヌープモードDirectoryDirectoryDirectry/COD
メモリDDR3DDR3/DDR4DDR3/DDR4
SMI速度2,667MT/sec3,200MT/sec3,200MT/sec
DIMM数24DIMM/ソケット
eMCAv1v2v2
MCA Recovery- Execution Path
MCA Recovery- Execution I/O
PCIe LER
Address Based Memory Mirroring-
Muliple Rank Sparing-
DDR4 Recovery for Command/Parity Errors-
OS/ISV統合---
I/O32xPCIe 3.0、1xDMI2(x4)

前世代と比較して概ね1.3倍の性能向上を実現

 Xeon E7 v4に用意されているSKUは次のようになっている。

【表3】Xeon E7 v4のSKU構成
最大ソケット数コア/スレッド周波数Turbo BoostLLCQPITDP価格(ドル)
E7-8890 v4824/482.2GHz60MB9.6GT/sec165W7,174
E7-8880 v4822/482.2GHz55MB9.6GT/sec150W5,895
E7-8870 v4820/402.1GHz50MB9.6GT/sec140W4,672
E7-8860 v4818/362.2GHz45MB9.6GT/sec140W4,061
E7-4850 v4416/322.1GHz40MB8GT/sec115W3,003
E7-4830 v4414/282GHz35MB8GT/sec115W2,170
E7-4820 v4410/202GHz-25MB6.4GT/sec115W1,502
E7-4809 v448/162.1GHz-20MB6.4GT/sec115W1,223
E7-8891 v4810/202.8GHz60MB9.6GT/sec165W6,841
E7-8893 v484/83.2GHz60MB9.6GT/sec140W6,841
E7-8867 v4818/362.4GHz45MB9.6GT/sec165W4,672

 Intelは性能データも公開している。従来世代の最上位SKUとなるXeon E7-8890 v3(18コア、2.5GHz、165W)と、新製品の最上位SKUとなるXeon E7-8890 v4(24コア、2.2GHz、165W)の比較では、SPECfp_rate_base2006で1.19倍、SPECint_rate_base2006で1.28倍、SPECjbb2015 Multi-JVM Criticalで1.29倍、TPC-E SQL Serverで1.3倍、SAP Sales and Distribution 2T LINUXで1.33倍、SAP Sales and Distribution 2T Windowsで1.33倍、SPECvirt_sc 2013で1.35倍という結果だという。Intelによれば、こうした結果から、概ね前世代に比べて約1.3倍性能が向上していると評価している。

Xeon E7-8890 v4とXeon E7-8890 v3の比較。Xeon E7-8890 v4が平均して1.3倍の性能向上(出典:Intel Xeon Processor E7-8800/4800 v4 Product Family Performance UPDATE、2016年、Intel Corporation)

 5年前に発売されたWestmere-EX世代のXeon E7-4870(10コア)とXeon E7-8890 v4の比較では、33台の4ソケットのXeon E7-8890 v4は、100台の4ソケットのXeon E7-4870と同等性能で、ネットワーク/メンテナンスコストが最大92%、電気/空調費が最大73%、ソフトウェアライセンスのコストが最大67%削減されるというメリットがあるとしている。

Xeon E7-8890 v4と5年前のXeon E7-4870の4ソケットサーバーを、同じ性能で台数で比較すると、Xeon E7-4870の100台に対し、Xeon E7-8890 v4は33台で済む。ネットワーク/メンテナンスコストが最大92%、電気/空調費が最大73%、ソフトウェアライセンスのコストが最大67%削減される(出典:Intel Xeon Processor E7-8800/4800 v4 Product Family Performance UPDATE、2016年、Intel Corporation)

 2ソケットのXeon E5-2699 v4(22コア)と4ソケットのXeon E7-8890 v4(24コア)の比較の場合には、20台の2ソケットXeon E5-2699 v4サーバーが、9台の4ソケットXeon E7-8890 v4サーバーと同等の性能で、TCOは25%低くなるという。

2ソケットのXeon E5-2699 v4(22コア)とXeon E7-8890 v4(24コア)の比較(出典:Intel Xeon Processor E7-8800/4800 v4 Product Family Performance UPDATE、2016年、Intel Corporation)

 競合他社との比較では、IBM POWER8(E870)とXeon E7-8890 v4との比較データも公開されており、性能ではXeon E7-8890 v4がIBM POWER8(E870)を40%上回りながら、電力は半分。これにより、コストパフォーマンスではIBM POWER8(E870)に比べて10倍高いとIntelは主張している。

IBM POWER8(E870)との比較(出典:Intel Xeon Processor E7-8800/4800 v4 Product Family Performance UPDATE、2016年、Intel Corporation)