ニュース
Intel、8ソケット対応の24コアプロセッサXeon E7 v4シリーズ
~Xeon E7 v3と比較して約1.3倍の性能
2016年6月6日 16:01
米Intelは6日(現地時間)、「Broadwell-EX」のコードネームで開発を続けてきたデータセンター(サーバー)向けプロセッサとなるXeon E7 v4ファミリーを発表した。Xeon E7 v4ファミリーは、同社の4ソケット超製品となるXeon E7としては初めて14nmプロセスルールで製造され、前世代となるXeon E7 v3ファミリー(開発コードネーム:Haswell-EX)が18コアだったのに対して24コアに強化されている。
Intelによれば、Xeon E7 v4はXeon E7 v3に比べて概ね1.3倍程度の性能を実現しており、5年前の2011年に投入された初代Xeon E7の4ソケットサーバー100台分と同じ性能を、33台分で実現でき、ランニングコストも削減可能だという。
E7は8ソケットまで対応
Intelのデータセンター向けプロセッサは、サブブランドで分類するとXeon E7、Xeon E5、Xeon E3の3種類があり、以下のような違いがある。
現行製品 | ソケット数 | GPU | ターゲット市場 |
---|---|---|---|
Xeon E7 v4(Broadwell-EX) | 4~8 | - | ミッションクリティカル、大規模サーバー |
Xeon E5 v4(Broadwell-EP) | 2~4 | - | メインストリームサーバー |
Xeon E3 v5(Skylake) | 1 | 有り/なし | エントリーサーバー |
一番ローエンドになるE3シリーズは、シングルソケットサーバー向けと位置付けられている。クライアントPCと同じダイが採用されており、内蔵GPUが無効にされているSKUと、そのまま有効にされているSKUがあり、後者はGPUのトランスコードハードウェアを利用して動画の高速変換も可能になっている。現時点ではクライアントPC向けの第6世代Coreプロセッサと共通のダイとなるSkylake(開発コードネーム)が採用されており、先日台湾で行われたCOMPUTEX TAIPEIでは、その最新製品となるXeon E3-1500 v5(別記事参照)が発表されている。
E5シリーズはメインストリームサーバーと位置付けられる2ソケットサーバー向けの製品となる。現状日本で一般的にサーバーと呼ばれているのはこの2ソケットのE5シリーズのことを指しており、エンタープライズサーバーや、データセンターのクラウドサーバーなどにはこのE5シリーズが利用されることが多い。現在の最新製品は3月31日(米国時間)に発表された、Xeon E5 v4(別記事参照)になる。
そして、新しく発表されたのが、Xeon E7 v4。E7シリーズは、Intelの自社チップセットでは4ソケットまで、サードパーティのチップセットであれば8ソケットまでの大規模構成に対応し、ミッションクリティカルサーバーやインメモリデータベースなどの大規模データベースサーバー向けと位置付けられいる。昨年(2015年)発表されたXeon E7 v3(開発コードネーム:Haswell-EX)を置き変えることになる。
Xeon E5 v4と同じダイを利用しつつ、最大24コアで拡張機能も実装
Xeon E7 v4は、CPUのダイそのものはXeon E5 v4に使われているBroadwell-EPと同じだ。Broadwell-EPのダイの特徴などに関しては、先の別記事で詳しく解説しているので、そちらをご参照頂きたい。
ただし、Xeon E7 v4では、Xeon E5 v4では無効にされていたいくつかの機能が有効にされている。具体的には、以下の3つの点。
- CPUコアが最大24コアまで(Xeon E5 v4では22コアまで)
- RAS機能
- SMIによる大容量メモリの搭載が可能に
Xeon E5 v4、Xeon E7 v4共通に使用されているBroadwellのLCC(Large Core Count)と呼ばれる最大構成のダイには、24コアが内蔵されている。しかし、Xeon E5 v4では最大構成でも2つのコアが無効にされ、22コア構成になっている。一方、Xeon E7 v4では最大24コア構成のSKUが用意されており、HT(Hyper Threading)テクノロジを有効にした場合には、最大48論理コアで利用できる。最大で8ソケット構成が可能になるので、1台で192コア/384スレッドというマシンを構築できる。
また、Xeon E5 v4では無効になっていた、RAS(Reliability Availability Serviceability、信頼性/可用性/管理性)機能が有効になっている。RASは、エラーなどをチェックして対処する機能で、ミッションクリティカルなサーバーに利用されるXeon E7シリーズには必須とも言える機能。Intelでは同社のRAS機能を「Intel RunSure Technology」と総称している。
このRAS機能は、毎世代機能が追加おり、前世代ではエンハンスドMCA Gen.2、アドレスレンジメモリミラーリング、複数のランク、スペアリング、DDR4コマンド/アドレスパリティエラーリカバリなどの機能が追加。Broadwell-EX世代では、OSやISVが機能をソフトウェアに取り込むことができるように拡張されているほかは、基本的には前世代と同じ機能が搭載される。
メモリ周りにも違いがある。Xeon E7では、SMIと呼ばれるバッファを外付けで装着し、その先にDIMMモジュールを装着する形でメモリを搭載する。Xeon E7 v4でもと同じく、Intel SMI Gen.2と呼ばれる第2世代のSMIコントローラを利用して、バッファ1つにつき6枚のDIMMを装着できる。そのバッファを4つ装着可能なので、1ソケットあたりに最大24枚のDIMMを装着できる。
Xeon E7 v4では新しく128GBの3DS LR-DIMMがサポートされる。これを利用した場合には、4ソケットのシステムでは、24(1ソケットあたり24DIMM)×4×128GBで12TB、8ソケットのシステムでは24TBという膨大な量のメインメモリを利用することが可能になる。なお、メモリの動作クロックなどは、Xeon E7 v3と同じだ。
また、従来は2構成でのみサポートされていた、キャッシュスヌープの新方式COD(Cluster on Die)に関して、4ソケット構成でも対応する。CODは、プロセッサ内部を2つのクラスタに分割し、2つあるホームエージェントにあるディレクトリキャッシュと呼ばれる14KBのキャッシュテーブルをまず参照し、そこでヒットしない場合にのみホームエージェントがスヌープを行なうという仕組みだ。これにより、LLC(Last Level Cache)のヒット率を上げ、かつメモリレイテンシの低減、メモリ帯域の効率的な利用もできる。
なお、Xeon E7 v4(Broadwell-EX)、Xeon E7 v3(Haswell-EX)、Xeon E7 v2(Ivy Bridge-EX)の3世代の機能やスペックは以下の通りだ。CPUソケットは、従来と同じSocket R1(LGA2011)になる。
Xeon E7 v2 | Xeon E7 v3 | Xeon E7 v4 | |
---|---|---|---|
ソケット | Socket R1 | ||
プラットフォームコードネーム | Brickland | ||
プロセス技術 | 22nm | 14nm | |
CPUコア | 最大15 | 最大18 | 最大24 |
最大TDP | 165W | ||
AVX | AVX1(8DP FLOPS/クロック/コア) | AVX2(16DP FLOPS/クロック/コア) | AVX2(16DP FLOPS/クロック/コア) |
VT-x新機能 | 未対応 | 対応 | 対応 |
FMA | 未対応 | 対応 | 対応 |
TSX | 未対応 | 対応 | 対応 |
QPI | 3xQPI 1.1(最大8GT/sec) | 3xQPI 1.1(最大9.6GT/sec) | 3xQPI 1.1(最大9.6GT/sec) |
LLC | 最大37.5MB | 最大45MB | 最大60MB |
スヌープモード | Directory | Directory | Directry/COD |
メモリ | DDR3 | DDR3/DDR4 | DDR3/DDR4 |
SMI速度 | 2,667MT/sec | 3,200MT/sec | 3,200MT/sec |
DIMM数 | 24DIMM/ソケット | ||
eMCA | v1 | v2 | v2 |
MCA Recovery- Execution Path | ○ | ○ | ○ |
MCA Recovery- Execution I/O | ○ | ○ | ○ |
PCIe LER | ○ | ○ | ○ |
Address Based Memory Mirroring | - | ○ | ○ |
Muliple Rank Sparing | - | ○ | ○ |
DDR4 Recovery for Command/Parity Errors | - | ○ | ○ |
OS/ISV統合 | - | - | - |
I/O | 32xPCIe 3.0、1xDMI2(x4) |
前世代と比較して概ね1.3倍の性能向上を実現
Xeon E7 v4に用意されているSKUは次のようになっている。
最大ソケット数 | コア/スレッド | 周波数 | Turbo Boost | LLC | QPI | TDP | 価格(ドル) | |
---|---|---|---|---|---|---|---|---|
E7-8890 v4 | 8 | 24/48 | 2.2GHz | ○ | 60MB | 9.6GT/sec | 165W | 7,174 |
E7-8880 v4 | 8 | 22/48 | 2.2GHz | ○ | 55MB | 9.6GT/sec | 150W | 5,895 |
E7-8870 v4 | 8 | 20/40 | 2.1GHz | ○ | 50MB | 9.6GT/sec | 140W | 4,672 |
E7-8860 v4 | 8 | 18/36 | 2.2GHz | ○ | 45MB | 9.6GT/sec | 140W | 4,061 |
E7-4850 v4 | 4 | 16/32 | 2.1GHz | ○ | 40MB | 8GT/sec | 115W | 3,003 |
E7-4830 v4 | 4 | 14/28 | 2GHz | ○ | 35MB | 8GT/sec | 115W | 2,170 |
E7-4820 v4 | 4 | 10/20 | 2GHz | - | 25MB | 6.4GT/sec | 115W | 1,502 |
E7-4809 v4 | 4 | 8/16 | 2.1GHz | - | 20MB | 6.4GT/sec | 115W | 1,223 |
E7-8891 v4 | 8 | 10/20 | 2.8GHz | ○ | 60MB | 9.6GT/sec | 165W | 6,841 |
E7-8893 v4 | 8 | 4/8 | 3.2GHz | ○ | 60MB | 9.6GT/sec | 140W | 6,841 |
E7-8867 v4 | 8 | 18/36 | 2.4GHz | ○ | 45MB | 9.6GT/sec | 165W | 4,672 |
Intelは性能データも公開している。従来世代の最上位SKUとなるXeon E7-8890 v3(18コア、2.5GHz、165W)と、新製品の最上位SKUとなるXeon E7-8890 v4(24コア、2.2GHz、165W)の比較では、SPECfp_rate_base2006で1.19倍、SPECint_rate_base2006で1.28倍、SPECjbb2015 Multi-JVM Criticalで1.29倍、TPC-E SQL Serverで1.3倍、SAP Sales and Distribution 2T LINUXで1.33倍、SAP Sales and Distribution 2T Windowsで1.33倍、SPECvirt_sc 2013で1.35倍という結果だという。Intelによれば、こうした結果から、概ね前世代に比べて約1.3倍性能が向上していると評価している。
5年前に発売されたWestmere-EX世代のXeon E7-4870(10コア)とXeon E7-8890 v4の比較では、33台の4ソケットのXeon E7-8890 v4は、100台の4ソケットのXeon E7-4870と同等性能で、ネットワーク/メンテナンスコストが最大92%、電気/空調費が最大73%、ソフトウェアライセンスのコストが最大67%削減されるというメリットがあるとしている。
2ソケットのXeon E5-2699 v4(22コア)と4ソケットのXeon E7-8890 v4(24コア)の比較の場合には、20台の2ソケットXeon E5-2699 v4サーバーが、9台の4ソケットXeon E7-8890 v4サーバーと同等の性能で、TCOは25%低くなるという。
競合他社との比較では、IBM POWER8(E870)とXeon E7-8890 v4との比較データも公開されており、性能ではXeon E7-8890 v4がIBM POWER8(E870)を40%上回りながら、電力は半分。これにより、コストパフォーマンスではIBM POWER8(E870)に比べて10倍高いとIntelは主張している。