ニュース
Intel、データセンター向けCPU「Xeon E5-2600 v2」を発表
~12/10/6コアの3種類のダイをラインナップ
(2013/9/11 03:30)
Intelは、現在サンフランシスコで開催中のIDF(Intel Developer Forum) 2013に合わせて、同社のデータセンター向けCPU「Xeon」の最新製品となる「E5-2600 v2」シリーズを発表した。
開発コードネーム「Ivy Bridge-EP」で知られてきた同製品は、昨年(2012年)の3月にリリースされたE5-2600(Sandy Bridge-EP)の後継となる製品で、製造プロセスルールが32nmから22nmに微細化されたほか、最大CPUコア数が8個から12個に強化されるなど、性能と電力効率が改善されているのが特徴になる。
従来のSandy Bridge-EPでは、8コアのダイのみが用意され、そのダイからCPUコアを無効にすることで6/4コア製品ラインナップを実現していたが、Ivy Bridge-EPでは当初から6/10/12コアという3つのダイデザインを用意し、製造効率を高めたのも特徴の1つと言える。
マイクロアーキテクチャに拡張が加えられているXeon E5-2600 v2
Xeon E5-2600 v2は、“v2”という製品名からもわかるように、2012年の3月に発表したXeonプロセッサー E5-2600の後継となる製品だ。
Intelのデータセンターサーバー向けのプロセッサは、4ソケット以上向けの「Xeon E7」、4ソケット向けの「Xeon E5-4600」、2ソケット向けの「Xeon E5-2600/2400」、1ソケット向けの「Xeon E3」、さらには先日「Atom C2000」として発表された低消費電力で高密度サーバー向けの「Atom C」などが用意されている。今回取り上げるXeon E5-2600 v2は、2ソケットのメインストリームサーバー向けとなる。
Xeon E5-2600 v2を、前世代のXeon E5-2600(Sandy Bridge-EP)、2世代前となるXeon 5600(Westmere-EP)の違いを表にすると、以下のようになる。
製品ブランド | - | Xeon E5 2600 v2 | Xeon E5 2600 | Xeon 5600 |
---|---|---|---|---|
開発コードネーム | - | Ivy Bridge-EP | Sandy Bridge-EP | Westmere-EP |
プロセッサマイクロアーキテクチャ | - | Ivy Bridge | Sandy Bridge | Nehalem |
製造プロセスルール | - | 22nm | 32nm | 32nm |
CPUソケット | - | LGA2011 | LGA2011 | LGA1366 |
CPUコア | 最大コア数/スレッド(ダイあたり) | 6/12、10/20、12/24 | 8/16 | 6/12 |
AVX対応 | ○ | ○ | - | |
LLC(最大) | 15MB、20MB、30MB | 20MB | 12MB | |
メモリ | メモリ | DDR3/DDR3L | DDR3/DDR3L | DDR3/DDR3L |
メモリチャネル | 4ch | 4ch | 3ch | |
メモリクロック | 最大1,866MT/sec | 最大1,600MT/sec | 最大1,333MT/sec | |
最大メモリ容量 | 768GB | 768GB | 288GB | |
電圧 | 1.5/1.35V | 1.5/1.35V | 1.5/1.35V | |
RDIMM | ○ | ○ | ○ | |
LRDIMM | ○ | ○ | - | |
I/O | QPI | 2ch | 2ch | 2ch |
QPI帯域 | 8GT/sec | 8GT/sec | 6.4GT/sec | |
PCI Express | 内蔵40レーン(Gen3)+4レーン(Gen2/DMI) | 内蔵40レーン(Gen3)+4レーン(Gen2/DMI) | - | |
PCI Express x16 NTB対応 | ○ | - | - |
表からも分かるように、最大の違いは、製造プロセスルールがXeon E5-2600の32nmから22nmに微細化されたことだ。
CPUの世代が新しくなるのは、マイクロアーキテクチャが新しくなるか、新しい製造プロセスルールが導入された時ということになるのだが、Intelはこの2つの要素を交互に導入することで、プロセッサの開発時に生じるさまざまなリスク(開発の失敗や、スケジュールの遅延など)を最小限にする“チックタック”ビジネスモデルを採用している。
Xeon E5-2600の製造プロセスルールは、その前の世代にあたるXeon 5600シリーズと同じ32nmを利用して製造されていたが、マイクロアーキテクチャを刷新し、PC向けのCoreプロセッサと同じリングバス構造を採用。CPUコア数を8つまで拡張できるようにした。
それに対して、今回のXeon E5-2600 v2は製造プロセスルールを22nmへ微細化する一方で、マイクロアーキテクチャは若干の拡張を加えるに留めた。しかし、微細化による性能向上と消費電力削減が期待できる。
6/10/12コアと3つのダイバリエーションが存在するIvy Bridge-EP
Xeon E5-2600 v2のマイクロアーキテクチャの改良点は、複数のダイバリエーションの存在と、リングバス構造の拡張だ。
Xeon E5-2600では、ダイバリエーションは8コアの1つのみで、SKUに用意されていた6/4コアといった製品は、8コアのダイからコアを無効にすることで製品展開をしていた。6コアの製品では2コアを無効にし、4コアの製品では4コアを無効にするといった具合だ。
しかし、Xeon E5-2600 v2ではダイは12/10/6コアと3つを用意し、後述するSKUにある8コアや4コアは、それぞれ10コア、6コアのダイから2コアを無効にするという形で提供される(実際には10コアから4コアを無効にして6コアにした製品もあるとIntelは説明する。これは製造上の柔軟性を確保するための措置だ)。このようにダイバリエーションを増やすことは、開発や動作検証にコストや時間がかかるという制約は付くものの、無駄が減るという意味で、より効率よく製造できるメリットがある。
また、12コア版のダイでは、リングバス構造を拡張した。従来のXeon E5-2600では、CPUコア/メモリコントローラ/システムバスなどを双方向のリングバスで接続していたのだが、これが12コア版では三重構造となる。ただし、各CPUコアやシステムバスが接続しているのは2つのリングバスになるという仕組みは変わらない。
12コア版では、そのままではレイテンシが増大する可能性があるため、こうした構造を採ったのだとIntelは説明する。また、三重リングバスを採用したことにより、メモリコントローラも増やすことができるようになった(ただしチャネル数は従来と変わらず4チャネル)。これにより、12コアではメモリ帯域の効率性が向上している。
Xeon E5-2600 v2は従来と同様、L3キャッシュがCPUコアに付随して配置される。各コアあたり2.5MBのL3キャッシュが付随するため、12コア版では30MB、10コア版では25MB、6コア版では15MBのL3キャッシュを搭載する。
CPUコアのアーキテクチャそのものは、クライアントPC向けの第3世代Coreプロセッサ(開発コードネーム:Ivy Bridge)に採用されているコアと共通で違いはない。Sandy Bridgeからの内部効率の改善と、Float 16-SPコンバージョンなどがAVX/SSEに追加されたことなどが強化点となる。
また、6コアのダイは、コンシューマのハイエンド向けデスクトップCPU「Core i7」のLGA2011ソケット版に転用される(別記事参照)。Core i7-4960X、i7-3970X、i7-3960Xは開発コードネームIvy Bridge-Eの名前が与えられているが、これはIvy Bridge-EPの6コア版そのものだと考えていい。
プラットフォームはRomley-EPで共通だが、PCI Express効率が改善
Xeon E5-2600 v2のプラットフォームは、Romley-EPの開発コードネームが与えられている、Xeon E5-2600と同じモノを利用することになる。チップセットも同じC600シリーズ(開発コードネーム:Patsburg)で、マザーボードはファームウェアのアップグレードは必要になるが、基本的に同じマザーボードが利用できる(サポートされるかはメーカーによる)。プロセッサ間の接続に利用されるQPIが2つ、CPU毎に40レーンのPCI Express Gen 3.0、チップセットに接続していないCPUがPCI Express Gen2が4レーンを提供できるという、プラットフォーム側の仕様は何も変わっていない(ただしメモリは新たに1,866MT/secに対応)。
ただし、PCI Expressのコントローラ内部には改良が入っており、PCI Express Gen3の仕様でオプションとして規定されているPCIe Atomic(フェッチ機能、スワップ機能など)やx16NTB(Non-Transparent Bridge、Sandy Bridge-EP世代ではx8NTBまで対応)などの機能を追加。これらにより帯域の有効活用が可能になるほか、追加のクロックゲーティング機能などにより省電力性も高まっている。こうした機能により、PCI Expressに、GPUを追加してGPGPUとして利用する場合に効率が高まるとIntelでは説明している。
前世代と比較して26~45%の性能向上を実現しているXeon E5-2600 v2シリーズ
Intelの発表によれば、Xeon E5-2600 v2は以下のようなSKUが用意されている。
プロセッサナンバー | コア数/スレッド数 | クロック周波数(ターボモード時) | ターボブースト対応 | L3キャッシュ | QPIクロック周波数 | ソケット | TDP | 千個ロット時価格(米ドル) |
---|---|---|---|---|---|---|---|---|
E5-2697 v2 | 12/24 | 2.7GHz(3.5GHz) | ○ | 30MB | 8.00 GT/sec | LGA2011 | 130W | 2,614 |
E5-2695 v2 | 12/24 | 2.4GHz(3.2GHz) | ○ | 30MB | 8.00 GT/sec | LGA2011 | 115W | 2,336 |
E5-2690 v2 | 10/20 | 3GHz(3.6GHz) | ○ | 25MB | 8.00 GT/sec | LGA2011 | 130W | 2,057 |
E5-2680 v2 | 10/20 | 2.8GHz(3.6GHz) | ○ | 25MB | 8.00 GT/sec | LGA2011 | 115W | 1,723 |
E5-2670 v2 | 10/20 | 2.5GHz(3.3GHz) | ○ | 25MB | 8.00 GT/sec | LGA2011 | 115W | 1,552 |
E5-2660 v2 | 10/20 | 2.2GHz(3GHz) | ○ | 25MB | 8.00 GT/sec | LGA2011 | 95W | 1,389 |
E5-2650 v2 | 8/16 | 2.6GHz(3.4GHz) | ○ | 20MB | 8.00 GT/sec | LGA2011 | 95W | 1,166 |
E5-2640 v2 | 8/16 | 2GHz(2.5GHz) | ○ | 20MB | 7.20 GT/sec | LGA2011 | 95W | 885 |
E5-2630 v2 | 6/12 | 2.6GHz(3.1GHz) | ○ | 15MB | 7.20 GT/sec | LGA2011 | 80W | 612 |
E5-2620 v2 | 6/12 | 2.1GHz(2.6GHz) | ○ | 15MB | 7.20 GT/sec | LGA2011 | 80W | 406 |
E5-2609 v2 | 4/4 | 2.5GHz | × | 10MB | 6.40 GT/sec | LGA2011 | 80W | 294 |
E5-2603 v2 | 4/4 | 1.8GHz | × | 10MB | 6.40 GT/sec | LGA2011 | 80W | 202 |
E5-2650L v2 | 10/20 | 1.70GHz(2.2GHz) | ○ | 25MB | 8.00 GT/sec | LGA2011 | 70W | 1,219 |
E5-2630L v2 | 6/12 | 2.4GHz(2.8GHz) | ○ | 15MB | 7.20 GT/sec | LGA2011 | 60W | 612 |
E5-2687W v2 | 8/16 | 3.4GHz(4GHz) | ○ | 25MB | 8.00 GT/sec | LGA2011 | 150W | 2,108 |
E5-2667 v2 | 8/16 | 3.3GHz(4GHz) | ○ | 25MB | 8.00 GT/sec | LGA2011 | 130W | 2,057 |
E5-2643 v2 | 6/12 | 3.5GHz(3.8GHz) | ○ | 25MB | 8.00 GT/sec | LGA2011 | 130W | 1,552 |
E5-2637 v2 | 4/8 | 3.5GHz(3.8GHz) | ○ | 15MB | 8.00 GT/sec | LGA2011 | 130W | 996 |
E5-1660 v2 | 6/12 | 3.7GHz(4GHz) | ○ | 15MB | - | LGA2011 | 130W | 1,080 |
E5-1650 v2 | 6/12 | 3.5GHz(3.9GHz) | ○ | 12MB | - | LGA2011 | 130W | 583 |
E5-1620 v2 | 4/8 | 3.7GHz(3.9GHz) | ○ | 10MB | - | LGA2011 | 130W | 294 |
12/10/8/6/4コアと各種の製品が用意されており、ユーザーはニーズや消費電力のバランスから必要な製品を選択することができる。
なお、Intelは発表と同時にベンチマーク結果も発表しており、その結果は以下のようになっている。
最上位SKUとなるXeon E5-2697 v2(2.7GHz、12コア、TDP 130W)は、前世代のXeon E5-2690(2.9GHz、8コア、TDP 135W)と比較して26~47%程度の性能向上を実現していることが分かる。さらに2世代前のXeon X5570との比較では概ね2.2倍、3世代前のXeon X5570との比較では概ね3.3倍の性能向上があることが確認できたとIntelでは説明している。