後藤弘茂のWeekly海外ニュース

デュアルコアからオクタコアまでスケーラブルなNehalem




●バリエーションの多いNehalem

 Intelが来年(2008年)後半に投入する次期CPU「Nehalem(ネハーレン)」は、2コアから8コアまでのバリエーションを持つ。最初のNehalemはクアッドコア版だが、Intelは続けて2009年中にデュアルコア、オクタコア、さらにGPU統合版を投入する。これまで、Intelは、ダイ(半導体本体)レベルではCPUのバリエーションを最小に止めてきた。しかし、Nehalemでは、異なるコンフィギュレーションのダイを積極的に展開する。また、投入する市場に合わせて、CPUコア以外の部分の差別化も図る。

Patrick(Pat) P. Gelsinger氏

 IntelのPatrick(Pat) P. Gelsinger(パット・P・ゲルシンガー)氏(Senior Vice President and General Manager, Digital Enterprise Group)は、Nehalemの展開について次のように語る。

 「Nehalemでは、モノリシックな(1チップに統合された)クアッドコア版が最初の製品になるだろう。次に、2009年にデュアルコア版と8コア版のNehalemも投入する。8コア版は、8個のコアがそれぞれ2スレッドを実行できる、モノリシックな1個のシリコンになる。

 2009年には8ソケットバージョンも提供する。8コアがそれぞれ2スレッドで、システム当たり8ソケット、トータルでは128スレッドをネイティブにサポートできる。これが2009年の最大のコンフィギュレーションとなる。もちろん、顧客がノードコントローラを使うことでさらに大規模なコンフィギュレーションを作ることもできる。また、2009年にはグラフィックス統合版を含めたNehalemのバージョンも提供する」

 Intelが、Intel Developer Forum(IDF)で公開したクアッドコア版NehalemはDP(Dual-Processor)版が「Gainestown(ゲインズタウン)」、UP(Uni-Processor)版が「Bloomfield(ブルームフィールド)」。どちらも、ネイティブクアッドコアで、従来のCore Microarchitecture(Core MA)系のような、デュアルコアCPUを2個、MCM(Multi-Chip Module)に封止したクアッドコアではない。2008年の第3四半期後半から第4四半期前半にかけて、Intelが投入する予定のNehalemは、このクアッドコアのダイ(半導体本体)だ。

Nehalemの構成
※別ウィンドウで開きます
PDF版はこちら

Intel Notebook / Desktop Roadmap
※別ウィンドウで開きます

Intel Xeon Enterprise Roadmap
※別ウィンドウで開きます

●スケーラブルなNehalem

 しかし、Nehalemのダイは1種類ではなく、Intelは2009年には、コアのコンフィギュレーションが異なるダイを、少なくともさらに3種類投入する。デュアルコア、オクタコア、GPU統合と、デュアルコアと合わせて合計で4系統のコアコンフィギュレーションが併存する。これは、Core MA系との大きな違いだ。Core MAの製品群は、基本的にデュアルコアとシングルコアの2種類のコアコンフィギュと、デュアルコアのキャッシュSRAMの量を変えたバージョンで構成されている。これは、MP向けのXeon 7300系(Tigerton:タイガートン)も含む。それと比べると、Nehalemの方が、ダイのバリエーションがより大きく種類も多い。

 Intelは、その理由として、Nehalemアーキテクチャがスケーラブルな設計になっていると説明する。実際にダイを見ても、NehalemのCPUコアが1個単位でブロック化されているように見える。また、Nehalemでは、CPUコア群とインターフェイス部分を結ぶオンチップネットワークブロックと思われる部分も大きい。オンチップネットワークも、スケーラブル設計になっている可能性が高い。この点が、2個のCPUコアがタイトに統合されたCore MAとは大きく異なる。Nehalemでは、CPUコア数の増減を、最初から考慮して設計した形跡がある。

 じつはIntelも、Core MAのネイティブクアッドコアCPUを開発していた。これは「Whitefield(ホワイトフィールド)」で、Intelのインドの開発センターが担当していたが、キャンセルとなっている。IntelのJustin R. Rattner(ジャスティン・R・ラトナー)氏(Senior Fellow, Corporate Technology Group/CTO, Intel)によると、クアッドコアCPUのキャンセルは開発の難航にあったという。

 「インドではクアッドコアCPUを設計していたが、遅れ続けた。そのため、結局、完成できないと判断して打ち切った。問題の1つは、情報の共有がうまく行かなかったことで、設計者同士の連携がうまくいかず、開発が難航した」(Rattner氏)

 Core MAは、スケーラブルに拡張することが難しい設計であり、それが一因となってCore MAを開発したIntelイスラエルとは別な開発部隊がクアッドコア開発を担当したと推測される。しかし、開発のハンドリングがうまく行かず、Core MAのクアッドコアは実現しなかった。それに対して、Nehalemは最初からクアッドコア、あるいはそれ以上を見越した設計を取っているため、迅速にスケーラブルな展開が可能になると見られる。

 Nehalemのこうした特徴は、AMDのBarcelona(バルセロナ)系CPUと共通している。Barcelona系も、スケーラブルにコアコンフィギュレーションが容易な設計を取っている。AMDもIntelも、これまでのCPUはデュアルコア世代で、デュアルコアに最適化設計されていた。しかし、次の世代ではどちらもマルチコアに最適化する。そのため、モジュラー化とスケーラビリティが、AMDとIntelに共通した特徴となっているようだ。

 AMDはモジュラー化のために、CPUの各モジュールのインターフェイスをクリーンに定義しつつある。Intelがそうした設計を行なっているかどうかはわからないが、基本的なアプローチはAMDと似通ったものになるはずだ。

PenrynとNehalemのダイ比較
※別ウィンドウで開きます
PDF版はこちら

Core MAとNehalemのスケーラビリティの違い
※別ウィンドウで開きます
PDF版はこちら

●Nehalemのメインストリームへの浸透はしばらくかかる

 Intelは、デュアルコアNehalemも必要としている。クアッドコアNehalemのダイサイズ(半導体本体の面積)は約270平方mmと推定されるからだ。これは、メインストリームCPUとしては高コストなダイサイズだ。IntelのメインストリームCPUは、通常、100平方mm台であり、デュアルコア版Nehalemはその範囲に収まると推定される。Intelは、Core MA世代でクアッドコアCPUの価格を引き下げて浸透を図っている。しかし、コスト的に考えると、メインストリームCPUを全てクアッドコアに切り替えることは、45nmプロセス世代ではまだ不可能だ。そのため、デュアルコアが必要となる。

Intel CPU Die-Size and Microarchitecture
※別ウィンドウで開きます
PDF版はこちら

Stephen L. Smith氏

 こうした背景から、2008年のローンチからしばらくの間、Nehalemは、ハイエンドに留まると見られる。IntelのStephen L. Smith(スティーブ・L・スミス)氏(Vice President, Director, Digital Enterprise Group Operations, Intel)は、次のように語る。

 「Nehalemが一気に(Core MAを)置き換えるのではなく、Penrynもしばらくは継続する。(Nehalem登場後も)Penrynは、デスクトップPCと伝統的ノートPCでは、メインボリュームとなるだろう。来年後半のNehalemは、ハイエンドで始まり、下に降りるのはしばらくかかるだろう

 最初の世代のNehalemは、サーバーとワークステーション、ハイエンドデスクトップPCには向いている。Nehalemの高い機能とパフォーマンスは、ハイエンドでは魅力だ。しかし、Nehalemをボリュームゾーンへと持って行くには、より安い(システム)ソリューションが必要となる。メインストリームに移行するには、ローコストプラットフォーム、つまり、異なる設計のマザーボードとシステム設計が必要になる。

 その意味では、ハイエンドとメインストリームでは設計が異なる。しかし、今でもOEMは異なる市場セグメントに対して、異なるマザーボードを用意している。新チップセットが出れば、必然的に異なるマザーボードとなる。製品立ち上げは少し複雑になるが、たいした問題ではないと考えている」

 Nehalem自体だけでなく、チップセット側もローコストソリューションが必要となる。Intelは、DP/UP(Uni-Processor)サーバー&ワークステーションとデスクトップ向けには、非常に強力なハイエンドチップセット「Tylersburg(タイラスバーグ)」を用意している。Tylersburgの概要は以前掲載した“いよいよベールを脱ぐIntelの次期CPU「Nehalem」”でレポートした通りだ。

 しかし、メインストリーム向けのNehalemは、Tylersburg系とは異なるチップセットでカバーする。よりローコストなプラットフォームを用意している。こちらは、従来の3チップソリューション(CPU+MCH+ICH)ではなく、2チップソリューション(CPU+IOH)になると言われている。

●しばらくはNehalemとCore MAが平行

 ただし、AMDのようなトリプルコア版への派生については、Intelは否定的だ。「トライコアはクアッドコアでのイールド(歩留まり)問題のためだろう。特に興味深い製品ではない」(Gelsinger氏)。「イールド上の問題がないのなら、トリプルコアを製品化する理由はない」(Smith氏)という。

 マルチコアCPUで、歩留まりを上げるためにコア数を減らすことは珍しいアプローチではない。CPUダイ(半導体本体)上で、1個のCPUコア部分に欠陥(Defect)が発生するケースはありうる。その場合、チップ上の全てのCPUコアが活きていないと製品化できないとすると、そのチップは破棄するしかなくなる。ところが、欠陥があるCPUコアだけを無効にして、他のCPUコアを活かして製品化するなら、歩留まりは飛躍的に向上する。

 PLAYSTATION 3(PS3)のCell Broadband Engine(Cell B.E.)が、8個のSPE(Synergistic Processor Element)のうち1個を無効にしているのは、まさにその理由からだ。逆を言えば、ダイ上の欠陥が少なく、イールドが十分に高いなら、そうした“n-1”マルチコアCPUの製品化は不要となる。Gelsinger氏やSmith氏が指摘しているのは、そのことだ。

 Intelの2008年後半以降のCPU計画は、Nehalemファミリと、Core Microarchitecture(Core MA)系のPenrynファミリが併存する。特に、バリューセグメントでは、現状ではNehalemアーキテクチャの投入計画は、OEMにも明らかにされていない。Nehalemはシングルコアはカバーせず、そのため、45nmプロセス世代を通じて2系統のマイクロアーキテクチャが併存すると予想される。

 ここ数回のパターンでは、Intelの新CPUは登場すると迅速に旧世代と入れ替わった。新マイクロアーキテクチャのCore 2系ですら、かなり速いペースでNetBurst系を置き換えた。しかし、今回のNehalemでは、Intelは、ややゆっくりしたペースを取るかもしれない。

 Nehalemのメインストリームへの浸透は、NehalemのGPUコア統合版の計画とも絡んでくる。企業向けデスクトップではGPUコア統合版が必要になる。今回、Nehalemではチップセット側にはグラフィックスは統合せず、CPU側に統合すると説明している。これは、従来言われていたNehalem向けのグラフィックス統合チップセット「SummitLake」の計画とは異なっている。NehalemのGPU統合については、次にレポートしたい。

●モバイルではデュアルコアが主軸

 モバイル版Nehalemの計画はどうなっているのだろう。コードネーム「Gilo(ギロ)」と言われているモバイルNehalemは、パフォーマンスノートPCとメインストリームノートPCの2セグメントで登場する。モバイルNehalemは、クアッドコア版をハイパフォーマンスノートPCに投入するが、メインストリームはデュアルコア版になる。

 IntelのShmuel (Mooly) Eden(ムーリー・エデン)氏(Vice President, General Manager, Mobile Platforms Group, Intel)は、モバイル版NehalemのCPUコア数について次のように語る。

 「(CPUコア数については)推測できるだろう。少なくとも16コアをノートPCに載せることはない(笑)。実際、私には、4コアについても、多くのユーザーが使うとは思えない。確かに、来年後半に、我々はノートPCに4コアを乗せる。しかし、それはゲームとノートワークステーションをメインに考えている。そんなに早く、(4コアが)メインストリームの領域に降りてくるとは思えない。

 なぜなら、メインストリームノートPCでの4コアは、私にはユーセージとソフトウェアが見えないからだ。並列度の高いアプリケーションはサーバー向けであり、ノートPC(のソフトウェア環境)では、そんなに多くのCPUコアは必要がない。また、コア数を増やすことで、バッテリ駆動時間を犠牲にしたくはない。そのため、(ノートPCでの)4コアは、しばらくの間はハイエンドに留まるだろう。

 4コアを載せておいて、バッテリ駆動時には稼働するコア数を減らすような手法も、選択肢の1つとしてありうる。その手法なら、厚手のノートPCでも、バッテリ駆動時間を延ばすことができる。しかし、その場合でも、アプリケーションが見えないことは同じだ。

 これは、3年前に我々が64-bitをサポートしないCore Duo(Yonah:ヨナ)を公表した時を思い出させる。あの時は、なぜ64-bitを不要と判断したのかと、誰もが我々に聞いた。しかし、今日でも64-bitアプリケーションはまだ使いやすい段階にはない(笑)」

 モバイルのソフトウェア環境では、デュアルコアまでが必要とされる範囲で、そのため、当面はハイエンドノートPC以外はクアッドコアは必要がない、というのがIntelの見解だ。少なくとも、クアッドコアに、消費電力を犠牲にするだけの価値は見いだしていない。

マルチコアCPUでの歩留まり向上策
※別ウィンドウで開きます
PDF版はこちら

●モバイルもTDPレンジは従来を維持

 また、Eden氏はCPUコア数以外の部分にも、モバイル向けのフィーチャをNehalemに実装する方向を示した。

 「今日、CPU設計の転換は、以前のCPUよりずっと容易になっている。例えば、今日では、各ソリューションに合わせて、CPUコア数を差別化することができる。Nehalemはアーキテクチャ的に変更可能で、各市場セグメントに合わせて特定のフレーバーを加えることができる。

 誤解がないようにつけ加えると、(どの市場向けのNehalemも)CPUコアの内部自体は非常に似通っている。しかし、コアを取り巻くアンコア(非コア)部分の多くは、市場によって異なる可能性がある。モバイル、デスクトップ、サーバーそれぞれに合わせたフレバーを、(アンコア部分で)加えることができる。モバイルのフレバーについては、例えば、これまでも(チップセットで)メモリコントローラをモバイルに特化させて来た」

 今回、NehalemはDRAMインターフェイスとチップ間インターコネクトのQuickPath Interconnect(QPI)インターフェイスを搭載する。インターフェイスは、消費電力の削減の余地が多い部分だ。これまでも、モバイルプラットフォームでは、チップセットに省電力フィーチャを載せて来た。Nehalem世代では、MCH機能がCPUに統合されたため、CPUのアンコア部分で、省電力機能を実装することになる。

 もっとも、Nehalemは、Core MAと比べるとCPUコアのサイズが大きい。このことは、CPUの中でロジック部分が大きいことを意味している。CPUの中のSRAM部分は、電力的にはリーク電流(Leakage)に対する影響が大きい。それに対してロジック部分は、アクティブ電力への影響が大きい。つまり、Nehalemは、原理的にはTDP(Thermal Design Power:熱設計消費電力)が高くなりやすい。Edenは、Nehalemの消費電力について次のように語る。

 「我々は、(Nehalemだからと言って)バッテリ駆動時間を犠牲にすることは望んでいない。NehalemのノートPC版は、従来のノートPC向けCPUと同じ電力設計のターゲットを想定している。ラフに言って、同じ電力設計枠に収まる。

 こうしたことに、人々が驚かないことに対して、私は逆に驚いている。Nehalemは完全に新マイクロアーキテクチャで、Core 2 Duoの整形手術ではない。高いターゲットを実現しようとしている」

 Intelは、デスクトップ版Nehalemでも、最上位は130Wと、Core MA系とほぼ同じレベルのTDPで投入する。DP(Dual-Processor)向けのGainestownが130W/80W/60Wの3段階、UP(Uni-Processor)向けのBloomfieldは130W/80W版で投入される見込みだ。モバイルでも、少なくともデュアルコア版は、従来とTDPレベルを揃えると推測される。必然的に、Nehalemではアクティブ電力を押さえ込むための省電力設計がさらに進めるか、CPU動作クロックをさらに抑えることになる。

●IA-64とプラットフォーム互換となるMP版Nehalem

 Nehalemはサーバーサイドでも、非コア部分のコンフィギュレーションが変わる。MP(Multi-Processor)版Nehalemは、QuickPath Interconnect(QPI)が2リンクではなく4リンク実装する。マルチソケット間を、最短のパスで結ぶために、より多くのインターコネクトが必要だからだ。これは、次期IA-64系CPUと共通する。

 Intelは、昨年(2006年)、Nehalem世代では、MP構成のIA-32系プラットフォームとIA-64系プラットフォームが、プラットフォーム互換になると説明していた。Gelsinger氏は、このプランは、現在もそのままだと言う。

 「Nehalemで公開したQuickPath Interconnect(QPI)は、「Tukwila(タックウィラ:次期IA-64プロセッサ)」も同様に備える。Tukwilaは来年の末までに量産がスタートし、Nehalemのようにネイティブクアッドコア設計で、同様にダイレクトメモリアーキテクチャをサポートする。

 我々は、4ソケットバージョンのNehalemで、4リンクのQPIマトリックスで4ダイが連結されるコンフィギュレーションを示した。このコンフィギュレーションで使われるIOHは、Tukwilaのコンフィギュレーションで使うIOHと全く同じだ。完全に同じIOHのシリコンが、NehalemとTukwilaの両方のプラットフォームをサポートする。

 ただし、両者では電力供給(の仕組み)が異なり、ボード設計も異なる。だから、ソケット互換ではない。しかし、システムアーキテクチャ的には互換だ。メモリアーキテクチャも共有する。ItaniumとハイエンドXEONのメモリアーキテクチャは同じになるだろう」

 つまり、MP版Nehalemである「Beckton(ベックトン)」は、Tukwilaと同じチップセット同じシステム構成が可能となる。Intelは、かなり以前からIA-32系とIA-64系の統合化を計画していた。ソケット互換の案も2回ほど浮上している。QPI化でも、最初はIA-64系とIA-32系をソケット互換にすると、OEMには説明していた。しかし、今回も、再びソケット互換ではなく、システム互換までとなった。

 Intelが両系統の互換化を図る理由の1つは、IA-64系とIA-32系のプラットフォームを交換可能にすることで、サーバーベンダーのIA-64投資のリスクを減らすこと。容易に両互換のサーバーを作れるようにして、IA-64製品参入を促すことだった。逆を言えば、Intelのプラットフォーム互換戦略は、IA-64をどれだけ重視しているかも表している。Intelがこの戦略にあまり注力しなくなると、IA-64はますます勢いを削がれることになるかもしれない。

NehalemとTukwilaのプラットフォーム互換
※別ウィンドウで開きます
PDF版はこちら

□関連記事
【9月27日】【海外】Penrynの1.5倍のCPUコアを持つ次世代CPU「Nehalem」
http://pc.watch.impress.co.jp/docs/2007/0927/kaigai389.htm
【9月20日】【海外】IntelがNehalemの概要を発表、実動デモも公開
http://pc.watch.impress.co.jp/docs/2007/0920/kaigai388.htm
【9月16日】【海外】いよいよベールを脱ぐIntelの次期CPU「Nehalem」
http://pc.watch.impress.co.jp/docs/2007/0916/kaigai386.htm

バックナンバー

(2007年10月2日)

[Reported by 後藤 弘茂(Hiroshige Goto)]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2007 Impress Watch Corporation, an Impress Group company. All rights reserved.