後藤弘茂のWeekly海外ニュース

マルチコアCPUが怒濤のように押し寄せるIntelの新ロードマップ




●IDFでわかったデュアルコアCPUの概要をチャート化

 “Intelは15以上のデュアルコアCPUと、10以上のクアッド(4個)以上コアCPUを開発している”、8月23日から米サンフランシスコで開催されたIntelの技術カンファレンス「Intel Developer Forum(IDF)」で、同社はマルチコアへの傾倒をこのように表現した。実際、Intelの2006年は、新旧のマイクロアーキテクチャのデュアルコアCPUが入り交じり、さながら“デュアルコアラッシュ”と呼ぶような状況になっている。

IntelのIA-32 CPUの構成の違い
PDF版はこちら
Intel CPUコアの移行予想図
PDF版はこちら

 そこで、IDFで明らかになったIA-32系CPUコアの概要を、市場セグメント毎に整理してみた。

 デスクトップのデュアルコアCPUは、2006年後半の次世代マイクロアーキテクチャCPU「Conroe(コンロー)」以降は、すっきりとした構図となる。元々、デスクトップはConroe世代からデュアルコアになる予定だったので、本来のコースへと戻ることになる。逆を言えば、Conroe以前のPentium D 8xx(Smithfield:スミスフィールド)とPentium D 9xx(Presler:プレスラ)は、ピンチヒッターだった。

 Smithfieldが急ごしらえだったことは、Intel自身も認めている。Intelは、IDF前週に米パロアルトで開催されたチップ関連シンポジウム「Hot Chips 17」で、Smithfieldの詳細を公開。マルチコアへの急激な移行の動きのために、まずタイムツーマーケットを考えて、迅速に実現できる方法を選んだと説明した。Smithfield設計のための余裕は9ヶ月ほどしかなかったようだ。通常のCPU設計からは考えられない短期間だ。

 実際、Smithfieldは90nm版Pentium 4(Prescott:プレスコット)を2個つなげただけに近い。Conroeは、2つの物理CPUコアが4MBのL2キャッシュとFSB(Front Side Bus)を共有する、一般的なデュアルコアCPUだ。それに対して、SmithfieldとPreslerでは、2つのCPUコアがそれぞれFSBを持ち、パッケージの1個のFSBから分岐するパッケージ内配線になっている。下が、Hot Chipsで発表されたSmithfieldのFSBの図だ。これを見ると、じつに単純な接続であることがよくわかる。Preslerも、シングルコアのCedar Mill(シーダーミル)のダイ(半導体本体)を2個、単一パッケージに収めたもので基本はSmithfieldと同じだ。

 もっとも、もともとデュアルコアのために設計されていないダイ(半導体本体)を2個つなげることだけでも苦労だったという。Hot Chipsでは、既存のプラットフォームに合わせなければならず、テストデータベースもシングルコア用で、パッケージサイズも制限があり、消費電力のヘッドルームがわずかしかない。例えば、CPUの周辺は配線が密集するため、2コアを単純にくっつけると、ルーティングが非常に難しくなる。

●Pentium XE系は4スレッドから2スレッドへ

 Pentium Extreme Editionブランドのプレミアデスクトップは、現在はSmithfield-XE(スミスフィールドXE)コア。Smithfieldの派生品で、Hyper-Threadingをイネーブル(有効に)することで2コア/4スレッドとした。スレッド並列性(TLP:Thread-Level Parallelism)の高さが最大の差別化となっている。2006年前半に、これが65nmプロセスのPreslerに世代交代するとしても基本的には大きな変化はないと予想される。

 ただし、その先、Conroeに切り替わると、プレミアブランドがどうなるのか、まだ見えない。ConroeにはHyper-Threadingが実装されていないため、スレッド並列性はコア数と同じ2スレッドになる。もし、Intelがプレミアブランドを維持するとしたら、別な付加価値で差別化を図る必要がある。もっとも、プレミアブランドだけ周波数を引き上げるといったパターンも考えられる。デスクトップのConroeの場合はTDP(Thermal Design Power:熱設計消費電力)が65W、サーバーのWoodcrestのTDP 80Wとの間に差があるので、周波数を上げる余裕があると推定できる。

 モバイルはデスクトップより単純で、シングルコアの90nm版Pentium M(Dothan:ドタン)から、デュアルコア第1世代の「Yonah(ヨナ)」、そして、第2世代の「Merom(メロン)」へと移行して行く。Conroeとコアが共通のMeromが当面のゴールだ。

●MP向けのPaxvilleが年内に登場

 サーバーCPUは、デスクトップやモバイルよりさらにややこしい。

 マルチプロセッサ(MP)サーバー向けCPUは、2005年中に投入される「Paxville(パックスビル)」でデュアルコアとなる。Paxvilleは90nmプロセスだが、Smithfieldとは実装が異なる。デスクトップ用デュアルコアと異なり、PaxvilleではFSBは1つだけだ。下がPaxvilleのFSBで、オンチップで配線されていることがわかる。そのため、設計期間がSmithfieldよりも長くなり、同じ90nmプロセスなのに、Smithfieldより登場が遅れていた。

 IntelがPaxvilleだけはFSBを統合したのは、そうしない限り4プロセッサ構成ができないからだ。現在のIntel x86 CPUのFSBの転送レートでは、1バスに接続できるのは2ロード、つまり2個のCPUまでだという。IntelのMP用チップセット「Intel E8500(Twin Castle:ツインキャッスル)」では、2つのFSBにそれぞれ2CPU/2ロードを接続するトポロジーとなっている。

 ところが、Smithfield系CPUの場合、チップパッケージ内でFSBが分岐しているため、1個のCPUで実質2ロードとなる。そのため、高い転送レートを維持したまま、2個のCPUで合計4ロードを、1つの共有FSBに接続することができない。MP向けCPUでは、この設計はバスアーキテクチャの制約から必須だった。

 CPU設計に時間がかかるため、ほかの市場のCPUが65nmプロセスに移る2006年前半も、MP向けCPUだけは90nmプロセスに留まる。65nmに移行するのは2006年後半の「Tulsa(タルサ)」からだ。TulsaはNetBurst系の、おそらく最後のCPUとなる。Tulsaはデュアルコアで、各コアに1MBずつのL2キャッシュを持ち、さらに16MBの共有L3キャッシュを搭載する。L3バスのところでアクセスを調停する。

●ConroeとWhitefield

 Tulsaの後は、Conroeと同アーキテクチャのCPUコアの「Whitefield(ホワイトフィールド)」となる。Whitefieldは4コアのクアッドコアCPUで、スレッド並列性は4スレッドとなる。そのため、Hyper-ThreadingがイネーブルになっているPaxvilleやTulsaとは論理上のスレッド並列性は変わらない。

 Whitefieldは16MBの共有L2キャッシュを備える。Tulsaと違い、L3ではなくL2を大容量化している。Intelが今回示した図では、Conroeを2個接続することで4コアにし、L2キャッシュを単純に増量したように見える。本当に、この図の通りの設計になるかどうかはわからない。しかし、Conroeベースだということを考慮すると、あり得る選択かもしれない。

 Conroe系CPUは、デュアルコアに最適化してコアが設計されていると言われる。そのため、Conroeを分解して4コアでキャッシュを共有する設計にするためには、CPUコア自体にも手を入れなければならない。それには、非常に時間がかかると推測される。Whitefieldは65nmプロセスであるため、あまり設計に時間がかかると、プロセス世代的に時代遅れになってしまう。また、MPだけが旧アーキテクチャのまま取り残されるという状態が続いてしまう。

 今回のIDFでは、Whitefieldの後に、同プラットフォームのCPUとして「Dunnington(ダニングトン)」というコードネームも登場した。Dunningtonの正体はまだわからないが、順当に考えれば、45nmプロセス版CPUだと推測される。

●DPサーバー向けは3つのデュアルコアCPU

 デュアルプロセッサ(DP)サーバー向けデュアルコアCPUも複雑なロードマップになっている。

 IntelはもともとデュアルコアサーバーCPUとして65nmプロセスの「Dempsey(デンプシ)」を2006年第1四半期に投入する予定だった。DempseyはPreslerと同様に、Cedar Millを2個、ワンパッケージに納めてFSBを分岐させたCPUだ。Dempseyは新しいLGA771パッケージとなり、サポートチップセットは「Greencreek(グリーンクリーク)」「Blackford(ブラックフォード)」となる。Blackford/Greencreekは、DP向けだがFSB(Front Side Bus)を2つ備えている。CPUとチップセット間をポイントツーポイントで接続し、2つのFSBでデュアルプロセッサを実現する。

 現在のDP用CPUのFSBの転送レートでは、1バスに接続できるのは2ロード、つまり2個のCPUまでだ。Dempseyの場合、チップパッケージ内でFSBが分岐しているため、実質2ロードとなる。しかし、Blackford/Greencreekはポイントツーポイント接続であるため、それでも問題は生じない。Dempseyでも1,066MHzの高転送レートでFSBを駆動できる。逆を言えば、1つのFSBに2個のCPUを接続する、従来のIntel E7520(Lindenhurst:リンデンハースト)チップセットではサポートできない。

 しかし、Intelは90nmプロセスのマルチプロセッサ(MP)サーバー向けデュアルコアCPU「Paxville(パックスビル)」の予定をやや早めて、2005年中に投入することに決定。さらに、PaxvilleのDP版を新たに作った。Paxville DPは、E7520チップセットでサポートする。そのため、DPサーバー向けには、Paxville DP+E7520と、Dempsey+Blackford/Greencreekの2系統が一時的にできてしまい、さらにその後にConroe系の「Woodcrest(ウッドクレスト)」が迫るというややこしい構図となっている。

 もっとも、IntelはPaxville DPはそれほど本気ではないようで、価格も2.8GHzで1,000ドル前後と極めて高い設定になっている。DempseyはデスクトップCPUに近い価格なので、FSBが1つか2つかの違いが、価格的には大きなギャップとなる。Intelは、明らかにDempsey+Blackford/Greencreekへと誘導している。

□IDF Fall 2005のホームページ(英文)
http://www.intel.com/idf/us/fall2005/
□関連記事
【8月25日】【海外】Intelが次世代マイクロアーキテクチャCPUを公開
http://pc.watch.impress.co.jp/docs/2005/0825/kaigai206.htm
【8月25日】【IDF】オッテリーニCEOが次世代マイクロアーキテクチャへの移行を発表
http://pc.watch.impress.co.jp/docs/2005/0825/idf03.htm

バックナンバー

(2005年8月26日)

[Reported by 後藤 弘茂(Hiroshige Goto)]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2005 Impress Corporation, an Impress Group company. All rights reserved.