後藤弘茂のWeekly海外ニュース


	■後藤弘茂のWeekly海外ニュース■ Intelが目指すNehalemでのGPUとCPUの統合

●Nehalemではシステムパーティショニングが変わる

　Intelは、45nmプロセスのNehalem(ネハーレン)世代から、GPUをCPUへと統合する。CPUとGPUを統合するというビジョン自体は、AMDの次世代CPUと同じだ。しかし、IntelとAMDでは、CPUとGPUの統合の目的と方法が異なる。それは、今後のヘテロジニアス(Heterogeneous:異種混合)型マルチコア時代のCPUをどう創るかという点で、IntelとAMDのビジョンが異なっていることを意味している。

Stephen L. Smith(スティーブ・L・スミス)氏

　IntelのStephen L. Smith(スティーブ・L・スミス)氏(Vice President, Director, Digital Enterprise Group Operations, Intel)は、NehalemでのGPU統合の理由を次のように説明する。

　「今日のシステムパーティショニングでは、FSBを備えたCPUがあり、CPUからはFSBを挟んでメモリコントローラが位置する。そして、グラフィックスはメモリコントローラのオプションとなっている。1番目のチップはCPUプラスFSB、2番目のチップがメモリコントローラプラスオプションのグラフィックスというパーティショニングだ。

　グラフィックスは、基本的にメモリコントローラの側にあるものだ。実際、ディスクリートグラフィックスカードでは、(GPUに)メモリコントローラがある。グラフィックス統合チップセットのコンセプトも、メモリコントローラの近くにグラフィックスを置くことだった。(このコンセプトに沿った)今日の(Intelの)システムパーティショニングは、非常に効率的で、高いパフォーマンスを達成できている。

　しかし、将来は、(CPUの)スケーラビリティを向上させるために、(Nehalemでは)メモリコントローラをCPU側へと移動させる。その時点になると、システムパーティショニングの自然な流れとして、グラフィックスもそちら(CPU)側に移ることになる。メモリコントローラがCPU側にある以上、グラフィックスコントローラを(CPUから)分離したチップにすることは、合理的ではなくなるからだ。グラフィックスをメモリコントローラと同じロケーションに移したいと考えている。このシステムパーティショニングの変化こそ、我々がグラフィックスを(CPU側へと)移す根本的な理由だ」

　つまり、GPUコアはメモリコントローラと同じチップ内で近接していることが望ましい。だから、CPUにメモリコントローラを統合したら、必然的にGPUコアもCPU側へ移動するという説明だ。

システムパーティショニングの変化の推測図
(別ウィンドウで開きます)
※PDF版はこちら

Nehalem(Gainestown/Bloomfield)の内部構成
(別ウィンドウで開きます)
※PDF版はこちら

●GPUコアとDRAMコントローラの統合の必要性

　実際にはもっと話は込み入っており、Smith氏の説明ではまだ不十分だ。そもそも、CPUとGPUでは、CPUの方がメモリレイテンシ短縮の必要性が強い。汎用CPU上の処理では、ランダムなメモリアクセスが発生することが多く、キャッシュで吸収できない場合は、メモリからのロード待ちでCPUの処理がストールしてしまう。そのため、CPUではメモリレイテンシがクリティカルだ。

　ところが、グラフィックスの場合は、依存性のない処理が膨大にあり、それぞれを並列処理できる。そのため、1つの処理がメモリ待ちでストールしても簡単にスイッチできる。CPUよりメモリレイテンシトレラントで、メモリコントローラが別チップにあっても、原理的にはグラフィックスの方がパフォーマンスの低下が少ない。

　実際には、従来、チップセット側にGPUコアとメモリコントローラがあったのは、開発と製造上の制約に過ぎない。CPUは設計が複雑で開発サイクルが長い。一方で、GPUコアとメモリインターフェイスはアーキテクチャのサイクルが短い。また、メモリインターフェイスには、多くのメモリベンダの多くのDRAMデバイスとの互換を取るというやっかいな作業がある。CPUを独立させて、FSBでセカンドチップと結ぶ従来のIntelアーキテクチャには、こうした開発サイクルのズレや、互換性検証の煩雑さからCPUを自由にするという意味合いがあった。

　では、なぜ、IntelはNehalemでCPUにGPUを統合するのか。まず、CPU側は、性能を伸ばすためにメモリコントローラの統合が必要となっている。そして、今後のクライアントPCのソフトウェア環境では、一定水準の3Dグラフィックス性能が必須であり、そのためには膨大なメモリ帯域を必要とする。

　この点がWindows Vista前と後で大きく違う点であり、メモリ帯域のために、今後のGPUコアはメモリコントローラとオンチップで接続する方が有利となる。特に、パフォーマンス/消費電力を考えれば、その方が有利だ。結果として、IntelもAMDも、GPUコアをCPU側に持ってこようとしている。

●45nmプロセス世代で実現できた統合化

　もちろん、統合化の源にはプロセス技術の進化があることは言うまでもない。Intelは、当初、Nehalemでの最初のGPU統合版は2ダイソリューションを検討していたと言われる。MCM(Multi-Chip Module)を使って、CPUのダイ(半導体本体)とGPUのダイをパッケージ内で連結する方式だ。実際に、その場合の2ダイの配置について、冷却効率の面から細かい検討が行なわれたとある業界関係者は伝える。

　しかし、現在の計画では、NehalemにGPUコアをネイティブで統合するようだ。つまり、CPUとGPUを1個のチップにまとめようとしている。

　Smith氏は、IDFでのプレスブリーフィング後に、GPU統合はMCMで実現するのかという質問に対して、首を横に振って否定した。また、次のように語った。

　「我々は45nmプロセスになって、初めて統合グラフィックスとメモリコントローラをCPU側に移すことができるだけのゲート数のバジェットを得た。それも統合化の1つの理由だ。45nmプロセスでなら、製造時に、平均ダイサイズで膨大なペナルティを負うことなく、(CPUにGPUコアとメモリコントローラを)統合することができる」(Smith氏)

　GPU統合は、メインストリームPCから下のソリューションであるため、IntelもAMDも、最初はデュアルコアCPUにGPUコアを統合すると推定される。例えば、クアッドコアNehalemにGPUコアを足すと、ダイサイズ(半導体本体の面積)は300平方mmを大きく超えると見られるため、コスト的に考えにくい。しかし、CPU側がデュアルコアなら、今の統合グラフィックス程度の規模なら、200平方mm台前半のチップに納めることができると推定される。

　逆を言えば、32nmプロセスから先になると、メインストリーム&バリューCPUは、GPUを統合しないとダイが余ってしまう。スレッド並列性の低いソフトウェア環境をターゲットとすると、汎用CPUコアの数は急激に増やすことができない。すると、経済的な側面でもCPUとGPUを統合しなければならなくなる。

ダイサイズ移行図
(別ウィンドウで開きます)
※PDF版はこちら

●IOH側にGPUコアを統合するプランはなし

　では、IntelはGPUコアをチップセット側に統合する製品プランは、一切持たないのだろうか。元々のNehalemのプランでは、デスクトップ向けには最初は統合グラフィックスチップセットを提供する計画だった(モバイルは当初からCPU側にGPUを統合の予定だった)。しかし、Smith氏は、統合グラフィックスチップセットのプランを否定する。

　「(GPUをIOHに統合するプランに対する答えは)ノーだ。グラフィックスコントローラをIOHに統合することは、システムアーキテクチャ的に意味をなさないからだ。IOHは、(QPI＋PCIeより)やや複雑になるかもしれない。コンシューマビデオポートのようなものへのコネクションを持つようになるかもしれない。しかし、グラフィックスコントローラ自体は持たないだろう」(Smith氏)

　明瞭に統合グラフィックスチップセットの存在を否定している。CPUへのGPU統合が、現在のNehalemプラットフォームの製品プランのようだ。チップセット側にGPUコアという計画は、修正されたと見られる。もちろん、パフォーマンスデスクトップでは、ディスクリートグラフィックスが必要となるため、GPU統合版Nehalemはメインストリームから下のオプションとなるだろう。

　また、Smith氏が後段で語っているのは、アナログビデオ出力のことだと推定される。CPUにアナログビデオ出力を統合することは、技術上ややハードルが高い。ローノイズでハイパフォーマンスのミクスドシグナル回路には、特殊なプロセスのフィーチャが必要になるからだ。IntelがそうしたCPUの複雑化を避けるとしたら、チップセット側にアナログアウトを内蔵するか、別チップを使うのが自然な流れになる。

　ちなみに、IntelがNehalemで最初に提供するチップセット「Tylersburg(タイラスバーグ)」は、ハイエンドソリューションで、IOH(I/O Hub)チップのほかに、ICHを別チップとして接続する。しかし、メインストリーム向けのチップセットはICHとIOHが統合されたチップになる見込みだ。従来の3チップソリューション(CPU+MCH+ICH)から2チップソリューション(CPU+IOH)へと移行してゆくと見られる。

Gainstownの構成例
(別ウィンドウで開きます)
※PDF版はこちら

●Nehalemに統合するGPUコアはIntel統合グラフィックスの流れ

　IntelがNehalemでGPUコアを統合することは明瞭になった。しかし、今のところ、どのようなGPUコアを載せるのかは明らかになっていない。Intelは、グラフィックス統合チップセット向けのGPUコアをすでに持っている。しかし、グラフィックス向けには、より汎用性の高いMIMD(Multiple Instruction, Multiple Data)型のデータ並列プロセッサであるLarrabee(ララビー)も準備している。Nehalemには、どちらを載せてくるのだろう。Smith氏は次のように答える。

　「Larrabeeは、2008年に最初のデモを行なう。Larrabeeのソフトウェアの準備が整うまでには、しばらく時間がかかるだろう。一方、我々のグラフィックスアーキテクチャは、すでに膨大な出荷を行なっている。そして、Intel 965以降は、我々の統合グラフィックスは、プログラマブルアーキテクチャとなっている。

　つまり、我々はすでに(CPUへの統合に)使えるグラフィックスのベースラインは持っている。最初は我々の持つベースラインから選択できると考えている。それから時間とともに、グラフィックス(ハードの)アーキテクチャ自身が変化して行くこともあるだろう。ただし、我々は、ほかにも(IntelグラフィックスとLarrabee以外にも)選択肢を持っている」

　これも明瞭で、Intelは基本的には従来の統合グラフィックスの路線のGPUコアを、Nehalemに統合しようとしている。Intelの統合グラフィックスは、すでにユニファイドシェーダ型のフレキシブルなShaderプロセッサ構造を持っている。グラフィックス用途と考えるなら、その発展系のコアをCPUに取り込むことは自然だ。

　それに対して、Larrabeeは、まだ先のフェイズだ。将来的にはLarrabeeが次のGPUアーキテクチャとして統合される可能性もあるが、まだ明確にはなっていない。Larrabeeについては、ディスクリートとしてソフトウェア環境を整え、実績を上げてからということになりそうだ。

●2000年のTimna以来となるGPUとメモリコントローラの統合

　CPUとGPUの統合では、いつ、どんなGPUアーキテクチャを統合するのか、GPUコアのリフレッシュをどうするのか、そういった部分でさまざまなハードルがある。

　興味深いのは、NehalemでのGPUコアの統合に対しての、Intel幹部の若干の温度差だ。Smith氏を始めとする、デスクトップ&サーバーを担当するDigital Enterprise Groupは、GPUの統合化をNehalemのポイントの1つとして強調する。Nehalem自体が、同グループで開発されている。

Shmuel(Mooly) Eden(ムーリー・エデン)氏

　それに対して、Core Microarchitectureを開発したMobility Groupは、より慎重な見方をしている。Mobility Groupも、Digital Enterprise Groupが開発したNehalemを、ノートPC向けCPUとして2008～2009年に導入する。そして、ノートPCでは、メインストリーム以下のカテゴリでGPU統合が切実に必要とされている。IntelのShmuel(Mooly) Eden(ムーリー・エデン)氏(Vice President, General Manager, Mobile Platforms Group, Intel)は、次のように語る。

　「CPUとGPUの統合を成功させるには、正しい時に正しい技術で行なわなければならない。最初にGPUを統合したCPUは何だったかを思い出して欲しい。それはFUSIONではない。CPUとGPUを統合した最初のチップは「Timna(ティムナ)」だった(笑)。

　Paul(Paul S. Otellini(ポール･S･オッテリーニ)氏(President & CEO))は、Timnaについて2つのミスがあったと言った。1つはTimnaの開発を始めたこと、もう1つはTimnaをやめたことだ。なぜなら、Timnaがキャンセルされたのは、GPUの統合がうまく行かなかったからではないからだ。GPU統合自体は素晴らしく、うまくいった。それなのに、Timnaが出荷されなかった理由は、RDRAMインターフェイスを統合したことだった。RDRAMは高価過ぎたからだ。

　Timnaの経験があるから、CPUとGPUの統合は、私にとって新しい話ではない。だから、統合には制約がつきまとうことを理解している。例えば、CPUを2年毎にリフレッシュし、そしてGPUを6から7カ月毎にリフレッシュしたいとする。すると、(CPUの開発サイクルのためにGPUアーキテクチャが)凍結される期間が長くなってしまう」

　Timnaは、Eden氏が率いていたIntelイスラエルの開発チームが開発したPentium III系の統合CPUで、GPUコアとDRAMコントローラを内蔵していた。Eden氏が語るように、TimnaはRDRAMサポートだったために、RDRAMの立ち上げ失敗とともに葬られてしまった。CPUへのGPUとDRAMコントローラの統合は、一面ではリスキーであり、CPUベンダーにとっては賭けでもある。


2000年に発表したTimnaの構想 (別ウィンドウで開きます) ※PDF版はこちら	Timnaを搭載したプラットフォームのブロックダイアグラム (別ウィンドウで開きます) ※PDF版はこちら	Timnaのダイ

●ウルトラモビリティも統合化へと進む

　もっとも、GPUとDRAMコントローラの統合は、モバイルでは消費電力の低減と、チップ数の削減による実装面積の縮小につながる。Eden氏も、統合化自体は正しい方向だと期待を語る。

　「全体的には、モバイルテクノロジの統合化は、I/Oを減らすことで消費電力とフットプリントを減らす利点がある。また、CPUとグラフィックスをタイトに統合できれば、(GPUとCPUの)実行ユニットをそれぞれが使うこともできるようになる。多くの面で、統合は理にかなっている。だから、私はCPUとGPUの統合が、(CPUの)正しい方向だと信じている。全般的には、どんどん統合へと革新されて行くだろう。

　しかし、注意深くならなければいけないことも確かだ。まず、マーケティング上(の統合)と、真の統合を区別する必要がある(笑)。マルチチップパッケージで(GPUをCPUパッケージに)入れたとしよう。それはチップの実装面積を減らすが、革新的かというと、そうではない。同じシリコンに(CPUとGPUを)入れた場合は、それは革新だ」

　Intelの内部でも、モバイル系ではCPUとGPUの統合化を強く望んでいることがわかる。パフォーマンス/消費電力を考えれば、統合化の利点は明白だ。また、Eden氏は、MCMによるGPU統合については、“マーケティング”主導のプランとして明らかに否定的だ。これは当然で、消費電力の低減を求めるならシリコン上での統合が行なわれないと意味が薄いからだ。こうした発言からは、Mobility Groupは最初からGPUのネイティブ統合を求めていたことがわかる。

　ちなみに、Mobility Groupが開発している2010年のCPU「Sandy Bridge」は、最初からGPU統合を見据えた設計となっていると言われる。流れとしては、Intelでも、今後2～3年で、CPUへのGPU統合が当然のものになって行くと見られる。また、それはPC向けCPUだけでなく、全体のトレンドとなって行くだろう。Eden氏は次のように語る。

　「市場によっても統合のペースは異なる。Anand（Anand Chandrasekher(アナンド・チャンドラシーカ)氏(Senior Vice President, General Manager, Ultra Mobility Group))の分野(ウルトラモバイル機器)では、CPUとGPUの統合は、より迅速に起こる。なぜなら、ほかに選択肢がないからだ。GPUを統合しなければ、ウルトラモバイル機器にフィットさせることはできないだろう。

　ウルトラモバイルの分野では、SOC(System on a Chip)への統合化は、PCよりずっと先に進む。その分だけリスクが大きく、より注意深く設計しなければならない。しかし、CPUとGPUの統合の方向自体は正しい」

　IntelのUltra Mobility Groupが2009年に導入する「Moorestown(ムーアズタウン)」プラットフォームも、CPU側にGPUコアとDRAMコントローラを統合する。ウルトラモビリティ向けでは、統合化へと一気に進む見込みだ。

　こうして見ると、IntelもAMDと軌を一にしてGPUの統合へと進んでいるように見える。しかし、両者のアプローチには、大きな違いがある。AMDはGPUコアを汎用に使うことを目的として統合しようとしている。それに対してIntelから今見えているステップは、グラフィックスのためのプロセッサとしての統合だ。両者のビジョンには、かなり違いがある。

□関連記事
【10月2日】【海外】デュアルコアからオクタコアまでスケーラブルなNehalem
http://pc.watch.impress.co.jp/docs/2007/1002/kaigai390.htm
【9月27日】【海外】Penrynの1.5倍のCPUコアを持つ次世代CPU「Nehalem」
http://pc.watch.impress.co.jp/docs/2007/0927/kaigai389.htm
【9月20日】【海外】IntelがNehalemの概要を発表、実動デモも公開
http://pc.watch.impress.co.jp/docs/2007/0920/kaigai388.htm
【9月16日】【海外】いよいよベールを脱ぐIntelの次期CPU「Nehalem」
http://pc.watch.impress.co.jp/docs/2007/0916/kaigai386.htm

□バックナンバー

(2007年10月5日)

[Reported by 後藤弘茂(Hiroshige Goto)]

【PC Watchホームページ】

PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

■後藤弘茂のWeekly海外ニュース■

Intelが目指すNehalemでのGPUとCPUの統合

【PC Watchホームページ】