後藤弘茂のWeekly海外ニュース

Hyper-Threading化を一気に進めるIntel
~2007年には16スレッドの並列処理?




●IntelがHyper-Threading中心の戦略に転換

 Intelの2003年は「Hyper-Threading」の年になる。Intelが路線を変更、一気にHyper-Threadingの普及を押し進めてくるからだ。

 Intelは、Hyper-Threadingテクノロジを“オン”にしたPentium 4 3.06GHzを発表した。同社がOEMメーカーに対して以前に行なっていた説明では、Hyper-Threadingは3.06GHz以上のPentium 4でのみ提供されるはずだった。つまり、3GHzを境に、上がHyper-Threadingオン、下がHyper-Threadingオフで、3.06GHz以上のCPUの価格が安くなるに従ってHyper-Threadingを普及、来年末頃までに全てのPentium 4ラインにHyper-Threadingがもたらされるという戦略だった。だが、この計画は変更になった可能性がある。

IntelのWilliam M. Siu副社長兼事業本部長

 IntelのWilliam M. Siu(ウィリアム・スー)副社長兼事業本部長(Vice President & General Manager, Desktop Platforms Group)は次のように説明する。「ゴールは、Hyper-Threadingテクノロジを重要なリクワイヤメントにすること」「Intelは来年Hyper-Threadingを来年中頃までに、様々な価格ポイントでマルチプルな製品を提供する」「魅力的な価格になるだろう」

 また、3GHz以下の周波数で提供するのかという質問に対しても「可能性はある」と答えている。Hyper-Threadingは3GHzからとされていた従来の説明とは大きな違いだ。だとすれば、Intelは2003年のデスクトップCPUでは、Hyper-Threadingを全面に押し出し、一気に普及させる戦略に計画に切り替えた可能性が高い。

 実は、前兆はあった。Intelは11月頭に、大手OEMメーカーとCPUロードマップの更新の定例ミーティングを行なう予定だったが、これがキャンセルされている。そのため、Intelが比較的大きなロードマップ変更を検討しているという観測が広がっていた。

 現状では、まだ、Intelが具体的にどんな戦略に切り替えるのかはわからない。しかし、推測されるのは、来年夏頃に、2GHz台の製品も含めてPentium 4ラインナップ全てでHyper-Threadingをオンにするというストーリーだ。だとすると、新フィーチャをハイエンドから徐々に浸透させるパターンではなく、一気に下まで持って来るSSE方式の普及戦略を採ることになる。そうすると、来年の夏頃にはHyper-ThreadingはPentiumクラスCPUの当たり前の機能になっているだろう。

●CeleronとモバイルへのHyper-Threadingはまだ先

 もっとも、Hyper-ThreadingはCeleron系までは降りて来ないと思われる。Siu氏は「バリューセグメントでは、プロセッサ自体は対応できても、メモリ(帯域)などHyper-Threadingに必要なシステム要素が足りないと、意味があるかどうか」と指摘する。

 NorthwoodにはHyper-Threading機能が実装されているため、IntelはNorthwoodベースのCeleronでもCPU自体はHyper-Threadingを提供可能だと思われる。ただし、Hyper-Threadingが有効に働くと、メモリ帯域などがより必要になるのも確かで、Siu氏の指摘は理にかなっている。また、Intelは新フィーチャを、Pentium系とCeleron系のマーケティング上の差別化のために使うことも多い。今回は、Hyper-Threadingを普及させるものの、Pentium系だけに留めるといった差別化を図る可能性が高いと推測される。

 そして、これはIntelの新マーケティングプログラムとも連携している可能性がある。Intelは、Banias発表に際して、CPUだけでなくチップセットや無線LANチップを組み合わせたプラットフォーム自体にもブランドをつける。そして、業界関係者によると、Intelは同様のプログラムを同時期にデスクトップにも導入するつもりだと言われる。例えば、Hyper-Threadingと次世代CPU「Prescott(プレスコット)」、次世代チップセット「Springdale(スプリングデール)」の組み合わせでブランディングするかもしれない。

 ちなみに、モバイルへのHyper-Threadingの導入はやや遅れる見込みだ。業界筋の情報によると、これは、現在のWindowsが、Hyper-ThreadingとC3/C4省電力ステイトを同時にハンドルできないためだという。そのため、モバイルへのHyper-Threadingの導入は、Microsoftが「Longhorn(ロングホーン)」へとWindowsをアップグレードするタイミングより後になりそうだ。

●デスクトップCPUは4スレッドへ向かう

 ではこの先はどうなるのか。IntelはデスクトップCPUではHyper-Threadingをさらに発展させることを明言している。IntelのPatrick Gelsinger(パット・ゲルシンガー)CTO兼副社長は「Hyper-Threadingでは2スレッドを並列に実行できるが、将来はもっと多くのスレッドを同時実行できるようになるだろう。これはちょうど、CPUの実行ユニットのこれまでの変化と似ている。486の時には1本の命令実行パイプしかなかったのが、Pentiumで2本になって、Pentium Proで7つになったのと同じような進化だ」と4月のIDF-J時に語っている。

 4スレッドの並列処理に拡張されるタイミングはまだ不明だが、少なくとも2004年後半と見られる次のアーキテクチャ「Nehalem(ネハレム)」では、おそらく4スレッドになっているだろう。つまり、デスクトップやミッドレンジまでのサーバー&ワークステーションは1CPUで4スレッド、4wayのマルチプロセッサなら16スレッドを並列に処理できるようになるわけだ。

 しかし、Hyper-Threadingのような「スレッドレベル並列処理(TLP:Thread-Level Parallelism)」技術の導入は、IA-32系CPUだけに限定されるわけではない。というか、本来的に言うならアプリケーションがマルチスレッド化されていて、走っているスレッド数が多いサーバーこそマルチスレッド化が有用だ。だから、IntelはIA-64にもTLPを導入する。Intelは以前からIA-64にもTLPを導入することは明言していた。

●エンタープライズCPUは1CPUで16スレッドを並列処理?

 そして、10月のCPU業界のカンファレンス「Microprocessor Forum(MPF)」では、IntelのJohn H. Crawford氏(ジョン・H・クロフォード)氏(Intel Fellow, Enterprise Platform Group)が、同社のエンタープライズ向けCPUの方向性としてTLP導入を明確に示した。Crawford氏によると2007年になれば65nm(0.065μm)プロセスで400平方mmのダイサイズ(半導体本体の面積)のチップに10億個のトランジスタを搭載できるという。そのため、エンタープライズ向けCPUなら、1CPUの中に4つのCPUコアと共有キャッシュメモリを搭載するマルチコア(Multi-Core)ができるようになるという。つまり、4コアの1CPUで4スレッドの並列処理ができる計算になる。

 さらに、各CPUコアにHyper-Threadingテクノロジを導入すれば、TLPの度合いはさらに高まるとCrawford氏は言う。一般にTLPにはマルチコアと、Hyper-Threadingのような「Simultaneous Multithreading(SMT)」の2つの方法があるが、Intelはサーバーではこの両方の導入を考えているようだ。おそらく、2005年に登場する次世代アーキテクチャのIA-64 CPU(「Chivano(チバーノ)」というコードネームが噂されているが未確認)が、TLP導入の最初のIA-64 CPUになるだろう。

MPFにおけるJohn H. Crawford氏のスライド。2007年には65nmプロセスで10億トランジスタのCPUが可能に 同じくCrawford氏のスライド。1CPUに4つのコアを搭載、各コアにHyper-Threadingテクノロジを導入する

 実は、IntelはIA-64系プロセッサへのSMTの採用の可能性は前から探っている。例えば昨年には「Speculative Precomputation : Long-range Prefetching of Delinquent Loads」という論文を、また、今年になってからは「Memory Latency - Tolerance Approaches for Itanium Processors : Out-of-Order Execution vs. Speculative Precomputation」という論文を発表、IA-64アーキテクチャにSMTを採用した場合のシミュレーション結果を発表している。それによると、IA-64に4スレッドのSMTとアウトオブオーダ実行を実装すると、IA-64のベースアーキテクチャより141%も性能が向上する(=241%の性能になる)という。

 だとしたら、これがIA-64系CPUの進化の路線になる可能性は高い。つまり、「インストラクションレベルパラレリズム(Instruction-Level Parallelism:ILP)」の限界を破るために、IA-64もIA-32と同じコースを向かうわけだ。

 これらの論文やCrawford氏の発表で、5年後のIA-64を推測すると次のようになる。1CPUコアが4スレッドで、4コアを1チップに搭載したマルチコアで、4wayのマルチプロセッサ構成で、システム全体では64スレッド/サイクルとなる。同時期のPCが4スレッド/サイクルと推定すると16倍、目がくらむような並列度だ。

 というわけで、Intel CPUは、デスクトップもサーバーも「スレッド、スレッド、全てがスレッド」(Gelsinger氏)のアーキテクチャ拡張へと向かって突進していく。

Collins, H.Wang, D.Tullsen, H.C, Y.-F.Lee, D.Lavery, and .Shen.「Speculative Precomputation:Long-range Prefetching of Delinquent Loads」28th International Symposium on Computer Architecture , July 2001.

Perry H.Wang, Hong Wang, Jamison D.Collins y , Ed Grochowski, Ralph M.Kling, and ohn P.Shen「Memory Latency-olerance Approaches for Itanium Processors: Out-of-Order Execution vs.Speculative Precomputation」8th International Symposium on High-Performance Computer Architecture (HPCA)

□関連記事
【11月14日】Intel、Hyper-Threading Technology対応のPentium 4 3.06GHzを正式発表
http://pc.watch.impress.co.jp/docs/2002/1114/intel.htm
【11月14日】インテル、Pentium 4 3.06GHz発表会でHTテクノロジをデモ
http://pc.watch.impress.co.jp/docs/2002/1114/intel2.htm
【11月14日】【Hothot!】Pentium 4 3.06GHz速攻レビュー!
http://pc.watch.impress.co.jp/docs/2002/1114/hotrev188.htm

バックナンバー

(2002年11月15日)

[Reported by 後藤 弘茂]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp 個別にご回答することはいたしかねます。

Copyright (c) 2002 Impress Corporation All rights reserved.