TEXT:Ta 152H-1

Pentium 4とは?
 Intelから昨年11月20日にリリースされたPentium 4は、初めてP6アーキテクチャを搭載したPentium Proの発表以来、約5年ぶりとなる新しいIA-32コアアーキテクチャ“NetBurst”を採用した最新の32bit CPUである。このPentium 4は、リリース前は“Willamette”のコードネームで呼ばれていた製品で、0.18μmプロセスルールで製造され、トランジスタ数は4,200万個とCoppermineコアのPentium IIIが2,800万個なのに比べると集積度は非常に高い。動作周波数は現在、1.3/1.4/1.5/1.7GHzの製品が出荷されており、今後は2GHzの製品も予定されているようだ。Intelは、Pentium 4のコアアーキテクチャであるNetBurstを今後5、6年のパフォーマンスPC用マーケット向けの主力に位置付けている。Intelではハイエンドワークステーションやサーバーマシン向けに、長期的にはIA-64の普及を狙っているが、現時点ではそのクラスにPentium 4と同じNetBurstアーキテクチャを採用したサーバー向けの“Foster”と呼ばれるCPUを市場投入する予定である。

Pentium 4が登場した背景
 P6アーキテクチャは、150MHzで動作するPentium Proから始まり、Pentium IIIで1GHzまで到達した。Pentium 4がリリースされる前、動作周波数では、AMDがAthlon 1.2GHzをリリースしているのに対し、IntelはPentium III1.13GHzを不具合で回収する事態となり、Athlonが性能面で優位に立つ状態になってきていた。CPUの動作周波数というファクターは、ユーザーにCPUの性能を直接的にアピールできる重要なスペックである。そのため、IntelではPentium IIIよりも高速に動作するIA-32対応CPUのリリースが必要となってきていたのだ。Pentium 4の開発は、もちろんAthlonの登場以前から行なわれていたはずだが、その高速動作かつ高性能といった仕様に重点を置いたその設計は、ライバルとなるCPUのリリース動向や性能をも見込んだものと考えることができるだろう。

Pentium 4のアーキテクチャ
 Pentium 4のNetBurstアーキテクチャはこれまでには例を見ないほど多くの特徴を備えている。以下、簡単だが特徴的なアーキテクチャのいくつかを説明していこう。 命令処理の中心部は“ハイパーパイプライン”と呼ばれる従来のCPUより細分化された20ステージにもおよぶパイプラインが用意されている。パイプラインを細分化することにより、1ステージでの処理が減り、動作クロックの限界を高めやすくなるのだ。次にPentium 4の整数演算ユニットは“ラピッド・エグゼキューション・エンジン”と呼ばれ、単純なオペレーションならCPUクロックの2倍のスピードで動作できる。つまり、動作周波数1.5GHzのPentium 4なら、局所的には3GHz相当で動作していることになる。また、このPentium 4はマルチメディア関係でも機能強化が施され、新たに“SSE2”が追加された。このSSE2は、これまでのMMX命令およびSSE命令を拡張したもので、128bit整数演算命令や128bit倍精度浮動小数点命令を含む144の新たな命令が追加されている。一般的にPentium 4は、Pentium IIIなどと比べて浮動小数点演算の性能が向上していると言われるが、これはこのSSE2による命令拡張を活用した場合のことである。ちなみにSSE2を利用するためには、ソフトウェアの対応が必要とされるが、現在、対応アプリケーションとしてはDirectX 8.0などが挙げられる。そのほか、深いパイプラインを持つPentium 4では分岐予測機構が強化されている。これは、BTB(Branch Target Buffer)と呼ばれる分岐予測バッファで、処理命令の分岐先についての予測情報とその分岐先を収めるために用意されたものだ。Pentium 4では、その容量は4,096エントリーとPentium IIIの512エントリーに対しその数は8倍にも達しており、このことからIntelは分岐予測精度に関してPentium 4はPentium IIIの3倍の性能を誇ると言っている。また、Pentium 4は高クロック駆動と低レイテンシを両立させるため、容量は小さいが高速なL1キャッシュを搭載している。そのL1データキャッシュの容量は8KBで、1クロックで128bitのデータをロードしストアするといった2アクセスを同時に行なうことが可能だ。そのため、CPUが1.5GHzで動作している場合、ピーク帯域での帯域幅は48GB/sにもなる。Pentium 4のL1命令キャッシュにあたるトレースキャッシュ(Execution Trace Cache)は、x86命令をPentium 4の内部命令“μops”に変換するデコーダや、コード中の分岐を見て実行されるパス(トレース)をたどり必要なものだけ取り出す機構が含まれている。そして、この仕組により、パイプライン処理の負担減少を実現している。一方、L2キャッシュの容量は256KBで、48GB/s(1.5GHz動作時)という広い帯域幅を持ち、L2キャッシュとしてはほかのCPUには例を見ないほどの高速さを誇っている。なお、Pentium 4のFSBクロックは、Pentium IIIなどと同じ100MHzである。しかし、1クロックあたり4回のデータ転送が行なえるようになっており、実際のデータ転送サイクルは400MHzとなる。このため、CPUとメモリコントローラ(MCH)間のデータ転送レートはピーク時で3.2GB/sにも達している。これは、FSB 266MHz版Athlonの2.1GB/sに対しても高い転送レートを誇っており、現状では、最高の帯域を持つPC用システムバスとなる。これら以外にもまだまだPentium 4の特徴はあるが、それら基本となるものはIA-32のインストラクションセットアーキテクチャを維持しつつ、できるだけ高速動作が可能となる設計によるものである。

処理能力
 Pentium 4は高い動作周波数を特徴の一つとしているが、新しい内部構造を持つため動作周波数あたりの処理能力では、これまでのP6アーキテクチャのCPUと同列に比較はできない。そもそも動作周波数そのものが異なっていることもあり、単純に双方のアーキテクチャのCPUを比べることにはムリがある。しかし、実際には従来からあるアプリケーションを実行する場合、Pentium IIIやAthlonのほうが高い性能を発揮することが多いというのが一般的な見解として定着している。これは、アプリケーションがPentium 4に最適化されていないことによるのが原因で、広いメモリ帯域幅やSSE2の高い浮動小数点演算能力を活かすソフトウェアが多く登場してくれば、Pentium 4の優位性を体感することができるようになるだろう。

Pentium 4用チップセット“i850”
 Pentium 4はSocket423と呼ばれる新しいCPUソケットを採用しており、対応チップセットも現在のところIntel 850だけである。このi850チップセットは、MCH(Memory Controller Hub)がKC82850、ICH(I/O Controller Hub)がFW82801BA、それにFWH(FirmWare Hub)で構成される。このうち、ICHはi815Eなどに採用されたICH2で、FWHはi810以来の従来製品である。そのため、i850チップセットの要はMCHのKC82850にあると言えるだろう。このMCHは、CPUインターフェースにはシングルCPUのみ対応しており今後登場するマルチプロセッサ版のPentium 4であるFosterはサポートしていない。また、Pentium 4はバス帯域幅が最大3.2GB/sにもなり、この性能を引き出すためにメモリ帯域幅も同程度に高速化することが必須になってくる。そこでi850では、メモリインターフェースに2チャンネルのDRDRAMを採用し、メモリ帯域幅も3.2GB/sを確保している。DRDRAMはチャンネルを増やすことで容易に帯域幅を増やすことが可能だが、2チャンネルという仕組上、高価なメモリモジュールを同じ容量で2本ずつ増設する必要がある。Pentium 4が市場において比較的高価なCPUである上、メモリモジュールに出費がかさむのでは、なかなか市場に普及しないことも懸念される。そのため、Intelは「RDRAM Credit Program」と呼ばれるプログラムで、Pentium 4のリテールパッケージに64/128MBのDRDRAMを2本同梱して出荷し、割安感を出している。また、Inteは順次、価格を引き下げていくことを予定しており、今後が楽しみなCPUの一つであることは間違いないだろう。



 
Pentium 4は、これまでのSocketタイプのIntel CPU同様、PGAパッケージで提供される
 
Pentium 4の裏側。ピンは総数423と現在のCeleronやPentium IIIに比べてかなり多い
 
●Pentium 4ブロックダイアグラム
 
i850のMCHであるKC82850。CPU-MCH間のシステムバスは、400MHzのデータ転送を実現する
 
i850のICHは、i815Eなどで採用されているICH2(FW82801BA)が搭載される
 
Pentium 4 1.5GHzのリテールパッケージ。メモリなし/128MB/256MB同梱の3種類のパッケージがある