多和田新也のニューアイテム診断室

ようやく登場した新Pentium 4「Prescott」【解説編】
~Northwoodとの違いやいかに?




 2003年春のIDFで概要が発表され、同年第4四半期には登場するとされていた「Prescott」がついに登場した。90nmプロセスの製造技術面でも注目されるほか、新たな拡張命令、キャッシュ容量の増加などパフォーマンス面でも期待は大きい。さらに、近い将来にはプラットフォームの刷新も予定されており、まさにPentium 4の再出発を担う存在である。今回は、このPrescottのアーキテクチャやパフォーマンスを、Northwoodとの違いを中心にお伝えしたい。なお、ベンチマークについては、別稿を参照されたい。

●一気に7製品のCPUを発表

 2月3日のInteの製品発表はPrescottの登場が話題の中心となるが、まずは登場したCPUのスペックを整理しておこう。表1は発表されたCPUのラインナップである。

 まず、Prescottコアを採用した製品は5製品。そのうち、3.40E/3.20E/3E/2.80E GHzの4製品は、800MHz FSB駆動で1MBのL2キャッシュを搭載。Hyper-Threading(以下、HT)もサポートする。2.80A GHzはPrescottのエントリークラスに位置付けられるCPUで、533MHz FSBでHyper-Threadingをサポートしない点が大きな特徴である。

 また、従来の0.13μmプロセスを使った製品も2種類発表された。まず、2MBのL3キャッシュを搭載することで話題となったPentium 4 Extreme Editionに3.40GHz版が登場。さらに、Northwoodコアを使った3.40GHzモデルも発表されている。

 これにより、3.40GHzと3.20GHzは、

E:Prescott
無印:Northwood
Extreme Edition:Gallatinベース

の3製品。2.80GHzにいたっては、

E:Prescott(800MHz FSB/HT対応)
A:Prescott(533MHz FSB)
C:Northwood(800MHz FSB/HT対応)
無印:Northwood(533MHz FSB)

の4製品がラインナップされてることなり、ちょっと分かりにくくなってしまっている。ただ、基本的にクロックの後ろに「E」が付けられたモデルと、2.80A GHzがPrescottコアの製品である点を覚えておくことで、この混乱は避けられるだろう。

 価格は3.40E GHzと、3.40GHzがそれまでのNorthwood 3.20GHzと同じ417ドルで、同クロックのPrescottとNorthwoodに価格差が付けられていないのは興味深い。

【表1】発表されたCPUの仕様比較
  3.40E GHz 3.20E GHz 3E GHz 2.80E GHz 2.8A GHz Extreme Edition 3.40GHz 3.40GHz
プロセスルール 90nm 0.13μm
FSB 800 MHz 533 MHz 800MHz
L1データキャッシュ 16KB 8KB
L2キャッシュ 1MB 512KB
L3キャッシュ -- 2MB --
Hyper-Threading ×
OEM向け価格 417ドル 278ドル 218ドル 178ドル 163ドル 999ドル 417ドル

●Prescottの特徴をチェック

 さて、Northwoodコアと同じ「Pentium 4」の名前が冠せられたPrescottコアのCPUではあるが、数々のアーキテクチャの改良が施されている。ここでは、使い勝手やパフォーマンスに影響するであろう部分を中心に、4つのポイントに分けてPrescottの特徴をまとめておきたい。

○製造プロセスの微細化と対応マザーボード

 Prescottは、高クロック化を図るには欠かせないプロセスの微細化、つまり90nmへと微細化したコアであることが最大の特徴。

【写真1】Prescottのダイ写真。トランジスタ数は1億2,500万個、ダイサイズは112平方mm

 プロセスの微細化により、トランジスタ数が増えてもダイサイズを維持、または縮小することができ、コスト面でもメリットが生まれる。ちなみにPrescottのトランジスタ数は1億2,500万個、ダイサイズは112平方mmとなっており(写真1)、Northwoodの5,500万個/131平方mmと比べても、より小さなダイサイズでトランジスタ数を増やすことに成功している。

 ただ、駆動電圧を下げ、トータルの消費電力も下がるというのがプロセスを微細化するメリットでもあったのだが、Prescottに関していえば、これは思い通りにいかなかったようだ。

 その理由については、後藤弘茂氏のコラムでたびたび触れられているとおり、プロセスの微細化によってトランジスタの絶縁部分が物理的に小さくなってしまうために発生するリーク(漏れ)電流が要因として指摘されている。

 プロセスの微細化によってトランジスタの駆動電圧自体は下がっても、回路内で漏れ出てしまう電流を補うべくさらに多くの電流を流さなければならなくなり、結果としてトータルの消費電力が増えてしまったというわけだ。もちろん、それに伴い発熱も増加することになる。

 そのような問題を抱えつつ登場したPrescottがどのようなスペックになったか、というのが表2である。ここでは現在公開されている情報のみ掲載しているが、駆動電圧は1.25-1.4Vと、Northwoodの3.20GHz(1.55V)に比べれば低く規定されているものの、3.40E/3.20E GHzのTDP(Thermal Design Power:熱設計電力)は100Wをオーバーしてしまっているのである。

【表2】Prescott Pentium 4の主な仕様
  3.40E GHz 3.20E GHz 3E GHz 2.80E GHz
VID 1.25-1.4V
ICC(max) 91A 78A
TDP 103W 89W

 さらに、発熱の問題以前に気になるのが、マザーボードがこの消費電力に耐え得るか? 動くのか? という点である。Intelは「既存のIntel 875P/865PEのマザーボードすべてで対応できる」と言っている。しかし、中にはNorthwoodの要求スペックギリギリの電源回路しか実装していないマザーボードが存在する可能性もあり、これはあくまで理論上の話として捉えたほうが無難だと思われる。

 上記のような電源回路しか実装していないようなマザーボードでPrescottを使用した場合、動作しないだけでなく、過大な電力流した結果、最悪は電源回路が焼けてしまう危険性がある。Prescott(とくに3.40E/3.20E GHz)を使うならば、すでにWeb上でPrescott対応状況を示しているマザーボードベンダーの情報など、今後、順次提供されていくと思われるPrescott対応状況を確認し、対応が正式表明されたマザーボードを使うのが堅実だろう。

【すでにPrescott対応マザーの情報を公開しているベンダー】

Albatron:http://www.ask-corp.co.jp/news040122-1.htm
AOpen:http://aopen.jp/company/news/2003/prescott.html
ASUSTeK:http://www.asus.co.jp/products/mb/event/prescott/index.html
GIGABYTE:http://www.gigabyte.co.jp/nippon/news/prescott.html

○CPUブロックダイヤグラムとキャッシュ容量

 図1は、Prescottコアのブロックダイヤグラムを示したものである。従来のWillamette/Northwoodコアのブロックダイヤグラムは、Intel Technology Journal内にある「The Microarchitecture of the Pentium 4 Processor」の5ページ目を参照いただきたいが、同じNetBurstアーキテクチャだけあって、見た目に大きな違いはない。

 しかし、キャッシュの先読み(プリフェッチ)機能の改善や、分岐予測(ブランチ)のアルゴリズムを改良するなど、内部的な変更点は多いという。

 もっとも大きな変更点はキャッシュ容量である。PrescottではL1データ/L2ともに容量が増加され、L1データキャッシュが16KB、L2キャッシュが1MB(Northwood Pentium 4はそれぞれ8KB/512KB)となっている。

 このデータキャッシュの容量増加は、クロック向上を狙ううえでも欠かせないファクターである。CPUの高速化の進み具合に比べれば、メインメモリのアクセス速度向上はそれほど進んでいない。このギャップを埋めるのがデータキャッシュである。キャッシュを踏み台とすることでCPU-メインメモリ間の直接アクセスを減らせることになるので、この容量アップはトータルのパフォーマンスアップに繋がるというわけだ。

 またHyper-Threadingにより、CPUが複数の処理を同時に行なうと、読み出すデータ量がさらに増える。そうした点でもキャッシュ容量の増加には大きな意味がある。

 一方で、トレースキャッシュの容量が増加していない点は要注意かもしれない。というのも、もし前述のように、キャッシュ先読みや分岐予測などによって、クロックあたりの処理性能が向上するようであれば、このトレースキャッシュ容量を増加させる必要性が生じると思われるのだが、それがなされていないからだ。

 Northwoodコアで12Kμopsの容量が遊んでいた、というのならPrescottで1クロックあたりの処理性能が上がる可能性も否定できないが、製造コストなどを考えると容量に余裕を持たせることは考えにくい。

 キャッシュの増加分などもあるので、PrescottのパフォーマンスがNorthwoodと同じということはないだろうが、演算性能に限って言えば、大きなパフォーマンスアップを期待するのは難しいかも知れない。これについては、後述のベンチマークで解明していこうと思う。

【図1】Prescottブロック・ダイヤグラム

○13個の新命令群「SSE3」の追加

 さて、Prescottでは新たに13個の命令が追加され、それが「SSE3」と命名された。追加された命令は表3に示したとおりで、主にゲームや動画エンコーダなどの性能向上を狙った新命令群とされている。

 また、Hyper-Threadingの効率をアップすべく、MWAIT/MONITORという2つの命令も追加されている。例えば、Hyper-Threadingにより2つのスレッドが動作中、1つのスレッドが処理待ちによって半停止状態になってはいる時、スレッドを1つ占有してしまうため、もう1つのスレッドの動作へ影響を及ぼすことがある。この場合に、処理待ち状態のスレッドをMWAIT命令で完全に停止させることで、もう1つのスレッドを効率よく動かす、といったことが可能になるのである。

 今後登場するであろうSSE3対応アプリケーションで、こうした命令を活かした開発がなされれば、Hyper-Threadingの効果がさらに向上する可能性がある。

【表3】PrescottのSSE3で追加された新命令
浮動小数点から整数に変換 FISTTP
複雑な演算 ADDSUBPD、ADDSUBPS、MOVDDUP、MOVSHDUP、MOVSLDUP
ビデオエンコーディング LDDQU
AOSフォーマットを利用したSIMD浮動小数点 HADDPD、HSUBPD、HADDPS、HSUBPS
スレッド同期 MONITOR、MWAIT

○新たな熱保護技術

 最後に、Prescottで導入された新しい熱保護技術を紹介しておきたい。先に紹介したPrescottの仕様(表2)で、Tcaseの値を提示していない点に気付かれた方もいるかもしれない。Prescottでは、これまでプロセッサごとに規定されていたTcaseの値を、消費電力に応じて規定する方式に切り替えている。その一覧が(表4)である。例えば、3.40E/3.20E GHzなら、TDPが103Wなので、もっとも大きく電力を消費している状態であれば102Wと104Wの間、73.2度前後ということになるわけだ。

【表4】Prescottの各消費電力時のMaximum Tcase
Power(W) Tcase max(度) Power(W) Tcase max(度)
0 43.3 54 59
2 43.9 56 59.5
4 44.5 56 59.5
6 45 58 60.1
8 45.6 60 60.7
10 46.2 64 61.9
12 46.8 66 62.4
14 47.4 68 63
16 47.9 70 63.6
18 48.5 72 64.2
20 49.1 74 64.8
22 49.7 76 65.3
24 50.3 78 65.9
26 50.8 80 66.5
28 51.4 82 67.1
30 52 84 67.7
32 52.6 86 68.2
34 53.2 88 68.8
36 53.7 90 69.4
38 54.3 92 70
40 54.9 94 70.6
42 55.5 96 71.1
44 56.1 98 71.7
46 56.6 100 72.3
48 57.2 102 72.9
50 57.8 104 73.5
52 58.4

 加えてCPU内部に、新たに「T.Control」、「T.Ambient」というパラメータが追加されている。この2つのパラメータに関して、今回発表された製品の具体的な数値は、現時点で公表されていないが、これはCPU冷却用ファンの回転数を制御するためのパラメータで、その概念を示したのが図2だ。

 CPU内部のサーマルダイオードで検出した温度がT.Controlの値以下の場合はファンの速度を低速に維持し、T.Controlの値をオーバーしたときはT.Ambient、つまりCPU周辺の温度を睨みつつファンの回転数を制御することになる。

 現在のPCではCPUだけでなく、ビデオチップなどの周辺パーツの発熱も増加傾向にある。これまでのようにCPUのみの温度監視によるファン回転数制御から、周辺温度にも気を遣うことで、より効果的な熱処理を行なうための技術なのである。

【図2】Prescottで採用された熱保護技術

 ベンチマーク編に続く。

□The Microarchitecture of the Pentium 4 Processor(英文)
http://www.intel.com/technology/itj/q12001/articles/art_2.htm
□関連記事
【2月3日】【多和田】ようやく登場した新Pentium 4「Prescott」(ベンチマーク編)
http://pc.watch.impress.co.jp/docs/2004/0203/tawada10.htm
【2月3日】【多和田】ようやく登場した新Pentium 4「Prescott」(追加編)
http://pc.watch.impress.co.jp/docs/2004/0203/tawada11.htm
【2月2日】Intel、新Pentium 4「Prescott」の価格を公開
http://pc.watch.impress.co.jp/docs/2004/0202/intel.htm
【2003年4月16日】【海外】パイプラインを拡張して高クロック化を図るPrescott
http://pc.watch.impress.co.jp/docs/2003/0416/kaigai01.htm

バックナンバー

(2004年2月3日)

[Text by 多和田新也]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp
個別にご回答することはいたしかねます。

Copyright (c) 2004 Impress Corporation All rights reserved.