多和田新也のニューアイテム診断室

ようやく登場した新Pentium 4「Prescott」【ベンチマーク編】
〜キャッシュ容量とパイプライン段数が大きく影響




●3.20E GHzを使ってパフォーマンスを検証

 それでは解説編に引き続き、実際のプロセッサを見てみることにしたい。今回試用するのは、Prescottコアを採用したPentium 4 3.20E GHzである(写真2)。目立つのはその裏面で、NorthwoodコアのPentium 4と比較して、コンデンサの数が倍以上にも増えており、これによりCPUの駆動にかかる電圧の安定を図っているものと想像される(写真3)。

 付属のCPUクーラーは、これまでのPentium 4のものと外観に大きな違いはない(写真4)。今回、このクーラーを使って、先に紹介したT.Control、T.Ambientの動きを見てみようかと思ったのだが、周辺温度を見て動きを変える、といったような動作を確認できなかった。マザーボードのBIOSなど、アップデートが必要な部分もあるのかも知れないが、これについては情報を収集しつつ追々試していくことにしたい。

【写真2】Prescottコアを採用したPentium 4 3.20E GHz(Engineering Sample品)。μPGA478パッケージの従来のPentium 4と大きな外観の違いはない 【写真3】向かって左がPentium 4 3.20E GHz(Prescott)、右が同3.20GHz(Northwood)の各裏面である。コンデンサの数が倍以上に増えている点に注目 【写真4】CPUクーラーは従来のものと外観に大きな違いはない

 さて、「CrystalCPUID」を使って、Prescottの情報を取得してみると、画面1のようになる。ステッピングがすでに“3”まで進んでいるあたりからは、90nmプロセス開発の苦労を伺い知ることができる。このほか、Modelが変更されていたり、SSE3へ対応している点、L2キャッシュが1,024KB(1MB)へと増えていることも確認できるが、なぜかL1データキャッシュの容量が取得できなかった。

 そこで、「PC Wizard 2004」も合わせて実行してみると、こちらでは、完全とはいえないながらも、16KBであると確認できた(画面2)。NorthwoodコアのPentium 4でそれぞれを実行した場合の結果は、画面3、4に示しているので参考にしてほしい。

【画面1】Pentium 4 3.20E GHzにおけるCrystalCPUIDの実行結果 【画面2】Pentium 4 3.20E GHzにおけるPC Wizard 2004の実行結果。L1データキャッシュの情報を表示している
【画面3】Pentium 4 3.20 GHzにおけるCrystalCPUIDの実行結果 【画面4】Pentium 4 3.20 GHzにおけるPC Wizard 2004の実行結果

 続いてパフォーマンスの検証に移りたい。比較対象にはPentium 4 3.20GHzと、Athlon 64 3400+を用意した。テスト環境は表5に示すとおりである。

 なお、マザーボードはIntel 875Pを搭載したASUSTeKの「P4C800」をVersion 1014のBIOSを適用した状態で使用したが、ベンチマークテスト中、怪しい動きは一切なく、問題なく動作したことを付記しておく。

【表5】テスト環境
CPU Pentium 4 3.20E GHz Pentium 4 3.20 GHz Athlon 64 3400+
チップセット Intel 875P nForce3 150
マザーボード ASUSTeK P4C800 GIGABYTE GA-K8NNXP
メモリ PC3200 DDR SDRAM 1GB(512MB×2)
ビデオカード Albatron FX5700U(NVIDIA GeForce FX 5700 Ultra/Detonator XP 53.03)
HDD Seagate Barracuda 7200.7(ST3120026AS)
OS Windows XP Professional(ServicePack1/DirectX 9.0b)

●CPU性能

 まずはCPUの演算性能のチェックから行なっていきたい。グラフ1が「Sandra2004」の「CPU Arithmetic Benchmark」、グラフ2が同じく「CPU Multi-Media Benchmark」の結果を表したものだ。

 注目は、いずれの結果も、Prescottコアの3.20E GHzがNorthwoodコアの3.20GHzに敗北を喫している点だ。3.20GHzでは全結果でAthlon 64 3400+を上回る演算性能を見せているのだが、3.20E GHzはDhrystone(整数演算テスト)で最下位という結果になっている。

 先にも触れたとおりCPUブロックダイヤグラム自体に、PrescottとNorthwoodで大きな違いはなく、内部的にはさらなる改良を加えられたはずが、演算性能が低下しているというのはどういうことだろうか。これについては推測できることがあるのだが、後に行なうメモリテストの結果も関連するので、そこで述べることにしたい。

【グラフ1】Sandra2004(CPU Arithmetic Benchmark) 【グラフ2】Sandra2004(CPU Multi-Media Benchmark)

 CPUテストでもう1つ、CPU処理を中心とした実際のアプリケーション処理の結果を測定する「PCMark04」のテスト結果をグラフ3に示した。3.20E GHzと3.20GHzの間では、テストによって成績の良し悪しが入れ替わるようになっており、Sandra2004で見せた演算性能の悪化が、内部処理の改良やキャッシュ容量の増加によって補われるケースが存在することを示している。

 キャッシュ容量が生きてそうな処理としては、動画エンコードが挙げられるが、DivXでは好成績を収めている一方、WMVのエンコードはNorthwoodに劣っており、確実に高いパフォーマンスを発揮するとはいかないようである。

【グラフ3】PCMark04(CPU Test)

●メモリ性能

 続いてメモリ性能を見てみよう。グラフ4に示したのはSandra 2004の「Cache & Memory Benchmark」の全結果を折れ線グラフで表したものを、視点を変えて2パターン示したものである。この結果の中から、いくつかポイントとなる部分を具体的な数値とともに抜き出したものがグラフ5だ。

 ここで抜き出したポイントがどういう意味を持つか紹介しておくと、

4KB:Prescott/NorthwoodともにL1キャッシュ範囲
16KB:PrescottはL1キャッシュ、NorthwoodはL2キャッシュ範囲
256KB:Prescott/NorthwoodともにL2キャッシュ範囲
1MB:PrescottはL2キャッシュ、Northwoodは実メモリ範囲
256MB:Prescott/Northwoodともに実メモリ範囲

のアクセス速度をそれぞれチェックできる。

 この結果を見てみると、まず16KB、1MBのブロックサイズの転送においては、3.20GHzに対して、より多くのキャッシュを搭載する3.20E GHzが高速に動作していることが分かる。256MBの結果に見る実メモリのアクセス速度は、チップセット側の機能に依存する上、FSBの帯域幅も同じなので、ほとんど変わらない結果になっている。

 ところが、共にL1キャッシュのアクセスとなる4KB、同じく共にL2キャッシュの256KBの結果は注視する必要がある。ここで3.20E GHzに対して、3.20GHzが優秀なパフォーマンスを見せているのだ。キャッシュの速度はCPUクロックと同じクロックで動作しているので、ともに3.2GHzという動作クロックであるにも関わらず、このような結果なのである。

【グラフ4】Sandra 2004(Cache & Memory Benchmark 1) 【グラフ5】Sandra 2004(Cache & Memory Benchmark 2)

 動作クロックが同じで、パフォーマンスに差がでるということは、キャッシュメモリのアクセス時に発生しているレイテンシの差ということが想像できる。そこで「CPU-Z」をチェックしてみると、やはりグラフ6のような結果が出る。各キャッシュメモリのアクセス時にPrescottはNorthwoodに対して、L1キャッシュは倍、L2キャッシュはおよそ1.5倍のサイクルを費やしているのである。

【グラフ6】CPU-Z Latency Test

 ここで、先の演算性能の低下のところも含めた話になるが、こうした事態が発生する原因として考えられるのが、後藤氏のコラムで触れられているパイプライン数の増加である。

 Prescottのパイプラインの段数などは現時点で正式に発表されていないが、Northwoodの20段より増加していると言われている。パイプラインの段数を増やすことは、高クロック化を進める上でメリットとなるが、一旦キャッシュミスが発生すると、パイプラインを停止させたあとの復旧に要する時間(ペナルティ)も長くなるというデメリットも持ち合わせている。その結果がこれらのベンチマーク結果に表れたのではないかと推測される。

●アプリケーション性能

 ここからは実際のアプリケーションを使ったベンチマークをいくつか試してみよう。まずは、「SYSmark2002」(グラフ7)である。インターネットコンテンツ作成アプリケーションを中心とした「Internet Content Creation」では、扱うファイルサイズが大きい点や、マルチスレッドアプリケーションが多いことなど、キャッシュ容量の多い3.20E GHzに有利かと思いきや、またも3.20GHz以下の成績に留まっている。その差も約3%と、決して無視できない違いである。

【グラフ7】SYSmark2002

 一方、グラフ8に示した「SYSmark2004」の結果を見てみると、こちらは「2D Creation」で同列となったほかは、「Internet Content Creation」、「Office Productivity」の各テストで、いずれも3.20E GHzが3.20GHzを上回る性能を見せている。

 グラフ9に示した「Winstone2004」の結果もSYSmark2004同様に、3.20E GHzが3.20GHz以上のパフォーマンスを安定して発揮する結果になっている。ただし、こちらはAthlon 64 3400+の性能には追いついていない。

【グラフ8】SYSmark2004 【グラフ9】Winstone2004

【画面5】TMPGEnc 3.0 XPressの環境設定画面。ベータ版ではあるがSSE3にも対応している

 もう1つ、動画エンコードテストとして「TMPGEnc」によるMPEG-1エンコードをテストしてみると、こちらも3.20E GHzが3.20GHz以上のパフォーマンスを発揮するという結果が出ている(グラフ10)。

 一連の結果を見てみると、SYSmark2002のような例はあるものの、実アプリケーションにおいては、3.20GHzと比較して、3.20E GHzのほうが良好なパフォーマンスを示す傾向が見て取れる。SYSmark2004や、Winstone2004で良好な結果が得られたように比較的新しいアプリケーションや、TMPGEncのようにマルチスレッド処理を効率的に行なっているアプリケーション、という条件がPrescottの性能を発揮しやすい場所だと考えられる。

 ちなみにPrescottで追加されたSSE3に対応しているアプリケーションは、現時点で登場していないが、ペガシスの「TMPGEnc 3.0 XPress」がSSE3に対応する予定になっている。現在はベータ版の段階ではあるものの、一応SSE3に対応しているので、その効果をテストしてみた(画面5)。

 結果はグラフ11に示すとおりで、SSE3をOFFにした場合とONにした場合を比較すると、MPEG-1で4%、MPEG-2で6%の性能向上が見て取れる。大きな性能向上ではないものの、SSE3をOFFにした状態のMPEG-1エンコードでは、3.20GHz以下のパフォーマンスだったものが、ONにすることで逆転するほどの効果はがられる。今後SSE3対応アプリケーションが登場した暁には、前述のアプリケーションテストの結果以上にNorthwood−Prescott間との差が開く可能性はある。

【グラフ10】TMPGEnc(MPEG-1エンコード) 【グラフ11】TMPGEnc 3.0 XPress Beta 3.0.0.5

●3D性能

 最後に3D性能のテストを見ておきたい。まずは、グラフ12に示した「Unreal Tournament 2003」だが、3.20E GHzと3.20GHzの間で目立った性能差は現れず、小数点第2位で四捨五入するとまったく同じ値、という結果が出ている。Flybyについてはビデオカードが同一のため、そこがボトルネックとなっている可能性もあるが、Botmatchもほぼ同じ結果であることから、少なくとも3Dキャラクタを動作させるような処理については両製品で、ほとんど違いがないといえる。

 そのほか、「3DMark03」(グラフ13)、「AquaMark3」(グラフ14)、「3DMark2001 Second Edition」(グラフ15)と、いずれも3.20E GHzと3.20GHzに大きな違いは見られない。AquaMark3はUnreal同様に小数点第2位以下の誤差に留まった。3DMarkの2製品では、わずかに3.20E GHzが優秀な傾向はあるものの、誤差といっても差し支えないほど小さな差である。

【グラフ12】Unreal Tournament 2003 【グラフ13】3DMark03 Build340
【グラフ14】AquaMark3(Avarage FPS) 【グラフ15】3DMark2001 Second Edition

●Socket478の最後に一花咲かすアイテムではあるが……

 以上のとおりPrescottは、演算性能やキャッシュのアクセス速度はNorthwood以下、ただし、実際のアプリケーションベンチマークではNorthwood以上のパフォーマンスを発揮できるという結果に終わった。実際のアプリケーションで優秀なパフォーマンスを発揮する傾向にあるのは強味で、今後クロックが向上していくのであれば期待は大きい。

 しかし、今回登場したSocket 478版のPrescottが買いか?、という話になると違った評価をする必要がある。実際のアプリケーションでパフォーマンスが向上したとはいっても大幅なアップというわけではないし、SYSmark2002のように低下するベンチマークすらあるわけで、確実にパフォーマンスが向上するとはいえない。

 すでに対応が表明されているマザーボードを使用していて安心してPrescottへ移行できるのであれば乗り換えるのも一案だと思う。というのも、現時点で日本での価格は発表されていないものの、米ドルでのOEM向け価格はすでに報じられているとおり。PrescottとNorthwoodの同クロック品の間に価格差を付けていないという魅力ある設定で、購入し直すならPrescottコアが良いかも、と思わせるに十分である。

 しかし一方で、ベンダーからPrescott対応が表明されていないマザーボードを使っている人は、消費電力の大きさから動作には不安があるのも事実で、手放しでお勧めできる状況ではない。

 また、安心してPrescottを使うために、マザーボードを買い換えるというのも考え物だ。消費電力の増加に伴いμPGA478のピンを流れる電力が限界に来ていることから、第2四半期にもLGA775という新しいパッケージのPrescottや、対応チップセットが登場する予定で、その際には再度マザーボードごと購入し直す必要が生じる。アップグレードパスが乏しいSocket 478マザーを買い換えるというのならば、将来性のあるAthlon 64マザーへ乗り換えるという選択肢も視野に入れたほうがいいと思う。

 というわけで、パフォーマンス面で確実性には欠けるが、そこそこの向上が期待できつつ、妙味のある価格設定がなされていることから、今すぐにCPUの購入を考えている人にならばPrescottコアのPentium 4を1つの選択肢としてお勧めできるだろう。しかし、マザーボードから何からPrescottにこだわって購入し直すほどの強い動機は感じない、というのが現時点における印象だ。

 今後、将来性のあるLGA775プラットフォームが登場し、さらにSSE3アプリケーションが増えるなどの周辺環境が整えば、Prescottへの評価もまた違ったものになるだろうと思われ、そのときに改めて実力を見てみたい。

□The Microarchitecture of the Pentium 4 Processor(英文)
http://www.intel.com/technology/itj/q12001/articles/art_2.htm
□関連記事
【2月3日】【多和田】ようやく登場した新Pentium 4「Prescott」(解説編)
http://pc.watch.impress.co.jp/docs/2004/0203/tawada09.htm
【2月3日】【多和田】ようやく登場した新Pentium 4「Prescott」(追加編)http://pc.watch.impress.co.jp/docs/2004/0203/tawada11.htm
【2月2日】Intel、新Pentium 4「Prescott」の価格を公開
http://pc.watch.impress.co.jp/docs/2004/0202/intel.htm
【2003年4月16日】【海外】パイプラインを拡張して高クロック化を図るPrescott
http://pc.watch.impress.co.jp/docs/2003/0416/kaigai01.htm

バックナンバー

(2004年2月3日)

[Text by 多和田新也]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp
個別にご回答することはいたしかねます。

Copyright (c) 2004 Impress Corporation All rights reserved.