多和田新也のニューアイテム診断室

Noconaコアへと生まれ変わった新「Xeon」




 6月29日に発表された90nmプロセスの新Xeonは、Extended Memory 64 Technology(EM64T)や拡張版SpeedStepの搭載など、見所の多い製品。EM64Tの恩恵を受けられる環境は限られるものの、現状のWindows XP Professionalではどの程度のパフォーマンスが見られるのか。その実力をチェックしてみたい。

●ようやくFSBが800MHzに達したXeon

 Noconaの開発コードネームで知られてきた新Xeonであるが、従来モデルのPrestonia/GallatinコアのXeonから大幅にアーキテクチャが更新された。製造プロセスは90nmへと微細化。FSBが800MHz FSBに向上したほか、拡張命令のSSE3にも対応。このあたり、デスクトップ向けであるPrescottコアのPentium 4に近いスペックであり、ようやく追いついたという印象が強い。

Xeon

 ただし当然ながら、サーバー/ワークステーション向けであるXeonには、それ特有の機能もある。もっとも特徴的なところではマルチプロセッサ構成に対応する点であろう。また、すでに報じられているとおり、AMDのAMD64に追従する格好となった64bitのメモリアドレッシング技術「Extended Memory 64 Technology(EM64T)」をサポートした。これにより、エンタープライズ向けの一部のLinuxや、今年末にも登場予定のEM64Tに対応したWindows XPで、4GBを超えるメモリ領域を扱うことが可能となる。

 このほか、モバイル向けCPUで利用されてきた消費電力抑制技術の「Enhanced SpeedStep Technology」も搭載。CPUの負荷に応じてコア電圧やクロックを変化させることで、消費電力を抑えることができる。とくに長時間の連続稼動を行なうのが当たり前であるサーバー用途で、発熱の抑制などの効果を得られそうである。

 Xeonの登場に合わせて対応チップセットも新たにリリースされた。それが「Intel E7525」である。Intel E7525は800MHz FSBを正式サポート。また、こちらもデスクトップ向けに遅れをとる格好になったが、DDR2-400への対応、ビデオカード向けのPCI Express x16インターフェイスの搭載、といった特徴を持つ。

 また、PCI Express x8インターフェイスも内蔵している。このインターフェイスはそのまま1基のPCI Express x8として利用できるほか、PCI Express x4を利用するPCI-X Hub「Intel 6700PXH」を介して2基のPCI-Xインターフェイスを持たせ、かつPCI Express x4を別途利用する、といった使い方ができる。

 なお、サウスブリッジには、Intel 875Pなどデスクトップ向けチップセットでも利用されているICH5R、もしくはHanceRapidsことIntel 6300ESBが利用される。

●デュアル構成でとOpteronデュアル、Pentium 4 560と比較

 それでは、ベンチマークで性能をチェックすることにしたい。評価環境はXeon 3.60GHzデュアル+Intel E7525のIntel製評価キットを利用している(写真1)。比較対象に用意したのは、AMDから借用したOpteron 248デュアルの評価キット(写真2)とPentium 4 560。テスト環境の詳細は表を参照されたい。

 Xeon 3.60GHzにおけるCrystalCPUIDの結果は画面1のとおり。EM64TやSpeedStepのフラグが立っていることが確認できる。ただ、SpeedStepに関して、マザーボードのBIOSでもEnableにすることはできる(画面2)のだが、実際にOS上でクロックや電圧が変化することは確認できなかった。おそらくSpeedStepに対応させるためのドライバ等が必要だと想像されるが、現時点で提供はされていないようだ。

【写真1】IntelのXeon3.60GHz評価キット。マザーボードは同社のIntel E7525搭載マザー「SE7525GP2」が使われる。最下部のPCI-XスロットにRAIDボードの「SRCS16」が装着されている 【写真2】AMDのOpteron 248評価キット。マザーボードはMSIの「K8T Master2-FAR」。チップセットはVIAのK8T800
【画面1】Xeon 3.60GHzにおけるCrystalCPUIDの結果 【画面2】SE7525GP2のBIOS設定画面では、SpeedStepを有効にするパラメータが用意されているが、OS上ではドライバがないためか機能しなかった

【表】テスト環境
CPU Xeon 3.60GHz×2 Opteron 248(2.2GHz)×2 Pentium 4 560(3.6GHz)
チップセット Intel E7525 VIA K8T800 Intel 925X
マザーボード Intel SE7525GP2 K8T Master2-FAR Intel D925XCV
メモリ Registered PC2700 DDR SDRAM 2GB(1GB×2/CL=2.5) Registered PC3200 DDR SDRAM 2GB(512MB×4/CL=2) PC4300 DDR2 SDRAM 2GB(512MB×4/CL=4)
ビデオカード NVIDIA GeForce PCX 5750 NVIDIA GeForce FX 5700 Ultra NVIDIA GeForce PCX 5750
ビデオドライバ ForceWare 61.45
HDD WesternDigital WD Raptor WD360×2(RAID0)
RAIDコントローラ Intel SRCS16 VT8237内蔵 ICH6R内蔵
OS Windows XP Professional(ServicePack1a/DirectX 9.0b)


●CPU性能

 それではベンチマークの結果を順に紹介していくことにする。最初は「Sandra 2004 SP2」の「CPU Arithmetic Benchmark」(グラフ1)と、「CPU Multi-Media Benchmark」(グラフ2)だ。

【グラフ1】Sandra 2004 SP2(CPU Arithmetic Benchmark) 【グラフ2】Sandra 2004 SP2(CPU Multi-Media Benchmark)

 Pentium 4 560は隅に置かれた格好になってしまっているが、これは、Sandraが物理的なCPUの個数に応じてスコアが大きくなる傾向にあるからだ。すべてのテスト結果で、Xeon 3.60GHzはPentium 4 560のほぼ倍のスコアになっており、CPU単体の演算性能はXeon 3.60GHzとPentium 4 560で大きな差がないことが想像できる。

 デュアル構成同士となるOpteron 248デュアルとの比較でも、Xeon 3.60GHzが優秀な成績だ。とくにその傾向はSSE2命令を利用するテストで顕著に表れている。純粋な演算性能という点では、NoconaコアのXeonはまずまずのものを持っていそうである。

 ただし、この演算性能が実際の性能に直結しないことは、これまでの本連載でも分かっていることである。続いて行なったのは「PCMark04」のCPU Test(グラフ3)。このテストは、CPUを対象としたコンポーネントベンチでありながら実際のアプリケーションに近いテストを行なうのだが、ここではXeonが優秀と言い切れない結果が出ている。

 グラフのFile Compression~Image Processingまではマルチスレッドのテストとなる。ここでは物理的に2つのCPUを持つXeon、Opteronが強い。ちなみにHyper-Thredingに対応するIntel製CPU2種の場合、論理CPUの数はXeonデュアルが4個、Pentium 4 560が2個となる。残りのテストの結果はOpteron、Pentium 4が優秀であり、PCMark04ではマルチスレッド処理が行なえることのメリットはせいぜい2個までといった雰囲気が漂っている。4個の論理CPUによるマルチスレッド処理が有効に働かない場合、Xeonデュアルのパフォーマンスには疑問が残る結果といえそうである。

【グラフ3】PCMark04(CPU Test)

●メモリ性能

 次にメモリアクセス速度も見ておきたい。テストはSandra2004 SP2の「Cache & Memory Benchmark」で、まずはグラフ4に全結果を示しているが、キャッシュが有効となる1MBまでの転送でXeonデュアルの結果が飛び抜けている。が、これも先のCPU性能のテストで触れたとおりで、Sandraのテストの特性により物理CPUの数に応じてスコアがインフレを起こしているためと考えていい。そのことから、Pentium 4 560と同等の性能と見ていいだろう。同様にグラフではPentium 4 560と同等のスコアが出ているOpteronデュアルも、実際はその半分程度が単体のスコアと見ていい。

 さて、続いて実メモリの性能差を見ておきたいが、今回は各環境がすべて違うスペックのメモリであるため、同列の比較は難しい。具体的な数値はグラフ5に抜き出しているが、こうした差があるという参考程度に捉えていただければ幸いだ。今回はXeonでRegistered DDR333を使用しているが、DDR2を使えばまた結果も大きく変わってくる可能性は高い。

【グラフ4】Sandra 2004 SP2(Cache & Memory Benchmark) 【グラフ5】Sandra 2004 SP2(Cache & Memory Benchmark)

●アプリケーション性能

 それでは、実際のアプリケーションを利用したベンチマークを実施することにしよう。まず、グラフ6に「SYSmark 2004」、グラフ7に「Winstone 2004」の結果を示している。マルチスレッドが有効に働くアプリケーションが多いSYSmark2004のInternet Content CreationではXeonデュアルが強く、続いてOpteronデュアルといった傾向だが、それ以外ではOpteronデュアルが安定して好成績を収めた印象だ。

 一方、SYSmark2004のOffice ProductivityのようにPentium 4がもっとも好成績という結果もある。マルチスレッドが大きな意味をなさないテストでは、メモリ帯域幅など周辺環境が大きく影響。さらにPC向けアプリケーションでは4つのスレッドを処理するところまで作りこんである製品は限られるであろうし、Xeonデュアルの論理CPUが4個あることのメリットを享受できる状況は(少なくともPCの代替として使うには)限られそうである。

【グラフ6】SYSmark2004 【グラフ7】Winstone 2004

 続いては、今回はインターネットクライアントとしての性能を見る「WebMark 2004」もテストしている。オフラインモードと呼ばれる、ネットワークを介さないテストを実行した結果をグラフ8に示したが、インターネットクライアントとしての性能はXeonデュアルとPentium 4に期待できそうな結果が出ている。とはいえ、ここまでの各テスト結果を見るにOpteronデュアル環境の性能が低すぎるように思え、SSE2/SSE3といった拡張命令の性能差が結果に大きく反映されているのではないかと推測している。

 アプリケーション性能テストの最後に、「TMPGEnc 3.0 XPress」を使ったMPEGエンコードの速度も見ておきたい(グラフ9)。ご覧のとおり、MPEG-1でOpteronデュアルが飛びぬけ、MPEG-2でXeonデュアルが優秀な成績という傾向が表れた。最高精度設定のMPEG-2エンコードも試したみたところ、ここではXeonデュアルがさらに良い性能を発揮する。

 TMPGEnc 3.0 XPressはSSE3、マルチスレッドに強いテストということもあり、こうした高い負荷がかかる処理においては論理CPUが4個ある強みも含めて、よい性能を発揮できるようである。ただし、MPEG-1やPCMark04のCPUテストに含まれるWMV、DivXのように、エンコードエンジン次第ではOpteronデュアルやPentium 4のほうが高速にエンコードできる場合があることも覚えておく必要がある。

【グラフ8】WebMark 2004 【グラフ9】TMPGEnc 3.0 XPress

●3D性能

 最後に3Dベンチマークをいくつか実行しておきたい。ただ、今回はXeonおよびPentium 4環境はPCI Express x16接続、Opteron環境はAGP接続という制約があり、近い性能のビデオカードを利用しているとはいえ、同列での比較はしづらい状況である。

 それでも、CPU処理の割合が結果に大きく影響する「Unreal Tournament 2003」のBotmatch(グラフ10)、「Unreal Tournament 2004」(グラフ11)の結果を見るに、3Dゲームを扱うという観点においてはXeonデュアルは決して向いているとは思えない傾向が出ている。

【グラフ10】Unreal Tournament 2003 【グラフ11】Unreal Tournament 2004

 また、そのほかに実施した「3DMark03」(グラフ12)、「AquaMark3」(グラフ13)、「3DMark2001 Second Edition」(グラフ14)、「FINAL FANTASY Official Benchmark」(グラフ15)の結果は、Opteronデュアル環境が大きく他を引き離している。この差はビデオカードのインターフェイスの差だけとは言い切れないほどの大きなアドバンテージであり、特筆しておきたい。

【グラフ12】3DMark03 Build340 【グラフ13】AquaMark3(Average FPS)
【グラフ14】3DMark2001 SecondEditon 【グラフ15】FINAL FANTASY Official Benchmark 2

●用途に左右されるXeonデュアル環境

 以上のとおり、Xeon、Opteron、Pentium 4の各CPUを、PC用途で使った場合のパフォーマンスを検証してきた。新しくなったNoconaコアのXeonはテストによっては非常に高いパフォーマンスを発揮する一方で、シングルプロセッサのPentium 4にも劣るシチュエーションも多発する結果となった。例えば今回のテスト結果でいえば、マルチスレッド化や拡張命令への対応が進んでいるコンテンツ作成系アプリケーションなどには強いが、ビジネスアプリケーションや3Dゲームには向かない雰囲気であり、かなり用途に左右されるとみていい。

 もちろん価格対性能比でいえば、Pentium 4で十分なシチュエーションが多く、諸手を挙げてお勧めするにはアピールの弱い結果ではある。少しでも高い性能を必要とする用途では導入の価値もあるといったところだろうか。

 なお、今回試した環境はメモリにDDR333を使っているため、DDR2-400を使った環境ならばもう少し違った結果になる可能性はある。また、対応チップセットに関しても、「Lindenhurst」のコードネームで呼ばれた「Intel E7520/7320」が発表された。このチップセットはメモリなどの基本仕様はIntel E7525と変わらないが、PCI Express x16スロットが省かれている。

 実際のマザーボードにはRAGE XLなどをPCIバス接続などで搭載してくるだろうと思われるが、PCI Express接続のビデオカードを用意するよりも導入コストが抑えられる可能性が高い。3D性能に関しては現時点でXeonに高い期待をかけるのは難しそうであり、E7520やE7320搭載のマザーボードを待つのも有効な手といえそうだ。

□関連記事
【8月2日】インテル、NoconaコアXeon対応チップセット「E7520/7320」
http://pc.watch.impress.co.jp/docs/2004/0802/intel2.htm
【6月29日】インテル、全面刷新を行なった新Xeonプロセッサ
http://pc.watch.impress.co.jp/docs/2004/0629/intel2.htm

バックナンバー

(2004年8月5日)

[Text by 多和田新也]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp
個別にご回答することはいたしかねます。

Copyright (c) 2004 Impress Corporation All rights reserved.