多和田新也のニューアイテム診断室

クアッドコア×デュアルCPUで“8コア環境”を実現する「Xeon 5300」




 本連載ではすでに、「Kentsfield」のコードネームで呼ばれてきたデスクトップ向けクアッドコアCPU「Core 2 Extreme QX6700」のレビュー記事をお届けしているが、Intelは11月15日に一連のクアッドコアCPUを正式発表した。

 今回のレポートでは、DPサーバー/ワークステーション向けの製品となる「Xeon 5300」シリーズを利用したシステムの検証を行なってみたい。

●即日出荷の1,066MHz FSB版と、来年出荷の1,333MHz FSB版

【写真1】今回テストに用いたXeon 3製品。上の2つがクアッドコアのXeon 5300シリーズとなる。デュアルコアのXeon 5160とは裏面が少し違っているのが分かる

 Xeon 5300シリーズは、「Clovertown」の開発コードネームで呼ばれたものだ。そのラインナップは表1の通り。基本的な構造は、Kentsfieldと同じで、デュアルコアであるWoodcrestコアのダイをCPUパッケージ上に2つ載せた仕組みである。Xeon 5300シリーズはデュアルプロセッサに対応する製品となるので、クアッドコア(4コア)×デュアルプロセッサ(2CPU)で計8コア、つまりOct-Coreの環境を構築できる。

 今回試用するのは、Xeon E5320とXeon X5355の2種類だ(写真1)。外観上の違いは特にないが、前者が1,066MHz FSB、後者が1,333MHz FSBのモデルとなる。CPUIDを見てみると、Xeon E5320がB1ステッピング、Xeon X5355がB3ステッピングになっている(画面1~3)。こうしてみると、Xeon X5355はCore 2 Extreme QX6700とスペックがほぼ一致しており、中身は同じものと考えてよさそうである。

 Xeon 5300シリーズは、Dempseyコアから使われているBensley/Glidewellプラットフォームでの動作が可能であり、今回の検証環境も、本連載のDempseyの記事Woodcrestの記事と同一のシステムを使用している。

 言い換えるなら、Intel 5000シリーズのチップセットを利用している環境があれば、BIOSのアップデート程度で、クアッドコアのデュアルプロセッサ環境を実現できるわけだ。

 ただし、今回発表された4製品のうち、1,066MHz FSBの2製品は即日出荷されるが、1,333MHz FSBの出荷開始は来年初頭が予定されている。このあたり、クアッドコアの船出としては、少々寂しい印象も受ける。

【画面1】1.86GHz動作となるXeon E5320におけるCPU-Zの結果。ステッピングは「B1」 【画面2】2.66GHz動作となるXeon X5355のCPU-Zの結果。ステッピングは「B3」となる 【画面3】こちらは参考までに、WoodcrestコアのXeon 5160のCPU-Zの結果。ステッピングは「B0」となっている

【表1】Xeon 5300シリーズのスペック
  動作クロック FSB L2キャッシュ容量 TDP
Xeon X5355 2.66GHz 1,333MHz 8MB(4MB×2) 120W
Xeon E5345 2.33GHz 80W
Xeon E5320 1.86GHz 1,066MHz
Xeon E5310 1.60GHz

●8コアの実力をベンチマークテストで検証

 それでは、パフォーマンスの検証を行なうことにする。環境は表2に記した通りである。先にも述べた通り、過去に取り上げたシステムなのだが、今回はHDDとビデオカードがやや異なっている。

【表2】テスト環境
CPU Xeon X5355×2
(Clovertown/2.66GHz/1,333MHz FSB)
Xeon E5320×2
(CloverTown/1.86GHz/1,066MHz FSB)
Xeon 5160×2
(Woodcrest/3.00GHz/1,333MHz FSB)
チップセット Intel 5000X
マザーボード Supermicro X7DA8
メモリ PC2-5300 DDR2 SDRAM 1GB×4(FB-DIMM)
ビデオカード NVIDIA Quadro FX 4500(512MB/PCI Express x16/ForceWare 84.26)
HDD Western Digital WD Caviar SE(WD1200JS)
OS Windows XP Professional(ServicePack 2/DirectX 9.0c)

 では、Sandra 2007 SP1の「Processor Arithmetic Benchmark」と「Processor Multi-Media Benchmark」の結果から見てみたい(グラフ1)。本連載で何度も述べている通り、このテストはコアの数に応じてスコアが加算される。そのため、Xeon 5300シリーズ2製品を半分のスコアにして、1コア当たりの性能を推計してみると、Xeon 5160に対してXeon X5355が89%程度、Xeon E5320が62%程度のスコアで、クロックに応じた妥当性のある数値に落ち着く。

【グラフ1】Sandra 2007 SP1(Processor Arithmetic/Multi-Media Benchmark)

 続いては、「PCMark05」の「CPU Test」の結果である(グラフ2、3)。Xeon 5160に対してXeon 5300シリーズ両製品はそれぞれ約89%、約62%という値で落ち着いている。最高で4タスク同時実行テストがもっとも負荷の高いテストとなる本ベンチマークでは、4コア(デュアルコア、デュアルプロセッサ)のXeon 5160で十分ということである。

 このことから、CPUの性能としては、現時点でもすべてのCPUが同等程度には引き出されていると考えて良さそうだ。SandraのようにCPUリソースがフルに使われるようなソフトではClovertownの2製品にアドバンテージがある一方で、PCMark05のようにクロックのほうが活きるケースも出てくるわけだ。

【グラフ2】PCMark05 Build 1.1.0(CPU Test - シングルタスク)
【グラフ3】PCMark05(CPU Test - マルチタスク)

 次にメモリ性能を見てみよう。テストは、Sandra 2007 SP1の「Cache & MemoryBenchmark」(グラフ4)と、「EVEREST Ultimate Edition 2006 Version3.5」に含まれる「Cache & Memory Benchmark」のメモリレイテンシテストの結果だ(グラフ5)。

 やはりクアッドコア×2の環境は数値が倍近くに跳ね上がる。キャッシュの範囲内では、Xeon 5300シリーズ両製品のスコアがやや伸び悩んでいる印象は受けるものの、それほど突飛な結果とはいえない。

 ただ、Xeon 5300シリーズ両製品は、レイテンシがやや大きめな結果になっている。SandraにおけるXeon E5320の64MB以上の結果が劣っているのはFSBの影響が大きいだろうが、Xeon E5355がXeon 5160に劣っているのは、メモリレイテンシの増加分を表わしている。

 ClovertownのアーキテクチャではCPUパッケージ上の2つのダイがFSBを介して接続される。キャッシュのコヒーレンシ維持などのためにFSBを無駄に使ってしまうことになるわけで、これがメモリパフォーマンス低下の一因になっていると想像される。

【グラフ4】Sandra 2007 SP1(Cache & Memory Benchmark)
【グラフ5】EVEREST(Cache & Memory Benchmark)

 続いては、実際のアプリケーションを利用したベンチマークの結果である。テストは、SYSmark 2004 Second Edition」(グラフ6)、「Winstone 2004」(グラフ7)、「CineBench 9.5」(グラフ8)、「動画エンコードテスト」(グラフ9~11)である。

 まず、SYSmark 2004 Second Editionについてだが、やはり今回の環境でもInternet Content Creationが動作せず、Office Productivityのみの結果となっている。これとWinstone 2004の結果は、先に示したPC Mark05のCPU Testの結果に比べると、Xeon 5300シリーズ両製品が健闘している結果ではある。対Xeon 5160で見た場合、Xeon E5355が最低でも90%、Xeon E5320が同じく最低でも70%程度のパフォーマンスを出している。

 とはいえ、Xeon X5355がXeon 5160を上回るテストもあるものの、ほとんどのスコアは劣っており、8コアの威力は示されていない結果になっている。

【グラフ6】SYSmark 2004 Second Editon
【グラフ7】Winstone 2004

 続いてのCineBench 9.5であるが、今回は単にCineBench 9.5のみを実行した場合に加え、バックグラウンドでTMPGEncのMPEG-2エンコード処理、MainConceptのH.264 Encoderを利用したエンコード処理を実行し続けた状態で、CineBench 9.5をテストした場合の結果も併記した。

 CineBench 9.5のマルチCPUレンダリングでは、8コアがほぼフルに動作する状態でレンダリングを行なえるため、Xeon X5355はクロックの不利を跳ね返すスコアを見せた。ただし、シングルCPUレンダリングやXeon E5320では、まだクロックの差の方が影響してしまっている格好だ。

 MPEG-2エンコードを実行しても、この傾向は変わらない。そもそも、MPEG-2エンコードは現在ではかなり軽い処理とも言えるわけで、Xeon 5160も余力残しで処理を進めているということなのだろう。

 しかし、MainConceptのH.264 Encoderを利用した動画エンコードは、負荷も重く、ソフトウェア側のマルチスレッド化もかなり進んでいる。この状況下においては8コアのメリットの片鱗がうかがえる結果となった。このような状況は、ことコンシューマにおいては、まず見られないものだが、こうした処理においてなら8コアの威力が発揮される。

【グラフ8】CineBench 9.5

 続いては、もう少しコンシューマ寄りで負荷の高いテストとして、動画エンコードの例を挙げてみたい。ちなみに、Xeon 5300シリーズ両製品では、DivX6.4の動画エンコード中にエラーが発生してしまうトラブルに見舞われたため、結果は載せていない。DivXのプロパティ画面では8コアをしっかり認識しており、正しく動作すれば面白い結果が期待できただけに残念だ。

 グラフ9に示した通常の動画エンコード処理についてだが、ここでは、全般にXeon 5160のクロックが押し切った結果が多い。先にも述べた、高負荷+マルチスレッドの条件を備えたH.264 Encoderは、Xeon X5355も良い結果を見せているものの、劇的なほどではない。

 そこで、今回は、この通常のエンコードにテストに加え、2つの高負荷パターンを加えている。1つはフロントでHD動画を再生しバックグラウンドで動画エンコードを実行した場合だ。高負荷テストとはいってみたが、HD動画の再生はCPU負荷が10~15%前後といったところで、実は、それほど負荷が高いというほどでもない。それでも、H.264エンコードではXeon X5355がXeon 5160を上回り、そのほかのXeon 5300シリーズの結果も、Xeon 5160に対して、平均5%ほど差を詰めている。

 もう1つの高負荷テストが、TMPGEnc 4.0 XPressに含まれるバッチエンコードを利用したものだ。TMPGEnc 4.0 XPressのバッチエンコードは、Windows上で認識した論理コア数を上限とした並列エンコードが行なえるので、ここでは、Xeon 5160で最大4ファイル同時、Xeon 5300シリーズ両製品で最大8ファイル同時エンコードに設定。

 TMPGEnc上からエンコードが行なえる、MPEG-2とWMV9の2種類のエンコード処理を、それぞれ4ファイル、8ファイル実行させたときの所要時間をストップウォッチで計測した。ファイルはいずれも6,000フレームのDV動画である。この場合、8ファイルの処理を行なわせると、Xeon 5300シリーズが全ファイルを同時エンコードできるのに対し、Xeon 5160では4ファイルずつ処理を行なう格好となる。

 その結果だが、MPEG-2ではあまり効果が見られず、Xeon 5300シリーズ両製品が横ばいの結果となった。ちょっと不思議な結果にも思えるが、先述の通りMPEG-2エンコードは、このクラスのCPUにとっては軽い処理といえる。ということは次に問題になるのはメモリ転送速度ということになるわけで、これがボトルネックになったのではないかと考えている。

 一方、CPUにかかる負荷がMPEG-2よりも大きいWMV9エンコードは、劇的な違いが出た。4ファイルエンコード、8ファイルエンコードともに、Xeon 5300シリーズ両製品が、Xeon 5160を上回る結果となったのである。4ファイルエンコードの場合は、Xeon 5160デュアル環境も全ファイルを同時実行することになるわけだが、マルチスレッド化が進んでいないWMV9エンコードでも2コアまでは、それなりに意味がある。よって、4ファイル実行時であっても2コアを使えるXeon 5300シリーズに分があったわけだ。当然、8ファイルエンコードになれば、全ファイルを同時進行できる強みもあり、差を広げている。

【グラフ9】エンコードテスト

 続いては3D関連のテストを行なっておきたい。テストは、「3DMark06 CPU Test」(グラフ12)、「3DMark06」(グラフ13)、「3DMark05」(グラフ14)、「3DMark03」(グラフ15)、「DOOM3」(グラフ16)、「SPEC Viewperf 9」(グラフ17)である。

 3DMark06のCPU Testは、高負荷で、かつマルチスレッド化も進んでいるテストなので、Xeon 5300シリーズが非常に健闘している。3DMark06のトータルスコアもCPU Testの影響があって、それなりのスコアとなっている。が、そのほかの3Dベンチは、おおむねクロックが優位に出た格好だ。ここは、妥当性の高い結果が出ているといえる。

【グラフ10】エンコードテスト(MPEG-2 HD再生中)
【グラフ11】エンコードテスト(TMPGEnc 4.0 XPress バッチエンコード)
【グラフ12】3DMark06 Buid 1.0.2(CPU Test)
【グラフ13】3DMark06 Buid 1.0.2
【グラフ14】3DMark05 Build 1.2.0
【グラフ15】3DMark03 Build 3.6.0
【グラフ16】DOOM3
【グラフ17】SPEC Viewperf 9

 最後に、今回のシステムの消費電力を紹介しておきたい(グラフ18)。ご覧の通り、Xeon E5320はXeon 5160よりも若干消費電力が低めとなっているが、Xeon X5355はピークで400Wを超え、非常に大きな電力を消費していることが分かる。今回の環境はCPU以外はすべて同一だから、CPUだけでこれだけの差が発生しているわけで、システムの更新を考えている人は要注意といえるだろう。

【グラフ18】消費電力

●個人ユースは難しいXeon 5300シリーズ

 以上の通りパフォーマンスを見てくると、CPUに対して高い負荷がかかる+マルチスレッド化がしっかり行なわれているアプリケーション、またはマルチタスクにおいては、8コアの威力が発揮された。だが、コアのアーキテクチャが同じということで、ほとんどの局面で、クロックが高い方が良い結果が出た。

 前々回に紹介したCore 2 Extreme QX6700の結果で分かる通り、4コアでも持て余している印象を受ける現状のコンシューマアプリケーションにおいては、8コアの効果はそれほど大きくないと言っていいだろう。

 そういう意味では、ここ数年、差が縮まっていたPCとワークステーションの差が再び大きく開いた感も受ける。この製品の真価は、膨大なデータを計算させるようなHPCなどの分野で発揮されるのだろう。

□関連記事
【11月2日】【多和田】登場間近のクアッドコアCPU「Core 2 Extreme QX6700」
http://pc.watch.impress.co.jp/docs/2006/1102/tawada88.htm
【8月1日】【多和田】Coreマイクロアーキテクチャ採用のWoodcrestこと「Xeon 5100」
http://pc.watch.impress.co.jp/docs/2006/0801/tawada81.htm
【5月23日】【多和田】Bensley/Glidewellプラットフォームへと移行するDempseyコア「Xeon 5060」
http://pc.watch.impress.co.jp/docs/2006/0523/tawada75.htm

バックナンバー

(2006年11月15日)

[Text by 多和田新也]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2006 Impress Corporation, an Impress Group company. All rights reserved.