多和田新也のニューアイテム診断室

6コアCPUがいよいよPCへ「Core i7-980X」



 Intelがかねてより予告している、デスクトップPC向けの6コアCPUで、「Gulftown」のコードネームで呼ばれたこの製品は、「Core i7-980X」の名称で登場することになっている。製品の正式発表前に性能を検証する機会を得たので、チェックしてみたい。

●6コアに12MBのL3キャッシュを搭載

 Gulftownのコードネームで呼ばれたCore i7-980Xは、デスクトップPC向けに発売されるCPUとしては、初めての6コアCPUとなる。IntelのXeonやAMDのOpteronといったサーバー/ワークステーション向けのCPUには6コアが投入されているが、いよいよPC環境においても6コアCPUを利用できるようになった。

 本製品はLGA1366対応CPUとしてリリースされる(写真1、2)。つまり、メモリコントローラはDDR3-1066のトリプルチャネルということになる。チップセットはIntel X58 Expressを組み合わせて使用。既存のマザーボードでもBIOS対応によって利用可能だ。動作クロックは3.33GHzで、Core i7-975と同じ(画面1)。TurboBoostをサポートしており、最大で3.6GHzまで動作クロックが上がる点も同じだ。TDPも同じく130Wである。

【写真1】デスクトップPC向け製品初の6コアCPUとなる「Core i7-980X」 【写真2】Core i7-980X(左)とCore i7-975(右)の裏面。LGA1366である点は同じだが、コンデンサなどの配置は異なる 【画面1】CPU-Zの結果。TurboBoostにより1段上がって26倍で動作した状態になっている

 Core i7-980XとCore i7-975の仕様上の違いは、コア数とL3キャッシュの容量にある。コア数は前述のとおり6で、Hyper-Threadingをサポートすることで12スレッドの同時実行が可能となっている。OS、アプリケーションでも、その様子を確認できる(画面2〜4)。ここでは分かりやすい例として、CineBenchの画面をサンプルにしている。

【画面2】Hyper-Threadingにより12スレッドの同時実行が可能 【画面3】CineBench R11.5で12スレッド同時処理をさせている様子 【画面4】CineBench R10で同じく12スレッドを同時実行

 L3キャッシュはクアッドコアのCore i7-975が8MBであったのに対して、6コアのCore i7-980Xは12MBとなる。4コアで8MB、6コアで12MBだからコアとL3キャッシュ容量の比率は変わっていない。もちろん、L3キャッシュは全6コアが共有して使用する。各コアに32KBのL1データキャッシュ、256KBのL2データキャッシュを備える点も同様だ。

 仕様から見えにくい点として、プロセスルールも変更されている。Core i7-975は45nm、Core i7-980Xは32nmだ。32nmプロセスの採用は、6コア化(トランジスタ数が増加)したにも関わらず、4コアのCore i7-975と同じTDPを実現できている要因の1つだろう。

 これ以前には、2010年頭に登場したClarkdaleのCPUコア部分が32nmプロセスを用いている。Clarkdaleは、45nm製品にはない機能として、AES暗号/復号処理を高速化する命令セットであるAES-NI(New Instructions)が導入されたが、Core i7-980Xはこれも利用可能だ。

 Core i7-975とCore i7-980Xは同じ130W TDPだが、付属のCPUクーラーは変更される。Core i7-975では他製品よりも一回り大きいトップフロータイプのCPUクーラーが付属した。Core i7-980Xではこれに代わり、サイドフロータイプの新しいCPUクーラーが付属している(写真3〜5)。

【写真3】Core i7-980Xのリテール品に付属するCPUクーラー。サイドフロータイプで、プッシュピンではなくバックプレートとネジを使って固定する 【写真4】銅ベース、ヒートパイプ、アルミフィンと、昨今のCPUクーラーでは定番の構造になっている 【写真5】ファンはNidec製。97mm角、25mm厚のファンで、回転数は800〜1,800rpm、ノイズは20〜35dBAが公称されている

●Core i7-975との性能比較

 ここからはベンチマーク結果の紹介だ。テスト環境は表1に示したとおりで、ここではCore i7-975との比較を行なう。6コア/12スレッドという新しいスタイルの製品ということもあり、ここではHyper-Threadingを無効化した場合の環境も加えた(以後、本文、グラフともにHyper-ThreadingをHTを表記する)。

【写真6】Intel X58 Express+ICH10Rを搭載する、ASUSTeK「P6TD Deluxe

 テスト環境に関していくつか補足説明を加えておく。まずマザーボードはASUSTeKから借用した「P6TD Deluxe」を使用(写真6)。CPUが正式発表前のため公式対応BIOSはリリースされてないが、テスト開始時点の最新バージョンである「0404」を適用することでCPUは認識、動作している。

 メモリはDDR3-1333のトリプルチャネル構成としている。先述のとおり、Core i7-980X/975は公式にはDDR3-1066までのサポートとなるが、DDR3-1333をサポートするマザーボードがほとんどであり、メモリの入手性や製品のセグメントを鑑みてもDDR3-1333以上で利用するユーザーが多いと思われるからだ。

 ストレージは2台のHDDによるRAID 0アレイを組んでいる。CPU、メモリの高速化により相対的にHDDがボトルネックになりやすくなっているため、それを少しでも解消するためである。

【表1】テスト環境
CPU Core i7-980X
Core i7-975
チップセット Intel X58 Express+ICH10R
マザーボード ASUSTeK P6TD Deluxe
メモリ DDR3-1333(2GB×3/9-9-9-24)
グラフィックス機能
(ドライバ)
Radeon HD 5870
(CATALYST 10.2)
ストレージ Seagete Barracuda 7200.12(ST3500418AS 2台/RAID 0)
電源 KEIAN KT-1200GTS
OS Windows 7 Ultimate x64

 では順に結果を紹介していきたい。Sandra 2010cのProcessor Arithmetic/Processor Multi-Media Benchmark(グラフ1)、PassMark Performance Test 7のCPU Test(グラフ2)、PCMark05のCPU Test(グラフ3〜4)の結果を示す。

 まず、PCMark05については、最大で4タスクの同時実行に留まるため、4スレッド以上の同時実行が可能で、かつ動作クロックが同じ今回のCPUではまったくといって差がない。

 SandraとPassMarkは、マルチスレッドへの最適化が行なわれているCPUベンチということもあり、6コアの効果が出ている。Core i7-980XのHT無効時とCore i7-975のHT有効時では後者のほうが同時実行できるスレッド数は多いが、物理的なコアによるCPUリソースの差のメリットが出るテストが多い。

 他方、PassMarkの浮動小数点演算テストのように演算ユニットをフルに使っていることが原因と見られるHT有効/無効の差がない結果や、同じくPassMarkのFind Prime Numbersのようにオーバーヘッドが原因と見られるHT無効時のほうが良好なスコアを出す結果が見られることも気に留めておきたい。

【グラフ1】Sandra 2010c (Processor Arithmetic/Multi-Media Benchmark)
【グラフ2】PassMark Performance Test 7(CPU Test)
【グラフ3】PCMark05 Build 1.2.0(CPU Test−シングルタスク)
【グラフ4】PCMark05 Build 1.2.0(CPU Test−マルチタスク)

 次に、Sandra 2010cのCache & Memory Benchmark(グラフ5)と、PCMark05のMemory Latency Test(グラフ6)、Sandra 2010cのMemory Latency Benchmark(表2)である。Sandraのキャッシュ範囲内のテストについてはマルチスレッド動作によるスコアの飛躍があるが、おおむねコア数に準じた1.5倍という結果にある。レイテンシについては、Sandraの4MB転送テストで見られるように、容量が増えたCore i7-980Xはややレイテンシが大きい傾向にある。

 メインメモリへのアクセスについては、実効速度はHT無効時のほうが多少良い結果が出る傾向が見られるものの、各条件とも極端な差はない。レイテンシについてはL3キャッシュが12MBと大きくなっていることもあって、16MB転送の値もキャッシュの影響を受けているように見られる。そのため、表で示したSandraの64MB転送の値が唯一参考にできるスコアといえるが、その結果はランダムアクセスではCore i7-980Xがやや遅く、シーケンシャルアクセスではほぼ同等、という結果になっている。

【グラフ5】Sandra 2010c(Cache & Memory Benchmark)
【グラフ6】PCMark05 Build 1.2.0(Memory Latancy Test)

【表2】Sandra 2010c Memory Latency Benchmarkの結果詳細
Random Access i7-975(HT無効) i7-975(HT有効) i7-980X(HT無効) i7-980X(HT有効)
1kB 1.2ns/3.9clocks 1.2ns/3.9clocks 1.2ns/3.9clocks 1.2ns/3.9clocks
4kB 1.2ns/3.8clocks 1.2ns/3.9clocks 1.2ns/3.8clocks 1.2ns/3.9clocks
16kB 1.2ns/3.9clocks 1.2ns/3.9clocks 1.2ns/3.9clocks 1.2ns/3.9clocks
64kB 2.9ns/9.6clocks 2.9ns/9.6clocks 2.9ns/9.6clocks 2.9ns/9.6clocks
256kB 3.9ns/13.2clocks 3.9ns/13.1clocks 4.3ns/14.3clocks 4.2ns/13.9clocks
1MB 13.7ns/45.7clocks 13.7ns/45.7clocks 16.0ns/53.5clocks 16.0ns/53.5clocks
4MB 15.6ns/52.0clocks 15.6ns/52.1clocks 18.0ns/60.1clocks 18.0ns/60.1clocks
16MB 65.6ns/219.1clocks 65.8ns/220.0clocks 60.1ns/200.7clocks 62.3ns/208.1clocks
64MB 69.3ns/231.5clocks 69.5ns/232.3clocks 71.9ns/240.2clocks 72.0ns/240.5clocks
Linear Access i7-975(HT無効) i7-975(HT有効) i7-980X(HT無効) i7-980X(HT有効)
1kB 1.2ns/3.8clocks 1.2ns/3.9clocks 1.2ns/3.8clocks 1.2ns/3.9clocks
4kB 1.2ns/3.8clocks 1.2ns/3.9clocks 1.2ns/3.8clocks 1.2ns/3.9clocks
16kB 1.2ns/3.9clocks 1.2ns/3.9clocks 1.2ns/3.8clocks 1.2ns/3.9clocks
64kB 2.9ns/9.6clocks 2.9ns/9.6clocks 2.9ns/9.6clocks 2.9ns/9.6clocks
256kB 2.9ns/9.8clocks 2.9ns/9.8clocks 3.0ns/9.9clocks 3.0ns/9.9clocks
1MB 3.4ns/11.5clocks 3.4ns/11.5clocks 3.5ns/11.9clocks 3.6ns/11.9clocks
4MB 3.5ns/11.6clocks 3.5ns/11.6clocks 3.6ns/12.0clocks 3.6ns/12.0clocks
16MB 7.7ns/25.6clocks 7.7ns/25.8clocks 6.5ns/21.6clocks 6.6ns/22.1clocks
64MB 7.7ns/25.6clocks 7.7ns/25.8clocks 7.6ns/25.5clocks 7.6ns/25.4clocks

 ここからは実際のアプリケーションを用いたベンチマークテストである。テストはSYSmark 2007 Preview(グラフ7)、PCMark Vantage(グラフ8)、Intel HDxPRT 2009(グラフ9)、CineBench R10(グラフ10)、CineBench R11.5(グラフ11)、POV-Ray(グラフ12)、ProShow Gold(グラフ13)、TMPGEnc 4.0 XPressによる動画エンコード(グラフ14、15)を実施している。

 Intel HDxPRT 2009については、Lynnfield登場時の記事でも紹介しているが、Intel製のベンチマークテストである。今回はIntel製品のみの比較であることと、新しめのアプリケーションを実行するテストであることから実施している。

 CineBench R11.5については、ニュース記事にもあるとおり、MAXONが2月にリリースしたベンチマークソフトだ。Cinema 4Dエンジンを用いたもので、CineBench R10の後継といえるもの。このCPUテストを行なうと、初期状態ではOSが認識しているコア数と同数のスレッドが同時に走る。CineBench R10のようなシングルCPUレンダリングテストは特別に用意されていないが、設定画面から実行スレッド数を変更することができるので、ここでシングルスレッド実行を指定した場合のテストも行なっている。なお、過去の記事との比較用にCineBench R10もしばらくは並行して実行していくことにした。

 結果は、6コアの効果があるところ、ないところの区別がはっきり出ている印象だ。SYSmark2007は頭打ちに近い結果で、OverallはCore i7-980Xのほうが低いスコアとなった。Video Creationのようにマルチスレッド効果の大きいテストは良い結果を見せているが、それでもHT有効時にはかえって、誤差のレベルを超えて低いスコアとなった。

 PCMark VantageやIntel HDxPERT 2009では、HT有効/無効で差が小さい部分はあるものの、少なくとも6コアの効果は見られる結果となっている。ちなみにPCMark VantageのCommunicationsで、Core i7-980Xのスコアが飛び出しているのは、AES-NIによってAES処理テストで良好な結果となったからである。

 3Dレンダリングやレイトレーシングは、スレッド数が多いほど良い傾向を見せている。ちなみに、シングルスレッドと12スレッド実行時の差を見ると、CineBench R10が約5.5倍、CineBench R11.5が約7.4倍、POV-RAYが約7.6倍と、アプリケーションによって差があることが分かる。

 動画エンコード周りのテストもおおむねCore i7-980Xが良好な結果となっているが、Core i7-975ではHT有効で高速化されるのに対し、Core i7-980Xではスコアが下がるシーンが見られるのは気になるところだ。

【グラフ7】SYSmark 2007 Preview(Ver. 1.06)
【グラフ8】PCMark Vantage Build 1.0.1
【グラフ9】Intel HDxPRT 2009(総合スコア)/(詳細結果)
【グラフ10】CineBench R10
【グラフ11】CineBench R11.5
【グラフ12】POV-Ray v3.7 beta 35a
【グラフ13】Photodex ProShow Gold 4.0
【グラフ14】動画エンコード(SD動画)
【グラフ15】動画エンコード(HD動画)
【グラフ16】3DMark06 Build 1.2.0 / 3DMark Vantage Build 1.0.2 (CPU Test)
【グラフ17】3DMark Vantage Build 1.0.2 (Graphics Test)

 次に3Dアプリケーションのベンチマークテストである。テストは、3DMark 06/VantageのCPU Test(グラフ16)、3DMark VantageのGraphics Test(グラフ17)、3DMark06のSM2.0 TestとHDR/SM3.0 Test(グラフ18)、BIOHAZARD 5 ベンチマーク(グラフ19)、Crysis Warhead(グラフ20)、FarCry 2(グラフ21)だ。

 Core i7-980X、Core i7-975でほとんど差がない結果となっており、頭打ちの傾向が見られる。とはいえ、Crysis Warheadのように低解像度でCore i7-980XのHT無効時が良好な結果を出す傾向にある。タイトルによってはCPU側がボトルネックになるケースでは、このような傾向を見せる可能性もあることを示しているが、こと高解像度でのゲーム利用において、両者の差はそれほどないといって差し支えないだろう。

【グラフ18】3DMark06 Build 1.2.0(SM2.0 Test,HDR/SM3.0 Test)
【グラフ19】BIOHAZARD 5 ベンチマーク
【グラフ20】Crysis Warhead(Patch 1.1)
【グラフ21】Far Cry 2(Patch 1.03)

 最後に消費電力の測定結果である(グラフ22)。ここは、Core i7-980Xのほうが消費電力増す傾向が出ている。コア数が増えたためとみて間違いないだろう。アイドル時は両製品ともに1.6GHzまで動作クロックが下がるが、ここもコア数の差によってCore i7-980Xのほうが消費電力は大きめだ。

 HT有効時に消費電力が増す傾向も押さえておくべきだろう。よく言えばCPUリソースを無駄なく使っていることの証左ともいえるわけだが、その差は20〜30Wと使用時間によっては無視できない大きな差となっている。これはCore i7-980Xに限った話ではないが、消費電力が増したCore i7-980Xでは、より気遣いたいポイントだ。

【グラフ22】消費電力

●3.33GHzの動作クロックが意味を持った結果に

 以上のとおり結果を見てくると、おおむねCore i7-975と同等以上の結果になった。当然、マルチスレッドに最適化されたアプリケーションにおいては、6コアの効果が見られ、そうでないテストではCore i7-975と同等程度の結果となった。

 これは、Core i7-975と同じ3.33GHzの動作クロックを維持したことの意味の大きさを物語る結果といえる。これまで、コア数が増加する際には、既存の製品よりもクロックを下げてリリースされることが多かった。しかしCore i7-980Xはコア数を増やしつつ、動作クロックはCore i7-975と同じ。これによって、おおむねアプリケーションを問わず、同等もしくはそれ以上という結果が引き出されたことになる。

 価格は従来のExtreme Editionから引き継ぎ999ドルと高価だ。市場においてはCore i7-975との価格差が生まれる可能性はあるが、同じ価格帯で同等以上の性能が得られることは歓迎できるだろう。

 唯一惜しいのは消費電力で、プロセスシュリンクがあったにも関わらず、結果としてCore i7-975よりも増してしまったのは残念だ。ハイエンド向けなので省電力に対するニーズが小さい製品だが、購入を検討しているユーザーは留意しておきたいポイントだ。