■多和田新也のニューアイテム診断室■
インテルは9月8日、Core i7/i5シリーズの新製品を発表した。この第3四半期からの投入が予告されていたもので、LGA775に代わるメインストリーム向けの新しいプラットフォームが生まれることとなる。この新CPU、新プラットフォームの特徴をまとめるとともに、パフォーマンスのチェックを行なっていきたい。
●Nehalemアーキテクチャによる新CPUインテルがCoreマイクロアーキテクチャ、いわゆるNehalemアーキテクチャのCore i7を投入したのが2008年11月のことになる。この製品はBloomfieldのコードネームで開発されたコアで、メインストリームの価格帯にも投入されたものの、インテルの戦略としてはハイエンドユーザ向けのセグメントに位置付けられる製品だ。
今回登場する製品は、Lynnfieldのコードネームで開発が進められた、名実ともにメインストリーム向けの製品となる。つまり本製品には、新しいNehalemアーキテクチャのCPUが登場したというだけでなく、インテルのメインストリームCPUがCore 2シリーズからCore iシリーズへ移行するという意味もあるのだ。
投入されるのは3モデルで、Bloomfield各製品とともに主な仕様を表1にまとめた。同じマイクロアーキテクチャを使った製品ではあるが、両者の違いは非常に大きいので、表1を細かく追いつつ紹介していきたい。
Core i7-870 | Core i7-860 | Core i5-750 | |
ソケット種別 | LGA1156 | ||
対応チップセット | Intel P55 | ||
チップセットインタフェース | DMI(2GB/sec) | ||
対応メモリ | DDR3-1333 | ||
メモリチャネル | 2ch | ||
動作クロック | 2.93GHz | 2.80GHz | 2.66GHz |
最大クロック(Turbo Boost時) | 3.6GHz | 3.46GHz | 3.20GHz |
L1データキャッシュ | 32KB×4 | ||
L2キャッシュ | 256KB×4 | ||
L3キャッシュ | 8MB | ||
Hyper-Threading | 対応 | 非対応 | |
TDP(最大) | 95W |
Core i7-975 Extreme Edition | Core i7-965 Extreme Edition | Core i7-950 | Core i7-940 | Core i7-920 | |
ソケット種別 | LGA1366 | ||||
対応チップセット | Intel X58 | ||||
チップセットインタフェース | QPI(6.4GT/sec) | QPI(4.8GT/sec) | |||
対応メモリ | DDR3-1066 | ||||
メモリチャネル | 3ch | ||||
動作クロック | 3.33GHz | 3.20GHz | 3.06GHz | 2.93GHz | 2.66GHz |
最大クロック(Turbo Boost時) | 3.60GHz | 3.46GHz | 3.33GHz | 3.20GHz | 2.93GHz |
L1データキャッシュ | 32KB×4 | ||||
L2キャッシュ | 256KB×4 | ||||
L3キャッシュ | 8MB | ||||
Hyper-Threading | 対応 | ||||
TDP(最大) | 130W |
まず、CPUパッケージが従来のCore i7ともCore 2シリーズとも異なる。そして、ソケットの形状もLGA1156という新しいタイプのものが使用されることになった(写真1~5)。必然的に、マザーボードを含めて導入する必要がある。
このCPUパッケージ、ソケットの変更の理由は大きく2つあると考えていい。1つはチップセットとのインターフェイスにDMIが採用され、Core i7(Bloomfield)のQPIとも、Core 2のFSBとも異なるためだ。つまり、ソケットという物理的な問題だけでなく、論理的なインターフェイスプロトコル自体が異なるため、LGA1366、LGA1156、LGA775の3者間には一切の互換性がないということになる。
もう1つの大きな理由は、メモリインターフェイスだ。Nehalemアーキテクチャを採用する今回の製品は、メモリコントローラをCPUに内蔵している。Bloomfieldでは3chのメモリインターフェイスを備えていたが、Lynnfieldではこれが2chとなる。メモリインターフェイスを内蔵するためにLGA775よりもピン数が増えることにはなるが、チャネル数が少ないためにLGA1366ほどのピン数は必要なかったというわけだ。
写真4、5でも分かるとおり、ピン数は増えたものの、ピン同士の隙間がLGA1366並みに詰められていることで、CPUパッケージサイズ自体はLGA775と大きく変わらない。
【写真6】LGA1156のソケット側。固定金具は大きく変更されており、カバーとレバーが同一方向に開く |
ソケットの金具はLGA1366やLGA775とは異なり、レバーとカバーが同じ側に開閉するものになった。ソケット部周辺に金属がなく、かなり簡略化された印象を受ける。開閉方法については動画で紹介しているが、カバーのヒンジとは逆側にあるピン上の金具へカバーを固定する格好となる。
また、CPUクーラーを固定するリテンション部のサイズが変更されたことで、これも異なるものが必要となる(写真7~10)。サイズはかなり近いものの、互換性はない。ただ、すでにLGA1156対応のリテンションキットの販売を表明しているメーカーは多く、サードパーティ製クーラーも早い段階で選択肢が豊富になると見込まれる。
【動画】LGA1156で使われる固定金具の動作 |
先にも少し触れたメモリ周りの変更であるが、従来のCore i7(Bloomfield)が3chメモリインターフェイス、Lynnfieldコアを採用する今回の製品が2chメモリインターフェイスとなる。チャネル数では減らされたが、正式な対応メモリはDDR3-1066からDDR3-1333へと強化されており、帯域幅はDDR3-1066の3chで約25.6GB/sec、DDR3-1333の2chで約21.2GB/secとなる。さすがに3chメモリインターフェイスには及ばないが、高速なメモリモジュールをサポートすることで、その差は若干小さくなっている。
LynnfieldとBloomfieldにはメモリ周りのほかに、もう1つ大きな違いがある。Bloomfieldはメモリコントローラは内蔵するが、ビデオカード接続用のPCI Expressインターフェイスはチップセット側のノースブリッジ(IOHと呼ばれる)に委ねていた。Lynnfieldでは、このPCI ExpressもCPU側に内蔵される。
このことは、チップセットのスタイルをも変えることになる。Intel製チップセットはこれまで、メモリコントローラを内蔵するIntel 4シリーズ以前はMCH/GMCH、メモリコントローラを内蔵しないIntel X58は先述のとおりPCHと呼ばれ、I/O周りのインターフェイスを提供するICHと組み合わせて、2チップで提供されてきた。
Lynnfieldではメモリコントローラに加え、PCI ExpressもCPU側に内蔵された。ノースブリッジで提供されてきた機能のほとんどをCPU側に実装したことで、チップセットも主にI/O周りを提供する1チップへと集約され、根本的なスタイルが変化した(図1)。この対応チップセットや搭載マザーボードについては、CPUの紹介から話がそれるので、詳しくは後述することにしたい。
【図1】Lynnfield世代の製品におけるCPUとチップセットのスタイル。これまでチップセットが2チップだったが、CPU側にメモリコントローラとPCI Expressが内蔵されることで、チップセットが1チップになる |
動作クロックについては、今回のモデルではCore i7-940以下のラインのセグメントへ投入される格好となる。ただ、表1でも示しているとおり、Turbo Boost時の最大クロックは、従来のCore i7(Bloomfield)を上回ることになる。
Bloomfieldの製品では、1コアのみクロックが上昇する場合は2段階、2~4コア分のクロックが上昇する場合は1段階、それぞれ倍率が上昇する仕様となっている(もちろんExtreme Editionにはこのリミットはない)。これに対し、Lynnfieldは最大で5段階の倍率アップが行なわれる(図2、画面1~3)。
つまり、定格クロックこそBloomfield版Core i7の下位に位置付けられているものの、Turbo Boostの稼働状態によっては、より高いクロックで動作することがあるというである。Turbo Boostの動作を左右するTDPが、130Wから95Wに下がっているとはいえ、この機能の強化はLynnfieldの大きなメリットといえるだろう。
このほか、キャッシュの仕様はBloomfieldと変わらず、Hyper-Threadingの機能も有している。ただし、Core i5シリーズはHyper-Threadingが無効化されており、ブランドの違いにより明確に機能差が設けられている点に注意が必要といえる。
●Intel P55 Expressチップセットとマザーボードの詳細
さて、Lynnfield世代になったことでCPUとチップセットのスタイルが変わることが先述したとおりであるが、このチップセットへと話題を移したい。このLynnfieldに対応するチップセットはIntel P55 Expressとなる。Intel P55ではIbexpeakのコードネームで開発されたPCH(Platform Controller Hub)の1チップのみで構成され、そのブロックダイヤグラムは図3のようになる。
【図3】Lynnfield+Intel P55環境のブロックダイヤグラム |
Intel 4/5シリーズで使われたICH10シリーズに比べると、PCI Expressのレーン数が合計6レーン分から8レーン分へ、USB2.0インターフェイスが12基から14基へというように、細かな機能強化が図られている。
今回テストに使用するIntel P55搭載製品は、Intelの「DP55KG」である(写真11)。Intelでは現時点で4モデルのIntel P55搭載マザーボードを発売予定だが、本製品はその最上位モデルとなる。I/Oリアパネル部のCMOSクリアスイッチ、Bluetoothの搭載、追加SATAコントローラを備えるなど、ハイエンドユーザを意識した仕様の製品となる(写真12~15)
CPUの機能とも話が関連するが、マザーボード上にはPCI Express x16に対応したスロットが3基用意されている。うち2基はCPU側から、残りはチップセット側から接続されるものだ。Intel DP55KGでは物理的にPCI Express x16スロットとなっているのは1スロットのみだが、PCI Express x8形状、同x4形状のスロットにそれぞれPCI Express x16カードを挿すことができるようになっている(写真16)。
CPUのところでは詳しく説明しなかったが、Lynnfieldに内蔵されたPCI Expressはx16が1基分となるが、これはPCI Express x8×2のコンフィグレーションで動作させることもできる。いうまでもなく、これはマルチビデオカード環境に対応させるためだ。マザーボード上の青色のスロットがCPU側からのPCI Expressインターフェイスとなる。
LynnfieldとIntel P55の環境においては、AMDのCrossFireのほか、ライセンス供与を受けたマザーボードにおいてはNVIDIA SLIを利用できることがNVIDIAから発表されている。IntelのDesktop Boardシリーズにおいてもここで紹介しているIntel DP55KGのほか、「Intel DP55SB」、「Intel DP55WG」の計3製品がNVIDIA SLIをサポートする。
ちなみに、AMDのCrossFireはブリッジパーツがビデオカード側に付属するが、NVIDIAのSLIはマザーボード側に、このパーツが付属することになっている。Intel製品といえどもそれは例外ではなく、Intel DP55KGにもIntelロゴ入りの青いSLIブリッジが付属している(写真17)。
【写真16】PCI Express x8/x4スロットは、PCI Express x16の拡張カードを装着、固定できるようになっている | 【写真17】Intel Desktop BoardシリーズのNVIDIA SLIサポート製品には、SLI用のブリッジパーツが付属する |
さて、このIntel DP55KG上でCore i7-870とCore i5-750を動作させたときの状況を、BIOS設定画面で少し紹介することにしたい。BIOS設定画面のトップページではCPUの動作クロックやメモリ周りの動作状況をざっくりと確認できるが、この結果を見ると両製品とも定格どおり、Turbo Boostによる最大動作が表1で紹介した値のとおりであることを確認できる(画面4、5)。また、メモリクロックもデフォルトでDDR3-1333として動作している。
【画面4】Core i7-870を装着した場合のBIOS設定画面トップページ | 【画面5】Core i5-750を装着した場合のBIOS設定画面トップページ。もちろん、こちらにはHTの設定がない |
Intel DP55KGにはいくつかのオーバークロック設定も用意されている。倍率のリミットが設定されてはいるものの、Turbo Boost時の動作倍率なども確認することができるほか、メモリタイミングなどもわりと細かく指定できるようになっている(画面6~8)。
【画面6】Core i7-870のオーバークロック設定画面。Turbo Boost時のリミット倍率などを確認できる | 【画面7】こちらはCore i5-750のオーバークロック設定画面 | 【画面8】BIOS設定画面におけるメモリ周りのチューニング設定 |
先にLynnfieldのTurbo Boostは最大で5段階の倍率アップが可能になったことを紹介したが、Intel DP55KG上で設定されたデフォルト設定はその動作状態がおおいに参考になる。
Core i7-870においては定格22倍に対して、1コア動作時に最大27倍(3.6GHz)、2コア動作時に最大26倍(3.46GHz)、3~4コア動作時に最大24倍(3.2GHz)。つまり、4/3/2/1コア動作時において、2/2/4/5の倍率アップ設定が行なわれる。
Core i5-750においては1~2コア動作時に最大24倍(3.2GHz)、3~4コア動作時に最大21倍(2.8GHz)となっており、1/1/4/4の倍率アップ設定ということになる。ちなみにBloomfieldの場合、この表記を使うと1/1/1/2という倍率アップ設定になる。
最後にIntel DP55KGにはちょっとしたギミックが仕込まれている。写真14にも写っているが、ボードの端に骸骨(スカル)の模様が描かれているのだが、これはBIOS設定画面から設定を変更することで動作中に光らせることができる(画面9、写真18)。これがあることで実用面で何かが変わるわけではないが、ハイエンド製品らしい面白い機能といえる。
【画面9】「Skull Backlighting」が、基板上の骸骨に埋め込まれたLEDの有効/無効を切り替える設定となる | 【写真18】BIOS上でライトを有効にすると基板上の骸骨が青く浮かび上がる。HDDアクセスに合わせて目の部分を赤く光らせることもできる |
●3つの異なるアーキテクチャで製品比較
それではベンチマークの結果を紹介していくことにしたい。テスト環境は表2に示したとおりで、Lynnfieldを採用するCore i7-870とCore i5-750をテスト対象する。比較には、前世代という立場になったYorkfieldコアのCore 2 Extreme QX9650と、既存のCore i7であるBloomfieldコアの製品から今回の製品と同じくクロックで動作するCore i7-940とCore i7-920を用意した。
Core 2 Extreme QX9650は、既存のメインストリーム向け製品では最上位モデルとなるCore 2 Quad Q9650を意識してテストしたものだが、テストに使用した個体は初期のC0ステッピングのもの。Core 2 Quad Q9650ではE0ステッピングが採用されており、パフォーマンスの違いはないものの、消費電力では差があることは勘案する必要がある。
なお、各環境のマザーボードは、先述のIntel DP55KGのほか、Intel P45を搭載する「Intel DP45SG」、Intel X58を搭載する「Intel DX58SO」(写真20)をテストに使用している。
CPU | Core i7-870 Core i5-750 | Core 2 Extreme QX9650 | Core i7-940 Core i7-920 |
チップセット | Intel P55 | Intel P45+ICH10R | Intel X58+ICH10R |
マザーボード | Intel DP55KG | Intel DP45SG | Intel DX58SO |
メモリ | DDR3-1333(1GB×4/9-9-9-24) | DDR3-1066(1GB×3/8-8-8-20) | |
ビデオカード | NVIDIA GeForce GTX 280(GeForce Release 190.38) | ||
HDD | Seagete Barracuda 7200.12(ST3500418AS) | ||
OS | Windows Vista Ultimate Service Pack 2 |
【写真19】Intel P45+ICH10Rを搭載する、Intelの「DP45SG」 | 【写真20】Intel X58+ICH10Rを搭載する、Intelの「DX58SO」 |
では順に結果を紹介していく。まずはCPU性能のチェックだ。テストは、Sandra 2009 SP4のProcessor Arithmetic/Processor Multi-Media Benchmark(グラフ1)、PassMark Performance Test 7のCPU Test(グラフ2)、PCMark05のCPU Test(グラフ3~4)である。
PassMark Performance Testは本コラムでは初めて結果を取り上げるベンチマークソフトであるが、これはCPU、メモリ、グラフィック、HDDといったコンポーネント単位で性能を評価できるものだ。マルチスレッドに対応するうえ、64bit版も用意されているあたりが便利なベンチマークソフトであることから採用することにした。
さて、Core i7-870の結果から見ていくが、全体にCore i7-940に近い傾向を見せていることが分かる。細かく見ると、PCMark05のシングルスレッド/シングルタスクのテストでは、非常に高いスコアをマークしており、最大3.6GHzで動作するTurbo Boostの効果がよく分かる。また、マルチスレッドのテストにおいてもCore i7-940と同等か上回る結果が多い。これも、4コア動作時に3.06GHzまでのクロックアップに留まるCore i7-940に対し、Core i7-870では3.2GHzまでクロックアップされるケースがあることから、こうした結果が出ているものと見られる。
ただ、Turbo Boostは動作中の電力や発熱などを見て動的にクロックを変化させるため、とくにマルチスレッドが効くテストの一部(SandraのWhetstoneやPassMarkなど)で、Core i7-940より低いスコアになるケースも見られる。これは、TDPの余裕が大きいCore i7-940ではTurbo Boostが効いた一方、Core i7-870では定格で動作してしまった結果ではないかと推測される。動的クロック制御を持つCPUの場合、安定した性能が出ないことがあるのは致し方ないだろう。
一方のCore i5-750は、Core i7-920と同じクロック、同じアーキテクチャではあるが、Turbo Boostの倍率アップ幅が大きい一方、Hyper-Threadingは無効化されているという性格の製品になる。結果として、PCMark05のシングルスレッド/シングルタスクのテストのような場合には、Turbo Boostの上がり幅が大きいおかげでCore i7-920を上回るスコアをマークするが、全般的にはCore 2 Extreme QX9650と良い勝負になっているが、SSE 4.2を使うことができるDrystone以外では下回る結果が多い。
とくに、マルチスレッド化されたテストではHyper-Threadingが無効化されているのが大きく響いている印象を受ける。PassMarkのCompressionテストあたりが顕著で、Hyper-Threadingを持つCore i7各製品はCore 2 Extreme QX9650を上回る結果を見せるものの、これが無効化されたCore i5はスコアが伸び悩むといった格好になっている。
【グラフ1】Sandra 2009 SP4 (Processor Arithmetic/Multi-Media Benchmark) |
【グラフ2】PassMark Performance Test 7(CPU Test) |
【グラフ3】PCMark05 Build 1.2.0(CPU Test-シングルタスク) |
【グラフ4】PCMark05 Build 1.2.0(CPU Test-マルチタスク) |
次にメモリ周りの性能である。テストはSandra 2009のCache & Memory Benchmark(グラフ5)と、PCMark05のMemory Test(グラフ6)、メモリのレイテンシをチェックするSandraのMemory Latency Benchmark(表3)、PCMark05のMemory Latency Test(グラフ7)である。
キャッシュの性能はCPUクロックに同期するため、やはりTurbo Boostの影響を受けて一定しない傾向が見られる。PCMark05のテストではCore i7-870がCore i7-940のキャッシュ性能を上回るという結果を見せているが、Sandraは同等程度である。いずれも定格クロックであれば、この結果は妥当なものであり、おそらくTurbo Boostによるクロックアップが行なわれなかった状態同士ての結果と見ていいだろう。
一方、Core i5-750とCore i7-920を比較した場合はHyper-Threadingの有無という違いもあり、Sandraのキャッシュ速度も大きく異なるグラフを描く。ただ、PCMark05の結果ではCore i7-940に迫るほどのキャッシュ性能を見せている。Core i5-750とCore i7-940はTurbo Boostのピーククロックが同じであり、この結果もTurbo Boostによるクロックの上がり幅が大きくなったことの効果といえる。
また、キャッシュ容量ごとの速度という意味では、Core 2 Extreme QX9650に近い変化を見ているが、L2キャッシュの速度はさすがに良好であるものの、L1はやや遅い結果になっている。このあたりは、Core i7を取り上げた以前のテスト結果と同様だ。
実メモリのアクセス速度であるが、Sandraでは3chのDDR3-1066対応コントローラを持つBloomfieldコアの製品がやや高速、PCMark05では2chのDDR3-1333対応コントローラを持つLynnfieldコアのほうがやや高速という結果になった。いずれもそれほど大きな差ではなく、理論上のピーク性能はBloomfield製品のほうが有利ではあるが、データアクセスの内容によっては上下する程度の違いといえる。
メモリレイテンシはLynnfield製品が良好な結果を示しているが、これはメモリパラメータの影響もあるはずだ。今回のテストではElixerの同一メモリモジュールを用いているのだが、このモジュールはDDR3-1333動作時にCL=9、DDR3-1066動作時にCL=8で動作する。
DD3-1333のサイクルタイムは約7.5nsで、9クロックで約67.5nsとなる。DDR3-1066のサイクルタイムは約9.4nsで、8クロックは約75nsでDDR3-1333の9クロック分より遅いが、7クロックなら約65.8nsと逆転する。CL=7で動作するDDR3-1066モジュールも少なくなく、Bloomfield環境とLynnfield環境におけるメモリレンテンシの差は違った傾向になることも考えられる。この点は踏まえておくべきだろう。
【お詫びと訂正】初出時、サイクルタイムの数値を誤って記載しておりました。お詫びして訂正いたします。
ちなみに、チップセットにメモリコントローラを持つCore 2環境と比べても性能の伸びは著しい。この点は、新しい世代になることでメモリ性能は大きく向上したといえる。
【グラフ5】Sandra 2009 SP4(Cache & Memory Benchmark) |
【グラフ6】PCMark05 Build 1.2.0(Memory Test) |
【グラフ7】PCMark05 Build 1.2.0(Memory Latancy Test) |
Random Access | Core i7-870 | Core i5-750 | Core 2 Extreme QX9650 | Core i7-940 | Core i7-920 |
1kB | 1.2ns/3.6clocks | 1.4ns/3.6clocks | 1.0ns/3.0clocks | 1.4ns/3.8clocks | 1.5ns/4.1clocks |
4kB | 1.2ns/3.6clocks | 1.4ns/3.6clocks | 1.0ns/3.0clocks | 1.4ns/3.7clocks | 1.5ns/4.1clocks |
16kB | 1.2ns/3.6clocks | 1.4ns/3.7clocks | 1.0ns/3.1clocks | 1.4ns/3.8clocks | 1.5ns/4.1clocks |
64kB | 3.1ns/9.0clocks | 3.4ns/9.1clocks | 5.0ns/15.1clocks | 3.5ns/9.4clocks | 3.8ns/10.2clocks |
256kB | 3.2ns/9.4clocks | 3.5ns/9.3clocks | 5.6ns/16.7clocks | 3.9ns/10.3clocks | 4.0ns/10.6clocks |
1MB | 15.8ns/46.2clocks | 17.6ns/47.0clocks | 5.8ns/17.3clocks | 18.1ns/48.2clocks | 18.6ns/49.6clocks |
4MB | 17.9ns/52.5clocks | 20.0ns/53.2clocks | 8.0ns/24.1clocks | 20.5ns/54.7clocks | 21.1ns/56.2clocks |
16MB | 75.2ns/220.6clocks | 79.2ns/211.2clocks | 67.3ns/201.8clocks | 83.8ns/223.4clocks | 84.3ns/224.9clocks |
64MB | 79.5ns/233.3clocks | 84.0ns/223.9clocks | 82.1ns/246.1clocks | 88.6ns/236.3clocks | 89.3ns/238.1clocks |
Linear Access | Core i7-870 | Core i5-750 | Core 2 Extreme QX9650 | Core i7-940 | Core i7-920 |
1kB | 1.2ns/3.6clocks | 1.4ns/3.7clocks | 1.0ns/3.1clocks | 1.4ns/3.8clocks | 1.5ns/4.1clocks |
4kB | 1.2ns/3.6clocks | 1.4ns/3.6clocks | 1.0ns/3.0clocks | 1.4ns/3.7clocks | 1.5ns/4.1clocks |
16kB | 1.2ns/3.6clocks | 1.4ns/3.7clocks | 1.0ns/3.0clocks | 1.4ns/3.8clocks | 1.5ns/4.1clocks |
64kB | 3.2ns/9.5clocks | 3.6ns/9.6clocks | 4.3ns/12.9clocks | 3.7ns/9.9clocks | 4.0ns/10.7clocks |
256kB | 3.3ns/9.5clocks | 3.6ns/9.6clocks | 4.3ns/12.9clocks | 3.8ns/10.1clocks | 4.1ns/10.8clocks |
1MB | 3.8ns/11.2clocks | 4.3ns/11.4clocks | 4.3ns/12.9clocks | 4.4ns/11.8clocks | 4.7ns/12.5clocks |
4MB | 3.9ns/11.4clocks | 4.3ns/11.5clocks | 4.4ns/13.1clocks | 4.5ns/11.9clocks | 4.8ns/12.7clocks |
16MB | 9.1ns/26.8clocks | 9.5ns/25.2clocks | 10.4ns/31.2clocks | 10.2ns/27.3clocks | 9.8ns/26.2clocks |
64MB | 9.1ns/26.8clocks | 9.5ns/25.2clocks | 10.4ns/31.3clocks | 10.2ns/27.3clocks | 9.8ns/26.2clocks |
さて、次に実際にアプリケーションを用いたベンチマークテストである。テストはSYSmark 2007 Preview(グラフ8)、PCMark Vantage(グラフ9)、Intel HDxPRT 2009(グラフ10)、CineBench R10(グラフ11)、POV-Ray(グラフ12)、ProShow Gold(グラフ13)、TMPGEnc 4.0 XPressによる動画エンコード(グラフ14、15)だ。Intel X58使用環境でPCMark Vantageでフリーズする現象に見舞われたため、動作しなかったテストを省いている。なお、本コラムで初めて行うテストをいくつか実施しているので、それらを簡単に説明しておきたい。
Intel HDxPRT 2009はSYSmark 2007のように実際のアプリケーションをスクリプトに従って動作させ、その処理時間を計測するもの。そこから独自のスコアを算出するほか、各テストパターンにおける処理時間も表示させることができる。以前にも書いたことだが、CPUメーカー製のベンチマークはマーケティング目的の要素が強く客観性に欠けるという面は否めない。ただ、本稿ではIntel製CPUのみをテスト対象としたことから、各CPU間の性能指標の1つとして参考にし得ると判断して取り上げている。
POV-Rayは説明不要なほど著名なレイトレーシングソフトウェアだ。シングルスレッド処理とマルチスレッド処理を選択してレンダリング処理を行なわせ、その処理性能がPixel/sec(pps)という単位で表示される。その結果を取り上げている。
ProShow Goldは、Photodexが発売するスライドショー作成ソフトウェアである。日本語版がないアプリケーションではあるのだが、マルチスレッドにしっかり対応しているうえ、処理終了後にスライドショー動画の作成に要した時間を表示してくれる。マルチスレッド処理の性能指標に役立つソフトウェアとして取り上げることにした。本稿では、Nikon D300で撮影したJPEGファイル25枚を登録し、各写真間にさまざまなトランジションをこらした2分30秒のシーケンスを作成。これを1,920×1,080ドットのMPEG-2ファイルへ書き出した際に要した時間を示している。
ということで結果を見てみると、Core i7-870が非常に優れた結果を見せていることが分かる。これは定格の動作クロックがCore i7-940と同じなうえにTurbo Boostによるクロック上昇が大きいことの影響と見て良いだろう。
逆にスコアが伸び悩んだところは、Hyper-Threadingが有効になっていることが影響している可能性を見て取ることができる。Core i7-870のスコアが伸び悩んだテストは、SYSmark2007のVideo Creation、POV-RayのAll CPUsレンダリング、WMV9エンコードあたりが挙げられるが、これらはいずれもCore i5-750どころかCore 2 Extreme QX9650にも劣る結果となった。併せて、Core i7-940/920のスコアも伸び悩んでおり、Hyper-Threadingによる効果がない、もしくは悪影響が出てしまった結果となっている。
そのCore i5-750のほうは、Core i7-920との上下関係が激しく出ている。CineBenchやPOV-Ray、PhotoShow Gold、動画エンコードなど、マルチスレッド化された単一アプリケーションではCore i7-920を下回る結果となっており、Turbo Boostによる倍率の上がり幅が大きいとはいえ、Hyper-Threadingを持たないことの不利が出ている。ただ、先ほど触れたとおり、Hyper-Threadingを持たないことが有利になったと見られる結果があるほか、SYSmarkやPCMarkのような複合的なテストでCore i7-920を上回ることは、普段使いのPCとして良好なパフォーマンスを得られそうな傾向といえる。
このCore i5-750とCore 2 Extreme QX9650との比較では、一長一短といった感じで特定の傾向は見られない。ただ、詳しくは最後にまとめるが、両者の価格差も考慮する必要があり、Core i5-750を上回る結果が少なくないという結果は、コストパフォーマンスの観点では悪くない結果とはいえる。
続いては、3Dベンチマークの結果である。テストは、3DMark 06/VantageのCPU Test(グラフ16)、3DMark VantageのGraphics Test(グラフ17)、3DMark06のSM2.0 TestとHDR/SM3.0 Test(グラフ18)、BIOHAZARD 5 ベンチマーク(グラフ19)、ストリートファイターIV ベンチマーク(グラフ20)、Tom Clancy's H.A.W.X(グラフ21)、Unreal Tournament 3(グラフ22)だ。
ここはアプリケーションによる差が非常に顕著なものとなった。全体的にはH.A.W.X.のような例はあるものの、Core 2よりもCore i7環境のほうが良好な結果は出ている。BloomfieldとLynnfieldの差はアプリケーションによる傾向がある。ここで取り上げているアプリケーションではLynnfieldのほうが良い結果を見せるものが多いが、それほどサンプルが多いわけでもないので絶対的にLynnfieldのほうが好結果を出すゲームタイトルが多いとは言い切れない。
ただ、どっちが良い結果を出しているにせよ、Core i7-870とCore i7-940、Core i5-750とCore i7-920の差は数%程度であり、定格クロック製品同士の比較では似たような性能を期待できるだろう。逆にいえば、Lynnfieldはより高いクロックを出せるTurbo Boostを持ちながら、このぐらいの結果に留まるという見方もでき、率直な印象としては、もう少しLynnfieldが好結果を出して欲しかったと言える。
次に消費電力の測定結果を紹介しておきたい(グラフ23)。先述のとおり、今回のCore 2 Extreme QX9650はCore 2 Quad Q9650を想定した採用であるが、コアのステッピングが古いので、この結果は参考程度に見てほしい。また、BloomfieldとLynnfield間でもマザーボードの違いはあるが、プラットフォームの変化という意味も持つ今回の製品の場合、このシステム全体のシステムを比較することに大きな意義があると考えている。
その結果であるが、アイドル時の消費電力はBloomfield/Lynnfieldとも似たような結果だ。ただ、負荷がかかった場合はLynnfieldのほうがかなり低い消費電力に留まることが分かる。
理由は2つ考えられる。1つはTDPでLynnfieldの両製品は95W、Bloomfieldは130Wとなる。Turbo Boostを有効にした状態では、余裕がある分はクロックを上げて積極的に埋めている動きをすることもあって、この差がはっきりと出たということは考えられる。もう1つの理由はチップセットが2チップから1チップ化されたことだ。Lynnfieldの場合はPCI Expressとメモリコントローラを動作させた状態で95WのTDPに収まる。IbexpeakのTDPは不明だが、さすがにIntel X58+ICH10Rの2つを足した消費電力よりは低いと思われる。この2つの理由は、影響の程度の差はあるだろうが、複合的に作用して、今回の結果につながったと推測される。
【グラフ23】消費電力 |
●導入ユーザが増えそうな64bit環境での性能差
さて、最後にもう1つ、64bit環境でのベンチマーク測定結果をいくつか紹介しておきたい。64bit OSを取り巻く環境が整備されてきているうえ、Windows 7への移行という時期でもあり、64bit OSを導入しようと考えているユーザは少なくないと思うからだ。
テスト環境は先の表2に準じ、OSのみWindows Vista Ultimate SP2の64bit版に変更している。テストはこれまでに紹介してきたもののなから、64bit対応アプリケーションを中心にピックアップしたが、32bitアプリも一部に含めている。
ここでは32bitと64bitの性能差が主題ではないため、64bit環境での計測結果のみでグラフを構成しているが、テスト条件などは変えていないので、先述の結果と比較は可能だ。
Sandra 2009 SP4のProcessor Arithmetic/Processor Multi-Media Benchmark(グラフ24)、PassMark Performance Test 7のCPU Test(グラフ25)は、いずれも64bitに対応する。
ただ、PassMarkの結果はLynnfieldで揃ってスコアが伸び悩むという結果になった。32bitと同等どころか急激にスコアを下げた箇所も目立つ、あまりに不自然な結果であり、ここでは参考程度に留めることにしたい。
Sandraは妥当と見られる結果になっているが、各CPU間の性能差は32bit環境のテストと傾向があまり変わらない。ただ、Hyper-Threadingを持たないCore i5-750がMulti-Mediaテストでスコアを大きく伸ばすなど、HT有効の各製品より伸び幅が大きい結果が見られるのが興味深いところだ。
【グラフ24】Sandra 2009 SP4 (Processor Arithmetic/Multi-Media Benchmark) |
【グラフ25】PassMark Performance Test 7(CPU Test) |
次にSYSmark 2007 Preview(グラフ26)、CineBench R10(グラフ27)、POV-Ray(グラフ28)、TMPGEnc 4.0 XPressによる動画エンコード(グラフ29)の結果である。
SYSmarkとTMPGEnc 4.0 XPressは32bitアプリケーションとなるが、この結果の傾向は32bitアプリケーションのテストの際と、大きく変わらない。結果の絶対値も同等か、やや遅い結果となる。これは致し方ないだろう。
CineBench R10とPOV-Rayは64bitバイナリを用いてテストを行なっている。この2つは32bit環境でのテストと異なる傾向が出ている。
まずCineBench R10であるが、Core i5-750のスコアの伸びが非常に大きく、32bit環境のテストでは劣っていた比較対象を上回る結果を見せる。シングルCPUレンダリングではCore i7-940を上回る結果となり、マルチCPUレンダリングではCore 2 Extreme QX9650との序列を入れ換えることに成功している。一方で、マルチCPUレンダリングにおいては、Core i7の各製品も非常に高いスコアをマークしており、明確にCore 2以上に伸びが見られる。
POV-Rayは、One CPUレンダリングのスコアは32bit環境と似たようなものだが、All CPUsレンダリングで大きな変化を見せた。32bit環境においては、ここでHyper-Threadingの効果が薄い結果となっていたが、64bit版ではガラリと傾向を変え、、Hyper-Threadingを有効にしたCore i7各CPUが良好な結果をマークした。32bit環境では何らかのボトルネックが発生していることが推測できる結果で、64bit化の効果が非常に分かりやすく見られるサンプルとなっている。
【グラフ26】SYSmark 2007 Preview(Ver. 1.06) |
【グラフ27】CineBench R10 |
【グラフ28】POV-Ray v3.7 beta 34 |
【グラフ29】動画エンコード(SD動画) |
残るは3Dベンチマークである。3DMark Vantage(グラフ30、31)、BIOHAZARD 5ベンチマーク(グラフ32)、Tom Clancy's H.A.W.X(グラフ33)をテストしている。
いずれも32bit環境での結果と傾向に大きな違いはなく、絶対的なスコアも誤差の範囲といえる。これらはいずれも32bitアプリケーションであり、こうした結果も当然といえるが、逆に同等程度のスコアに留まっていると捉えれば、64bit環境でゲームを行ないたいというニーズを持っている人にとって、悪くない結果といえるだろう。
【グラフ30】3DMark Vantage Build 1.0.1(CPU Test) |
【グラフ31】3DMark Vantage Build 1.0.1(Graphics Test) |
【グラフ32】BIOHAZARD 5 ベンチマーク |
【グラフ33】Tom Clancy's H.A.W.X |
●メインストリームらしい価格設定もポイント
最後に今回投入される製品の価格であるが、インテルが提示する参考価格は下記のとおり。現行製品と比較して、Core i7-870がCore i7-950程度、Core i7-860がCore i7-920程度、Core i5-750がCore 2 Quad Q9400程度といったところである。
Core i7-870:54,560円
Core i7-860:27,570円
Core i5-750:19,030円
Core i7-870は最上位モデルとしてのプレミアを感じる設定だが、下位の2製品はかなりアグレッシブな価格設定ではないだろうか。Core i7-870とCore i7-920の性能差から考えてもCore i7-860はより高い性能を期待できるし、Core i5-750とCore 2 Extreme QX9650の性能差から見ると、こちらも価格性能比は高そうだ。
プラットフォームの新規導入が必須なのでイニシャルコストは大きくなってしまうが、メインストリームプラットフォームということで今後も、このプラットフォームには多くの製品がラインナップされていくことになる。将来性あるプラットフォームへの投資と考えることはできるだろう。
性能面ではTurbo Boostの効果が非常に大きい。文中でも触れたが、Turbo Boostがあるおかげで、定格クロックが同じBloomfield版のCore i7を上回るシーンが目立つ。メモリチャネル数の違いを補って余りある性能を得られる印象を受ける、というのが率直な感想だ。Bloomfieldの登場から約10カ月とずいぶんジラされた気はするのだが、価格/性能の両面で新プラットフォーム導入の価値を示した製品といえるだろう。
ただ、製品ラインナップの少なさだけはいかんともしがたい。マザーボードごと購入が必要であるということは、CPUのバリエーションが増えることが間口を広げることにつながるわけで、とくに価格面でバリエーションが広がることに期待したい。