■多和田新也のニューアイテム診断室■
以前からロードマップが示されていたとおり、Intelは2010年第1四半期に、CPUとGPUをワンパッケージにしたメインストリーム向けCPU「Clarkdale (クラークデール、開発コード名)」を発表する予定になっている。このCPUは当初、Core i5/i3、そしてPentium Gという製品名で展開されることになる。このうち、GPU部の動作クロックが高いことが特徴となる「Core i5-661」を試用する機会を得たので、そのベンチマーク結果を紹介したい。
●グラフィックス統合型環境のアーキテクチャ変更Intelが発表予定のCalrkdaleことCore i5/i3のプラットフォームは、従来でいうところの、メインストリームCPU+グラフィックス統合型チップセットを置き換える存在となる。ただし、冒頭でも触れたとおり、GPUコアはCPUパッケージの側に統合される。そのため、従来とは少しスタイルが異なる。
図1はIntelが説明に用いているスライドを引用したものだが、左側が従来型のCPU+グラフィックス統合型チップセットの構成、右側がCore i5/i3(Clarkdale)+チップセットの構成、の各ブロックダイヤグラムとなる。
【図1】従来のグラフィックス統合型環境(左)と、Clarkdaleを用いたグラフィックス統合型環境(右)の違い |
Core i7以降、メモリコントローラや外付けビデオカード用のPCI ExpressインターフェイスがCPU側に内蔵された点はClarkdaleでも踏襲される。そして、ClarkdaleではCPU側にグラフィックス機能が内蔵された。ただしCPU自体にディスプレイへ出力する機能はなく、Flexible Display Interface(FDI)と呼ばれるインターフェイスを通してチップセット側から出力されることになる。そのため、Clarkdale内蔵GPUを使うためには、このディスプレイ出力機能を持った新しいチップセットを用いる必要があるわけだ。
もう少しアーキテクチャ面を細かく見てみよう。まずClarkdale側は2つのダイを1つのパッケージに統合した格好になっている(写真1)。片側のダイがデュアルコアCPU、もう一方のダイがメモリコントローラ、PCI Expressインターフェイス、そしてグラフィックスコアで形成している(図2)。この2つのダイの間はQPIで接続されるというが、帯域幅は公表されていない。
今回検証に試用する「Core i5-661」を写真1、2に示すが、裏面を見るとコンデンサなどの配置がLynnfield版Core i5とは異なっており、異なる2つのダイが載っていることを感じさせるレイアウトになっている。
これまでのBloomfieldやLynnfieldでは、CPUコアとメモリコントローラ、PCI Expressが1つのダイで形成されていたが、Clarkdaleではこれらが切り離されて、QPIというインターフェイスでつながれることになった。パッケージこそ1つで、インターフェイスがQPIに置き換わったものの、Clardkaleは、従来のCPU+ノースブリッジの構成に戻ったと捉えることもできる。
【写真1】Clarkdale(上)とチップセット(下)。GPUはCPU側に実装されており、ディスプレイへはFDIを通じてチップセット側から出力される | 【写真2】Clarkdaleを用いたIntel i5-661。GPUクロックが高い6x1シリーズの製品 | 【写真3】左がClarkdale(Core i5-661)、右がLynnfield(Core i5-750)の裏面 |
【図2】Clarkdaleのダイ写真と機能。メモリコントローラとPCI ExpressはGPU側に統合。2つのダイはQPIで結ばれる |
【画面1】Core i5-661におけるCPU-Zの結果。L3キャッシュは4MB。後述のIntel H55搭載製品上で定格クロック動作させたときの電圧は1.144Vとなった |
CPUダイは、32nmプロセスで製造。「Westmere」の開発コード名で呼ばれたデュアルコアCPUを用いている。トランジスタ数は3億8,300万個、ダイサイズは81平方mm、L3キャッシュは4MBとなる(画面1)。Core i5/i3はいずれもHyper-Threadingが有効化されており、4スレッド実行が可能である。Lynnfieldを用いたCore i5はクアッドコアでHyper-Threadingが無効化された仕様になっているので、(もちろんコアのリソースは異なるが)Core i5であれば全製品で4スレッド同時実行が可能、という見方はできる。ちなみに、この下のPentiumブランドで展開されるSKUはHyper-Threadingが無効化されることになっている。
従来のCore i7/i5に実装されているTurboBoost TechnologyはCore i5にのみ搭載。最大5段階というアップ幅はLynnfieldと同じものである。ただし、グラフィックス機能が1つのパッケージに収められている分、CPUだけの熱設計の枠内でブーストできるLynnfieldに比べると、条件は厳しくなると見ていいだろう。
全Core i5/i3のラインナップは表1に示したとおりである。Core i5は600番台、Core i3は500番台のプロセッサー・ナンバーが割り振られている。さらにCore i5は6xx番台と6x1番台の2つの製品ラインがある。末尾が「1」のモデルが、GPUクロックが引き上げられる代わりに、TDPも増している。さらに、6xx番台がサポートしているIntel VT-d、Intel TXT、Intel vProサポートを外しており、コンシューマ向けモデルという色合いが濃い印象を受ける。
ちなみに、Westmereは、いわゆるNehalemアーキテクチャのシュリンク版という位置付けにはなるが、AES-NI(Advanced Encryption Standard - New Instructions)という、AESの暗号化を高速に処理する新命令が実装されている。対応アプリケーションであれば、従来のNehalemアーキテクチャ採用製品に対するメリットとなる。これの性能差は後ほど紹介したい。
Core i5-670 | Core i5-661 | Core i5-660 | Core i5-650 | |
ソケット種別 | LGA1156 | |||
対応チップセット | Intel 5シリーズ | |||
チップセットインタフェース | DMI(2GB/sec) | |||
対応メモリ | DDR3-1333 | |||
動作クロック | 3.46GHz | 3.33GHz | 3.33GHz | 3.20GHz |
最大クロック(Turbo Boost時) | 3.73GHz | 3.60GHz | 3.60GHz | 3.46GHz |
L1データキャッシュ | 32KB×2 | |||
L2キャッシュ | 256KB×2 | |||
L3キャッシュ | 4MB | |||
TDP(最大) | 73W | 87W | 73W | |
Hyper-Threading | ○ | ○ | ○ | ○ |
GPUクロック | 733MHz | 900MHz | 733MHz |
Core i3-540 | Core i3-530 | |
ソケット種別 | LGA1156 | |
対応チップセット | Intel 5シリーズ | |
チップセットインタフェース | DMI(2GB/sec) | |
対応メモリ | DDR3-1333 | |
動作クロック | 3.06GHz | 2.93GHz |
最大クロック(Turbo Boost時) | NA | NA |
L1データキャッシュ | 32KB×2 | |
L2キャッシュ | 256KB×2 | |
L3キャッシュ | 4MB | |
TDP(最大) | 73W | |
Hyper-Threading | ○ | ○ |
GPUクロック | 733MHz |
Core i7-870 | Core i7-860 | Core i5-750 | |
ソケット種別 | LGA1156 | ||
対応チップセット | Intel 5シリーズ | ||
チップセットインタフェース | DMI(2GB/sec) | ||
対応メモリ | DDR3-1333 | ||
動作クロック | 2.93GHz | 2.80GHz | 2.66GHz |
最大クロック(Turbo Boost時) | 3.6GHz | 3.46GHz | 3.20GHz |
L1データキャッシュ | 32KB×4 | ||
L2キャッシュ | 256KB×4 | ||
L3キャッシュ | 8MB | ||
Hyper-Threading | ○ | ○ | × |
TDP(最大) | 95W |
一方のGPU/メモリコントローラ/PCI Expressインターフェイス側のダイは、45nmプロセスで製造。トランジスタ数は1億7,700万個、ダイサイズは114平方mmとなる。
統合されたグラフィックス機能は「Intel HD Graphics」と呼ばれる。これまでは「Intel Graphics Media Accelerator(Intel GMA)」と呼ばれてきたが、GPUコアに新しいブランドが採用されたことになる。ただし、特にナンバーは振られておらず、単にIntel HD Graphicsと呼ばれる。
3D処理の面では、実行ユニットの増量や、バーテックスシェーダのハードウェア処理化、階層型Z処理が可能になった。対応APIはDirectX 10とOpenGL 2.1。なお、DirectX 10は前世代から対応している(表2)。
このほか、動画再生支援が強化されており、デュアルストリームのハードウェアデコードをサポートしたほか、ポストプロセス・スケーリングのアクセラレーション範囲が広がった。デュアルHDMIをサポートし、これはオーディオやHDCPも2つのストリームを出力できる。
とはいえ、基本的には従来のIntel GMAのアーキテクチャの機能強化版である。Intel GMAはIntel G965からユニファイドシェーダアーキテクチャを採用しており、その第3世代に位置付けられる。
Clarkdale (Intel HD Graphics) | Intel G45 (Intel GMA X4500HD) | |
Execution Unit数 | 12基 | 10基 |
ハードウェアバーテックス処理 | Enhanced with clip/cull/setup | Enhanced |
階層型Zバッファ/Zクリア | ○ | × |
コアクロック | ~900MHz | ~800MHz |
最大ビデオメモリ | 1.7GB | 768MB |
Direct Xサポート | DX10 | |
OpenGLサポート | OpenGL2.1 | OpenGL2.0 |
ShaderModelサポート | SM4.0 | |
デュアルHDMI | ○ | × |
続いて、Clarkdaleに対応したチップセットに話を向けたい。先述のとおり、Clarkdaleに内蔵されたGPUを使用するためには、FDIを通してディスプレイ出力が可能なチップセットが必要となる。そのチップセットが、Intel H57/H55/Q57 Expressである。Intel Q57はvPro対応のビジネス向けソリューションという位置付けで、これは従来の命名ルールと同じである。
そのIntel Q57のブロックダイヤグラムを図3、Intelの資料をもとに作成した各チップセットの仕様比較を表3に示す。図3の紫色で示されたオプション機能のうち、Intel TXTとIntel AMTに対応しないものがIntel H57、さらにIntel Rapid Storage Technologyに対応しないものがIntel H55となる。
【図3】Intel Q57のブロックダイヤグラム。Intel H57はここからIntel TXT/AMTサポートを省いたもの。Intel H55はさらにRapid Storage Technologyサポートが外れる |
Intel H57 | Intel H55 | Intel Q57 | Intel P55 | |
対応ソケット | LGA1156 | |||
HD Graphicsサポート | ○ | ○ | ○ | × |
USB2.0ポート | 14基 | 12基 | 14基 | 14基 |
SATAポート数 | 6基 | |||
PCI Express 2.0 x16 コンフィグレーション | x16×1 | x16×1 x8×2 | ||
PCI Express 2.0 | 8基 | 6基 | 8基 | |
PCI | 4基 | |||
Remote PC Assist Technology | ○ | ○ | × | × |
Rapid Storage Technology | ○ | × | ○ | ○ |
Anti-Theft Technology | × | × | ○ | × |
Identity Protect Technology | ○ | ○ | × | × |
Quick System Technology | ○ | ○ | ○ | × |
Active Management Technology with Remote PC Assist Technology for Business | × | × | ○ | × |
Intel ME Ignition FW | × | × | × | ○ |
Intel ME FW 6.0 | ○(8MB) | ○(8MB) | ○(8MB) | × |
コンシューマユーザーにとってはIntel H57とIntel H55の2つが主な選択肢となる。両者の違いは、USBポート数や拡張スロット用のPCI Expressレーン数、そしてRapid Storage Technologyの有無である。
Intel H55でRapid Storage Technologyが省略され、RAIDを使えない。1チップのIntel 5シリーズは、いずれもIbexpeakの開発コード名を持つチップが使われるが、これを用いた製品でRAID非対応となるのは、現時点でIntel H55のみとなる。
今回検証に用いるのは、このIntel H55を搭載した「Intel DH55TC」である(写真4)。統合型チップセットということもあって、microATXフォームファクターのマザーボードとなっている。上位SKUのIntel H57ではATXモデルも登場するだろうが、下位SKUとなるIntel H55のほとんどはmicroATX以下のサイズになると思われる。
I/Oリアパネル部には最近のIntel Desktop Boardシリーズでは削減傾向にあるPS/2を1基備える。ディスプレイ出力はD-Sub15ピン、DVI-D、HDMIの3種類を備える、ほかの統合型チップセットでも当たり前になった組み合わせだ。Intel H57/H55を搭載する製品もこの構成が主流になりそうである。
【写真4】Intel H55を搭載する「Intel DH55TC」 | 【写真5】I/Oリアパネル部。ディスプレイ出力はD-Sub15ピン、DVI-D、HDMIを備える |
●クアッドコアを主な対抗製品にベンチマークテストを実施
それではベンチマーク結果の紹介へ移りたい。テスト環境は表4、5に示したとおり。比較対象には、Core i5-750、Core 2 Duo E8600/Quad Q9550、Phenom II X4 965 Black Edition(以下、BEと表記)を取り上げた。
これらのCPUと組み合わせるプラットフォームだが、Core i5両製品は先述のIntel H55のほか、Intel P55搭載マザーでもテスト。もちろん内蔵GPU環境はIntel H55との組み合わせのみとなる。Hyper-ThreadingおよびTurbo Boostはいずれも有効化している。
【写真6】AMD785+SB710を搭載する、ASUSTeK「M4A785TD-V EVO」 |
Core 2両製品についてはIntel G45搭載製品を用いているが、Intel G45マザーボードにはDDR2が多いことを鑑みて、この環境のみDDR2-800を使用している。Phenom II X4 965と組み合わせたのはDDR3対応のAMD785Gマザーボードで、ASUSTeKから「M4A785TD-V EVO」を借用している(写真6)。
テストは外付けビデオカードとしてRadeon HD 5870を用いた環境と、それぞれの内蔵グラフィックスを用いた環境でテスト。グラフ中では、外付けビデオカードを使用した環境を「dGPU」、内蔵グラフィックスを使用した環境を「iGPU」と表記している。
なお、テストを始めた時期の問題で、Radeon HD 5870のドライバはCATALYST 9.11で統一している(現在は9.12が最新)。Intel H55とIntel G45の内蔵グラフィックスのドライバは異なるものを用いており、前者はClarkdaleに対応した最新のベータドライバで、Intel G45はテスト時点の最新正式ドライバとなる。
ちなみに、このClarkdaleに対応した最新ベータドライバであるが、ドライバが提供する設定画面が、従来のドライバとは異なっている(画面2~5)。これは、機能の増加よりはUIの変更という面が大きいが、GPUコアのブランド変更とともに、この画面もリニューアルされたということである。
CPU | Core i5-661 Core i5-750 | Core 2 Duo E8600 Core 2 Quad Q9550 | Phenom II X4 965 Black Edition(Rev.C3) | |
チップセット | Intel H55 | Intel P55 | Intel G45 | AMD 785G+SB710 |
マザーボード | Intel DH55TC | ASUSTeK P7P55D-E EVO | ASUSTeK P5Q-EM | ASUSTeK M4A785TD-V EVO |
メモリ | DDR3-1333(2GB×2,9-9-9-24) | DDR2-800(5-5-5-18) | DDR3-1333(2GB×2,9-9-9-24) | |
グラフィックス機能 (ドライバ) | Radeon HD 5870 (CATALYST 9.11) | |||
ストレージ | Seagete Barracuda 7200.12(ST3500418AS) | |||
電源 | KEIAN KT-1200GTS | |||
OS | Windows 7 Ultimate x64 |
CPU | Core i5-661 | Core 2 Duo E8600 Core 2 Quad Q9550 | Phenom II X4 965 Black Edition(Rev.C3) |
チップセット | Intel H55 | Intel G45 | AMD 785G+SB710 |
マザーボード | Intel DH55TC | ASUSTeK P5Q-EM | ASUSTeK M4A785TD-V EVO |
メモリ | DDR3-1333(2GB×2,9-9-9-24) | DDR2-800(5-5-5-18) | DDR3-1333(2GB×2,9-9-9-24) |
グラフィックス機能 (ドライバ) | Intel HD Graphics (Version. 8.15.10.2008) | Intel GMA X4500HD (Version. 8.15.10.1994) | Radeon HD 4200 (CATALYST 9.11) |
ストレージ | Seagete Barracuda 7200.12(ST3500418AS) | ||
電源 | KEIAN KT-1200GTS | ||
OS | Windows 7 Ultimate x64 |
では、順に結果を紹介していく。まずは、CPU性能のチェックで、Sandra 2010aのProcessor Arithmetic/Processor Multi-Media Benchmark(グラフ1)、PassMark Performance Test 7のCPU Test(グラフ2)、PCMark05のCPU Test(グラフ3~4)の結果を示す。
昨今のCPUベンチマークはマルチコアへの最適化が進んでおり、同じアーキテクチャでも、物理的に4つのコアを持つCore i5-750との差が目立っている。さらにいえば、アーキテクチャが異なるが、やはりクアッドコアとなるCore 2 Quad Q9550やPhenom II X4 965 BEに対しても、不利な傾向が強い。
さらに、デュアルコアであるCore 2 Duo E8600に対しては、全般に良い結果を示す傾向にあるものの、PassMarkやPCMark05のシングルタスクではアドバンテージが弱まる部分があり、アーキテクチャ改良やHyper-Threading、Turbo Boostといった機能があったとしても、それらが活きる場面と活きない場面があることは気に留めておきたい。
【グラフ1】Sandra 2010a (Processor Arithmetic/Multi-Media Benchmark) |
【グラフ2】PassMark Performance Test 7(CPU Test) |
【グラフ3】PCMark05 Build 1.2.0(CPU Test-シングルタスク) |
【グラフ4】PCMark05 Build 1.2.0(CPU Test-シングルタスク) |
ところで、Westmereコアに実装されたAES-NIについて、Sandra 2010a、PCMark Vantageで、その効果が表れたので紹介しておきたい。Sandra 2010aのCryptography Benchmark(表6)、PCMark VantageのCommunications テストに含まれるデータ暗号化/復号テスト(グラフ5)を結果をここに示す。なお、表6中、AES256のテストはCore i5-661のみAES-NI(※1で示した箇所)が使われ、ほかは一般的なCPU処理となる。SHA256はiSSE4に対応しているが、Phenom II X4 965 BEは一般的なCPU処理となる(※2で示した箇所)。
結果は一目で分かるほど大きなものとなっている。Sandraの結果のみ表形式で示したのは、Sandraが出力する結果の単位が違っているためだ。そのぐらい差が大きい。もちろん命令セットの追加なので、その命令を用いたアプリケーションである必要があるわけだが、暗号化処理に対するニーズは高まる一方であることが考えれば、新製品のアドバンテージとして評価したい。
【グラフ5】PCMark Vantage Build 1.0.1 (PCMark Communications Test) |
(値:Bandwidth) | AES256 vPadLock Cryptographic | SHA256 vPadLock Hashing |
Core i5-661(dGPU - H55) | 3.54GB/sec(※1) | 451MB/sec |
Core i5-661(dGPU - P55) | 3.56GB/sec(※1) | 454MB/sec |
Core i5-750(dGPU - H55) | 456MB/sec | 735MB/sec |
Core i5-750(dGPU - P55) | 461MB/sec | 746MB/sec |
Core 2 Duo E8600(dGPU - G45) | 284MB/sec | 410MB/sec |
Core 2 Quad Q9550(dGPU - G45) | 485MB/sec | 697MB/sec |
Phenom II X4 965 BE(dGPU - AMD785G) | 515MB/sec | 628MB/sec(※2) |
Core i5-661(iGPU - H55) | 3.48GB/sec(※1) | 452MB/sec |
Core 2 Duo E8600(iGPU - G45) | 283MB/sec | 410MB/sec |
Core 2 Quad Q9550(iGPU - G45) | 483MB/sec | 697MB/sec |
Phenom II X4 965 BE(iGPU - AMD785G) | 515MB/sec | 630MB/sec(※2) |
さて、次にメモリ周りの性能を紹介したい。テストはSandra 2010aのCache & Memory Benchmark(グラフ6)と、PCMark05のMemory Test(グラフ7)、メモリのレイテンシをチェックするSandra 2010aのMemory Latency Benchmark(表7)、PCMark05のMemory Latency Test(グラフ8)である。
まず実効帯域であるが、キャッシュ部分はCore i5-750に比べて、L2/L3キャッシュでの速度低下が滑らかに見えるが、これはSandra 2010aがテストを行なうブロックサイズと仕様が生み出した妙といってよく、1MBの部分がL3キャッシュがフル稼働した際の実効帯域ということになる。キャッシュ速度の相対的な傾向は、これまでのCore i7-800番台とCore 2 Quadを比較したものと似ており、ベースクロックが同程度であれば、L1キャッシュは同程度の速度、L2キャッシュは良好という結果である。
問題はメインメモリの速度である。Core i5-661はLynnfieldのCore i5-750に比べ、目立って遅いことが分かる。Core i5-750に対して速度が遅いという結果はSandra 2010a、PCMark05 Memory Test 16MBサイズのテストで共通している。
付け加えると、メモリレイテンシもCore i5-750に対して大きくなっている。Sandra 2010aのランダムアクセス時のレイテンシは、全テスト環境中もっとも大きい結果となってしまった。リニアアクセス時はまずまずの性能であり、PCMark05ではPhenom IIと同程度、Core 2よりは良い、といったあたりになっている。Lynnfieldで発揮したレイテンシの小ささというメリットが失われているといっていい結果だ。
これは、CPUコアとメモリコントローラの間にQPIを挟んだためとだろう。先述のとおり、LynnfieldではCPUコアにメモリコントローラを統合することでレイテンシの抑制と実効速度の向上を果たしたが、CPUコアとメモリコントローラのダイが分かれてしまったため、Lynnfieldのような性能は出なくなったということである。Core 2に対しては、接続がQPIであるため、優位な結果がでているが、それでも2チップに分かれていることのデメリットは見えてしまっている。CPU以上にメモリ帯域幅への要求が大きいGPUコアの側にメモリコントローラを統合するのは仕方ない判断だとは思うが、ちょっともったいない印象を受ける結果になっている。
【グラフ6】Sandra 2010a(Cache & Memory Benchmark) |
【グラフ7】PCMark05 Build 1.2.0(Memory Test) |
【グラフ8】PCMark05 Build 1.2.0(Memory Latancy Test) |
Random Access | Core i5-661(dGPU - H55) | Core i5-661(dGPU - P55) | Core i5-750(dGPU - H55) | Core i5-750(dGPU - P55) | Core 2 Duo E8600(dGPU - G45) | Core 2 Quad Q9550(dGPU - G45) | Phenom II X4 965 BE(dGPU - AMD785G) |
1kB | 1.2ns/ 4.1clocks | 1.2ns/ 3.9clocks | 1.3ns/ 3.6clocks | 1.4ns/ 3.6clocks | 0.9ns/ 3.1clocks | 1.1ns/ 3.0clocks | 0.9ns/ 3.0clocks |
4kB | 1.2ns/ 4.1clocks | 1.2ns/ 3.9clocks | 1.3ns/ 3.6clocks | 1.4ns/ 3.6clocks | 0.9ns/ 3.2clocks | 1.1ns/ 3.0clocks | 0.9ns/ 3.0clocks |
16kB | 1.2ns/ 4.1clocks | 1.2ns/ 3.9clocks | 1.3ns/ 3.6clocks | 1.4ns/ 3.6clocks | 0.9ns/ 3.2clocks | 1.1ns/ 3.0clocks | 0.9ns/ 3.0clocks |
64kB | 3.1ns/ 10.3clocks | 3.0ns/ 9.9clocks | 3.4ns/ 8.9clocks | 3.4ns/ 9.1clocks | 4.7ns/ 15.7clocks | 5.3ns/ 15.1clocks | 0.9ns/ 3.0clocks |
256kB | 4.5ns/ 14.8clocks | 4.2ns/ 14.0clocks | 4.8ns/ 12.7clocks | 4.8ns/ 12.8clocks | 5.3ns/ 17.6clocks | 5.9ns/ 16.7clocks | 4.6ns/ 15.7clocks |
1MB | 16.0ns/ 53.1clocks | 15.3ns/ 51.1clocks | 17.4ns/ 46.2clocks | 17.5ns/ 46.9clocks | 5.4ns/ 18.0clocks | 6.1ns/ 17.2clocks | 17.0ns/ 58.2clocks |
4MB | 64.9ns/ 215.7clocks | 44.6ns/ 149.1clocks | 19.6ns/ 52.3clocks | 19.9ns/ 53.2clocks | 8.0ns/ 26.6clocks | 8.4ns/ 24.0clocks | 24.3ns/ 82.9clocks |
16MB | 117.1ns/ 389.4clocks | 112.6ns/ 376.6clocks | 75.9ns/ 201.8clocks | 76.9ns/ 205.7clocks | 85.5ns/ 285.4clocks | 83.7ns/ 237.6clocks | 75.4ns/ 257.4clocks |
64MB | 121.6ns/ 404.2clocks | 116.7ns/ 390.2clocks | 80.6ns/ 214.4clocks | 81.6ns/ 218.3clocks | 102.3ns/ 341.8clocks | 102.0ns/ 289.7clocks | 80.5ns/ 274.8clocks |
Linear Access | Core i5-661(dGPU - H55) | Core i5-661(dGPU - P55) | Core i5-750(dGPU - H55) | Core i5-750(dGPU - P55) | Core 2 Duo E8600(dGPU - G45) | Core 2 Quad Q9550(dGPU - G45) | Phenom II X4 965 BE(dGPU - AMD785G) |
1kB | 1.3ns/ 4.2clocks | 1.2ns/ 3.9clocks | 1.3ns/ 3.6clocks | 1.4ns/ 3.6clocks | 1.0ns/ 3.2clocks | 1.1ns/ 3.0clocks | 0.9ns/ 3.0clocks |
4kB | 1.2ns/ 4.1clocks | 1.2ns/ 3.9clocks | 1.3ns/ 3.6clocks | 1.4ns/ 3.6clocks | 0.9ns/ 3.1clocks | 1.1ns/ 3.0clocks | 0.9ns/ 3.0clocks |
16kB | 1.2ns/ 4.1clocks | 1.2ns/ 3.9clocks | 1.3ns/ 3.6clocks | 1.4ns/ 3.6clocks | 0.9ns/ 3.2clocks | 1.1ns/ 3.0clocks | 0.9ns/ 3.0clocks |
64kB | 3.1ns/ 10.3clocks | 3.0ns/ 9.9clocks | 3.4ns/ 8.9clocks | 3.4ns/ 9.1clocks | 3.9ns/ 12.9clocks | 4.3ns/ 12.3clocks | 0.9ns/ 3.0clocks |
256kB | 3.1ns/ 10.5clocks | 3.0ns/ 10.1clocks | 3.4ns/ 9.1clocks | 3.5ns/ 9.3clocks | 3.9ns/ 12.9clocks | 4.4ns/ 12.4clocks | 2.7ns/ 9.4clocks |
1MB | 3.8ns/ 12.7clocks | 3.6ns/ 12.1clocks | 4.1ns/ 10.9clocks | 4.1ns/ 11.1clocks | 3.9ns/ 13.0clocks | 4.4ns/ 12.4clocks | 6.8ns/ 23.3clocks |
4MB | 5.1ns/ 17.0clocks | 4.6ns/ 15.4clocks | 4.2ns/ 11.1clocks | 4.2ns/ 11.2clocks | 4.1ns/ 13.5clocks | 4.4ns/ 12.6clocks | 6.9ns/ 23.7clocks |
16MB | 9.7ns/ 32.3clocks | 9.4ns/ 31.4clocks | 7.8ns/ 20.7clocks | 9.0ns/ 24.1clocks | 12.9ns/ 43.2clocks | 12.7ns/ 35.9clocks | 13.4ns/ 45.7clocks |
64MB | 9.8ns/ 32.5clocks | 9.4ns/ 31.3clocks | 7.8ns/ 20.8clocks | 9.0ns/ 24.2clocks | 13.0ns/ 43.4clocks | 12.6ns/ 35.9clocks | 13.4ns/ 45.8clocks |
Random Access | Core i5-661(iGPU - H55) | Core 2 Duo E8600(iGPU - G45) | Core 2 Quad Q9550(iGPU - G45) | Phenom II X4 965 BE(iGPU - AMD785G) |
1kB | 1.2ns/3.9clocks | 0.9ns/3.0clocks | 1.1ns/3.0clocks | 0.9ns/3.0clocks |
4kB | 1.2ns/3.9clocks | 0.9ns/3.0clocks | 1.1ns/3.0clocks | 0.9ns/3.0clocks |
16kB | 1.2ns/3.9clocks | 0.9ns/3.0clocks | 1.1ns/3.0clocks | 0.9ns/3.0clocks |
64kB | 3.0ns/9.9clocks | 4.5ns/15.1clocks | 5.3ns/15.1clocks | 0.9ns/3.0clocks |
256kB | 4.2ns/13.8clocks | 5.0ns/16.7clocks | 5.9ns/16.7clocks | 4.6ns/15.6clocks |
1MB | 15.3ns/50.9clocks | 5.2ns/17.2clocks | 6.1ns/17.2clocks | 16.9ns/57.7clocks |
4MB | 47.4ns/157.6clocks | 7.4ns/24.9clocks | 8.4ns/23.8clocks | 24.1ns/82.2clocks |
16MB | 113.1ns/376.0clocks | 86.0ns/287.2clocks | 87.8ns/249.1clocks | 79.1ns/270.0clocks |
64MB | 117.2ns/389.6clocks | 103.3ns/345.0clocks | 107.3ns/304.5clocks | 84.3ns/288.1clocks |
Linear Access | Core i5-661(iGPU - H55) | Core 2 Duo E8600(iGPU - G45) | Core 2 Quad Q9550(iGPU - G45) | Phenom II X4 965 BE(iGPU - AMD785G) |
1kB | 1.2ns/4.0clocks | 0.9ns/3.0clocks | 1.1ns/3.0clocks | 0.9ns/3.0clocks |
4kB | 1.2ns/3.9clocks | 0.9ns/3.0clocks | 1.1ns/3.0clocks | 0.9ns/3.0clocks |
16kB | 1.2ns/3.9clocks | 0.9ns/3.0clocks | 1.1ns/3.0clocks | 0.9ns/3.0clocks |
64kB | 3.0ns/9.9clocks | 3.7ns/12.4clocks | 4.3ns/12.3clocks | 0.9ns/3.0clocks |
256kB | 3.0ns/10.1clocks | 3.7ns/12.4clocks | 4.4ns/12.4clocks | 2.7ns/9.3clocks |
1MB | 3.6ns/12.1clocks | 3.7ns/12.4clocks | 4.4ns/12.4clocks | 6.8ns/23.1clocks |
4MB | 4.7ns/15.5clocks | 3.9ns/12.9clocks | 4.4ns/12.5clocks | 6.9ns/23.5clocks |
16MB | 9.6ns/31.9clocks | 13.4ns/44.6clocks | 13.5ns/38.3clocks | 14.4ns/49.2clocks |
64MB | 9.6ns/31.8clocks | 13.3ns/44.6clocks | 13.5ns/38.3clocks | 14.4ns/49.3clocks |
ここからは実際のアプリケーションを用いたベンチマークテストの結果を紹介する。テストはSYSmark 2007 Preview(グラフ9)、PCMark Vantage(グラフ10)、CineBench R10(グラフ11)、POV-Ray(グラフ12)、ProShow Gold(グラフ13)、動画エンコード(グラフ14、15)である。
グラフは外付けGPU環境、内蔵GPU環境を混在して掲載したが、一部テストではその影響が色濃く出ている。基本的には薄い色のバーで示した外付けGPU環境、濃い色のバーで示した内蔵GPU、それぞれの間の相対的な関係を比較したい。
一部テストではCore i5-661がもっとも良い結果を示すものがある。SYSmark2007の3Dテスト、PCMark VantageのCommunicationsテスト、CineBench R10やPOV-RAYのシングルスレッドテストあたりがその例だ。理由ははっきりしていて、PCMarkについては先述のとおりAESの処理が飛び抜けているから、残りはシングルスレッド処理が中心もしくは完全なシングルスレッド処理だからである。こうしたものであれば、Core i5-750を上回るクロックの高さを意味を持つことになる。
とはいえ、多くのテストは、Core i5-750を下回る結果になっており、クロックの差で、物理的なコア数の差が埋められていないことが分かる。また、Phenom II X4 965 BEに比べると全般に低めのスコアとなっており、これにも及ばない印象は強い。
ただ、Core 2 Duo E8600はもちろんのこと、Core 2 Quad Q9550にも肉薄しているのは興味深い結果といえる。効率的なマルチスレッド処理が行なわれているCineBenchやPOV-RAYでは差をつけられてしまっているが、SYSmark/PCMarkはこれを上回るテストが多いし、動画エンコードでもCPUへの負荷が高いHD動画ではやや不利なところを見せているが、H.264では同等程度まで肉薄している。
デュアルコアという物理的な制約はあるものの、より高クロックであることやアーキテクチャの改良、そしてHyper-Threadingが功を奏していることになる。前世代のクアッドコア(しかも価格がより上位のモデル)に対して、良い勝負ができるというのは、好印象を受ける結果である。
【グラフ9】SYSmark 2007 Preview(Ver. 1.06) |
【グラフ10】PCMark Vantage Build 1.0.1 |
【グラフ11】CineBench R10 |
【グラフ12】POV-Ray v3.7 beta 34 |
【グラフ13】Photodex ProShow Gold 4.0 |
【グラフ14】動画エンコード(SD動画) |
【グラフ15】動画エンコード(HD動画) |
次に3D関連のベンチマークである。GPUの影響をほとんど受けない3DMark Vantage/06のCPUテストのみ全環境を1つのグラフで示したが、外付けGPUと内蔵GPUで一部異なるテストを行なっているので、ここからはグラフを分けて紹介する。
まず3DMark Vantage/06のCPUテスト(グラフ16)の結果を見ておきたい。両テストともマルチスレッド化されているため、クアッドコア製品の優位性が目立つ結果となった。Core 2 Quad Q9550に対しても、ここでは劣る結果になっており、マルチコアへの最適化が進んだアプリケーションではやはり一歩及ばない。ただし、Core 2 Duo E8600に対するアドバンテージは出ている。
【グラフ16】3DMark06 Build 1.1.0 / 3DMark Vantage Build 1.0.1(CPU Test) |
次は外付けGPUを用いた環境のテスト結果だ。テストは、3DMark VantageのGraphics Score(グラフ17)、3DMark06のSM2.0テストとHDR/SM3.0テスト(グラフ18)、BIOHAZARD 5 ベンチマーク(グラフ19)、Far Cry 2(グラフ20)、Tom Clancy's H.A.W.X(グラフ21)である。
各アプリケーションの設定は、3DMark VantageはExtremeプリセットをベースにAA/AFを無効化した状態。3DMark06はAA/AFともに非適用。BIOHAZARD 5はモーションブラー有効を含め最高クオリティに設定し、4xAAを適用。Far Cry 2は最高クオリティの設定に加え、4xAAを適用。H.A.W.X.も最高クオリティ設定および4xAAを適用している。解像度はいずれも、1,280×1,024ドット、1,600×1,200ドット、1,920×1,200ドットでテストしている。
一定の傾向が出た結果とは言いづらいが、大局的に見るとCore i5-750、Phenom II X4 965が良いスコアを出す傾向が強く、次いでCore i5-661という位置付けといえる。ただ、Far Cry 2のようにGPUの負荷が相対的に高くなるシーンでNehalemアーキテクチャ環境のスコアが伸び悩むシーンが見られたりする。全体の安定感ではPhenom II X4 965環境が優れており、ゲームタイトルのマルチコアへの最適化が進んできた昨今では、クロックが高いとはいえデュアルコアという不利が目立ちつつある結果といえる。
【グラフ17】3DMark Vantage Build 1.0.1(Graphics Test) |
【グラフ18】3DMark06 Build 1.1.0(SM2.0 Test,HDR/SM3.0 Test) |
【グラフ19】BIOHAZARD 5 ベンチマーク |
【グラフ20】Far Cry 2(Patch 1.03) |
【グラフ21】Tom Clancy's H.A.W.X |
次に内蔵GPUを用いた環境のテスト結果である。テストは3DMark VantageのGraphics Score(グラフ22)、3DMark06のSM2.0テストとHDR/SM3.0テスト(グラフ23)、BIOHAZARD 5 ベンチマーク(グラフ24)、ストリートファイターIVベンチマーク(グラフ25)、FINAL FANTASY XI for Windows - Vana'diel Bench 3(グラフ26)である。
各アプリケーションの設定は次のとおり。3DMark VantageはEntryプリセットの設定。3DMark06は先述の外付けGPU環境と同じ。BIOHAZARD 5はモーションブラー無効、全設定LOW、AA/AF無効。ストリートファイターIVベンチマークはバックグラウンドのみHIGH設定で、ほかはすべてLOW、AA/AFは無効。FF Bench 3はHIGH設定のみテスト。解像度はFF Bench 3を除き、800×600ドット、1,024×768ドット、1,280×1,024ドットで行なっている。
結果はテストごとに優劣の入れ替わりが激しいものとなった。3DMark Vantageや3DMark06、BIOHAZARD 5ベンチマークではIntel HD GraphicsがAMD 785Gを上回る性能を示す一方、ストリートファイターIVベンチマークとFF Bench 3はAMD 785Gのほうが良いフレームレートとなっている。
Intelのグラフィックス機能というと、これまではあまり高い性能を持っていないイメージが強かったが、ドライバのチューニングがはまれば、かなり良い性能を出せるということだろう。Intelがこうしたチューニングを進め、今後も多数のゲームタイトルへ最適化していってほしいとは思う。が、あくまで既存の内蔵GPUに比べて良い性能を出せるポテンシャルを持っているということであり、ゲーム用途を強く意識した製品ではないことを考えると、Intelがそこに注力していくかは懐疑的に見ている。
最後は消費電力の測定である。ここも外付けGPU環境と内蔵GPU環境はグラフを分けている(グラフ27、28)。また、内蔵GPU環境に関しては、3D処理時の消費電力も結果を示した。
ここはCore i5-661がデュアルコア製品であること、そして32nm+45nmプロセスへシュリンクしたCPUおよびGPUコアであることの意味が出た結果といえる。特に内蔵GPUを用いた環境の結果は極めて良好だ。
ちなみに、テスト環境の表でも示したとおり今回のテストは1,200Wという、ちょっとオーバースペックな電源を使用している。現実的にはもう少し小容量の電源を組み合わせることが多いと思うが、こうした低い消費電力の際に高い効率で変換できる(俗っぽくいえば美味しいところを使える)電源なら、さらに低い消費電力を期待できるだろう。
【グラフ27】消費電力 |
【グラフ28】消費電力 |
●性能よりも、消費電力の良さが光る製品
以上のとおりCore i5-661のベンチマークテスト結果を見てきた。相対的な位置付けとしては、Core i5-750やPhenom II X4 965 BEよりは性能が低く、Core 2 Quad Q9550とは一長一短、Core 2 Duo E8600より高い性能を持っている、といったあたりの評価が妥当だろう。
ただし、消費電力の少なさは今回の比較対象すべてに勝るといっていい。デュアルコア製品であるCore 2 Duo E8600とは高負荷時に同等程度の消費電力という見方もできるが、アイドル時の消費電力を加えて総合的に見ると、Core i5-661の素行の良さが光るといっていい。
これに加味すべきは価格である。Core i5-661は196ドルの価格が提示されており、これはCore i5-750と同じである。そしてCore 2 Quad Q9550とCore 2 Duo E8600はいずれも266ドル、Phenom II X4 965 BEは195ドルだ。Core 2両製品はこの時点で、コストパフォーマンスの不利がある。
もっとも、注視すべきは、Core i5-661とCore i5-750が同じ価格という点だろう。ちなみにチップセットはIntel P55とH55が同じ40ドル、Intel H57は少し高い43ドルである。この価格と今回のベンチマークを見たとき、性能で決めるならどちらを選ぶかと問われたとき、Core i5-750+Intel P55の組み合わせに手を挙げる人のほうが多いのではないだろうか。少なくとも筆者はこちらを選ぶ。
その意味では、Core i5-661(Clarkdale全般にいえることだが)の存在価値は、性能ではなく、先に述べた優れた省電力性にあるように思う。Core i5-750の消費電力もほかのクアッドコアCPU環境に比べればまずまずの値ではあるが、デュアルコア製品に比べると、やはり大きな電力を必要としている。
Core i5-661は、内蔵GPUを用いた場合のアイドル時消費電力がPC全体で50W程度、高負荷時でも100W強。外付けGPUを用いた環境でも、Core i5-750に比べてアイドル時で15~20W程度、高負荷時では30W程度も低い。性能面で肉薄したCore 2 Quad Q9550と比較すれば、その魅力はより高まるだろう。
つまり、コストパフォーマンスで選ぶならCore i5-750、ワットパフォーマンスで選ぶならCore i5-661といった具合に、どちらに比重を置くかで、この2種類のCore i5のどちらを選ぶかが変わってくるだろう。同じブランドではあるが、Lynnfield版Core i5とは違うニーズを満たす製品として登場したものがClarkdale版Core i5である、というのが筆者の印象だ。