■元麻布春男の週刊PCホットライン■
最初のNehalemマイクロアーキテクチャに基づくプロセッサとして2008年11月にデビューしたCore i7-900番台(Bloomfield)は、FSBに代わるインターコネクトとしてQPIを採用、高いI/O能力に適応可能なハイエンド向けプロセッサであった。それから10カ月あまりを経て、ようやくNehalemマイクロアーキテクチャがメインストリーム向けに降りてきた。
9月8日に発表されたCore i7-870とCore i7-860、およびCore i5-750は、これまでLynnfieldのコード名で知られてきたデスクトップPC向けのプロセッサ。Core i7がHyper-Threadingをサポートするのに対し、Core i5はサポートしないという違いを持つ。いずれも900番台とは異なり外部インターフェイスはDMIで、新しい1チップのチップセットP55(Ibex Peak)を用いる。今まで3チップ(CPU+2チップ構成のチップセット)だったのを2チップにすることで、プラットフォームのシンプル化と低コスト化を図ろうということなのだろう。
Direct Media Interfaceの略であるDMIは、これまでもNorth BridgeチップとSouth Bridgeチップの接続に使われてきたもの。帯域は片方向1GB/secずつ、計2GB/secとなっている。これはほとんどの周辺機器には十分過ぎるものだが、グラフィックスには少々厳しい。Gen 2のPCI Express x16スロットの帯域はDMIの8倍の16GB/sec(双方向)にも及び、とても比べられるものではない。
要するにIntelは、メインストリーム向けのNehalemマイクロアーキテクチャでは、最初からチップセットにグラフィックス機能を持たせる予定ではなかった。Nehalemマイクロアーキテクチャの最大の特徴は、CPUにメモリコントローラを統合すること。ディスプレイメモリとしてメインメモリを共有するグラフィックスコアは、そのメモリコントローラのそばに置きたい。グラフィックスコアの統合先は、チップセットではなくCPUということになる。
IntelはデスクトップPC向けをClarkdale、ノートPC向けをArrandaleとして、グラフィックス統合型CPUの開発を進めているが、その登場は2010年の早い時期ではないかと言われている。グラフィックス統合型の投入が遅れるのは、プロセッサコアを32nmプロセス(Westmereコア)にする決断をしたため、とされる。というわけで、Lynnfieldについては外付けグラフィックスを用いること(グラフィックスカードの搭載)が前提となる。メインストリーム向けといっても、それほど下にまでは降りて来られない可能性が高い。ネットブックの登場以降、PCの単価が全体的に下がっているため、どこまでLynnfieldが浸透できるか、やや不安に感じる部分だ。
実際にP55チップセットを搭載したマザーボードがリリースされて分かったのは、ディスプレイ出力を備えたマザーボードは今のところ存在しない、ということだ。グラフィックスコアが統合されたClarkdaleは、今回発表されたLynnfieldと同じLGA1156パッケージで、同じIbex Peakチップセットを採用すると言われている。そして、内蔵グラフィックスの出力はIbex Peakが内蔵するディスプレイ出力回路を経て、外部に出力されることになっている。P55ベースのマザーボードがClarkdaleの内蔵グラフィックスに対応するのであれば、マザーボードにディスプレイコネクタが用意されていなければならない。今市販されているP55ベースのマザーボードにコネクタがないということは、Clarkdaleを組み合わせた場合、BIOS等の対応で動いたとしても、内蔵グラフィックス機能を利用できないということになる。
おそらくClarkdaleがリリースされるタイミングで、マザーボードのリフレッシュが行なわれ、ディスプレイコネクタを備えたものになるのだろう。逆にこのディスプレイコネクタを備えたマザーボードにLynnfieldを載せた場合、コネクタからディスプレイ出力が出力されないだけで、CPUとしては動作するハズだが、ちょっと紛らわしい。スマートに解決するには、ディスプレイ出力をADD2カードのような形に分離して、Clarkdaleの時はADD2カード、Lynnfieldの時にはADD2カードを取り外してグラフィックスカードを取り付ける、という方法が考えられる。が、ADD2カードがコスト高になることを考えれば、Lynnfield使用時には信号の出力されないディスプレイコネクタを抱える、ということになるのだろう。
Turbo Boostの仕組み。実際にはBoostする条件はTDPだけではない。この図でも、シングルコア時は5ビン、2コア時は4ビン、4コア時は2ビン上がるとキッチリ図示されているのがIntelらしい |
さて、今回発表された3種のCPUで面白いのは、下克上の可能性をはらんでいることだ。Nehalemマイクロアーキテクチャのプロセッサには、Intel Turbo Boost Technologyと呼ばれる機能が搭載されており、
・アクティブなCPUコアの数
・流れている電流
・消費電力
・プロセッサの温度
・定められた上限の動作クロック
に余裕がある場合、定格よりも高い動作クロックでプロセッサが動作する。
具体的には、すでに発表済みのCore i7-900番台(i7-920~i7-975のすべて)では、それが1/1/1/2であることが、IntelのSpecification Updateに明記されている。この数字は133MHzという基準クロックをベースに、4コア/3コア/2コア/1コア時にそれぞれどれくらいクロックが上がるか、ということを示したもので、たとえば定格動作が2.66GHzのCore i7-920プロセッサの場合、4コア~2コアだと2.8GHzまで、シングルコアの場合のみ2.93GHzまで動作クロックが上がる可能性を持つということだ。
これに対して今回発表されたLynnfieldプロセッサは、製品により細かく上げ幅が異なっている。
【表】TurboBoost時の最大クロック
4コア | 3コア | 2コア | 1コア | |
i7-870 | 3.2 | 3.2 | 3.46 | 3.6 |
i7-860 | 2.93 | 2.93 | 3.33 | 3.46 |
i5-570 | 2.8 | 2.8 | 3.2 | 3.2 |
通常時のクロックは順に2.93GHz、2.80GHz、2.66GHzだから、上の例にならうと、Core i7-870は2/2/4/5、Core i7-860は1/1/4/5、Core i5-750は1/1/4/4というクロックの上がり方をすることになる。900番台に比べて、かなりアグレッシブな仕様だ。逆に言えば、900番台は初めての製品ということで、安全マージンを大きくとったのかもしれない。あるいはサーバー/ワークステーション向けと同じプロセッサだから、これが理由でマージンが大きいのだろう。
で、これだけ大きくクロックが上がると、当然、コンサバな900番台との関係が微妙になる。同じ動作クロック2.66GHzでも、上位のCore i7-920の動作クロックが最大でも2.93GHz止まりなのに対し、Core i5-750は理論上3.20GHzまで上がる。Core i5-750の性能がCore i7-920を上回る可能性は高い。定格のクロックが2.93GHzのCore i7-870にしてもシングルコア時の最高クロックは3.60GHzだから、定格では上をいくCore i7-965(3.20GHz)を上回る可能性がある。
というわけで、新旧取り混ぜて、表にある5種類のシステムを用意してベンチマークテストを実施してみた。BIOSでHyper-Threading(Core i5-750とCore 2 Extreme QX9770を除く)およびTurbo Boost(Core 2 Extreme QX9770を除く)について、ONとOFFを行なって試している。メモリバスが3チャンネルのCore i7-900番台はメモリ搭載量が6GBになってしまうが、32bit OSなので、4GBを実装したほかのシステムに対して、実質利用できる量は変わらない。
【表1】テストに用いたシステム
評価マシン1 | 評価マシン2 | 比較マシン1 | 比較マシン2 | 比較マシン3 | ||
CPU | 名称 | Core i7-870 | Core i5-750 | Core i7-965 | Core i7-920 | Core 2 Extreme QX9770 |
コード名 | Lynnfield | Lynnfield | Bloomfield(6.4GT/s QPI) | Bloomfield(4.8GT/s QPI) | Yorkfield | |
TDP | 95W | 95W | 130W | 130W | 136W | |
定格クロック | 2.93GHz | 2.66GHz | 3.2GHz | 2.66GHz | 3.2GHz | |
TurboBoost時(ピーク) | 3.60GHz | 3.20GHz | 3.46GHz | 2.93GHz | - | |
クロックの差分(MAX) | 667MHz(133MHz×5) | 533MHz(×4) | 266MHz(×2) | 266MHz(×2) | - | |
4コア/3コア/2コア/1コア | 2/2/4/5 | 1/1/4/4 | 1/1/1/2 | 1/1/1/2 | - | |
マザーボ−ド | 名称 | Intel DP55KG | <- | Intel DX58SO | <- | Gigabyte GA-EP35-DS3R |
チップセット | P55 | <- | X58 | <- | P35 | |
メモリ | 4GB DDR3-1333(9-9-9-24) | <- | 6GB DDR3-1066(8-8-8-19) | <- | 4GB DDR2-800(5-5-5-18) | |
2GB DIMM×2(21.2GB/sec) | <- | 2GB DIMM×3(25.6GB/sec) | <- | 2GB DIMM×2(12.8GB/sec) | ||
グラフィックス | GPU | ATI Radeon HD 4890 | <- | <- | <- | <- |
1GB DDR5, Core 850MHz/Mem 975MHz | <- | <- | <- | <- | ||
表示解像度 | 1,600×1,200ドット、32bit、60Hz | <- | <- | <- | <- | |
ストレージ | HDD | Seagate Barracuda 7200.12 500GB | <- | <- | <- | <- |
OS | Windows 7 Ultimate x86 | <- | <- | <- | <- |
ベンチマークとして最初に取り上げるwPrime 2.0は、ニュートン法により整数の平方根を求めるテスト。基本的にはプロセッサの演算性能の測定向けには3,200万まで、CPUとメモリの安定性テスト向けには10億2,400万までの計算をする。結果は所要時間で示され、小さければ小さいほど高速ということになる。それほどシステム負荷は重くないが、テストをいくつのスレッドに分割して実行するか、指定できるのがミソだ。もちろん、テストはマルチタスクOS上で実行されており、OSのサービス等も動いているため、完全にスレッド数をコントロールできるわけではないのだが、目安にはなる。
【表2】wPrime 2.0の結果
評価マシン1 | 評価マシン2 | 比較マシン1 | 比較マシン2 | 比較マシン3 | ||
Turbo無効 | 1 スレッド(HT無効) | 44.242秒 | 48.936秒 | 42.252秒 | 52.218秒 | 50.544秒 |
2 スレッド(HT無効) | 22.168秒(直上比50.1%) | 24.555秒(直上比50.2%) | 21.376秒(直上比50.6%) | 26.077秒(直上比49.9%) | 25.319秒(直上比50.1%) | |
3 スレッド(HT無効) | 14.851秒(同67.0%) | 16.422秒(同66.9%) | 14.22秒(同66.5%) | 17.468秒(同67.0%) | 16.957秒(同67.0%) | |
4 スレッド(HT無効) | 11.2秒(同75.4%) | 12.387秒(同75.4%) | 10.861秒(同76.4%) | 13.25秒(同75.9%) | 12.762秒(同75.3%) | |
8 スレッド(HT無効) | 13.104秒(同117%) | 14.429秒(同116%) | 12.392秒(同114%) | 15.515秒(同117%) | 13.883秒(109%) | |
8 スレッド(HT有効) | 8.73秒(同66.6%) | 0 | 8.234秒(同66.4%) | 9.956秒(同64.2%) | 0 | |
Turbo有効 | 1 スレッド(HT無効) | 36.531秒(Turbo無効時比82.6%) | 40.747秒(Turbo無効時比83.3%) | 39.282秒(Turbo無効時比93.0%) | 48.297秒(Turbo無効時比92.5%) | 0 |
2 スレッド(HT無効) | 19.139秒(Turbo無効時比86.3%) | 20.763秒(Turbo無効時比84.6%) | 20.517秒(Turbo無効時比96.0%) | 24.438秒(Turbo無効時比93.7%) | 0 | |
3 スレッド(HT無効) | 13.662秒(Turbo無効時比92.0%) | 15.568秒(Turbo無効時比94.9%) | 13.658秒(Turbo無効時比96.0%) | 16.265秒(Turob無効時比93.1%) | 0 | |
4 スレッド(HT無効) | 10.375秒(Turbo無効時比92.6%) | 11.748秒(Turbo無効時比94.8%) | 10.423秒(Turbo無効時比96.0%) | 12.484秒(Turbo無効時比94.2%) | 0 | |
8 スレッド(HT無効) | 11.764秒(Turbo無効時比89.8%) | 13.009秒(Turbo無効時比90.2%) | 11.939秒(Turbo無効時比96.3%) | 14.781秒(Turbo無効時比95.3%) | 0 | |
Trubo有効 | 1スレッド(HT有効) | 36.254秒(HT無効時比99.2%) | 0 | 39.313秒(HT無効時比100%) | 48.329秒(HT無効時比100%) | 0 |
2スレッド(HT有効) | 19.108秒(HT無効時比99.8%) | 0 | 20.516秒(HT無効時比100%) | 24.422秒(HT無効時比99.9%) | 0 | |
3スレッド(HT有効 | 13.649秒(HT無効時比99.9%) | 0 | 13.641秒(HT無効時比99.9%) | 16.359秒(HT無効時比101%) | 0 | |
4スレッド(HT有効) | 10.405秒(HT無効時比100%) | 0 | 10.517秒(HT無効時比101%) | 12.906秒(HT無効時比103%) | 0 | |
8 スレッド(HT有効) | 8.486秒(HT無効時比72.1%) | 0 | 7.891秒(HT無効時比66.1%) | 9.531秒(HT無効時比64.5%) | 0 |
このwPrimeが実際に表示するスコアには、所要時間(秒数)に合わせてクロックも示されている。Core i7-900番台ならびにCore 2 Extremeプロセッサでは、どうやらアイドル時(あるいはプログラム起動時)のCPUクロックが表示されるようだが、Lynnfieldでは、アイドル時のクロックが表示されることもあれば、ピーククロックらしい数字が表示されることもあり、どうも十分枯れてはいない印象だ。
また、ピーククロックとおぼしき数字が表示される場合も、1スレッドでベンチマークした場合と、4スレッドや8スレッドの時で同じ数字が表示されることからすると、テスト中に実際に計測した数字とは思いにくい。いずれにしても、動作中に、実際にどのくらいのクロックで動いているのかを、この数字から読み取るのは危険だと思われるため、別の方法を用いることにした。
それはCPU-ZでおなじみのCPUIDが開発中のTMonitorを、wPrime実行中に表示させておくことだ。TMonitorは、プロセッサのスレッド(論理コア)ごとの実クロックを表示するもので、まだベータ版。そのためか、クロックのピーク値を読み取ることが困難だが、参考にはなる。もちろん、TMonitorの実行も性能に影響を与えるため、表に示したスコアの計測時とは別に実行して、スクリーンをキャプチャしている。
さて、スコアの比較だが、最初はHyper-ThreadingとTurbo Boostの両方を無効にした場合だ。Nehalemアーキテクチャのプロセッサに関しては、おおむね定格クロック順に並んでいる、と言いたいところなのだが、定格クロックが変わらないにもかかわらずCore i7-920よりCore i5-750の方が速い、という結果になっている。なぜCore i5のスコアがこれほど良いのか、正直分からない。間違って、Turbo Boostを有効にしてしまったかとも思ったのだが、Turbo Boost有効時はさらにスコアが向上している。理由については、もう少し調べてみる必要がありそうだ。
また、動作クロックを考慮すると、Core 2 Extreme QX9770よりもCore i7のスコアが格段に良く、3.2GHzのCore 2をCore i7-920を除くCore i7およびCore i5プロセッサが上回っている。これはもちろん、Core 2とCore i7/i5のアーキテクチャの差によるもので、Turbo Boostによる動作クロックの引き上げがなくてもCore i7/i5の性能が向上している1つの証だ。
Nehalemマイクロアーキテクチャの何が一番有効なのか、ハッキリとしたことは分からないが、1つ考えられるこはとwPrimeが比較的小さなプログラムで、実行ファイルでも1,760KBしかない、ということである。おそらくプログラムのコアである、ニュートン法による反復計算(近似計算)のループはもっと小さいだろう。これがNehalemのL2キャッシュに入っている可能性は高い。
Nehalemマイクロアーキテクチャでは、キャッシュメモリは32KB+32KBのL1、256KBのL2(ここまではコア毎に独立)、8MBのL3の3段構えになっている。が、Coreマイクロアーキテクチャと比べると、NehalemのL3キャッシュはCoreのL2キャッシュに相当し、NehalemのL2キャッシュはCoreのL1.5キャッシュ、という感じだ。つまりNehalemマイクロアーキテクチャのL2キャッシュは、CoreのL2より高速(低レーテンシ)で、これが性能向上に貢献しているのではないかと思う。
次にTurboを有効にした場合の結果だが、当然のことながらNehalemマイクロアーキテクチャのプロセッサはスコアが伸びる。が、良く見るとスコアの伸び具合がプロセッサによって異なっているのに気づく。表3は、Turbo Boostを有効にしたことで、どれくらいwPrimeの処理時間が短縮されたのかをまとめたものだが、1~2スレッド時にLynnfieldプロセッサの短縮度合いが高い、つまりは性能が向上していることが分かる。1~2コア時のクロック向上が、Lynnfieldは4あるいは5ビンであるのに対し、Bloomfieldは1コア時でも2ビンしか向上しないといった、Boostのかかり方の違いが現れているものと思われる。
【表3】Turbo Boost有効化による処理時間の短縮(Hyper-Threading無効) |
一方でBoostのかかり方が同じではないLynnfieldの2種だが、このグラフではほぼ同等の傾向を示し、両者の差は見えない。このテストで変化させたパラメーターは、wPrimeを実行するスレッド数のみだが、ベースとなるのがマルチタスクOSであり、wPrime以外のOSのサービス等を完全に止めることができないこと、Turbo Boostの上限を決めるのは利用されているコア数(≒スレッド数)だけではないこと、など複雑な事情がからみあっているものと思われる。なぜLynnfieldで、論理コア(=物理コア)数を越える8スレッドで実行した時に、ブーストが1ビン多くかかっているように見受けられるのかも、今の時点では説明できない。
Intelは明言を避けるが、オーバークロックしやすい「あたり」の個体とそうでない個体が存在するように、Boostのかかりやすい個体とそうでない個体が存在する可能性も否定できない。ここで言えそうなのは、WindowsのようなマルチタスクOSであっても、Turbo Boostは有効になりアプリケーションによってBoostのかかり方が変わってくること、Lynnfieldの方がアグレッシブにBoostされること、の2点だ。
このややこしいTurbo Boostに比べると、Hyper-Threadingの効果はハッキリしている。表4はTurbo Boost有効時に、Hyper-Threadingの有効時と無効時のスコアを比べたものだ(Turbo Boostの効果が明らかである以上、これをオフにする設定は現実的ではないだろう)。物理コア数を越えたスレッド数(この場合8スレッド)でwPrimeを実行した場合、Hyper-Threadingの効果は顕著だ。物理コア数よりスレッド数が少ない場合は、効果はほとんどない(ある意味当然だが)ものの、Hyper-Threadingをオンにしたことによる副作用もほとんどない。一般的な利用であれば、わざわざHyper-Threadingをオフにしておく必要はほとんどないのではないかと思う。
【表4】Turbo Boost有効時、Hyper-Threadingによる効果 |
以上は、wPrimeを実行し、得られた結果から推論したことだが、実際にどのように、どのくらいコアが利用されているのか、非常に気になるところだ。そこで、wPrimeを実行するかたわら、上記のTMonitorを実行してみた。また、この時の温度等を確認する目的で、Intel Desktop Control Center(IDCC)も実行している。IDCCの表示を見る限り、温度が上がりすぎたことはないが、Turbo Boostの基準となる温度が分からないため、温度がBoost値の制約条件になっているのかは不明だ。また注意が必要なのは、TMonitorやIDCCを同時実行しているため、表2のデータを計測した時とは条件が異なっている(スレッド数が多くなっている可能性が高い)という点である。
画面1は評価マシン1で、Turbo Boost有効/Hyper-Threading無効時のアイドル時にキャプチャした画面だ。TMonitorから読み取れるのは、SpeedStepが有効な時、アイドル状態のCore i7-870プロセッサの動作クロックは1,200MHzまで落ちる、ということである。またIDCCから読み取れるのは、オーバークロックの設定になっていないこと、Turbo Boostが有効で、そのピーククロックが3.60GHzであること、すべての温度は正常値(グリーン)であること、などだ。
【画面1】Turbo Boost有効/Hyper-Threading無効のアイドル時 | 【画面2】wPrimeを1スレッド指定で実行した |
このシステムでwPrimeを1スレッド指定で実行したのが画面2だ。クロックが立ち上がり、キャプチャ時Thread4で3,378.5MHzまで上昇していることが分かる。また、同時に複数のスレッドでクロックが立ち上がることがないことを考えると、システムの状態は基本的に静穏でwPrimeの1スレッドのみが実行されている、ということが言えるだろう。そして、1スレッドでの動作といえども、常に同じコアでずっと実行されるわけではないことも言えそうだ。
このグラフで黄色になっている部分が、Turbo Boostされたこと(定格クロックを越えた部分であること)を示している。3378.5MHzというのは、定格(2.93GHz)に対しおおよそ3ビン(133MHz×3)の上昇であり、プロセッサでアクティブになっているコア数が2以下になっていることは明らかだ。つまり最大上昇値が4ビンあるいは5ビンとなる領域でプロセッサは動作しているわけだが、この4ビンや5ビンというTurbo Boostの上限は、あくまでも最大値であり、それ以下で動作する場合も少なくないことがうかがえる。仮にここで同時動作しているコアが1個だったとして、5ビンまで引き上げる何らかの方法(強力な冷却を行なうなど)をユーザーがとり得るのか、ひょっとして「あたり」のプロセッサなら同じ条件下で4ビンあるいは5ビンまで上がるのか、ということは今回のテストでは分からない。
画面3は、wPrimeを2スレッドで実行した時のもの。IDCCでもCPUのロードが増えている(31%から56%へ)。TMonitorのThread2で読み取れる数字は3,223.7MHzだが、キャプチャするタイミングがピークからずれてしまった。ピークとしては画面2の時と同様、3,378.5MHz近くまで出ているように見える。wPrimeの2つのスレッドは、Thread2を中心に、Thread3とThread4で分担するような形で実行されている。
続く画面4ではwPrimeのスレッド数は3まで増えている。実行はThread2とThreda4を中心に、Thread1とThread3で半分ずつ実行されている感じだ。Thread2の様子を見る限り、動作クロックの上限は3,200MHzになっている。これは2ビン上昇した状態であり、3コアあるいは4コア動作時におけるCore i7-870の上限と一致する。
【画面3】wPrimeを2スレッドで実行した時 | 【画面4】wPrimeのスレッド数は3まで増やしたところ |
wPrimeを4スレッドで実施した画面5では、このことがより明確になっている。CPUのロードは100%で、4つのコアがフル稼働状態だ。すべてのコアはちょうど2ビン分クロックが上昇した3,200MHzで連続動作している。この状態はスレッド数を8に増やした状態でも変わらなかった(画面6)。
【画面5】4スレッドで実施したところ | 【画面6】HTがOFFの状態で8スレッドに増やしたところ |
ではHyper-Threadingを有効にしたらどうか。基本的にはHyper-Threadingを無効にした時と大きく変わらないが、4スレッドでwPrimeを実行してもすべての論理プロセッサが埋まるわけではないので、グラフのパターンは異なる。画面7はHyper-Threadingを有効にした状態で、wPrimeを4スレッドで実行した時のもので、スレッドの実行は多くの論理プロセッサに分散し、グラフはだいぶバラけているが、ピーククロックは3,200MHzでHyper-Threadingを無効にした場合と同じだ。
それではということで、Hyper-Threadingを有効にした上で、wPrimeを8スレッドで実行したのが画面8だ。CPUのロードはもちろん100%。TMonitorもピタッと上限に張り付いているが、上限のクロックそのものは3,050MHz前後に落ちている。定格に対して1ビン弱のクロック上昇で、コア数と上限クロック以外の条件で、クロック上昇が抑えられている。
【画面7】HTがONの状態で4スレッド同時実行したところ | 【画面8】HTがONの状態で8スレッドに増やしたところ |
同じ8スレッドでの実行でも、Hyper-Threadingを有効にした方が、プロセッサ内部のリソースをより酷使する(効果的に利用できる)ため、消費電力あるいは電流量でリミットがかかっているのだろう。表4で示したように、8スレッドならHyper-Threadingを有効にした場合の効果は顕著だ。
さて、wPrimeに時間を取りすぎてしまったため、残りのベンチマークテスト結果についてはあまり触れることはできない。が、すべてのベンチマークテストがwPrimeと同じ傾向にならないことが見て取れる。
たとえばPCMarkVantageでは、Turbo Boostの無効/有効にかかわらず、Core i7-920のスコアがCore i7-750のスコアを上回っている。この違いを生んだ理由として考えられるのは、wPrimeに比べてPCMarkVantageははるかに「重い」ベンチマークテストであり、システム負荷が高くTurbo Boostがかかりにくい、900番台のトリプルメモリチャンネルの帯域が効いている、といったことだ。また、PCMarkVantageではCore 2 Extremeが健闘しているが、wPrimeと異なりPCMarkVantageはコード、データともに大きいため、NehalemマイクロアーキテクチャのL2キャッシュの効能が若干スポイルされるのだろう。ほぼ同様のことがPCMark05にもあてはまりそうだ。
【表5】CineBench10 |
【表6】PCMark Vantage |
【表7】PCMark05 |
【表8】CrystalMark2004 R3 |
というわけで、最後は相当な駆け足になってしまったが、Lynnfieldはなかなかおもしろいプロセッサだ。環境(冷却含む)やアプリケーションによっては、800番台のプロセッサが900番台のプロセッサを上回る下克上が成立する。700番台でも条件によっては900番台を上回りかねない。ただ、Turbo Boostのピークを引き出す条件が必ずしもはっきりしないため、悩むことも増えるかもしれない。
今回IntelがCore i7-870のTurbo Boostのピーク値を3.60GHzまで引き上げたのは、少し意外でもあった。これは、現時点でのハイエンドプロセッサであるCore i7-975(定格3.33GHz)と、Turbo Boost時のクロックでは肩を並べるものであるからだ。もちろん、Core i7-975はExtreme Editionであり、ロックされていないオーバークロック向けのプロセッサだから、目指すところも異なっているわけだが、アグレッシブであることは間違いないだろう。
かつてIntelはPentium 4の時代に、プロセッサの動作クロックが5GHzを越えると語った。それは今も実現していないし、定格としては今後も実現しないのかもしれない。今の様子だと、動作クロックが4GHzに近づきながら、越えそうになったらコアの数が増えて、クロックは下がる、ということを繰り返しそうな雰囲気があるからだ。しかし今回のアグレッシブなブースト値の設定から考えると、定格が4GHzを越えることはなくても、Turbo Boost時の最大動作クロックが4GHzを越えることはそう遠くない気がしてくる。定格クロックではなく、Turbo Boost時の最大動作周波数でプロセッサを選別する時代がくるかもしれない。