元麻布春男の週刊PCホットライン

デスクトップ用Sandy Bridgeを検証する



 新年早々の1月6日(米国時間)からラスベガスで開催されるCESに合わせて、Intelは2011年の主力となる第2世代Core iプロセッサを発表する。「Sandy Bridge」という開発コード名で呼ばれてきたこのプロセッサは、これまでハイエンド以外で使われてきたLGA1156ソケットのプロセッサ(LynnfieldおよびClarkdale)を置き換えるもので、CPUとGPUを同一のダイ上に集積している。製造技術はすべて32nmプロセスで、Clarkdaleのようにグラフィックスだけ45nmプロセスといったことはない。Sandy BridgeはデスクトップPC、ノートPC(モバイル)の両方に使われるが、発表より一足先にデスクトップPC版を入手することができたので、その実力の片鱗を見てみたいと思う。

Core i7-2600Kプロセッサ(エンジニアリングサンプル)

 ここで用いるのは、1月上旬に発表される予定のデスクトップPC向けのSandy Bridgeの内、Core i7-2600KとCore i5-2500Kだ。Sandy Bridgeではプロセッサー・ナンバーがClarkdaleの3桁から4桁へと変わり、その4桁の数字で製品の序列が定められる。モバイル向けも含め、Sandy Bridgeにはすべて2000番台のプロセッサ−・ナンバーが与えられているが、おそらくこれは2世代目のCore iプロセッサを示しているのだろう。

 一方プロセッサー・ナンバー末尾のアルファベットだが、無印を含めると全部で4種類。無印を標準とすると、末尾にKを持つプロセッサは、いわゆるリミッターをすべて外したものであり、P67チップセット(後述)との組合せで、オーバークロックをサポートする。これはCarkdaleの途中で追加された機能だ。

 さらに、このKシリーズではグラフィックスも、12基の実行ユニットを内蔵し、上位版となるIntel HD Graphics 3000を採用している(ほかは実行ユニット6基のIntel HD Graphics 2000。デスクトップPC向けの場合)。従来、デスクトップPC向けのCore i7プロセッサはグラフィックス機能を内蔵しなかったが、Sandy Bridge世代では内蔵となる。なお、KシリーズでvProのサポートがないのは第1世代のCore iプロセッサ同様だ。

 もう1つの特徴で、無印と共通なのは、TDP(熱設計時消費電力)が95W(Core i5およびCore i7の場合)である点。そして、TDPを65Wに引き下げたものにS、さらに35Wまで引き下げたものにはTのアルファベットが付与される。

 TDP 35Wというと、モバイルプロセッサと同等ということになるが、同じ35WでもデスクトップPC向けの方がベースクロック(非ターボ時の動作クロック)が高く、高性能な反面、平均消費電力が大きい。また、Turbo Boost時の上がり幅が大きく設定されている。そういう意味では、デスクトップよりモバイルの方がTurbo Boost付きのCore i5に投資する価値が大きいと言えるかもしれない。

 今回用いた2種のデスクトップPC向けSandy Bridgeプロセッサに話を戻すと、主な仕様は表1の通り。Core i7とCore i5でかなり仕様が類似しており、CPUとGPUの動作クロックを除くと、大きな違いは8コア相当か4コア相当という点と、L3キャッシュサイズ程度にとどめられており、Core i5にお買い得感がありそうだ。

【表1】テストした2種類の第2世代Core iプロセッサ
  Core i7-2600K Core i5-2500K
コア数 4
Hyper-Threading対応 あり なし
ベースクロック(非Trubo Boost時) 3.40GHz 3.30GHz
Turbo Boost時クロック(最大) 3.80GHz 3.70GHz
L3キャッシュサイズ 8MB 6MB
内蔵グラフィックス Intel HD Graphics 3000
グラフィックスクロック 1,350MHz 1,100MHz
TDP 95W
メモリ(定格) DDR3-1333(PC3-10600)×2
vPro なし
AES-NI あり
AVX あり
Quick Sync Video あり
製造プロセス 32nm High-k/Metal Gate
ソケット LGA 1155

 この表に書いた機能の内、AES-NIは、Clarkdale/Arrandale世代で導入されたAES暗号化を支援する命令セットで、Sandy Bridgeにも継承されている。AVXはSandy Bridgeで導入される新しい256bit拡張命令セット。将来的にどのようなアプリケーションで活用されることになるのか(特に一般向け)まだハッキリとしないが、将来が期待されるものであることは間違いない。

 Quick Sync Videoは、Sandy Bridgeが備えるメディア処理機能の総称で、高速な動画の編集やエンコード/トランスコードをサポートする。従来から、この種の機能はCPUあるいはチップセットに備えられていたが、Quick Sync Videoが画期的なのは、MPEG-2およびH.264のビデオエンコードエンジンを、そっくりハードウェアで搭載していることだ。

 これまでIntelのメディア処理機能は、そのソフトウェア処理を支援する命令セットをサポートする形で実装されることが多かった。こうした実装は汎用性が高く、仮にCODECが変わった場合、ソフトウェアを書き換える必要があっても、命令自体は流用できることが大半だった。一方、エネルギー効率あるいはトランジスタ効率という点では、専用のエンコーダを実装した方が良いことが多い。

 このSandy Bridgeにおいても、Quick Sync VideoはGPUコアに内蔵されており、CPUコアに特定の機能を実装することは避けているように見受けられる。しかし、それでもこうした専用ハードウェアをプロセッサが内蔵するのは、Intelとしては画期的なことではないかと思う。あるいは、オレゴンではなく、イスラエルのデザインチームが設計を手がけたことの表れなのかもしれない。

 もう1つの特徴は、LGA1155と呼ばれる新しいソケットを採用していることだ。従って、既存のLynnfield/Clarkdaleと、Snady Bridgeを同じマザーボードで差し替えて使うことはできない。リテンションの位置は同じであるため、ヒートシンクを流用することは可能だが、新しいプロセッサには新しいマザーボードが必要になる。

 既存のLGA1156プラットフォームに対し、新しいLGA1155プラットフォームは、プロセッサとチップセット間の接続に用いるDMIの帯域が2倍に拡張されたほか、グラフィックス機能を取り込んだことで、ダイのレイアウトが変わり、ピンアウトが大幅に変更されている。6.0GbpsのSATA 3.0の対応を考えれば、DMIの帯域拡張は避けられない。その点から、ソケットが変わることも必然かもしれない。基本的にIntelは、Tick-Tockの2世代におけるソケット互換性しか保証しない、ということが現時点でのポリシーのようだ。したがって、Sandy Bridgeと次のIvy Bridgeはおそらくソケット互換性を持つだろうが、その次はまた変更される可能性がある、ということになる。

 このSandy Bridgeと対になるのがIntel 6シリーズチップセットだ。開発コード名を「Cougar Point」と呼ばれるこのチップセットは、グラフィックス機能をサポートしない代わりにオーバークロックをサポートするP67、グラフィックス機能をサポートしたH67、vProをサポートした大企業向けのQ67、中小企業向けのB65、グラフィックス機能をサポートした下位モデルとなるH61など、さまざまなバリエーションが投入される。

 SATA 6Gbpsは、全ポートが対応するわけではなく、チップセットのグレードにより1〜2ポートが対応となる。RAID対応は、型番末尾が7の最上位グレードのチップセットに限定される。なお、IDFで明らかにされた通り、USB 3.0対応は見送られており、外付けチップによるサポートが必要だ。

●3Dとメディア関連の性能が大幅向上

 今回、テストにはP67チップセットのIntel Desktop Board DP67BGと、H67チップセットのIntel Desktop Board DH67BLの2枚のマザーボードを用いた。いずれもオンボードにルネサスエレクトロニクス製のUSB 3.0ホストコントローラ(μPD720200)を実装する。ファームウェアはUEFIベースである。テストに際しては、DirectX 11に対応したRadeon HD 6870ベースのグラフィックスカードと、6GbpsのSATA 3.0に対応したCrucialのSSD C300 64GBを組み合わせている。

 比較のために、全部で3つのプロセッサを用意した。Core i7-870とCore i5-661は、Sandy Bridgeが直接置き換えることになるLGA1156ソケット対応のプロセッサであり、どの程度の性能の上積みが得られるのかを確認する狙いだ。またCore i5-661については、内蔵グラフィックスの性能向上についても比較したいと思っている。

 Core i7-980Xは、LGA1366ソケットのプロセッサであり、今回リリースされたSandy Bridgeによって置き換えられることのない、ハイエンド向けの製品だ。2010年末、Intelは別チップを付与することで6GbpsのSATAとUSB 3.0のサポートを加えたLGA1366マザーボード2種(DX58SO2およびDX58OG)をリリースしたが、それはこのプラットフォームをハイエンド向けに継続するために必要なリフレッシュだと見ることができる。今回、比較に加えたのは、新しいCore i7-2600Kがどのくらいハイエンドに迫れるのかを見たいと思ったからだ。

ATXサイズのDP67BGマザーボード Marvell製の外付けチップを用いたeSATAやIEEE 1394、USB 3.0をサポートしたDP67BGのI/Oパネル部 DP67BG上のUSB 3.0ホストコントローラーチップ
Micro ATXフォームファクタを採用したDH67BLマザーボード 2系統のディスプレイ出力(DVI-IおよびHDMI)をサポートしたDH67BLのI/Oパネル部。eSATAはチップセット内蔵のSATAポートを利用する DH67BLのSATAポート。青い色のコネクタが6Gbpsをサポートする

【表2】比較に用いた3種類のプロセッサ
  Core i7-980X Core i7-870 Core i5-661
開発コード名 Gulftown Lynnfield Clarkdale
コア数/Hyper-Thread対応 6コア/あり 4コア/あり 2コア/あり
ベースクロック/Turbo Boost時最大 3.33GHz/3.60GHz 2.93GHz/3.60GHz 3.33GHz/3.60GHz
L3キャッシュサイズ 12MB 8MB 4MB
グラフィックス なし なし あり
TDP 130W 95W 87W
製造プロセズ 32nm 45nm 32nm/45nm(GPU)
ソケット LGA1366 LGA1156 LGA1156

 まず最初は、マザーボードにDP67BGを使い、外付けグラフィックスカードを使用した比較だ。比較対象は、デュアルコアプロセッサであるCore i5-661を除く2モデルに絞っている。メモリはLGA1366ソケットのCore i7-980XのみがDDR3-1066(2GB×3、トリプルチャネル)、ほかはすべてDDR3-1333(2GB×2、デュアルチャンネル)となっている。ただし、Core i7-980Xに用いたマザーボードは、上述したリフレッシュされたものではなく、SATAは3.0Gbps止まりだ。

 この4種の比較結果が表3だ。全体を通して、プロセッサの性能はCore i7-980X > Core i7-2600K > Core i7-870 > Core i5-2500Kの序列になっているように見受けられる。PCMarkVantageでSandy Bridgeの方が優位に立っている大きな理由は、HDDテストの影響だと思われる。Sandy Bridgeのプラットフォームが6Gbpsに対応していることが効いているようだ。

 FF XIVベンチは見事にGPUバウンド(ボトルネックがGPU)になっている。特にHighの設定ではどのCPUでもほぼスコアは変わらない。3DMarkのスコアと合わせて考えて、最新の3Dゲームを効率よく楽しむのであれば、CPUをメインストリームのCore i5に抑えてもグラフィックスカードに投資すべきであることがわかる。逆に、Core i7クラスのプロセッサを用いるのであれば、グラフィックスはSLIやCrossFireのような、複数枚利用を真剣に考える必要があるということのようだ。

 TMPGEnc 4.0 Expressによるテストは、約10分間のMPEG-2動画(1,440×1,080ドット、インターレース)をH.264(1,280×720ドット、プログレッシブ)に変換した際の所要時間を計測した。TMPGEnc 4.0 Expressは、Quick Sync Videoには対応しておらず、基本的にはCPUの性能に依存する。結果は上の序列通りで、意外な結果ではない。

【表3】外部グラフィックスを利用したベンチマークテストのスコア
プロセッサ Core i7-2600K Core i5-2500K Core i7-870 Core i7-980X
PCMarkVantage(32bit) PCMarks 17540 16194 13455 17404
Memories 11883 11861 9847 10821
TV and Movies 6613 5983 6010 6708
Gaming 20343 18030 15100 19907
Music 13752 14880 14074 17039
Communications 16587 16063 8564 17398
Productivity 21094 20989 15640 18707
HDD 37419 37553 26400 31516
PCMarkVantage(64bit) PCMarks 18836 18114 14722 18647
Memories 12561 12572 10484 11440
TV and Movies 6692 5957 6003 6795
Gaming 20190 21606 18591 18158
Music 18367 16753 15431 17534
Communications 18199 16692 10644 18203
Productivity 23812 23232 18218 21705
HDD 37488 37409 25804 31534
3DMarkVantage 3DMark SCORE P17583 P16580 P16145 P18093
GPU SCORE 16196 16239 15263 15800
CPU SCORE 23663 17694 19532 32052
3DMark 11 3DMark P4290 P4211 P4055 P4111
Graphics Score 3946 3932 3762 3734
Physics Score 8405 6827 6986 9081
Combined Score 3978 4040 3887 3865
Cinebench 11.5(32bit) OpenGL 81.29fpd 75.38fps 63.06fps 68.23fps
CPU 6.35pts 4.90pts 4.94pts 8.41pts
Cinebench 11.5(64bit) OpenGL 76.29fps 71.60fps 60.84fps 64.35fps
CPU 6.75pts 5.44pts 5.28pts 8.89pts
CrystalMark 2004R3 Mark 291275 287940 249781 277736
ALU 72216 72501 57398 63449
FPU 64522 63566 55363 58703
MEM 51186 48181 45622 60026
HDD 29588 29567 27106 27630
GDI 19020 19645 14657 15142
D2D 5434 5202 4581 4868
OGL 49309 49278 45054 47918
FF XIV Bench High 4346 4347 4275 4279
Low 6647 6429 5828 6690
TMPGEnc Express 4.0 8分16秒 10分19秒 9分57秒 6分49秒

 内蔵グラフィックスを用いたベンチマークのスコアをまとめたのが表4だ。グラフィックス関連テストのいずれも、Sandy BridgeはClarkdaleより格段に高いスコアを残している。ClarkdaleではFF XIVベンチを実行することさえできなかったのが、Sandy Bridgeではちゃんと実行できた。Sandy Bridgeの3Dグラフィックスがかなり進化している証拠だ。

 しかし、そのスコアもRadeon HD 6870を用いた場合と比べて見れば、格段に低い。Intelの内蔵グラフィックスは、確実に進歩は遂げているものの、最新の3Dゲームをプレイするには、まだまだ力不足であるのは明らかだ。このスコアでFF XIVを快適にプレイすることはできない。3DMark 11が実行さえできないのは、Sandy Bridgeのグラフィックス機能がDirectX 10.1対応であることに由来する。

【表4】内蔵グラフィックスを用いたベンチマークのスコア
プロセッサ Core i7-2600K Core i5-2500K Core i5-661
PCMarkVantage(32bit) PCMarks 16071 14783 11801
Memories 7676 7658 6061
TV and Movies 6647 6277 4902
Gaming 13465 10587 7860
Music 14161 12873 12980
Communications 15777 14236 13961
Productivity 20174 19641 14032
HDD 32500 32462 24934
PCMarkVantage(64bit) PCMarks 17219 15927 12837
Memories 8499 8330 6423
TV and Movies 6718 6387 4912
Gaming 15161 13257 8704
Music 12921 15832 13240
Communications 16481 17187 14840
Productivity 22632 21607 16011
HDD 32720 32797 24829
3DMarkVantage 3DMark SCORE P2158 P1720 P481
GPU SCORE 1657 1323 365
CPU SCORE 23206 17367 9929
3DMark 11 3DMark N/A N/A N/A
Graphics Score N/A N/A N/A
Physics Score N/A N/A N/A
Combined Score N/A N/A N/A
Cinebench 11.5(32bit) OpenGL 12.67fps 10.84fps 1.75fps
CPU 6.41pts 4.88pts 2.71pts
Cinebench 11.5(64bit) OpenGL 12.90fps 10.87fps 1.85fps
CPU 6.87pts 5.40pts 2.89pts
CrystalMark 2004R3 Mark 242094 235004 164292
ALU 74033 72378 42767
FPU 66121 61504 43021
MEM 48894 48328 31824
HDD 29401 29357 26348
GDI 18498 18476 15548
D2D 1763 1727 1961
OGL 3384 3234 2823
FF XIV Bench High 412 351 N/A
Low 833 694 N/A
TMPGEnc Express 4.0 8分7秒 10分21秒 17分18秒

ペガシスのTMPGEnc Video Mastering Works5は、Sandy BridgeのQuick Sync Video(画面上はIntel Media SDK Hardware)をサポートする

 では、ハイエンドでIntelの内蔵グラフィックスに利用価値がないのかというと、どうやらそうでもないらしい。表5は、本校執筆時点で体験版が公開されているペガシスのTMPGEnc Video Mastering Works5(VMW)を用いたエンコードテストの結果だ。VMWは、TMPGEnc Express 4.0の後継となる製品で、エンコーダーに定評あるx264に加えIntel Media SDK 2.0を使用したエンコーダーを採用する。Sandy Bridgeを用いたシステムでは、H.264エンコードにQuick Sync Videoを利用することが可能になる。表5には、その効果がハッキリと出ている。

 ここでは、表3/表4のTMPGEnc Express 4.0で用いたのと同じ約10分間の動画を、x264とIntel Media SDKを用いたエンコーダーで、H.264に変換してみた。x264でのエンコードは固定画質で行なうと、その仕上がりが330MB前後であったため、固定画質設定のないIntel Media SDKでも仕上がりのファイルサイズが同じくらいになるように設定してみた(VBR、平均4,500kbps)。結果として、ハードウェアエンコーダを使った際の効果は著しい。x264によるソフトウェアエンコードの2倍、Intelソフトウェアエンコーダ比では約10倍となる。もちろん、動画のエンコードは、エンコードの設定、ソース、用いるフィルタ、フレームレート変換の有無など、さまざまな要素に影響を受けるため、一律に何倍と言うことはできないが、うまく使うと相当な高速化が期待できるだろう。

 表5から分かるもう1つの事実は、Quick Sync Videoを利用するには、(少なくとも今のところ)内蔵グラフィックスを利用しなければならない、ということだ。外部グラフィックスを用いたDP67BGでは、ハードウェアエンコーダを選択することはできなかった。

【表5】TMPGEnc Video Mastering Works5体験版によるテストの結果
プロセッサ Core i7-2600K Core i5-2500K Core i7-870 Core i7-980X Core i7-2600K Core i5-2500K Core i5-661
マザーボード DP67BG DP67BG DP55KG DX58SO DH67BL DH67BL DH55TC
x264エンコーダ 9分47秒 7分47秒 8分26秒 6分07秒 6分40秒 8分36秒 14分29秒
Intel Media SDK Software 44分36秒 40分27秒 50分07秒 45分35秒 39分42秒 45分59秒 50分28秒
Intel Media SDK Hardware N/A N/A N/A N/A 4分31秒 4分36秒 N/A

DH67BLのVideo設定。デフォルトではEnable if Primaryに設定されており、外付けグラフィックスカードのインストールで内蔵グラフィックスが無効化されるが、Always Enableを選択することで内蔵と外付け、両方の同時使用が可能になる

 Quick Sync Videoが利用可能なSandy BridgeとDH67BLの組合せで1つ触れておく必要があるのは、この構成にグラフィックスカードを追加することで、内蔵グラフィックスと外付けグラフィックスカードによるマルチディスプレイが可能である、ということだ。これまでIntelの内蔵グラフィックスは、外付けグラフィックスカードを利用すると、自動的に無効になっていたが、Sandy Bridgeではそのような制約はない。Quick Sync Videoも、このマルチグラフィックス構成において、内蔵グラフィックスがプライマリに設定されていれば利用可能だった。

 今回のテストにおいて、Quick Sync Videoによるエンコード時間は、Core i5とCore i7でほとんど変わらなかった。ということは、より安価なCore i3でもQuick Sync Videoの性能は同等である可能性が高い。これまで動画のエンコードというと、高価なマルチコアプロセッサの独壇場だったが、Sandy Bridgeの登場で、安価なCore i3プロセッサでもそれなりに楽しめるものになるかもしれない。ちなみに、さらに下位のPentiumブランドのSandy Bridgeでは、Quick Sync Videoはサポートされないことになっている。人によっては、これはPentiumに代えてCore i3を選ぶ決定的な差となるだろう。ペガシスによるVMW製品版のリリースもとても楽しみだ。

 この1月にリリースされるSandy Bridgeは、従来は内蔵グラフィックスを持たなかったCore i7にグラフィックス機能をもたらすと同時に、Core i5のクアッドコア化も推進する。現時点で分かっている範囲では、低消費電力向けの1品種を除き、Core i5プロセッサはクアッドコア化される。つまりクアッドコア+Hyper-Threadingで同時8スレッド処理のCore i7、クアッドコアで同時4スレッド処理のCore i5、デュアルコア+Hyper-Threadingで同時4スレッド処理のCore i3というのが、Sandy Bridgeによる第2世代Core iプロセッサの切り分けとなり、ある意味とても分かりやすい。Core iプロセッサ、イコール同時4スレッド処理以上、という図式だ。

 プラットフォームでは、USB 3.0対応が間に合わなかったのは残念だが、ファームウェアのUEFI化、6Gbps SATAへの対応など、こちらも着実な前進が見られる。外付けUSB 3.0を含め、増大する帯域ニーズに応えるために、DMIを拡張した点も見逃せない。2011年におけるIntelの主力として、大いに期待できそうだ。