笠原一輝のユビキタス情報局

Huron Riverことモバイル向け第2世代Coreプロセッサ
~その性能をベンチマークでテスト



 Intelが開発コードネーム「Sandy Bridge」(サンディブリッジ)こと第2世代Coreプロセッサ・ファミリーをまもなく投入する。ここ数年ではもはや定例ともなっている通り、International CES(今回は米国時間1月6日より開幕)において発表されることになるだろう。

 本記事では主にノートPC向けのプラットフォームとなる「Huron River」(ヒューロンリバー、開発コードネーム)の詳細と、ベンチマーク結果に迫っていきたいと思う。

●大幅な機能強化が図られているノートPC向けのSandy Bridge

 IntelはSandy Bridgeのプラットフォームとして、デスクトップPC向けの「Suger Bay」(シュガーベイ、開発コードネーム)とHuron Riverの2つを用意。今回この記事で取り上げるのはHuron Riverで、プロセッサのSandy Bridgeのほか、チップセットの「Couger Point」、無線モジュールの「Rainbow Peak」などから構成されている。

 もちろん、その中で重要な要素を占めるのがCPUだが、ノートブックPC向けには2つのダイが存在する。コードネーム上では、「Sandy Bridge-QC」、「Sandy Bridge-DC」となっており、前者がクアッドコア、後者がデュアルコアとなる。細かな仕様は表1のようになっている。

【表1】Sandy Bridge-QCとSandy Bridge-DCの仕様
 第2世代Coreプロセッサ・ファミリー2010 Coreプロセッサ・ファミリー
ダイ開発コードネームSandy Bridge-QCSandy Bridge-DCClarksfieldArrandale
プロセッサコアコア数4242
L1キャッシュ(各コア、命令+データ)64KB(32KB+32KB)64KB(32KB+32KB)64KB(32KB+32KB)64KB(32KB+32KB)
L2キャッシュ(各コア)256KB256KB256KB256KB
L3キャッシュ8MB4MB8MB4MB
AVX対応--
メモリコントローラ(対応メモリ、最高クロック)デュアル(DDR3-1333)デュアル(DDR3-1333)デュアル(DDR3-1333)デュアル(DDR3-1333)
Turbo Boost Technology2.02.01.01.0
プロセスルール32nm32nm45nm32nm
グラフィックスコアコアIntel HD Graphics 3000Intel HD Graphics 3000-Intel HD Graphics
EU数1212-12
ハードウェアエンコーダ--
DX世代10.110.1-10
プロセッサダイへの統合(プロセスルール)オンダイ(32nm)オンダイ(32nm)-オフダイ(45nm)
TDP45/35W35/25/17W45/35W35/25/17W

 前世代となる2010 Coreプロセッサ・ファミリー(開発コードネームはクアッドコアがClarksfield、デュアルコアがArrandale)と比較すると、大きな強化点は以下のようになる。

(1) 従来は別ダイだったGPUコアがプロセッサコアに統合された
(2) プロセッサコアの内部アーキテクチャも改良され、効率が改善した
(3) 256bit幅でベクター演算が可能なAVX命令セットに新たに対応した
(4) Turbo Boost Technologyが進化して、バージョン2.0になった

【図1】第2世代Coreプロセッサ・ファミリー(Sandy Bridge)と2010 Coreプロセッサ・ファミリー(Clarksfield、Arrandale)の比較

 中でも最大の強化点は、従来製品ではクアッドコアでは非搭載で、デュアルコアでは別ダイで同一基板上にMCM(Multi Chip Module)の形で実装されていたGPUコアが、オンダイ(つまり1チップとして実装される)になったことだ。

 オンダイになったメリットは、従来は45nmプロセスルールという1世代前のプロセスルールだったGPUも、32nmの最新プロセスルールで製造されることになり、周波数を上げたり、縮小で空いたスペースを使って機能を増やすことが可能になったことだ(GPUの詳しい機能に関しては後述)。

 CPUのマイクロアーキテクチャにも手が入っており、演算器の改良などにより、同じ周波数であっても命令の実行効率などが高まっており、処理能力が向上している。さらに、従来製品ではSSE命令を利用したベクトル演算は128bit単位で行なわれていたが、新しいAVX命令セットを利用すると、256bit単位で一度に演算できるためベクトル演算時の効率が改善されることになる。ただし、アプリケーション側が明示的にAVX命令を使わない限りは、まったく効果がない。また、OSもWindows 7のService Pack 1が必要となる。

 次に大きな強化点がTurbo Boost Technologyが進化してバージョン2.0になったことだ。従来のTurbo Boostでは、動作中の消費電力が規定値を下回っている場合のみ、クロック周波数を規定以上に引き上げることができた。

 Turbo Boost 2.0では、これに温度の概念が追加された。TDPは、製品毎に決められた最大電力枠。この枠を超えて電力を消費させると、熱暴走しプロセッサが正しく動作しなくなるという意味の数字だ。しかし、電力がTDPに達しても、すぐにプロセッサが熱暴走するわけではない。その仕組みを利用して、温度に余裕がある間は、TDPよりを超えた電力レベルにまで周波数を引き上げるのだ。

 これにより、短時間ではあるが、周波数を従来製品よりのTurbo Boostよりさらに引き上げることができる。エンコードなどの長時間プロセッサに負荷をかけるようなアプリケーションではわずかしか効果がないが、アプリケーションの起動時などに効果があり、体感速度が向上することになる。

【図2】Intel Turbo Boost 2.0の仕組み

●大きく進化した内蔵GPU

 内蔵GPUの基本的アーキテクチャは、前世代に内蔵されていたIntel HD Graphicsの進化版という位置づけになるが、内部構造にも手が入れられており、従来製品に比べて1.5倍の効率改善が図られているという。

 そのポイントは2つで、1つ目は、実行ユニット(EU)の数に関しては、従来製品と同じ12個だが、プロセッサと同じ32nmプロセスルールになったことで、周波数が引き上げられた。

 もう1つは、ビデオエンコードエンジン(Intel Quick Sync Video)を内蔵したことだ。従来製品のIntel HD Graphicsではビデオのデコードはハードウェアエンジンを内蔵していたが、エンコードはCPUで処理していた。これがSandy Bridgeでは、エンコードもハードウェアを内蔵させた。

 ただし、このQuick Sync Videoは固定機能であり、デコードはMPEG-2、MPEG-4 AVC、VC1(最大1080i/p)、エンコードはMPEG-2、MPEG-4 AVC(最大1080i/p)というように、対応フォーマットが限定される。このため、規定されていない形式、例えばDivXに変換したいといった場合は、やはりCPUで処理することになる。

 【お詫びと訂正】初出時に、両方デコードと記述しておりました。お詫びして訂正いたします。

 なお、演算性能は大幅に向上したが、対応するDirect3D(DirectX)のAPIは、Direct3D 10.1(いわゆるDirectX 10.1)までとなり、Direct3D 11には対応していない。Direct3D 11対応ゲームを前提としているなら、NVIDIAやAMDの単体GPUを搭載したノートPCを選択することになる。ちなみに、NVIDIAもAMDも、Sandy Bridgeの内蔵GPUとの切り換え機能に対応する予定だ。

 なお、現時点でIntelはDirect3D 11への対応予定を明らかにしていないが、OEMメーカー筋の情報によれば、Sandy Bridgeの後継製品となる「Ivy Bridge」(アイビーブリッジ)で対応する予定だと言うことだ。

●SATA 3.0への対応とDMIの倍速化が大きな強化点となるIntel 6シリーズ

 チップセットは、2010年Coreプロセッサ・ファミリー用のIntel 5 Series Chipset(開発コードネームIbexpeak)の後継となる、Intel 6 Series Chipset(開発コードネームCouger Point)が導入される。ノートPC向けのIntel 6 Series Chipsetは以下のようなSKU構成となっている。

【表2】ノートPC向けのIntel 6 Series Chipset
 HM67UM67HM65QM67QS67
小型パッケージ----
TDP3.9W3.4W3.9W3.9W3.4W
内蔵GPU対応
vPro対応---
Intel AT対応
RAIDRAID 0/1/5/10AHCIAHCIRAID 0/1/5/10RAID 0/1/5/10
USB 2.01414121414
SATA(うち6Gbps)6(2)6(2)6(2)6(2)6(2)
PCI Express(CS側)88688
PCI---

 従来製品との違いで目につくのは、単体型GPUを利用することを前提としたPM67などのSKUが無いことだろう。これは、Sandy Bridge世代では、すべての製品が内蔵GPUを持っていることになり、単体型GPUだけのノートPCという存在がないことを反映しているからだろう。ただし、単体型GPUがCPU内蔵GPUと切り換えできないデスクトップPCではP67が存在している。

 機能としては、Ibexpeakと大きな違いはなく、大きな機能強化に相当するのは、6つあるSATAのポートの内、2つがSATA 3.0で規定されている6Gbpsの高速データ転送に対応していること。USB 3.0については未対応で、次世代での課題として残されている。これ以外では、CPUとの接続バスであるDMIの帯域幅が従来製品の倍となった。

 細かな点では、前世代ではvPro用SKU(QM57、QS57)だけ対応していたIntel AT(Anti-Theft)が、Intel 6 Series ChipsetではすべてのSKUで対応となった。同機能を使うと、Absolute Softwareなどが提供しているリモートワイプ(遠隔地からのデータ消去)や、盗難後の現在地確認などを利用できる。すでにAbsolute Softwareは、米国でコンシューマ向けのサービス提供を計画していることを明らかにしており、今後スマートフォンなどと同じようにノートPCにもリモートワイプの機能などが標準サービスとなっていく可能性を秘めている。

 Huron Riverのもう1つのコンポーネントである無線モジュールだが、今世代で新規に追加されるのは、開発コードネーム「Rainbow Peak」で知られるBluetoothとのコンボモジュール、同じく「Kelsey Peak」で知られるWiMAXの廉価版モジュール、さらに「Conder Peak」で知られる1x2の無線LAN廉価版モジュールなどとなっている。上位に位置付けられる3x3のIntel Centrino Ultimate-N 6300(Puma Peak)、2x2でWiMAXのIntel Centrino Advanced-N+WiMAX 6250(Kilmer Peak)などは前世代のものが継続販売となる。

【表3】Huron River世代の無線LANモジュール(ピンクが新製品、緑は継続)
製品名(開発コードネーム)IEEE 802.11アンテナWiMAXBluetooth
Intel Centrino Ultimate-N 6300(Puma Peak)a/n3x3--
Intel Centrino Advanced-N+WiMAX 6250(Kilmer Peak)a/n2x2-
Intel Centrino Advanced-N 6230(Rainbow Peak)a/n2X2-
Intel Centrino Advanced-N 6205(Taylor Peak)a/n2x2--
Intel Centrino Advanced-N 6200(Puma Peak)a/n2X2--
Intel Centrino Wireless-N+WiMAX 6150(Kelsey Peak)n1x2-
Intel Centrino Wireless-N 1030(Rainbow Peak)n1X2-
Intel Centrino Wireless-N 1000(Conder Peak)n1X2--

●テストによっては前世代に比べて10倍近くの性能向上

 それでは実際の製品を利用してHuron Riverの性能に迫っていきたい。今回、用意したのは、ODMメーカーのCOMPALが製造するシステムで、マザーボードにはIntelのリファレンスマザーボード「NAR00 LA-6211P」が採用されている。

 プロセッサはクアッドコアのCore i7-2820QM。ベースクロックは2.3GHzでTurbo Boost時のクロックはシングルコア時には最高3.4GHz、デュアルコア時には3.3GHz、クアッドコア時には3.1GHzとなっている。チップセットはIntel HM67 Express、液晶パネルは17型の1,600×900ドットで、メモリは4GB(DDR3-1333、デュアルチャネル)などのスペックとなっている。

 比較対象として用意したのは、前世代のCalpellaベースとなる「ThinkPad T410s」だ。CPUはCore i5-540M(ベース2.4GHz)で、GPUはIntel HD GraphicsとNVIDIA NVS 3100M(16CUDAコア、512MB)を搭載する。

 Calpella世代には、内蔵GPUを持ったクアッドコアプロセッサが存在していないので、こうした変則的な選択になっている。そのため、プロセッサの性能を直接比較することはできないので、内蔵されているGPUがどれだけの性能を秘めているかを中心にチェックしていくことにした。Calpella搭載システムでは、3D関連のテストについてはNVIDIAの設定ツールを利用して、どちらかに固定してテストしている。テスト結果はグラフ1~5までの通りだ。

テストに利用したHuron RiverのリファレンスデザインのノートPC。ODMメーカーのCOMPAL製だが、タッチパッドのボタンにはなぜかPackard Bellの文字もCPU-ZによるCore i7-2820QMの詳細

【表4】テスト機材のスペック
 CalpellaHuron River
ノートブックLenovo ThinkPad T410sCOMPAL リファレンスデザイン
CPUCore i5-M540Core i7-2820QM
GPUIntel HD Graphics/NVS 3100MIntel HD Graphics 3000
メモリ4GB(DDR3-1333/デュアルチャネル)
SSDSamusng 128GB(MLC)Intel 160GB(MLC)
OSWindows 7 Ultimate

 グラフ1、グラフ2はPCMark05、PCMark Vantageの結果だ。Huron Riverはクアッドコア、Calpellaはデュアルコアという違いがあるため、CPUの処理能力などは参考程度にとどめていただきたいが、注目したいのはいずれのテストでもメモリ関連の項目の結果が改善されていることだ。

 Core i5-540Mのメモリコントローラは、GPUとともに別ダイになっており、メモリコントローラがオンダイになっているCore i7-2820QMに比べてメモリレイテンシが長くなっている。この点からメモリ関連の数値が改善していると考えることができる。

 数ある項目の中で大幅に数字が改善しているのは、グラフィックス関連の結果だろう。他の結果がせいぜい数割といったところであるのに対して、グラフィックスの数字は2倍以上という結果になっている。

【グラフ1】PCMark05
【グラフ2】PCMark Vantage

 グラフ3、グラフ4は3DMark06(Direct3D 9)、3DMark Vantage(Direct3D 10)。ここでは、Calpellaの環境では、NVS 3100M(GeForce 210M相当)での結果も合わせて掲載している。

 Intel HD Graphics 3000は、Direct3D 9世代の3DMark06ではCalpella世代のIntel HD Graphicsに比べて3倍近い描画性能を発揮しているだけでなく、ローエンドに属するとはいえ単体GPUであるNVS 3100Mに比べても1.5倍前後の描画性能を発揮している。さらに、Direct3D 10世代の3DMark VantageではCalpellaに比べて6倍近く、NVS 3100Mに比べても2倍弱という描画性能を発揮している。

【グラフ3】3DMark06
【グラフ4】3DMark Vantage

 グラフ5のCineBench R11.5でも同様の結果で、GPUの描画性能を計測するOpenGLテストでは、Calpellaの8.6倍、NVS 3100Mの1.42倍の性能を発揮している。

【グラフ5】CineBench R11.5

●内蔵GPUを選べるようになったクアッドコアノートPCの存在の大きさ

 ベンチマークの結果を見てわかるとおり、Huron Riverの最大の特徴と言える内蔵GPUの性能強化は、目を見張るものがある。

 特に、NVS 3100Mを上回ったというのは、なかなか衝撃的な結果だと言っていいだろう。NVS 3100Mは現行でローエンドな単体GPUであることは事実だが、Huron Riverは、現行のローエンドの単体GPUは十分に食ってしまう性能を実現しており、現行のローエンド単体GPUの存在意義をなくしかねない。

 もう1つ指摘しておきたいのは、Huron RiverではクアッドコアCPUでも、内蔵GPUだけあるいは内蔵GPU+単体GPUのスイッチャブルグラフィックス構成も可能になる点。

 内蔵GPUは総じて単体GPUよりも平均消費電力が低いため、バッテリ駆動時間を伸ばすことができる。これまで、高性能が欲しいが、同時にバッテリ駆動時間の短さが気になってクアッドコアプロセッサを選択することができなかったというユーザーでも、今後、両者を両立できるようになったことは、大きな意味があると言えるだろう。

バックナンバー

(2011年 1月 3日)

[Text by 笠原 一輝]