■多和田新也のニューアイテム診断室■
AMDは4月29日から、デスクトップPC向けの6コアCPU「Phenom II X6」シリーズを発売する。デスクトップPC向けの6コアCPUといえばCore i7-980XをIntelが発表したのが記憶に新しいが、Phenom II X6は低コスト6コアCPUを強くアピールしている点で興味深い存在となっている。この上位モデルとなる「Phenom II X6 1090T」のパフォーマンスをチェックしてみたい。
●自動オーバークロック技術の「Turbo CORE」も搭載AMDはサーバー/ワークステーション向けに、2009年6月のCOMPUTEX TAIPEIのタイミングで「Istanbul」コアの6コアOpteronを発表済みであるほか、8コア/12コアについても先月、「Magny-Cours」コアのOpteronを発表している。
今回発表されたのは、「Thuban」コアを採用しデスクトップPC向け6コアCPUとなるPhenom II X6だ。45nmプロセスで製造され、ダイサイズは346平方mmとされている。
その主なスペックは表1にまとめたとおり。コア当たりのキャッシュ容量(L1データが64KB、L2が512KB)、全コア共有のL3キャッシュの容量はDenebコアのPhenom II X4と同じ。動作クロックは上位モデルのPhenom II X6 1090Tが3.2GHz、下位モデルのPhenom II X6 1055Tが2.8GHzとなる。今回テストするのは、上位モデルのPhenom II X6 1090Tである(写真1、画面1)。
Phenom II X6 1090T | Phenom II X6 1055T | |
OPN | HDT90ZFBK6DGR | HDT55TFBK6DGR |
動作クロック (Turbo CORE時) | 3.2GHz(3.6GHz) | 2.8GHz(3.3GHz) |
L1データキャッシュ | 64KB×6 | ← |
L2キャッシュ | 512KB×6 | ← |
L3キャッシュ | 6MB | ← |
HT Linkクロック | 2.0GHz | ← |
TDP(最大) | 125W | ← |
【写真1】Phenom II X6 1090T。OPNのモデルナンバーを示す4桁のセグメントは「T90Z」という表記になっている | 【画面1】Phenom II X6 1090TにおけるCPU-Zの結果 |
クロックについては、表中に「Turbo CORE」時のクロックも掲載した。このTurbo COREは、Phenom II X6で初めて採用されたテクノロジで、言ってみれば、AMD版Turbo Boostとも呼べるものだ。つまり、負荷がかかっているコアが少数に集中している場合、非稼働コアをのクロックを下げ、TDPの枠内で稼働コアのクロックを自動的に上昇させるものである。
CPUのモデルナンバー末尾に“T”と付いていることが、Turbo COREに対応していることを示している。現在はPhenom II X6の2製品のみの対応となっているが、クアッドコア製品のリリースも予定されている。その場合は、Phenom II X4 9xxTといったモデルナンバーになるのだろう。
ちなみに、このTurbo COREは、3コア単位でクロックのアップ/ダウンが行なわれる点でTurbo Boostとは異なるものとなっている(図1、2)。クアッドコア製品の場合は2コア単位になるという。
【図1】Phenom II X6で採用されたTurbo COREは、3コアの動作クロックを引き上げることで、少ないスレッド数のときにも高い性能を出すようにするもの | 【図2】Turbo COREの動作の仕組み。特定のコアがCool'n'Quietによる低クロック動作やCステートへ入った場合に、アクティブな3コアをブーストステートへ引き上げる |
【画面2】AMDがデモで示したもの。SILKYPIXのRaw現像を3コアで行なっているところで、3つのコアが3.3~3.4GHz、非稼働のコアが2GHz弱で動作している |
AMDが行ったの3コア動作デモでは3コアが高クロック、3コアが低クロックという状態が安定して維持されていた(画面2)。低クロックコアはCool'n'Quietによって2GHz前後に落ちている状態だ。
このTurbo COREの挙動について、CineBench R11.5のスレッドを切り替えることで試してみた。まず、6コアフルロード時の結果が画面3である。これは定格どおりの3.2GHzで全コアが動作している。次に、AMDのデモのようなシチュエーションを作り上げるため、CineBench R11.5のスレッド数を3にし、タスクマネージャーを使ってCineBench R11.5のCPU割り当てを3つのコアに限定して動作させてみた結果が画面4である。こちらの結果は、3つのコアが3.6GHz動作となり、残り3つのコアが2GHz前後となっている。
しかし、タスクマネージャで使用するCPUコアを割り当てるという作業は少々イレギュラーなので、もっとシンプルにCineBench R11.5を1スレッド動作とし、タスクマネージャーは何も触らずに全コア動作させるテストも実施した。その結果は、プロセスがどのCPUに割り当てられるかが常時切り替わるために、画面5のように稼働コアが3.6GHzになることもあれば、画面6のように、あるコアの負荷が高まっているのにクロックの立ち上がりが間に合っていないようなケースも発生する。
さらに、画面6からは3コア単位でPステートが動いていないことを見てとれる。もちろん、ツールがクロックを取得するタイミングと、実際のCPU動作のタイムラグという可能性はある。それでも、最大3コアをターボモードに移行することができたということは確かとはいえ、AMDがいうように何もかもが3コア単位で動くわけではなく、実際にはもう少し柔軟な動きをしているように見受けられた。
ちなみに、ここで示した画面はAMD Over Drive 3.2.1のものである。このAMD Over Drive 3.2.1は、Phenom II X6と同時にリリースされる予定になっている。Phenom II X6 1090Tは、これまでのBlack Editionと同じく、倍率ロックフリーのCPUであり、オーバークロックユーザーに向けてもアピールしている。
さて、このPhenom II X6リリースのタイミングで、チップセットも拡充される。先月発売されたAMD 890GXに続き、AMD 8シリーズチップセットのラインナップが広がるのだ。具体的にはグラフィック非統合型のAMD 890FX、AMD 870、そして、グラフィック統合型チップセットでは、AMD 890GXの下位モデルとなるAMD 880Gがラインナップされる。
AMD 8シリーズに関しては別途テストを行なうことにしており、詳しくは記事を改めたい。ここでは、今回使用するAMD 890FXについてのみ簡単に紹介しておく。
AMD 890FXはAMD 790FXの後継となるチップセットで、PCI Express x16×2、PCI Express x8×4のコンフィグレーションによるCrossFireが可能なチップセットだ(図3)。
AMD 790FXとの主な違いはサウスブリッジ間インターフェイスがPCI Express 2.0ベースで、双方向合わせて4GB/secの帯域幅を持つ「ALink Express III」を採用したこと。サウスブリッジもALink Express IIIに対応するSB850となる。また、仮想化環境において、デバイスのI/O処理で使われる仮想メモリアドレスと物理メモリアドレスの変換をハードウェア処理するIOMMUをサポートしたのも大きな変更点といえる。
今回のテストで使用するのは、AMD 890FX+SB850を搭載するASUSTeKの「Crosshair IV Formula」である(写真2)。BIOSバージョンはテスト時点の最新ドライバとしてASUSTeKから提供されたバージョン0602である(画面7)。
ただ、このBIOSバージョン0602については、AMDから、情報解禁前日に「パフォーマンスの低下が見られる」という情報が届いている。そのため、Phenom II X6 1090T本来の性能を引き出せていない可能性がある。次回予定しているAMD8シリーズのテストにおいて、より新しいBIOS(もしくはパフォーマンス低下がないという古いバージョン)のドライバを用いたテスト結果も併せて紹介するので、ご了承いただきたい。
【図3】AMD 890FX+SB850のブロックダイヤグラム。SATA 6Gbps対応のSB850をALink Express IIIで接続する。AMD 790FXの特徴を引き継ぎつつ、AMD 8世代へ進化したものとなる |
●6コアPhenom IIの性能をチェックする
【写真3】価格はかなり違いがあるが、6コア環境として比較の対象とした、Core i7-980X+Intel DX58SO環境 |
それではベンチマーク結果の紹介に移りたい。テスト環境は表2に示したとおり。ここでは比較対象として、Phenom II X4の最上位モデルとなるPhenom II 965 Black Edition(以下、Black EditionをBEと表記)、6コア製品のCore i7-980Xを用意した。Core i7-980XはAMD、Intel両社の6コア製品という点で比較対象に加えたが、価格が倍以上も異なる点には留意したい。
CPU | Phenom II X6 1090T Phenom II X4 965 Black Edition | Core i7-980X |
チップセット | AMD 890FX+SB850 | Intel X58 Express+ICH10R |
マザーボード | ASUSTeK Crosshair IV Formula | Intel DX58SO |
メモリ | DDR3-1333(2GB×2/9-9-9-24) | DDR3-1333(1GB×3/9-9-9-24) |
グラフィックス機能 (ドライバ) | Radeon HD 5870 (CATALYST 10.3) | |
ストレージ | Seagete Barracuda 7200.12(ST3500418AS) | |
電源 | KEIAN KT-1200GTS | |
OS | Windows 7 Ultimate x64 |
では順に結果を紹介していきたい。まずはCPUベンチマークの結果として、Sandra 2010 SP1dのProcessor Arithmetic/Processor Multi-Media Benchmark(グラフ1)、PassMark Performance Test 7のCPU Test(グラフ2)、PCMark05のCPU Test(グラフ3~4)の結果から見ていく。
Phenom II X6とX4の比較において、安定してPhenom II X6が良い結果を残す傾向にあるが、これはCPUベンチマークがマルチコアへの最適化が進んでいることも理由に挙げられるだろう。Core i7-980XとPhenom II X6 1090Tの差は、大きいところで4倍近くもCore i7-980Xが上回っている部分もあるが、PassMarkの浮動小数点演算では逆にPhenom II X6 1090Tが上回る結果となっており、テストプログラムによって差はばらつく。
Phenom II X6とX4の差で面白い結果となったのが、PCMark05である。PCMark05では、シングルタスク、2タスク同時実行、4タスク同時実行のテストが実行される。グラフ3およびグラフ4上部の2タスク同時実行ではPhenom II X6 1090Tが高速な傾向にあり、逆に4タスク同時実行ではPhenom II X4 965 BEのほうが高速な傾向になる。
この理由は明白で、2タスク同時実行であれば3コア未満への負荷集中となるのでTurbo COREが稼働するからだ。4タスク同時実行では3コアを超えて負荷がかかるので定格クロックになる。Phenom II X6 1090TのTurbo CORE時は最大3.6GHzなので、3.4GHz動作のPhenom II X4 965 BEを上回るが、定格クロックは3.2GHzと低い。そのクロック差が結果につながったということになる。
つまり、Phenom II X6 1090Tは、Turbo COREが動くシーンであればPhenom II X4 965 BEを超える結果が出せる。しかし、4コアあれば十分なケースにおいては定格クロックの低さがネックとなる。そして、5コアをフルに稼働させるようなマルチコアへの最適化が行なわれていれば6コアCPUの良さが出る、といった性格があることが分かる。
【グラフ1】Sandra 2010 SP1d (Processor Arithmetic/Multi-Media Benchmark) |
【グラフ2】PassMark Performance Test 7(CPU Test) |
【グラフ3】PCMark05 Build 1.2.0(CPU Test-シングルタスク) |
【グラフ4】PCMark05 Build 1.2.0(CPU Test-マルチタスク) |
次にメモリ周りの性能をチェックしておきたい。テストは、Sandra 2010cのCache & Memory Benchmark(グラフ5)と、PCMark05のMemory Latency Test(グラフ6)、Sandra 2010cのMemory Latency Benchmark(表3)である。
ここで気になるのはメインメモリのアクセス速度で、Sandraのメモリアクセス速度の結果ではPhenom II X6 1090TがPhenom X4 965 BEを、多少ながら上回る傾向が出ているほか、PCMark05のメモリレイテンシも良好な結果が出ている。Sandraのメモリレイテンシの差はそれほど大きくないものの、ほか2つの結果は誤差というにはやや大きな印象を受けるところがあり、メモリコントローラに多少の改良が加えられている可能性もありそうである。
【グラフ5】Sandra 2010 SP1d(Cache & Memory Benchmark) |
【グラフ6】PCMark05 Build 1.2.0(Memory Latancy Test) |
Random Access | Core i7-980X | Phenom II X4 965BE | Phenom II X6 1090T |
1kB | 1.3ns/4.1clocks | 0.9ns/3.0clocks | 0.9ns/2.8clocks |
4kB | 1.3ns/4.1clocks | 0.9ns/3.0clocks | 0.9ns/2.8clocks |
16kB | 1.3ns/4.1clocks | 0.9ns/3.0clocks | 0.9ns/2.8clocks |
64kB | 3.2ns/10.2clocks | 0.9ns/3.0clocks | 0.9ns/2.8clocks |
256kB | 4.6ns/14.8clocks | 4.6ns/15.6clocks | 4.5ns/14.6clocks |
1MB | 17.5ns/56.0clocks | 16.9ns/57.6clocks | 17.4ns/55.7clocks |
4MB | 19.7ns/63.0clocks | 24.2ns/82.5clocks | 23.1ns/74.1clocks |
16MB | 66.0ns/211.1clocks | 77.3ns/263.7clocks | 77.4ns/248.5clocks |
64MB | 79.1ns/253.0clocks | 82.6ns/281.7clocks | 83.0ns/266.5clocks |
Linear Access | Core i7-980X | Phenom II X4 965BE | Phenom II X6 1090T |
1kB | 1.3ns/4.1clocks | 0.9ns/3.0clocks | 0.9ns/2.8clocks |
4kB | 1.3ns/4.1clocks | 0.9ns/3.0clocks | 0.9ns/2.8clocks |
16kB | 1.3ns/4.1clocks | 0.9ns/3.0clocks | 0.9ns/2.8clocks |
64kB | 3.2ns/10.2clocks | 0.9ns/3.0clocks | 0.9ns/2.8clocks |
256kB | 3.3ns/10.4clocks | 2.7ns/9.3clocks | 2.7ns/8.7clocks |
1MB | 3.9ns/12.5clocks | 6.7ns/23.0clocks | 7.6ns/24.4clocks |
4MB | 3.9ns/12.6clocks | 6.9ns/23.5clocks | 7.8ns/25.0clocks |
16MB | 7.0ns/22.4clocks | 13.5ns/46.0clocks | 13.6ns/43.7clocks |
64MB | 8.2ns/26.4clocks | 13.5ns/46.0clocks | 13.6ns/43.7clocks |
続いては、実際のアプリケーションを使ったテストである。テストはSYSmark 2007 Preview(グラフ7)、PCMark Vantage(グラフ8)、CineBench R10(グラフ9)、CineBench R11.5(グラフ10)、POV-Ray(グラフ11)、ProShow Gold(グラフ12)、TMPGEnc 4.0 XPressによる動画エンコード(グラフ13、14)を実施している。
ProShow Goldについて補足であるが、これまでは本コラムでの初出時に説明した25枚のJPEGファイルで2分30秒のスライドショーを作成する時間を測定してきたが、今回より50枚、5分のスライドショー作成へと変更した。出力ファイルは1,920×1,080ドットのMPEG-2ファイルである。
もう1つ、動画エンコードについては、今日におけるコーデックの普及具合を考慮して、今回よりDivXエンコードの測定を取りやめている。
このほか、PCMark VantageのCore i7-980Xの結果が一部欠けているのは、OverallテストおよびGamingテストのみ、途中でハングアップする現象に見舞われたからである。
さて、肝心の結果であるが、大局的にはPhenom II X6 1090TがPhenom II X4 965 BEを上回るといって差し支えないレベルにあるかと思う。マルチスレッド動作が効くシーンはもとより、シングルスレッドのテストでもTurbo COREの効果が出ている。
しかし、定格クロックの低さが徒となってPhenom II X4 965 BEを下回るシーンが多いのも事実だ。WMV9のエンコード結果が奮わないのは、3コアCPUや4コア+HTの8スレッド動作の際に見られたような、2コア、4コアといった一般的なコア数でない場合に性能が伸び悩むものと見られるので、ほかの結果とは違う理由と考えている。
しかし、SYSmark2007、PCMark Vantageあたりで伸び悩んだのは、CPUベンチマークのときにも見て取れたような、Phenom II X6にとって中途半端なスレッド数になってしまったからではないかと考えている。複数のアプリケーションが起動するベンチマークとはいえ、アプリケーションによっては、これでも4コアないしは5コア程度で十分な状況、つまりPhenom II X6にとっては、Phenom II X4よりも低いクロックで動作するが6コアの威力が引き出せない状況、になってしまったのではないだろうか。
コア数とクロックがトレードオフなのは、先のCPUベンチマークの結果でも指摘したとおりだ。もちろん、クアッドコア時代に最適化されたベンチマークソフトゆえに、こうした事態が起こりやすかったという可能性もあることは否定できない。
Turbo COREによって少ないスレッド数のテストでPhenom II X4を上回る結果を見せているのは事実であり、コア数とクロックのトレードオフを、新しいテクノロジを使って最小限に抑えているというのはPhenom II X6の重要なポイントといえるだろう。
次に3Dベンチマークの結果である。テストは3DMark VantageのCPU Test(グラフ15)、3DMark VantageのGraphics Test(グラフ16)、BIOHAZARD 5 ベンチマーク(グラフ17)、Crysis Warhead(グラフ18)、FarCry 2(グラフ19)だ。
この結果は、Phenom II環境がCore i7-980Xを上回るシーンを見られる。傾向としては、CPUの依存度が高い、3DMark VantageのCPUテストやバイオハザード5ベンチマーク、各テストの低負荷条件ではCore i7-980XのCPU性能が発揮されている。
一方で、GPUへの依存が強まる高解像度のシチュエーションでは、Phenom II環境が良好な結果を示す傾向にある。つまり、プラットフォームレベルでは、Core i7-980Xのテスト環境よりもGPUの性能をより引き出せているということになる。
【グラフ15】3DMark Vantage Build 1.0.2 (CPU Test) |
【グラフ16】3DMark Vantage Build 1.0.2 (Graphics Test) |
【グラフ17】BIOHAZARD 5 ベンチマーク |
【グラフ18】Crysis Warhead(Patch 1.1) |
【グラフ19】Far Cry 2(Patch 1.03) |
最後に消費電力の測定結果である(グラフ20)。Phenom II X6 1090TはPhenom II X4 965 BEよりも多少ながら電力を多めに消費する傾向が見てとれる。これはアイドル時も同様であり、単純にコア数の増加が生んだ消費電力増と見ていいだろう。ただ、125WというTDPの枠は同じだが、ピーク時の消費電力差は5W程度と非常に小さい。よほどぎりぎりの環境でもなければ、Phenom II X4 965 BEから移行できそうである。
また、Core i7-980Xに比べて、低い消費電力に抑えられている。性能差を考えると、Core i7-980Xの消費電力はよく抑えられているほうだとは思うが、Phenom II X6とCore i7-980Xの製品の違いを示す1つの指標として気に留めておきたい。
【グラフ20】システムの消費電力 |
●Turbo COREが生命線になっているPhenom II X6
以上のとおり結果を見てくると、一部には伸び悩んだテスト結果もあるものの、概ねPhenom II X4 965 BEを上回る傾向を見て取ることができる。この性能を出す上で、重要な意味を持っているのがTurbo COREであるのは言うまでもないだろう。
先述したとおり、6コアへとコア数が増えた一方で、定格動作クロックはPhenom II 965 BEの3.4GHzから3.2GHzへと引き下げられた。それでも少ないスレッド数からマルチコアへ最適化されたアプリケーションまで、安定してPhenom II X4 965 BEを上回ったのは、少ないスレッド時に動作クロックがPhenom II X4 965 BEを上回るからだ。4コアに負荷が集中した場合にウィークポイントは見られるが、逆にそこだけとも言える。
単純に6コアCPUと考えると、かなりヘビーな用途を想定する必要があるが、このテクノロジのおかげでPhenom II X6を導入する恩恵を受けるユーザを増やしている。
この恩恵を受けるユーザが増えることは、AMDの戦略にとっても重要だろう。それは価格勝負をしているからだ。Phenom II X6 1090Tは日本AMDの公称価格が35,000円程度。下位モデルのPhenom II X6 1055Tに至っては、22,000円程度としている。フライングで予約受け付けを開始したショップの販売価格も同程度だ。10万円を超えるCore i7-980Xとは比べるまでもない価格差で、AMDでは「Core i7-980Xを1個買う価格で、Phenom II X6を導入したPC一式を購入することができる」とアピールしている。6コアCPUをいきなりメインストリームに投入した、といっても過言ではない価格といえるだろう。
また、発売は4月29日が予定されているが、「GW前に発売できるよう日本から本社に働きかけた。供給量についても、少なくともGW中は大丈夫な量を確保している」としており、この点でも品薄なCore i7-980Xに対するアドバンテージになっている。
“6コアCPU!”と大々的に言ってしまうと、逆に興味を抱く人は減ってしまうかも知れないが、Turbo COREが効くシーンならPhenom II X4 965 BEを上回るということを前提に、多数のアプリケーション、多数のスレッドを回すような使い方でも性能を飛躍させられるCPUとして考えると、Phenom II X6の価格/性能のバランスは魅力あるものに映るのではないだろうか。