多和田新也のニューアイテム診断室

ついに登場! AMDのデスクトップ向けクアッドコアCPU「Phenom 9600」




 AMD初のデスクトップ向けクアッドコアCPUが正式に発表された。既報の通り「Phenom」という新ブランドを冠せられたCPUで、一部モデルは本日にも販売が開始されるはすだ。ここでは、2.3GHzで動作する「Phenom 9600」を利用してパフォーマンスを見てみたい。

●1ダイに4個を統合した“ネイティブ”クアッドコア

 AMDのクアッドコア製品については、さまざまなメディアから情報が伝えられているほか、AMD自身が秋葉原でイベントを開催するなどして、かなり詳細な情報がすでに周知となっている。その最大の特徴は、なんといっても1ダイに4コアを統合した“ネイティブ”クアッドコアである点だ。

 Phenomでは、4コアそれぞれに64KBの命令キャッシュ、64KBのL1データキャッシュ、512KBのL2キャッシュを持つほか、4コア共有のL3キャッシュを持つ。もともと、CPU内部にクロスバースイッチを持つことで、コアごとにキャッシュが分離している不利が小さいアーキテクチャではあったのだが、複数のコアからのリクエストが発生するデータなどをL3キャッシュに持つことで、性能がより高まることが期待される。

 マイクロアーキテクチャの面でも多くの変更がなされており、128bit浮動小数点ユニットの搭載や、新しい拡張命令群となるSSE4aの採用などが行なわれている。また、メモリコントローラはDDR2-1066に対応。現時点では正式に対応を謳うことはないようだが、これはDDR2-1066がJEDECで承認されていないためで、JEDECでの承認が行なわれ次第、本格的にアピールされることになると思われる。

 チップセットとの接続にはHyperTransport 3.0を採用した。製品によりHyperTransport 3.0の動作クロックは異なり、今回テストするPhenom 9600やPhenom 9500は1.8GHzで動作。よって、1.8GHz DDR(3.6GHz)×16bit×上下方向で合計で14.4GB/secの帯域幅となる。2008年第1四半期に予定されているPhenom 9700などはHyperTransport 3.0のクロックが2GHzとなっており、こちらは16GB/secの帯域幅となる。

 ちなみに、このHyperTransport 3.0に対応したソケットを「Socket AM2+」という表現で呼称したりするが、これは正確にはソケットの名称ではなく、HypertransPort 3.0や、DDR2-1066に対応するプラットフォーム全体を表す言葉とされている。

 AM2対応CPUとAM2+対応CPUのピン配列は物理的にはまったく同じであり、互換性がある。ただし、下位互換となるので、Phenomを従来のAM2プラットフォームのマザーボードに装着した場合は、HyperTransport 1.0/2.0の接続となるほか、次に紹介する電力管理もフルに活用できないことになる。

 その電力管理であるが、「Cool'n'Quiet 2.0」という名称の省電力機能が搭載されている。これは、従来のCool'n'Quitが搭載していたクロックや電圧のコントロールを拡張し、各コアで完全に独立してクロックをコントロールするほか、CPUコアと内蔵メモリコントローラへ2系統の電源供給ラインを設けることで、これも独立して電力管理を行なう。

 CPUダイ上の使われていないロジックの電源を落として省電力化する機能もあり、例えば、コアのロジックだけでなく、浮動小数点演算ロジックの省電力化や、メモリコントローラのリードロジックだけを省電力化するといったこともできる。

 メモリコントローラが独立した電源系統を持つようになった以外に、クロック生成にCPUクロックを利用しないようになった点も大きな変化だ。従来のAthlon 64は、メモリクロックがCPUクロックの整数分の1となっていたので、DDR2-800モジュールを利用しても400MHz DDRで動作しないこともあった。例えば、動作クロック3.2GHzであれば、3,200/8=400MHzが生成できるが、3GHzだと3,000/8=375MHzで動作してしまうことになっていたのだ。

 しかし、PhenomはCPUに関係なく、DDR2-800を装着すれば400MHz DDR、DDR2-1066を装着すれば533MHz DDRで動作させることができるようになったのだ。おそらく、HyperTransportやCPUのベースクロックとなっている200MHzから、2倍で400MHz(DDR2-800)、2.66倍で533MHz(DDR2-1066)といった具合に生成していると思われる。

 CPUのクロックに関しては、0.5倍刻みでクロック設定される。Phenom 9700では2.4GHz(200MHz×12)となり、Phenom 9600は2.3GHz(200MHz×11.5)、Phenom 9500は2.2GHz(200MHz×11)と、100MHz刻みでSKUが設定されている。

 今回テストするのは、2.3GHzで動作する「Phenom 9600」である(写真1)。定格電圧は1.1~1.25Vで、TDPは95Wとなる。裏面は従来のAthlon 64 X2と比較したが、ピン配列はまったく変わっていないことを確認できる(写真2)。

【写真1】AMDのクアッドコアCPU「Phenom 9600」。OPNはHD9600WCJ4BGDとなっている 【写真2】左がPhenom 9600、右がAthlon 64 X2 6400+。ピンの配置はまったく同じである

 CPU-Zの結果では、データベースに登録された情報の問題と思われる「Phenom X4」といった表記も見られるが、動作クロックやキャッシュ容量はスペック通りであることを確認することができる(画面1、2)。

 AMD OverDriveをPhenom搭載PCで利用した場合、コアごとに独立して倍率を変更することができる(画面3)。標準倍率より上へ変更することはできないが、面白い機能である。なお、Black Editionなどでは倍率を上げる変更もサポートされると思われる。

【画面1】CPU-Zの結果。2.3GHzの動作クロックなどを確認できる。動作電圧は1.264Vとなっており、1.1~1.25Vの定格より若干高めだが誤差の範囲だろう 【画面2】CPU-Zのキャッシュ情報。L3キャッシュが2MB×1となっており、共有キャッシュとして正しく認識されている 【画面3】Phenom環境においては、AMD OverDriveのAdvanced Modeでコアごとに独立して動作クロックを変更できる

●AMD初となるクアッドコアCPUのパフォーマンスをチェック

 それでは、パフォーマンスを見ていきたい。用意した環境は表の通りで、比較対象として、AMD製品からはデュアルコア製品の最高クロック製品である「Athlon 64 X2 6400+」と、TDP値が近い89Wの「Athlon 64 X2 6000+」を用意。Intel製品は、もっとも価格帯が近いクアッドコアCPUである「Core 2 Quad Q6600」とした。なお、このCore 2 Quad Q6600は初期に登場したB3ステッピングのもので、105W TDPの製品である。

 マザーボードは、前回のAMD 790FXの記事でも使用した、GIGABYTEのAMD 790FX搭載製品「GA-MA790FX-DQ6」である(写真3)。ただし、今回は最新BIOSである「F2i」を適用してテストを実施している。Core 2 Quad Q6600環境のマザーボードは、DDR2対応のIntel X38搭載マザーボードである、ASUSTeKの「P5E」である(写真4)。

【写真3】AMD 790FXを搭載するGIGABYTE「GA-MA790FX-DQ6」 【写真4】Intel X38を搭載するASUSTeK「P5E」

 なお、今回はAMDのSpiderプラットフォームのポテンシャルを見るという意味を込めて、ビデオカードはRadeon HD 3870を利用している。

【表】テスト環境
CPU Phenom 9600
Athlon 64 X2 6400+
Athlon 64 X2 6000+(89W版)
Core 2 Quad Q6600
マザーボード GIGABYTE GA-MA790FX-DQ6(AMD 790FX) ASUSTeK P5E(Intel X38 Express)
メモリ PC2-6400 DDR2 SDRAM(1GB×2/5-5-5-18)
ビデオカード ATI Radeon HD 3870(Driver Package Version:8.43.1-071028a-055060E-ATI)
HDD Seagete Barracuda 7200.10(ST3250620AS)
OS Windows Vista Ultimate

 では、CPUの性能から見ていきたい。テストはSandra XIIの「Processor Arithmetic/Processor Multi-Media Benchmark」(グラフ1)、「.NET Arithmetic/Multi-Media Benchmark」「JAVA Arithmetic/Multi-Media Benchmark」(グラフ2)と、PCMark05のCPU Test(グラフ3、4)である。

 まず、SandraのProcessor ArithmeticとProcessor Multi-Media Benchmarkであるが、全般にAthlon 64 X2に勝るスコアは出ている。ただし、このテストはコア数にスコアが比例するという性格を持っており、あくまでCPUのポテンシャルとしては、この通りであるという指標となる。

 そこでスコアを約半分として考えると、むしろAthlon 64 X2両製品よりも低いスコアとなるテストも多いわけで、コア当たりの演算性能という意味では、分が悪いように見える。しかし、クロック差も含めると、Athlon 64 X2の2.3GHz相当よりは高いスコアを出している。例えば、Athlon 64 X2 6000+(3GHz)の結果を基に、Athlon 64 X2の2.3GHz相当のスコアを算出。そしてそれを2倍してクアッドコア相当としたスコアを出してみると、

(19,453/3,000)×2,300≒14,914×2=29,828 (Processor Arithmetic Dhrystone ALU(MIPS))
(18,154/3,000)×2,300≒13,918×2=27,836 (Processor Arithmetic Whetstone iSSE3(MFLOPS) )
(56,945/3,000)×2,300≒43,658×2=87,316 (Processor Multi-media Integer iSSSE3,aEMMX/aSSE(it/sec))
(62,425/3,000)×2,300≒46,859×2=93,718 (Processor Multi-media Float iSSE2(it/sec))

となる。リニアにスコアが増減する傾向にあるSandraの両テストだからこそできる話であるし、もちろんAthlon 64 X2のアーキテクチャをそのまま使用したクアッドコアCPUなんてものは存在しないので、算出した数字が持つそれほど意味はない。ただ、こうした計算によって、コアあたりの比較においてPhenomのクロック当たりの演算性能が、Athlon 64 X2より高いと判断できる材料にはなる。

 .NET Arithmetic/Multi-Media Benchmark、JAVA Arithmetic/Multi-Media Benchmark、PCMark05のCPU Testは実際のアプリケーションを利用したCPUベンチマークで、このあたりの結果が、Phenomをより実践的に使用した場合の演算性能を出していることになる。

 .NET/Java上で動く演算テストはマルチスレッド化もされているようで、かなり安定したスコアを出している。多くのテストではCore 2 Quad Q6600に劣るスコアになっているものの、.NET上で動くDrystoneでは完全に上回る結果も見せており、そのポテンシャルの一端を垣間見せている。

 PCMark05では、シングルタスクテストや2タスク同時実行テストまでは、Athlon 64 X2 6400+/6000+に劣るシーンが多い。一方、4タスク同時実行テストは、4コアの効果があってスコアを大きく伸ばしている。こうした傾向はCore 2 Quad Q6600も同じである。

【グラフ1】Sandra XII (Processor Arithmetic/Multi-Media Benchmark)
【グラフ2】Sandra XII (.NET/Java, Arithmetic/Multi-Media Benchmark)
【グラフ3】PCMark05 Build 1.2.0(CPU Test - シングルタスク)
【グラフ4】PCMark05 Build 1.2.0(CPU Test - マルチタスク)

 続いては、メモリ性能をチェックしてみたい。テストは、Sandra XIIの「Cache & Memory Benchmark」(グラフ5)と、PCMark05の「Memory Latency Test」(グラフ6)である。

 まず、SandraのCache & Memory Benchmarkの結果であるが、これもマルチスレッドに対応したテストであり、特にキャッシュの範囲ではコアの数によってスコアが大きく影響されるテストなので、アーキテクチャが異なるテストでは横並びの比較が難しい。

 ただ、Phenom 9600とCore 2 Quad Q6600は同じクアッドコアであるが、32KB×4個で128KB以下のサイズの転送についてCore 2 Quadが飛び抜けており、L1キャッシュの性能についてはこちらに優位性がある。

 そこを超えて、Phenom 9600各コアのL2キャッシュ容量である512KBの範囲までは、Core 2 Quadよりも高速である。L1キャッシュとの排他利用の効果もあって、サイズ増加に伴うスコアの下がり方が緩やかなのも特徴である。

 続く1MBサイズの転送は、Phenom 9600はL3キャッシュの登場となる。Core 2 Quad Q6600はL2キャッシュの範囲となるが、ここは若干ながらPhenom 9600が高速である。動作クロックの差もあるので、同クロックであれば、さらに優位性は高まるわけで、L2/L3キャッシュの速度に関してはPhenomに分があると判断していいだろう。ただし、Core 2 Quad Q6600は4MB×2個という容量の面で利が有り、4MB転送でも速度が落ちないのが特徴的である。

 最後にメインメモリ部分であるが、ここはPhenom 9600がもっとも高速な結果となっており、次いでAthlon 64 X2 6400+、Core 2 Quad Q6600、Athlon 64 X2 6000+となる。Athlon 64 X2 6000+はCPUクロックの関係でメモリクロックが400MHzより低く設定されてしまっているので、このスコアが若干下がるのは致し方ない。

 PCMark05のMemory Latencyの結果を見ると、L1/L2の範囲においては、むしろAthlon 64 X2の方が1秒あたりのアクセス回数が多く、レイテンシが低く抑えられていることが分かる。しかし、メインメモリではPhenom 9600のレイテンシが際立って良好。Athlon 64 X2との比較で見れば、メモリコントローラの改良がなされているであろうことが想像できる。

 Core 2 Quad Q6600との差では内蔵メモリコントローラのメリットを感じさせる結果だ。とくにクアッドコアでは複数のコアからメモリアクセスのリクエストが発生するわけで、レイテンシが低いアーキテクチャに優位性が出るのではないだろうか。

【グラフ5】Sandra XII(Cache & Memory Benchmark)
【グラフ6】PCMark05 Build 1.2.0(Memory Latecy Test)

 さて、次に実際のアプリケーションの性能を見ていきたい。テストは、「SYSmark 2007 Preview」(グラフ7)、「PCMark Vantage」(グラフ8)、「CineBench R10」(グラフ9)、「動画エンコードテスト」(グラフ10)である。

 複数のアプリケーションを使った複合的なテストであるSYSmark2007、PCMark Vantegeでは、Core 2 Quad Q6600が安定した性能を見せているのが特徴的だ。Athlon 64 X2に対しては、多くは同等以上の性能を出しているものの、逆に劣るシーンも散見される。

 CineBench R10の結果からは2つの傾向を見て取れる。ここでは、CineBenchの設定画面からスレッド数を3パターンに切り替えてテストしているが、1スレッド/2スレッド処理までは、Phenon 9600がAthlon 64 X2両製品に対して明らかに劣っているのに対し、4スレッドになるとクアッドコアの威力を見せる結果だ。

 Sandraのところでも指摘した通り、動作クロックの低さが影響してコアあたりの性能という面では、Athlon 64 X2の3GHzや3.2GHzに劣っていることが分かる。もっとも、Core 2 Quad Q6600も同じ傾向にあり、PCMark05のCPUテストにも類似性がみられたものだ。3万円台のクアッドコア製品で、スレッド数が少ない場合は、低クロックゆえのデメリットが浮き出てしまう印象を受ける。

 SYSmark2007とPCMark Vantageにおいて、Phenom 9600が健闘したテストに1つ共通するものがある。それが、ビデオ作成系のテストだ。SYSmark2007ではVideoCreation、PCMark VantageはTV and Moviesである。

 グラフ10に示した各種動画エンコード結果を見ても、Phenom 9600がAthlon 64 X2に対して大幅なアドバンテージを握った。このあたりはコア数が増えたことによる大きなメリットが表れている格好だ。Core 2 Quad Q6600に比べるとまだまだ遅い結果にはなっているものの、HD解像度のH.264エンコードでは差を逆転している。動画エンコードならIntel製CPU、というイメージを崩す可能性を感じさせる結果といえる。

【グラフ7】SYSmark 2007 Preview(Ver.1.02)
【グラフ8】PCMark Vantage Build 1.0.0.0
【グラフ9】CineBench R10
【グラフ10】動画エンコード

 続いては3Dベンチマークである。「3DMark06」(グラフ11、12)、「3DMark05」(グラフ13)、「Crysis Single Player Demo」(グラフ14)、「Unreal Tournament 3 Demo」(グラフ15)、「LOST PLANET EXTREME CONDITION」(グラフ16)の結果を掲載している。

 ここでは、3DMark05とUnreal Tournament 3で優れた性能を見せた一方、3DMark06とCrysisではスコアが伸び悩む結果となった。3Dゲームでもマルチスレッド化が進行しており、クロックよりもコア数が影響するアプリケーションもあるが、そうでないなら、コア1つあたりの性能が良い方が高い性能を出せることになる。

 現在はこうした状況ではあるものの、ゲームのマルチスレッド化がどんどん進行している現在、クアッドコアであるPhenomのメリットは次第に高くなっていくことになると思う。

【グラフ11】3DMark06 Build 1.1.0 (CPU Test)
【グラフ12】3DMark06 Build 1.1.0
【グラフ13】3DMark05 Build 1.3.0
【グラフ14】Crysis Single Player Demo(CPU benchmark)
【グラフ15】Unreal Tournament 3 Demo
【グラフ16】LOST PLANET EXTREME CONDITION(DX10)

 最後に消費電力のテストである(グラフ17)。まずAthlon 64 X2両製品と比較して、アイドル時は若干高めであるものの、ピーク時は、Athlon 64 X2 6400+より低く、Athlon 64 X2 6000+より高いという結果だ。TDPが125WのAthlon 64 X2 6400+と、89WのAthlon 64 X2 6000+の間に、95WのPhenom 9600が来ているわけで、妥当な消費電力だろう。

 TDP 105WのCore 2 Quad Q6600(B3ステッピング)と比べると高めである。ただ、今回使用したマザーボードは、AMD 790FXのものが搭載機能の多いモデルに対し、Intel X38はわりとシンプルな構成のものである。CPUのみの消費電力差は、もう少し差は小さく見て良いと考えており、参考程度に捉えて欲しい。

【グラフ17】消費電力

●3万円台のクアッドコアが増える意義

 以上のとおりテストを進めてきたが、Phenom 9600は、マルチスレッドが進んだアプリケーションや、動画エンコードではAthlon 64 X2を上回るシーンもあるが、Core 2 Quad Q6600よりはやや低い傾向にある。価格にせよ、TDPにせよ、AMDがCore 2 Quad Q6600をライバルとして意識していることは間違いないと思うが、マザーボードの差を考慮して消費電力が同等程度であったとしても、パフォーマンスが高いCore 2 Quad Q6600の優位性は依然として残る。

 もし、このタイミングで2.4GHz以上の製品が出ていれば、Core 2 Quad Q6600にもっと肉薄しているのは間違いないし、上回る結果を見せるテストも増えたと思うだけに残念だ。ただ、AMDは1つのプロセスを熟成させていくという過去を持っており、このPhenomもリビジョンアップによって、今より良くなっていく可能性は秘めている。そうした期待は抱いている。

 つまり、Athlon 64 X2 6400+(TDP125W)との消費電力比較でも、これ以上クロックを上げると95W TDPの製品としては売れないのではないかと思われるわずかな差である点や、今回登場したSKUを見るに、とにかくクロックを上げられない状況であることがPhenomの現時点での最大の苦しみなのではないだろうか。

 ただ、Phenomには価格面の魅力はある。今回テストしたPhenom 9600は283ドル。日本円での価格は提示されていないが、国内で最初に登場する、251ドルのPhenom 9500が3万円台前半であることを考えると、Phenom 9600は3万円台半ば前後で販売されることになると思う。

 また、来年にも登場する予定のPhenom 9700も300ドルを切ることが明言されており、これまでCore 2 Quad Q6600のみであった3万円台のクアッドコアが一気に増えることになる。こうした状況を生んでくれるPhenomの意義は大きいし、この状況が新たな競争を生んで、よりコストパフォーマンスに優れたクアッドコアが入手できることにつながっていく期待も持てる。クアッドコアの市場に1つの変革をもたらすであろう製品ではないだろうか。

□関連記事
【11月19日】AMD、デスクトップ向けネイティブクアッドコア「Phenom」を正式発表
http://pc.watch.impress.co.jp/docs/2007/1119/amd.htm
【11月19日】【多和田】AMD初のPCI Express 2.0対応チップセット「AMD 790FX」
http://pc.watch.impress.co.jp/docs/2007/1119/tawada117.htm
【11月15日】【多和田】DirectX 10.1に対応するAMDの新GPU「Radeon HD 3800シリーズ」
http://pc.watch.impress.co.jp/docs/2007/1115/tawada116.htm

バックナンバー

(2007年11月22日)

[Text by 多和田新也]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2007 Impress Corporation, an Impress Group company. All rights reserved.