今から4年前、'99年の10月にサンノゼで開催されたMicroprocessor Forumにおいて、AMDは当時K8の名前で呼ばれていたHammerの概要を発表した。あれから、4年という年月が過ぎ、当初は2002年の末に出荷する予定が、今年の春になり、それも延期され、結局本日正式に発表されるに至った。 デスクトップPC用として発表されたのはAthlon 64 FX-51と、Athlon 64 3200+の2製品で、メモリコントローラをCPUに統合することで、メモリレイテンシを大幅に削減し、アプリケーションの実行速度を大幅に改善している。 特にハイエンドユーザーとしては、2.2GHzとAthlon 64 3200+(2GHz)よりも高クロックで動作し、デュアルチャネルのDDR400をサポートするAthlon 64 FX-51が気になるところだろう。当初は3700+というモデルナンバーをつける計画も検討されていたというAthlon 64 FX-51は強力な処理能力を持っていることが予想されるからだ。 だが、パラノイアを自称するIntelは、AMDが性能競争で自社の先を行くことを許さなかった。先週のIDFで、製品発表の意向が表明された2MBのL3キャッシュを搭載したPentium 4 Extreme Edition 3.20GHz(日本ではHT テクノロジ Intel Pentium 4 プロセッサ エクストリーム・エディション 3.20GHz、以下Pentium 4 Extreme Edition)は、CPUと同じ速度で動作する大容量のL3キャッシュを搭載することで、メモリへのアクセスを減少させ、結果的にメモリレイテンシの削減と同じような効果をもたらすことになる。これにより、従来のPentium 4に比べて高い処理能力を持つことが予想される。 今回は、これらAthlon 64 FX-51とPentium 4 Extreme Edition 3.20GHzの2製品を入手したので、ベンチマークなどを通じてその性能に迫っていきたい。
Athlon 64ファミリーにはAthlon 64 FX-51とAthlon 64 3200+という2製品が用意されている。1,000個ロット時の参考価格はそれぞれ733ドル(日本円で91,625円)、417ドル(52,125円)となっており、ハイエンド向けの価格となっている。 これまでの、AMD製品でハイエンドだったAthlon XP 3200+の1,000個ロット時の価格が464ドルだったことを考えると、Athlon 64 FX-51がいかにAMDにとって“スーパーハイエンド”と言ってよい製品であることがわかる。 【表1】Athlon 64 FX-51とAthlon 64 3200+
Athlon 64 FX-51は、AMDにとってIntelのCPUに対して性能面で上回り、Athlon 64は高性能なCPUであるということをエンドユーザーに対して印象づけるためのフラッグシップ製品である。 だが、AMDにとって、このAthlon 64 FX-51は、元々スケジュールされていた製品ではなかった。というのも、Athlon 64 FX-51の開発コードネームは“SledgeHammer”であることが、すべてを物語っている。 SledgeHammerは元々サーバー/ワークステーション用であるOpteron用として開発されたもので、クライアントPC向けであるAthlon 64に使われる予定はなかったのだ。もともとAMDはメモリコントローラがデュアルチャネルのSledgeHammerをサーバー/ワークステーション用のOpteronに、シングルチャネルのClawHammerをクライアントのAthlon 64というプランで進んできた。 ところが、Intelが今年の春にIntel 875P、Intel 865で800MHzのシステムバス+デュアルチャネルDDR400というチップセットをリリースしたことで、状況が大きく変わった。これらのチップセットとPentium 4の組み合わせはAthlon XPを大きく上回っており、実際Pentium 4 3.20GHzとAthlon XP 3200+を比較した場合には、多くのベンチマークでPentium 4 3.20GHzを下回るという状況になってしまっていた。 しかも、各チップセットベンダもこぞってデュアルチャネルのDDRチップセットをリリースしたことで、デュアルチャネル構成は、ハイエンドからメインストリームの市場では一般的になってしまったのだ。 AMDにとってAthlon 64は、それこそ社運をかけた製品だ。この製品のデビュー時に、処理能力が凡庸な結果であった場合、いきなり“駄目”の烙印を押されてしまうことになりかねない。したがって、なんとしてもAthlon 64が高い処理能力を持つという“評価”を得る必要があり、デュアルチャネルのAthlon 64の投入を検討した、ということだろう。 ただ、AMDにとってつらいのは、K8がCPUにメモリコントローラを統合していたことだ。言うまでもなくメモリコントローラの統合は、メモリレイテンシの削減を意味しており、性能面でのメリットは計り知れないものがある(この点に関しては後述する)。 しかし、CPUは、一度作ってしまうと2年程度は変更がきかない製品であり、ClawHammerをデュアルチャネルとするのはスケジュール的に無理がある。メモリコントローラを変更すれば、バリデーション(動作検証)はやり直しとなり、このタイミングで出すというのは不可能だった。だから、SledgeHammerをAthlon 64 FXとして出すという決断がされたのだろう。
このように急遽決められた決断であるため、若干のしわ寄せも出ている。1つは同じAthlon 64であるのに、Athlon 64 FXは940ピン、Athlon 64は754ピンという2つのインフラができてしまったという事実だ。
OEMメーカーにとって、Athlon 64 FXとAthlon 64を用意する場合、別々のマザーボードを用意する必要があり、コスト的には不利になる。また、メモリモジュールには、一般的にPCで利用されているUnbufferedが利用できず、ECC(Error Check and Correctting)機能を持つRegisteredのモジュールを利用する必要がある。 基本的にUnbufferdとRegisteredの差は、バッファの有無と、動作を確実にさせるためのECC機能であり、通常のPCでは必要とされておらず、性能面でのメリットはない。こうしたことからも、このAthlon 64 FXがいかに緊急避難的な製品であるかがわかる。 また、メモリはDDR400を搭載しているが、これまでのところメモリ標準化の団体であるJEDECではDDR400のRegisteredモジュールを規格化していない。従って、これまでのところ市場に流れた例もほとんどなく、残念ながら入手性はよくないというのが現状だ。 ただ、Athlon 64 FXが対応したことで、今後メモリモジュールベンダなどから登場する予定もあるので、時間が解決してくれるだろうが、これも一つの問題ではある。 なお、OEMメーカー筋の情報によれば、AMDはAthlon 64 FXの後継として、2004年の第2四半期に939ピンのAthlon 64 FXを出荷するという。この939ピンのAthlon 64 FXでは、Unbufferedのモジュールもサポートされる予定になっている。そのため、今回の製品は今後より高クロックの製品に切り替える場合にアップグレードできないので、その点は注意したい。ただし、940ピンのOpteron 1xxの高クロック版は今後もリリースされることになるだろうから、そちらを利用という手段もある。
Athlon 64 FXおよびAthlon 64の、Athlon XPに対する大きなアドバンテージとしてあげることができるのは、メモリコントローラのCPUへの統合だ。 これまでのPCのアーキテクチャでは、メモリコントローラはチップセット側に用意されており、CPUはシステムバスを経由してアクセスする仕組みになっていた。しかし、この仕組みの場合、CPUはCPUの内部クロックに比べて低速なシステムバス、チップセットを経由してメモリにアクセスすることになるため、レイテンシと呼ばれるメモリにアクセスするまでにCPUが待たされる時間が増えてしまい、性能低下につながっていた。 レイテンシが短くなればなるほど、CPUが待たされる時間が減るので、全体としてCPUの処理能力は向上するし、メモリレイテンシの削減は基本的にはどのようなアプリケーションを利用する場合でも性能向上につながるので、大きなメリットを得ることができる。実際AMDは、K8はK7に比べて同じクロックで比較すると20~25%の性能向上が見られると説明している。 だが、逆にデメリットもある。具体的には、メモリのトレンドと同期するのが難しいことだ。通常、CPUの新しいコアの投入は18カ月~2年に一度程度となっているが、チップセットは1年に一度というサイクルで更新される。これは、CPUの進化と、周辺部分の進化が同期していない場合に、CPUはいじらなくても、チップセットを変えるだけで最新技術に対応できるというメリットがあるからだ。 ところが、メモリコントローラを統合していると、新しいメモリの技術に対応するにはCPUの設計からやり直しになる。言ってみれば小回りがきかなくなってしまうのだ。メモリコントローラが統合されたCPUの設計をするエンジニアは数年先のメモリのトレンドを見誤らないように設計する必要があり、それは容易なことではない。 見誤るとどうなるか? それは今回のAthlon 64 FX-51のように、サーバー用のCPUをクライアントとして投入し、利用できるのはRegisteredメモリモジュールという、若干無理のある展開になってしまう場合もある。 Intelも過去にTimnaと呼ばれる統合型CPUを開発していたが、結局採用していたDirect RDRAMがメインストリームになることなく、キャンセルしたという過去がある。それほど、メモリ技術にあわせ込んでいくということは難しいのだ。 はっきり言って、これはトレードオフだ。どちらをとるかは、CPUを設計したアーキテクトの選択だろう。メモリコントローラの統合は、大きなギャンブルだが、それだけメリットも大きいのだ。
Athlon 64ファミリーのもう1つの大きな特徴は、新しい64bit命令セットであるAMD64に対応していることだ。AMD64は、IA32との下位互換性を維持しながら64bit命令の実行を行なえる、AMDオリジナルの命令セットだ。 AMDの命令セットと言えば、3DNow!テクノロジが思い浮かぶが、3DNow!ではIA32の拡張版であったのに対し、AMD64は完全に新しい命令セットといえ、利用するにはAMD64に対応したOSやアプリケーションが必要になる。 ただし、仮にAMD64に対応したOSやアプリケーションがない場合でも、Athlon 64 FX/Athlon 64は単なる32bitのIA32プロセッサとして利用することができる。というのも、AMD64のレジスタは、IA32のレジスタを拡張した形になっており、32bit OSやアプリケーションがネイティブの速度で動作できるからだ。16bitのx86をIA32に拡張したIntel 386以降のIA32のCPUが、16bit OSやアプリケーションをネイティブと同じに実行できたのと同じだといえる。 現時点では、64bit OSはSuSE LinuxやTurbo LinuxなどのLinux系のみになっており、64bitのWindowsは用意されていない。Linuxが受け入れられているサーバー系はともかくとして、クライアントでは標準OSとなるWindowsがなければ厳しいところで、現時点ではクライアントに関しては32bit専用だといってもいいだろう。 しかし、すでにMicrosoftはAMD64に対応した64bitWindowsであるWindows XP 64-Bit Editionを開発しており、5月に米国で行なわれたWinHECでは、ベータ版が開発者向けに配布され、デモも行なわれたほか、今年の3月に開催されたCeBitでも、AMD64で動作するWindows XP 64-Bit Editionがデモされた。 今後Windows XP 64-Bit Editionがリリースされれば、現行の32bitWindowsとの処理能力の差、64bitと32bitアプリケーションとの性能差などを計測することが可能になり、どの程度の性能向上が期待できるのかなど興味は尽きない。そうした意味では、早期にWindows XP 64-Bit EditionのAMD64版がリリースされることを希望したい。
さて、AMDの挑戦を迎え撃つIntelである。すでに、先週のIDFレポートでも報じたように、IntelはAthlon 64 FX-51にぶつける製品として、Pentium 4 Extreme Edition 3.20GHzを、今後数カ月の間に市場に投入するという意向表明をしている。 Pentium 4 Extreme Edition 3.20GHzは、開発コードネームGallatin(ギャラティン)で呼ばれていた2MBのL3キャッシュを搭載したコアを、Pentium 4に投入したという性格の製品だ。
そもそもGallatinは、Xeon MPというマルチCPUのIA32サーバー向けに開発されたコアだが、それをクライアントPC向けに投入した製品ということになる。製造プロセスルールは0.13μmプロセスルールで、トランジスタ数は公表されていないが、Gallatinの2.80GHzが1億6,900万とされているので、おそらくこれと同じだと考えていいだろう。 ちなみに、従来型Pentium 4に採用されてきたNorthwoodコアのトランジスタ数が5,500万であるのに比べると、これがいかに凄いかわかるだろう。なお、GallatinではキャッシュにECC機能が搭載されているが、今回のPentium 4 Extreme EditionではECC機能はオフにされている。 L3キャッシュの搭載のメリットは、メモリへのアクセスを減らすことで、メモリレイテンシを削減したのと同じ効果を得ることができることだ。データやプログラムコードなどがキャッシュに格納されている場合、CPUはメモリまでアクセスしないでキャッシュからデータを取り出し演算を行なう。 CPUと同じ動作周波数で動いているキャッシュから読み込めた場合には、メモリにアクセスするよりも圧倒的に高速に演算することができる。ただ、データやコードがキャッシュに入りきらないくらい巨大な場合には効果がない。そのため、キャッシュが512KBから512KB+2MBに拡張されたことで、処理可能なデータやコードが増え、その分の性能向上が期待できる。 ただ、トランジスタ数が増えたことにより、熱設計消費電力は上がってしまっている。Pentium 4 Extreme Edition 3.20GHzの熱設計の仕様は以下のようになっている。 【Pentium 4 Extreme Edition 3.20GHzの熱設計の仕様】
この仕様から考えると、熱設計消費電力が上がり、さらにTcaseも下がっているので、PCの熱設計に関しては、従来のもう一段上を考えた方がいいだろう。CPUファンなどはPentium 4 3.20GHzと同じもので大丈夫だと思われるが、ケース内のファンによる風の流れに配慮するなど、自作PCに入れて利用する場合には、かなり注意して利用する必要があるだろう。 なお、Pentium 4 Extreme Edition 3.20GHzと従来版Pentium 4 3.20GHzの差は、2MBのL3キャッシュのみとなっている。そのほかの特徴である、12k μOps+8KBのL1キャッシュ、512KBのL2キャッシュ、800MHzのシステムバス、HTテクノロジ対応などは同じとなっている。パッケージも478ピンのFCPGA2で、mPGA478ソケットで利用することができる。対応するチップセットはIntel 875/865ファミリーで、BIOSのバージョンアップなどにより対応することが可能になる。
前置きが長くなったが、Athlon 64 FX-51(2.20GHz)、Pentium 4 Extreme Edition 3.20GHzの2製品の処理能力を、ベンチマークプログラムを利用して確認してみよう。今回は、比較対象として、両社の以前のハイエンド製品であるAthlon XP 3200+(2.20GHz)とPentium 4 3.20GHzの2製品を用意した。環境は以下の通りで、テスト結果はグラフ1~グラフ13の通りだ。 【テスト環境】
■ベンチマーク結果
グラフ1はScienceMark 2.0を利用して計測したキャッシュの帯域幅の計測だ。残念ながら、L3キャッシュの測定はできないので、L1+L2キャッシュの帯域幅の計測となっている。Pentium 4に関しては、L3キャッシュが追加されただけであるので、Pentium 4 Extreme Edition 3.20GHzも、Pentium 4 3.20GHzも大きな差はない。 これに対して、Athlon 64 FX-51、Athlon XP 3200+の比較では、Athlon 64 FX-51が大幅に上回っており、Pentium 4に追いつく結果を出していることが見て取れる。なお、Athlon 64 FXやAthlon XPのL1キャッシュの帯域幅が、L2キャッシュの帯域幅に比べて広いのは、キャッシュの排他制御を行なっているためだ。 グラフ2は同じくScienceMark 2.0を利用したメモリ帯域幅の結果で、ここでは、Pentium 4やAthlon XPなどを引き離して圧倒的にトップとなっている。いずれの環境も、DDR400のデュアルチャネル構成となっており、メモリの帯域幅は6.4GB/secとなっている。その中でもAthlon 64 FX-51は5,382.42MB/secとなっており、実に理論値の82%と高効率を実現していることがわかる。 なお、Pentium 4が62%、Athlon XPが42%という効率であることを考えると、その高さは群を抜いている。これは、Athlon 64がメモリコントローラをCPUに統合しコアと同クロックで動作させることで、チップセット側にメモリコントローラがある場合のように、途中にバッファを入れて調整したりする必要が無く、言ってみればボトルネックになる部分がないためと考えてよく、メモリコントローラを統合した利点が出ていると考えることができる。 グラフ3は、Athlon 64 FX-51とAthlon XP 3200+のメモリレイテンシを比較したグラフだ。数字はメモリアクセスにかかったグラフ数を示しており、数字が低ければ低いほど、CPUがメモリに対して高速にアクセスできることを示している。 このグラフを見れば一目瞭然のように、同じコアクロック周波数、同じメモリクロックのAthlon XP 3200+に比べてAthlon 64 FX-51は大きなメモリレイテンシの削減がなされていることがわかる。転送しているデータ量によるが、データサイズが小さい場合には半分以下になっている場合もあり、Athlon 64においてメモリコントローラを統合した効果が大きいことがこれからわかる。 グラフ4はPentium 4 Extreme Edition 3.20GHzとPentium 4 3.20GHzのL2キャッシュのレイテンシ比較だ。ScienceMarkではL3キャッシュのベンチマークという項目がないためL2を見ているが、このL2キャッシュのレイテンシを見る限り、Pentium 4 Extreme Editionは、従来のPentium 4から若干の削減を見せている。Pentium 4 Extreme EditionとPentium 4の差はL3キャッシュが加わっただけなので、この効果はL3キャッシュが搭載されたものによるのだと考えていいだろう。こうした結果を見ると、2MBのL3キャッシュに入ってしまうデータやコードを処理する場合には、効果があると考えることができるだろう。
グラフ5、グラフ6はSYSmark2002のOffice Productivity、Business Winstone 2002 V1.0.1の結果だ。どちらのベンチマークプログラムも、Office XPやNetscapeといった実在のビジネスアプリケーションを利用して、その応答時間などを計測することで性能を相対的に計測するベンチマークで、特にメモリレイテンシが性能向上に与える影響が大きい。 どちらのベンチマークでも、Athlon 64 FX-51は、Pentium 4 Extreme Edition 3.20GHzを上回っている。従来製品であるAthlon XP 3200+に比べても大幅なパフォーマンスアップを果たしており、やはりメモリレイテンシの削減が大きな効果をもたらすことを実証していると言っていいだろう。 例えば、SYSmark2002のOffice Productivityでは、Athlon XP 3200+はPentium 4 Extreme Edition 3.20GHzのみならず、Pentium 4 3.20GHzにも劣っていたことを考えると、このメモリレイテンシの削減は非常に大きな性能向上につながっていると言ってよい。
コンテンツ作成系のベンチマークがグラフ7、8のSYSmark2002のInternet Contents CreationとTMPGEnc Plus Version 2.5によるMPEG-1エンコードのフレームレートテストだ。いずれの結果でも、Pentium 4 Extreme Edition 3.20GHzが、Pentium 4 3.20GHzはもとより、Athlon 64 FX-51、Athlon XP 3200+を上回っていることがわかる。 この結果は、これらのアプリケーションでSIMD型の演算が多用されているからだ。1クロックで数倍の演算が行なえるSIMD型演算の場合はクロック周波数が高ければ高いほど処理能力は向上する。実際、Pentium 4 Extreme Edition 3.20GHzとPentium 4 3.20GHzの差はあまり大きくなく、L3キャッシュを搭載した恩恵はあまり見られないと言ってよい。 なお、Athlon 64 FX-51の性能が、同じクロックのAthlon XP 3200+に比べて上がった理由としては、メモリ帯域幅の効率改善に加え、SSE2命令に新たに対応したからことも挙げられるだろう。
グラフ9~13までの3D系のベンチマークでは、あるベンチマークではPentium 4 Extreme Edition、逆に他のベンチマークではAthlon 64 FX-51が勝利した。具体的には3DMark03とQuake III ArenaではPentium 4 Extreme Edition 3.20GHz。3DMark2001、Final Fantasy XI Official Benchmark、Unreal Tournament 2003/BotmatchではAthlon 64 FX-51といった具合だ。 全体的に、クロック周波数の影響が大きいQuake III Arena、メモリレイテンシの影響などが大きいUnrealではAthlon 64という傾向がいえるが、総合的なベンチマークである3DMark03、3DMark2001 SEではほぼ互角となっているので、全体的に互角といっていいのではないだろうか。なお、いずれも前製品(Pentium 4 3.20GHz、Athlon XP 3200+)は明らかに上回っており、PCゲームユーザーにとってはどちらを購入しても大きな性能向上が期待できることは間違いない。
以上のように、今回両社がリリースしたCPUの処理能力をチェックしてくると、両社のCPU設計思想の違いが見えてくる。 AMDのAthlon 64は、とにかくメモリレイテンシを削減することでどのようなタイプのアプリケーションでも高い処理能力を実現しようという方向でCPUの設計を行なっていることは明らかだ。実際、どのベンチマークであってもAthlon 64 FX-51は、同じクロックのAthlon XP 3200+を上回っており、しかもその効果は絶大であることがベンチマーク結果を見るとわかる。 実際、クロック周波数が大きなウェイトを占めるコンテンツ作成系のベンチマークテストをのぞき、Athlon 64 FX-51は実クロックで1GHz近く上回るPentium 4を上回るか同等のスコアを残しており、もうこれは素直にアーキテクトを賞賛したい。Athlon 64の設計者たちは非常によい仕事をしたと言っていいだろう。 しかし、AMDの課題はマーケティングにある。正直に言って、Athlon 64 FX-51という製品は、ユーザーにとって、あるいはOEMメーカーにとって本当にすばらしい製品であるかと言えば、疑問が残る。 第一にメモリにRegistered DIMMを利用しなければならず、さらに第2四半期にはソケットが変わった939ピンのAthlon 64 FXがでることも見えている状況だ。この理由は、AMDがメモリのトレンドを見誤ったからであるのは火を見るより明らかだろう。もし、今の時点で、939ピンでUnbufferedのメモリモジュールが利用できる製品が出ていれば、ユーザーにとってすばらしい選択肢となっただろう。 AMDは次こそこうしたことが起きないような製品計画をしてほしいものだ。ただ、繰り返しになるが、製品自体は“エクセレント”の一言に尽きる。今後は、このすばらしい製品を生かせるマーケティングを期待したい。 対する、Intelも課題は無いわけではない。このPentium 4 Extreme Editionは、Athlon 64 FX-51対抗という狙いとともに、Prescottが第1四半期にスリップした穴を埋めるという意味合いを持っているというのはすでにIDFレポートなどで説明したとおりだ。 筆者は、IntelがPentium 4、そしてその後継となるPrescott、Tejasなどで狙っていることは明白だと思う。おそらく、Intelのアーキテクトたちは、PCの性能向上は、今後はレイテンシが問題になるオフィスアプリケーションよりも、SIMD型演算の導入でクロックが重要になるマルチメディア系のアプリケーションが焦点になるのだと踏んだのだと思う。だから、Pentium 4でどんどんクロックをあげてきたのだし、HTテクノロジを導入することで、CPU内部のリソースの有効活用などを行なってきたのだと思う。 Intelがそうした方向性をもっているのであれば、キャッシュのレイテンシ削減やメモリレイテンシの隠匿につながるL3キャッシュを搭載したPentium 4 Extreme Editionは、一時的な製品であることは明確だと思う。おそらく、実際に製品が出てみないとわからないが、本来は第4四半期にでるはずだったPrescott 3.40GHzとPentium 4 Extreme Edition 3.20GHzを比較した場合、ビジネス系のアプリケーションではもしかすると同じぐらいかもしれないが、おそらくTMPGEncなどのエンコード系ソフトではPrescott 3.40GHzの方が高い性能を発揮するだろう。そう考えれば、Pentium 4 Extreme Edition 3.20GHzが本来の進化の方向性ではないことは明白だ。ただし、現時点で、Pentium 4としては最強の製品であることには間違いはない。従来のPentium 4 3.20GHzにすべてのベンチマークで上回っていることは付け加えておきたい。 こうしたことから考えていくと、常にハイエンドなCPUが必要なPCゲーマーやPCで処理させる時間が長いプロフェッショナルユーザーであれば、今回リリースされたAthlon 64 FX-51、Pentium 4 Extreme Edition 3.20GHzを買う価値があるだろう。どちらかと言えば、ビジネスアプリケーションも含めて全体的に処理能力が高くなる方向性を考えているのであればAthlon 64 FX-51を、エンコードなどマルチメディア性能を重視するというユーザーであればPentium 4 Extreme Editionをというのが、お薦めとなるだろう。 なお、そのほかのエンドユーザーにとっては、おそらく10万円近い価格設定になると予想される(Pentium 4 Extreme Editionに関しては価格は未定だが……)両製品は、購入時の選択とはならないだろう。 しかし、この2製品が登場することで、下位モデルとなるAthlon XPや従来のPentium 4の価格は下がることになるだろう。それらの製品をより手軽な価格で買えるようになることが、一般ユーザーにとっても大きなメリットであるといえるだろう。 □関連記事 (2003年9月24日)
[Reported by 笠原一輝]
【PC Watchホームページ】
|
|