|
Pentium 4キラーとなりうるAMDの強力な新製品
|
今回はこのAthlon XPの1800+、1700+、1500+の3製品を利用して、Athlon XPのパフォーマンス、そして今回から導入されたモデルナンバーについて考えていきたい。
●性能面で2つのエンハンスメントが行なわれる
今回登場したAthlon XPには、5月にモバイル市場向けに投入されたモバイルAthlon 4プロセッサ、6月にサーバー/ワークステーション市場向けに投入されたAthlon MPプロセッサと同じPalominoコアが採用されている。Palominoコアは、従来のAthlonに採用されていたThunderbirdコアに比べるといくつかの点で強化されている。その違いは表1のようになっている(赤く表示されている部分が強化点)。
表1:AthlonとAthlon XPの相違点
Athlon | Athlon XP | |
---|---|---|
CPUソケット | Socket A | Socket A |
パッケージ | CPGA | OPGA |
プロセス技術 | 0.18μm(銅配線) | 0.18μm(銅配線) |
トランジスタ数 | 3,700万 | 3,750万 |
ダイサイズ | 120平方ミリメートル | 128平方ミリメートル |
消費電力 | - | 最大20%削減 |
温度制御機能 | なし | サーマルダイオード内蔵 |
L1キャッシュ | 128KB | 128KB |
L2キャッシュ | 256KB | 256KB |
エクスクルーシブキャッシュ | 対応 | 対応 |
エクスクルーシブTLB | - | 対応 |
ハードウェアプリフェッチ | - | 対応 |
システムバスクロック | 200/266MHz | 266MHz |
拡張命令 | ||
MMX | ○ | ○ |
3DNow!テクノロジ | ○ | ○ |
エンハンスト3DNow!テクノロジ | ○ | ○ |
SSE | - | ○ |
第1にCPUのパッケージが従来のCPGA(Ceramic Pin Grid Array)からOPGA(Organic Pin Grid Array)という、IntelのFC-PGAパッケージに似たパッケージに変更されている。
このCPGAからOPGAへの変更は、より高クロックを容易に実現するためとOEMメーカーに対しては説明されており、配線遅延の減少などにより高クロックを実現しやすいという効果が期待できるようだ。
さらに、CPUコアのデザイン自体も見直されており、トランジスタ数も3,750万とThunderbirdコアの3,700万から50万分だけ増えている。このため、ダイサイズも8平方ミリ分だけ増えている。にも関わらず、配線デザインなどを見直すことで、Thunderbirdコアのリファインがされており、消費電力は最大で20%ほど減っているとAMDでは説明している。
性能面に大きな変化を与える違いは、キャッシュのハードウェアプリフェッチ、TLBの排他制御が追加されるなどキャッシュ周りの強化と、新しい3DNow! Professionalと呼ばれる命令セットの追加だ。従来のThunderbirdコアのAthlonでは、エクスクルーシブキャッシュと呼ばれるL1とL2のキャッシュを排他的に制御する仕組みが導入されていた。
一般的なCPUでは、L1キャッシュに格納されているデータはL2キャッシュにも格納されているのだが、エクスクルーシブキャッシュを採用しているAthlonでは、L1キャッシュに格納されている内容はL2キャッシュより削除し、逆にL2に格納されているデータはL1から削除する。これによりL1キャッシュとL2キャッシュをこれまで以上に有効利用することができるようになっていた。
さらに、今回のAthlon XPでは、TLB(Translation Look-aside Buffer)の排他制御とキャッシュのハードウェアプリフェッチという機能が追加されている。TLBとはメモリの論理アドレスを実際にメモリ上のどこにデータが格納されているか、という物理アドレスに変換するテーブルをキャッシュしておくバッファのことで、キャッシュと同じようにL1とL2のそれぞれが用意されている。これの内容を、キャッシュと同じようにそれぞれ排他制御できるようになっている。
Athlon XP 1800+のコア部分 | 従来のAthlon(左)とAthlon XP(右)。パッケージはOPGAに変更された | 従来のAthlonとAthlon XPの裏面。キャパシタは裏面に配置された |
また、ハードウェアプリフェッチとは、将来使われるデータを予測しメモリへ先読みする機能のことだ。予測があたり先読みしたデータを利用することができれば、CPUがメモリからデータを読み込むのに待っている時間(専門用語でストールと呼ばれる)を減らすことができ、CPUの処理能力を向上させることができる。
日本AMDのコンピュテーションプロダクトグループ テクニカルマーケティング部 部長の小島洋一氏によれば「これだけで10%程度の性能向上を期待できる」とのことで、その通りであればその効果は決して小さくない。
また、新たに追加された52の新命令セットである3DNow! Professionalは、IntelのPentium III、Pentium 4、Celeronに採用されているストリーミングSIMD拡張命令(SSE)と互換になっており、SSEを実行するために必要なXMMレジスタも用意される。
これにより、Athlon XPではMMX、3DNow!、エンハンスト3DNow!という従来のAthlonで実行できた拡張命令セットに加えて、これまでIntelのCPUでしか実行できなかったSSEが実行できるようになる。x86系の拡張命令セットで実行できないのは、Pentium 4でしかサポートされていないストリーミングSIMD拡張命令2(SSE2)のみとなり、現時点でAthlon XPは、実行できる命令セットがもっとも多いCPUであるといってもいいだろう。
●グレード表記は実クロックからモデルナンバーへ変更
さて、今回のAthlon XPではグレード表示が、これまで利用されてきた実クロックではなく、“モデルナンバー”と呼ばれる相対的なグレード表示に変更されている。実クロックとの対照表は以下のようになっている。
表2:モデルナンバーと実クロック
モデルナンバー | 実クロック |
---|---|
1800+ | 1.53GHz |
1700+ | 1.47GHz |
1600+ | 1.4GHz |
1500+ | 1.33GHz |
見てわかるように、1800+が1.53GHz、1700+が1.47GHz、1600+が1.4GHz、1500+が1.33GHzとなっているのだ。この“xx00+”というのは、それぞれAthlon XPの中での相対性能を示しているという。
だが、どちらかといえば狙いは、Pentium 4と同じような性能を示すことを狙ったネーミングだと考えることができるだろう。その証拠にAMDが公開している資料では、Pentium 4 1.8GHz 対 Athlon XP 1800+、Pentium 4 1.7GHz 対 Athlon XP 1700+というベンチマーク結果が掲載されており、明らかにPentium 4を意識したネーミングであることが伺える。
なぜ、AMDはこうした仕組みを導入したのだろうか? 米国時間で昨日、サンフランシスコで行なわれたAthlon XPの発表会におけるAMDのW.J.サンダース会長兼CEOの言葉を借りれば「Intelがルールを変えたからだ」ということになる。
一般的にCPUの処理能力には2つのパラメータがあり、IPC(Instructions Per Clock)とクロック周波数がそれだ。Intelは、Pentium 4のマイクロアーキテクチャであるNetBurstマイクロアーキテクチャを説明する文章“Inside the NetBurst Micro-Architecture of the Intel Pentium 4 Processor”( http://www.intel.com/pentium4/download/netburst.pdf )の中で「性能=IPC×クロック」だと説明している。
つまり、IPCかクロックのどちらかをあげればCPUの性能は向上するということになる。IPCとは、1クロックあたりに実行できる命令数のことで、この数字が上がれば上がるほどCPUの実行効率がよくなる。
これを上げるためには、例えばパイプラインやスーパースケーラの仕組みを導入したりと、アーキテクチャ上の工夫を行なう必要がある。クロックについてはここで改めて説明するまでもないだろう。
ところで、前述の文章の中でIntelは「NetBurstマイクロアーキテクチャのIPCの平均は、P6マイクロアーキテクチャに比べておおよそ10~20%程度は下回っている」と説明している。つまり、NetBurstマイクロアーキテクチャに基づくPentium 4のIPCの平均はP6マイクロアーキテクチャに基づくPentium IIIなどに比べて低いというのをIntel自ら認めている訳だ。
仮に同クロックのCPUが存在すれば、Pentium IIIに比べてPentium 4の方が性能が低いと言われる理由はここにあり、本誌をはじめとしたPentium IIIとPentium 4を比較したベンチマークテストの結果もそれを裏付けている。
しかし、続けて“Inside the NetBurst Micro-Architecture of the Intel Pentium 4 Processor”では、「NetBurstマイクロアーキテクチャではP6マイクロアーキテクチャと比べてクロック周波数を40%程度はあげることができる」とも述べている。つまり、IPCが下がる分を、クロックをあげることでカバー、いやむしろそれを上回る向上分を実現しているアーキテクチャを採用しているのがPentium 4であると考えることが可能だろう。
おそらくIntelがこうしたアプローチをとった背景としては、IPCをこれ以上あげるのは難しいので、もう1つのパラメータであるクロックをあげていこうと、IntelでCPUを設計するデザイナーが判断したということだろう。
そうしたほうが性能のヘッドルームを確保できるはずだと考えた、そういうことだろう。確かに8月のIntel Developer Forumで3.5GHzのPentium 4のデモを行なうなど、そのアプローチはいろいろな面でメリットがあるということだろう。
しかし、こうしたアプローチをとったことは、Intelに思わぬマーケティング上の利益をもたらすことになった。それはクロック競争における圧倒的な勝利だ。というのも、クロックを上げることを優先に設計されたPentium 4は、すでに2GHzを出荷しており、今回1.53GHzを出荷したAMDに大きな差を付けている。
OEMメーカーの関係者は、彼らの大きな顧客であるコンシューマユーザーは、CPUの性能をクロックで判断すると口々に証言する。
であれば、仮に店頭で「Pentium 4 1.8GHz」、「Athlon 1.53GHz」と書かれたマシンが並んでいた場合、「Pentium 4 1.8GHz」の方が実性能が高いと判断してしまうのだ。しかし、実際には、後述するベンチマークの結果でもわかるように、どちらのCPUもさほど性能では変わらないことがわかる。
しかし、OEMメーカーにとっては、ユーザーがPCを買ってくれなければ話にならないわけで、「クロック=性能」だと考えているコンシューマユーザー向けにどちらのCPUを選択するだろうか? もはや説明するまでもないだろう。
そこで、AMDは自社、および第三者機関が行なったベンチマーク結果を基に、Athlon XPがPentium 4の同クロックと同等かを調べて、それをクロックの代わりにグレード表記とすることにした。それがモデルナンバーなのだ。
確かにPentium 4 1.8GHzとAthlon XP 1800+と並んでいれば、よく知らないコンシューマユーザーも「同じような性能なんだ」ということを理解しやすくなるだろう。そうしなければ、AMDはAthlon XP 1800+(1.53GHz)を、Pentium 4 1.5GHzと同じような価格で販売しなければならない。
仮に、すでにPentium 4のローエンドで100ドルに近い価格設定となっているPentium 4 1.5GHzとAthlon XPのハイエンドである1800+(1.53GHz)を同じ価格にしなければいけないとしたら、AMDの利益率は大きく下がり、x86事業で利益を出すのは難しいことになる。これがモデルナンバー導入の背景なのだ。
●ベンチマークによってはPentium 4を上回る処理能力を発揮
しかし、モデルナンバーの導入の根拠となるAthlon XPのベンチマークテストの結果が思わしくなければ、モデルナンバーも単なる絵に描いた餅となってしまい、ユーザーに受け入れられるのは難しいだろう。
そこで、今回はAthlon XPを利用したシステムと、Pentium 4のシステムを比較してAthlon XPの性能を探っていきたい。
Athlon XPのシステムとして利用したのは、GIGA-BYTE TechnologyのGA-7DX、PC2100(DDR SDRAM、CL=2)を利用したシステムだ。
GA-7DXはAMDのリファレンスシステムにも利用されており、リファレンスマザーボードといってもよい存在だ。チップセットはAMD-760が採用されている。
Intel側のシステムとしてはIntel D850MD、PC800(Direct RDRAM)を利用したシステムで、こちらもIntel純正のIntel 850マザーボードであり、リファレンスシステムと言っていいだろう。なお、GA-7DXは最新バージョンのBIOSに更新してある。
基本的にAthlon XPはシステムバスの電気信号の仕様などは同じであるため、266MHzのシステムバスをサポートしたSocket Aマザーボードであれば利用できるはずだが、Athlon XPをサポートした最新BIOSにアップデートしないと起動しないなどの問題に直面する場合があるので注意したい。
テスト環境は以下の通りだ。
【動作環境】
CPU | Pentium 4 | Athlon XP | Athlon |
---|---|---|---|
マザーボード | Intel D850MD | GIGA-BYTE GA-7DX | ASUSTeK A7M266 |
チップセット | Intel 850 | AMD-760 | AMD-760 |
メモリ | PC800 | PC2100(CL=2) | PC2100(CL=2.5) |
メモリ容量 | 256MB | ||
ビデオチップ | GeForce3(64MB、DDR SDRAM) | ||
ハードディスク | IBM DTLA-307030(30GB) | ||
OS | Windows 2000(英語版)+ServicePack2 |
テスト結果を見ていこう。正直なところ、今回のテスト結果は非常におもしろい結果となった。Pentium 4とAthlonの最高クロック同士であるPentium 4 2GHzとAthlon XP 1800+(1.53GHz)を比較した場合、業界標準といってよい4つのアプリケーションベンチマークであるSYSmark2001のInternet Contents CreationとOffice Productivity、Business Winstone 2001、Contents Creation Winstone 2001で比較した場合、Athlon XP 1800+(1.53GHz)がPentium 4 2GHzを4つのうち3つ(SYSmark2001/Office Productivity、Business Winstone 2001、Contents Creation Winstone 2001)で上回っているのだ。
【SYSmark2001】
|
Athlon XP 1800+(1.53GHz) Athlon XP 1700+(1.47GHz) Athlon XP 1500+(1.33GHz) Athlon 1.4GHz Athlon 1.33GHz Athlon 1.2GHz Athlon 1.13GHz Athlon 1GHz Pentium 4 2GHz Pentium 4 1.9GHz Pentium 4 1.8GHz Pentium 4 1.7GHz Pentium 4 1.6GHz Pentium 4 1.5GHz |
○そのほかのベンチマークはこちら
・【SYSmark2001 】
・【Winstone 2001】
・【3DMark2001】
・【Quake III Arena】
・【Pentium 4 Processor Application Launcher】
この中で、SYSmark2001のInternet Contents Creationだけ、やたらとAthlon XPのスコアが低いのがわかる。これはInternet Contents Creationに含まれるWindows Media Encoder 7が、Athlon XPがSSEをサポートしていることを認識できないためだ。
Windows Media Encoder 7はSSEを利用すると、大きな性能アップを期待できるが、SSEが利用できない場合はパフォーマンスが大幅に低下する。それを如実に表した数値がIntel Pentium 4 Processor Application Launcher V2.1だ。
これにはWindows Media Encoder 7を利用したテストが含まれているが、Athlon XP 1800+(1.53GHz)が130であるのに対して、Pentium 4 2GHzは180と大きな差がついている(なお、AMDでもこの問題は認識しているようで、メディアに対してはこの問題を修正する非公式なパッチを配布している。残念ながらこのパッチが本原稿の締め切り直前に配布されたため、まだ動作させるまでには至っていないのだが、AMDのホワイトペーパー( http://athlonxp.amd.com/includes/content/whitePapers/benchmarkingModelNumbering.pdf (PDF) )によれば5%程度のスコアの改善がみられると説明している。機会があれば追試してみたい)。
AMDではWindows Media Encoder 7の次期リリースでは修正されると説明しているが、それまでは、この結果が現実の結果ということになる。
このため、今回はこの結果を正式な結果としておきたい。このほかにも、Incoming ForcesもAthlon XPがSSE互換であることを認識してくれなかった。こうしたアプリケーションではおそらくCPUIDなどをみてIntelのCPUであれば、SSE命令を実行するという作り方をされているのだろうと推測される。
そうした意味では、3DNow! Professionalはインプリメントはされているが、実際にはSSEが認識されないアプリケーションは少なくない可能性がある。このあたりは、AMDがソフトウェアベンダに働きかけるなどして早期に解決してほしい。
3D系のベンチマークの最高クロック同士の比較では、Pentium 4 2GHzがAthlon XP 1800+(1.53GHz)を3DMark2001、Quake III Arenaのどちらにおいても上回った。このあたりは2チャネルのDirect RDRAMという高帯域幅のメモリが利用できるPentium 4のアドバンテージがでている部分である。
●性能面からみると妥当なモデルナンバー
さて、それではAthlon XP 1800+(1.53GHz)、Pentium 4 1.8GHzを利用してモデルナンバーをクロックに見立てた比較を行なっておきたい。Pentium 4 1.8GHzのスコアを基準に、Athlon XP 1800+(1.53GHz)のスコアを相対的に表示したのが以下のグラフだ。
結果から言えば、3つ(SYSmark2001/Office Productivity、Business Winstone 2001、Contents Creation Winstone 2001)はAthlon XP 1800+(1.53GHz)が大きく上回り、1つ(3DMark2001)はほぼ同等、2つ(Quake III Arena、SYSmark2001/Internet Contents Creation)はPentium 4 1.8GHzが上回るという結果になった。このうち、SYSmark2001/Internet Contents CreationでやたらとPentium 4の結果がよいのは、前述のようにWindows Media Encoder 7が原因なので、CPUそれ本来のパフォーマンスとしてはある程度は割引いて考える必要があるだろう。
そう考えると、この結果から、確かにPentium 4の実クロックに、対応すると思われるAthlon XPの性能は、上回っているとまでいくかどうかは微妙なところだが、かなりいい勝負になっていると考えていいだろう。ベンチマークの結果から言えることは、Pentium 4 1.8GHzとAthlon XP 1800+は“競合している”製品であると考えることができるだろう。
●コストパフォーマンスに優れたAthlon XPはPentium 4の強力なライバルになるだろう
以上のように、AMDのAthlon XPはPentium 4に比類する高い処理能力を実現している。Athlon XP 1800+でも、アプリケーションによってはPentium 4 2GHzを越えるスコアをたたき出しており、Athlon XP 1800+で252ドルという価格、Direct RDRAMに比べてDDR SDRAMの価格が安いことなどを考えると、コストパフォーマンスに優れたCPUであるということができるだろう。
コストパフォーマンスを重視したいユーザーであれば、Athlon XPは優れた選択肢となるのは間違いない。現時点では日本のOEMメーカーからどのようなAthlon XP搭載マシンがでるのかは明確ではないため、メーカー製PCを購入するユーザー層にお奨めかどうかは不明だが、少なくとも自作PCユーザーであればPentium 4にするのか、Athlon XPにするのかを迷うところだろう。
3Dなどの性能やSSE2のアドバンテージを重視するのであれば、Pentium 4(ただしIntel 850を利用したシステムという条件付きだが)、コストパフォーマンスや既存のSocket AからのアップグレードであればAthlon XPということになるだろう。
さて、最後にモデルナンバーの是非についての筆者の考えを述べておきたい。すでに述べているように、今回AMDがモデルナンバーで訴えたいユーザー層は、「ベンチマークって何?」というコンシューマユーザーの大部分を占めるエントリーユーザーだ。
正直なところ、本誌の読者のようなパワーユーザーにとっては、「クロック=性能」ではないことなど先刻承知だろうし、クロックあたりの性能でAthlon XPがPentium 4を上回っていることも、本記事を読んでいただいている訳だから、そちらも「知っているよ」ということだろう。
そうした意味では、パワーユーザにとって「おせっかい」以外の何者でもないし、混乱をよぶやり方であるのも否定できないだろう。また、「去年はクロック、クロックといってたくせに、クロックで負けたら言うこと変えるじゃん」という指摘、さらには「以前P-Ratingという失敗した方法と同じじゃん」という意見がでてくるのもわからなくはない。
正直筆者ももう少しスマートな方法はなかったのだろうかという疑問は感じている。そういう意味では、AMDのマーケティング手法にはまだ見直すべきところもあるし、おそらく今回の件でAMDもいろいろ学ぶこともあるだろう。
だが、このモデルナンバーを導入しなければ、AMDは、本来は高い性能を持つAthlon XPを、それよりも低い性能しか持たない同クロックのPentium 4と同じ値段で販売しなければならなくなる。そういう意味では、今回の件はAMDにとって「ノーチョイス」だった訳で、最善の策ではないとはわかりつつもやるしかなかったのだろう。
しかしもっとも大事なことは「エンドユーザーがPCを快適に利用できるようになること」ということだ。どちらのメーカーのCPUを利用するにせよ、ユーザーとしては投資に見合った性能がほしい訳で、それはAMDの言うとおりクロックで測れるものではない。それを実現するためのフェアな評価方法とは何か、このモデルナンバー導入をきっかけにそうした議論が深まるのであれば、AMDがモデルナンバーを導入した意義があったということができるようになるだろう。今後、Intelも含め、PC業界全体でそうした議論が深まっていくことに期待したい。
(2001年10月10日)
[Reported by 笠原一輝@ユービック・コンピューティング]