【IDF 2007】Penrynベンチマークセッションレポート
SSE4対応のDivXでPenrynの効果がもっとも明確に
会期:4月17日~18日(中国時間) 会場:Beijing International Convention Center ●Intel 975X搭載マザー上でPenrynが動作 今回のIDFでは45nmプロセスで製造される次期プロセッサ「Penryn」が大きなトピックであるが、この製品のベンチマーク測定を行なうことができるセッションが報道関係者向けに行なわれた。このセッションでは、次に示すクアッド/デュアルの各Penrynコア製品と、Kentsfieldコア製品を搭載したPCが用意され、実際にベンチマークを行なってスコアを比較できた。 ・Penryn クアッドコア(3.33GHz、1,333MHz FSB、12MB L2キャッシュ) 主な環境は次の通り。 ・マザーボード:Intel D975XBX2(Rev.505) ここで、Intel 975Xを搭載したマザーボードを利用している点が気になった人もいるかも知れない。Intel 975Xは本来、1,333MHz FSBをサポートしていないからである。しかし、今回利用されたIntel D975XBX2のRev.505では1,333MHz動作が可能になるよう変更が加えられた製品とのこと。 ただし、1,333MHz FSBはオフィシャルにサポートされるものではないとも述べており、Intel D975XBXのRev.303がDDR2-800動作は可能だが正式にはサポートされていなかったのと似た状況が生まれそうだ。PenrynはIntel 3シリーズチップセットと組み合わせるのが原則といえる。 ちなみに、CPU-Zの画面も確認することができたが、CPU-Z側がPenrynに対応していないバージョンであったため、CPUに関する情報で確認できたのは動作クロック程度にとどまっている。 ●SSE4の優位性を示すDivXの結果に注目 さて、それではPenrynのベンチマーク結果を紹介していきたい。今回のセッションは、3台のPCにあらかじめいくつかのベンチマークがインストールされており、それを用いてIntelスタッフが計測。スコアを報道関係者が取得することができるというもの(セッションには他媒体の関係者も同席している)。 ただし、時間の制約もあって、一部のベンチマークソフトが実施できていないため、ここではIntelから配布された資料に掲載されている数値も引用してグラフ化する。なお、グラフを掲載するベンチマークソフトは下記のとおりで、※印を付けたものはIntelの資料よりデータを引用したものである。また、グラフ1~4は長いほど良い性能であることを示し、グラフ5~6は短いほど性能が良いことを示すので注意されたい。
まず、Core 2 Extreme QX6800とクアッドコアPenrynとの比較でみると、グラフ1~5でそう大きな違いはない。安定して20~30%前後のスコア向上が見られている。ソフトウェア的にはCineBench 10を除けば既存のアプリケーションであり、ソフトウェア側の対応が必要なSSE4関連の影響はないはず。このスコアの伸びをもたらしたのは、クロック向上、FSB帯域幅、Radix-16 Divider、L2キャッシュ容量といったあたりだが、まずクロックアップが大きな影響を及ぼしていることは間違いない。 ただ、クアッドコアPenrynコアの3.33GHzという動作クロックは、QX6800の2.93GHzより13.5%程高く、クロック比よりも良好なスコアを伸びを示していることになる。それ以上のスコアの伸びは、そのほかのアーキテクチャの改良によってもたらされたものということになる。もっとも今回のテスト結果だけでは、どれがどのぐらい影響して、今回のスコアになっているかを判断するのは難しい。ただ、FSBの帯域幅に関してはメモリにDDR2-800を利用した環境ということもあり、あまり影響していないのではないかと思われる。 一方、デュアルコアPenrynはCore 2 Extreme QX6800に及ばないスコアがほとんどで、このあたりのテストではマルチスレッド対応アプリケーションにおいてコア数のビハインドを逆転できるほどの優位性は見られていない。ただ、グラフ1~5のうち唯一、Half-Life2 Lost CostではCore 2 Extreme QX6800を上回った。これはクロックが向上しているというメリットが発揮されたものだろう。しかも、30%を超えるFPSの伸びを見せており、ゲームにおいてPenrynのマイクロアーキテクチャが有効である可能性を感じさせる結果になっている。
最後に示したDivXであるが、見慣れないバージョンを使用している。これは、SSE4に対応したアルファ版とのことで、エンコード設定の画面内も、それらしい設定項目が用意されている。一般にマルチスレッドに対応したエンコードソフトは、アーキテクチャやクロックが同じであればコア数が多いほうが有利だし、クロック差以上にコア数のほうが速度にもたらす影響は大きい。先に示したMainConceptのH.264 Encoderなどは、その典型的な例といっていい。 しかし、今回のSSE4を利用したDivXでは、デュアルコアPenrynが、Core 2 Extreme QX6800を上回る速度でエンコードを終える結果を見せた。用意されていたサンプル動画が短いものであっため、数秒の差になっているが、一般的な長さの動画であれば、数分、数十分の違いとなるほどの大きな差をつけている。 なぜSSE4を利用すると動画エンコードが高速になるかについても説明があった。その大きな理由として挙げられたのが、SSE4で追加された「MPSADBW」「PHMINPOSUW」の2つの命令だ。前者は複雑なSAD演算を行なうもの、後者はレジスタ内の値から最も小さなUWORDを抜き出すもの。こうした命令が用意されたことで、MPEGエンコードにおいて時間がかかるこれらの処理を少ない命令数で実行できるとしている。 処理を軽くするために水平/垂直方向のみの動き検索を行なっていたようなアルゴリズムを組んでいる場合、ななめ方向の移動が発生すると正しく圧縮が行なわれないということもある。だが、128bitレジスタと上記の命令を利用すればこうしたアプローチを採らなくても、広い範囲のピクセルを利用した動き検索を高速に処理できるというわけだ。このほか、Super Suffle Engineの搭載によって、この128bitレジスタの書き換えなどが1クロックで終えられるはずで、これも影響している可能性は高い。 以上の通り、いくつかのベンチマークテストの結果を紹介したが、試したアプリケーションのほとんどでクロック比以上のスコア向上が見られた点に注目しておくべきだろう。Penrynに対する最適化がなされていないアプリケーションでも高い性能向上を享受できるということになるからだ。 なお、今回利用したDivXはまだアルファ版であるため入手はできない。そもそもSSE4を実装したCPUが市場に出ていないので、現状で対応したアプリケーションがないのもあたり前なのだが、Penryn登場後にSSE4を利用するアプリケーションがどのぐらい登場するかも気になるところだ。SSE4を利用した性能改善にはソフトウェア側の対応が欠かせないが、その効果はDivXのテスト結果だけでも十分に期待できるものである。 □IDF 2007のホームページ(英文) (2007年4月19日) [Reported by 多和田新也]
【PC Watchホームページ】
|