AMDは5月15日、Trinityの開発コードネームで呼ばれていた第2世代APU製品を発表した。今回、AMDより評価用の機材を借用できたので、第2世代APUの実力をベンチマークで確認してみた。
●CPU、GPUともアーキテクチャを変更した新APUAMDの第2世代APUであるTrinityは、Llanoと同じく32nmプロセスで製造されたAPUだ。CPUコアに第2世代のBulldozer「Piledriver」、GPUコアには、Radeon HD 6800などと同じVLIW4アーキテクチャを採用したGPUコアを備える。K10系のStarsコアとVLIW5アーキテクチャのGPUコアを採用していたLlanoから、CPU、GPUともアーキテクチャが変更されたことになる。
Trinityのブロックダイアグラムと特徴 |
Trinityのダイレイアウト |
TrinityのCPU部に採用されたPiledriverコアは、前述の通りBulldozerアーキテクチャに改良を施したCPUコアだ。1つのCPUモジュールに、2つの整数演算コアと1つの浮動小数点演算コアを備え、L2キャッシュやフロントエンドを共有するというBulldozerモジュールの設計をベースに、分岐予測ユニットの改善、共有L3キャッシュの省略や、新拡張命令セット「FMA3」のサポートなど、さまざまな変更が加えられている。
GPUコアは最大で384基のStream Processing Units(SP)を備える。GPUコアが備えるSP数は、LlanoベースのA8シリーズのGPUコアが備える400SPに比べて減少しているが、これはVLIW4とVLIW5のアーキテクチャの違いによるものであり、Llanoが備えるGPUに比べスペックダウンしたというわけではない。
APUの機能としては、自動オーバークロック機能Turbo COREの発展版「AMD Turbo Core Technology 3.0」を新たにサポートした。この機能では、CPUコア部分の自動オーバークロック機能に留まっていた従来のTurbo Core Technologyを発展し、負荷に応じてCPUとGPUの動作クロックを変動させる機能となった。このほか、メモリコントローラがサポートするメモリクロックは最大DDR3-1866とLlanoと同等だが、Trinityでは新たに1.25Vの低電圧DDR3メモリがサポートされた。
Piledriverコアの概要 |
VLIW4アーキテクチャを採用するGPUコアの概要 |
AMD Turbo Core Technology 3.0の概要 |
第2世代のAMD Aシリーズとして製品展開されるとTrinityでは、従来のAMD A8/A6/A4の各ラインナップに加え、ハイエンドAPUに位置するAMD A10シリーズが追加された。今回AMDより借用した機材に搭載されているTrinityは、ノートブック向けAMD A10シリーズの「A10-4600M」だ。
A10-4600Mは、2モジュール4コアのCPUコアと、384基のSPを持つ「Radeon HD 7660G」を統合している。A10-4600MはTurbo Core Technology 3.0をサポートしており、負荷状況に応じて、CPUは2.3GHzから最大3.2GHz、GPUは497MHzから最大686MHzの範囲で動作クロックが変動する。そのほか、ノートブックPC向けAPUということでメモリのサポートはDDR3-1600に留まるが、TDPは35Wと、Llanoベースのノートブック向けAMD A8シリーズの45Wより低く抑えられている。
【表1】主な仕様の比較CPU | A10-4600M | A8-3520M | Intel Core i5-2410M |
モジュール数 | 2 | ─ | ─ |
コア数 | 4 | 4 | 2 |
スレッド数 | 4 | 4 | 4 |
CPU動作クロック | 2.3GHz | 1.6GHz | 2.3GHz |
Turbo Boost時 | 3.2GHz | 2.5GHz | 2.9GHz |
L2キャッシュ | 4MB | 4MB | 6MB |
内蔵GPUコア | Radeon HD 7660G | Radeon HD6620G | Intel HD Graphics 3000 |
Streaming Processor | 384基 | 400基 | 12基 |
GPUコアクロック | 497MHz | 444MHz | 650MHz |
GPUコアクロック(最大) | 686MHz | ─ | 1,200MHz |
TDP | 35W | 35W | 35W |
●テスト機材
さて、それではベンチマーク結果の紹介に移りたい。
今回AMDから借用したTrinityの評価用PCとの比較対象として、AMD A8-3520Mを搭載したレノボ・ジャパンの「IdeaPad Z575 129995J」と、Intel Core i5-2410M(以下、i5-2410M)を搭載したASUSの「K53E」を用意した。なお、比較用の両製品については、標準仕様ではメモリがシングルチャンネル動作となっているため、今回はDDR3-1333動作の2GBメモリ2枚に変更してテストを行なった。また、Trinityの評価用PCは標準設定のDDR3-1600動作時のデータに加え、DDR3-1333動作時のデータも取得している。
ノートブックPCを使っての比較ということで、ディスプレイ解像度こそ同じであるものの、画面サイズや搭載HDDなどのスペックは統一されてい。比較結果をご覧いただく際はその点を考慮してご覧いただきたい。
【表2】テスト環境CPU | A10-4600M | A8-3520M | i5-2410M | |
内蔵GPU | Radeon HD 7660G | Radeon 6620G | Intel HD Graphics 3000 | |
メモリ | DDR3-1600 2GB×2 (11-11-12-24) | DDR3-1333 2GB×2 (9-9-10-24) | DDR3-1333 2GB×2 (9-9-9-24) | |
グラフィックスドライバ | 8.945-120328a-136239E | Catalyst 12.4 | 8.15.10.2696 | |
チップセット | AMD A70M | AMD A60M | Intel HM65 Express | |
ストレージ | 128GB SSD (SAMSUNG 830) | 640GB HDD (WD6400BPVT) | 500GB HDD (HTS545050B9A300) | |
ディスプレイ解像度 | 1,366×768ドット | |||
OS | Windows 7 Ultimate SP1 64bit(英語版) | Windows 7 Home Premium SP1 64bit |
A10-4600M搭載のTrinity評価用PC | A8-3520M搭載ノート「Lenovo IdeaPad Z575 129995J」 | Core i5-2410M搭載ノート「ASUS K53E」 |
●CPU処理中心のベンチマークテスト
まずはCPUベンチマークのテスト結果から見ていく。テストは「Sandra 2012.SP2 18.30」(グラフ1、2、12~15)、「PCMark05」(グラフ3、4)、「CINEBENCH R10」(グラフ5)、「CINEBENCH R11.5」(グラフ6)、「x264 FHD Benchmark 1.01」(グラフ7)、「Super PI」(グラフ8)、「PiFast 4.3」(グラフ9)、「wPrime 2.09」(グラフ10)、「PCMark Vantage」(グラフ11)だ。
結果を確認してみると、A10-4600Mが比較用に用意したA8-3520Mに対して多くのテストで優位な結果を記録していることがわかる。特に、A10-4600Mが備える4つの整数演算コアと拡張命令セットが活きるSandraのMulti-Media Integerでは、A8-3520Mに対して3倍以上の差をつけている。また、浮動小数点演算コアの数では劣るもののSandraのWhetstone FPUやMulti-Mmedia FloatでもA8-3520Mを上回っており、マルチスレッド処理においては、高い動作クロックと新しい拡張命令セットのサポートによってLlanoベースのAPUを上回るパフォーマンスを実現しているようだ。
一方、シングルスレッド時は最大2.5GHzで動作するA8-3520Mに差を詰められているテストも少なくなく、拡張命令セットの恩恵を受けられないSuper PIなどの計算系ベンチマークテストでは、A8-3520Mの後塵を拝している。この際、テスト実行中のA10-4600Mの動作クロックを確認したところ、スペック上限の3.2GHzではなく2.7GHz前後で動作している場面が大半だった。このことから、動作クロックのアドバンテージが少なくなったことも、シングルスレッドでA8-3520Mとの差が縮んだ要因となっていると思われる。
i5-2410Mとの比較においては、ほとんどのテストでi5-2410Mに対して劣勢な結果となっている。Llanoに比べれば多くのテストでその差を縮めているものの、まだCPU性能では追いつけていないという印象を受ける。
●3Dゲーム系ベンチマーク(DirectX 11)
続いて、3Dゲーム系のベンチマークテストの結果を確認していく。まずはDirectX 11対応ベンチマークテストの結果からだ。実施したテストは「3DMark 11」(グラフ16~19)、「Unigine Heaven Benchmark 3.0(DX11)」(グラフ20)、「Lost Planet 2 Benchmark(DX11)」(グラフ21)、「Stone Giant DX11 Benchmark」(グラフ22)、「Alien vs. Predator DX11 Benchmark」(グラフ23)、「Tom Clancy's H.A.W.X 2 Benchmark」(グラフ24)。なお、i5-2410Mについては、内蔵GPUのIntel HD Graphics 3000がDirectX 10.1のサポートに留まるため、スコアは取得できていない。
Radeon HD 7660Gを備えるA10-4600Mは、Radeon HD 6620Gを備えるA8-3520Mに対して、DDR3-1600動作のメモリとの組み合わせえで20~50%、DDR3-1333動作のメモリを搭載している状態でも10~40%の差をつけている。メインメモリをGPUとも共有するAPUでは、搭載しているメモリの動作クロックがGPU性能を左右するが、同一クロックのDDR3-1333でも差をつけているところを見ると、GPU性能が向上していることが伺える。
●3Dゲーム系ベンチマーク(DirectX 10/9)
DirectX 9世代とDirectX 10世代のベンチマークテストの結果を紹介する。実施したテストは「3DMark Vantage」(グラフ25~27)、「Unigine Heaven Benchmark 3.0(DX10)」(グラフ28)、「BIOHAZARD 5(DX10)」(グラフ29)「3DMark06 Build 1.2.0」(グラフ30)、「MHFベンチマーク 【大討伐】」(グラフ31)、「ファイナルファンタジーXIV オフィシャルベンチマーク」(グラフ32)、「Unigine Heaven Benchmark 3.0(DX9)」(グラフ33)、「Lost Planet 2 Benchmark(DX9)」(グラフ34)だ。
DirectX 11の結果に続いてA10-4600MがA8-3520Mに優位な結果を示しているが、DirectX 9ベンチ「LostPlanet2」のアンチエイリアシングを切った設定でA8-3520Mに逆転を許しており、全項目でA8-3520Mを上回ることはできなかった。ただし、このテストにおいて、A10-4600Mのスコアはアンチエイリアシングを有効にしてもフレームレートが大きく変動しないという、CPUがボトルネックになっている際に見られる結果を示している。
また、CPU処理中心のベンチマークでは後塵を拝していたi5-5410Mに対しては、「3DMark Vantage Build 1.1.0」のPhysics ScoreのようなCPU性能を測る項目を除けば、ほぼすべての項目で約2倍の差をつけて圧倒している。CPU処理能力でi5-2410Mが優位性を保っている反面、GPU性能では大きく差をつける結果となった。
●消費電力比較
最後にシステムの消費電力を測定した結果を紹介する。消費電力の数値については、バッテリを外した各PCのACアダプタにワットチェッカーを接続して測定した。いつもの検証以上に各環境のパーツ構成が異なっているため、あくまで参考程度の結果として確認して頂きたい。
【グラフ35】消費電力 |
A10-4600Mの消費電力は、CPU処理中心のCINEBENCH R11.5実行中はA8-3520Mと大きな差のつかない結果となっているが、3DMark 11など、GPUが3D描画を行なっている際の消費電力は10W近く高くなっている場面が見られた。それぞれ環境が違いすぎるため確実ではないが、GPUクロックが固定されているA8-3520Mに対し、Turbo CoreによってGPUクロックが上昇することが関係しているものと思われる。
●順当に性能向上を果たした第2世代APU以上、A10-4600Mを搭載したTrinityの評価機材と現行のノートPCを比較してみると、CPU、GPUとも順当にパフォーマンスアップを果たしたという印象を受ける。CPUに関しては得手不得手がハッキリしていたBulldozerアーキテクチャの特徴を受け継いでおり、StarsコアのLlanoから全面的にパフォーマンスアップしたとは言えないが、新たにサポートされた拡張命令セットが活かせる条件下では大きなパフォーマンスアップを体感できるだろう。
GPU側はしっかりパフォーマンスアップしており、ノートブック向けであるA10-4600Mであっても、ある程度のゲームプレイが楽しめそうな印象を受けた。多少設定を落とせば、DirectX 11世代でも描画負荷の軽いH.A.W.X 2のようなゲームなら、プレイできそうな印象だ。
CPU、GPUとも順当に性能向上を果たしたTrinityだが、今後の展開として期待されるのが内蔵GPUをGPGPUとして活用する展開だ。先日発売された「Adobe Photoshop CS6」では、Trinityを使った場合、新機能のぼかしギャラリーで最大10倍の高速処理が行なえるとされている。現時点ではCPU性能でi5-2410Mに及ばなかったA10-4600Mだが、3D描画以外の場面でGPUのポテンシャルを活かせる場が増えれば、いよいよAPUという存在が面白くなってくるだろう。今後のAMDとソフトウェアベンダーの連携に期待したい。
(2012年 5月 15日)
[Reported by 三門 修太]