AMDの第2世代APU“Trinity”の実力をベンチマーク


 AMDは5月15日、Trinityの開発コードネームで呼ばれていた第2世代APU製品を発表した。今回、AMDより評価用の機材を借用できたので、第2世代APUの実力をベンチマークで確認してみた。

●CPU、GPUともアーキテクチャを変更した新APU

 AMDの第2世代APUであるTrinityは、Llanoと同じく32nmプロセスで製造されたAPUだ。CPUコアに第2世代のBulldozer「Piledriver」、GPUコアには、Radeon HD 6800などと同じVLIW4アーキテクチャを採用したGPUコアを備える。K10系のStarsコアとVLIW5アーキテクチャのGPUコアを採用していたLlanoから、CPU、GPUともアーキテクチャが変更されたことになる。

Trinityのブロックダイアグラムと特徴
Trinityのダイレイアウト

 TrinityのCPU部に採用されたPiledriverコアは、前述の通りBulldozerアーキテクチャに改良を施したCPUコアだ。1つのCPUモジュールに、2つの整数演算コアと1つの浮動小数点演算コアを備え、L2キャッシュやフロントエンドを共有するというBulldozerモジュールの設計をベースに、分岐予測ユニットの改善、共有L3キャッシュの省略や、新拡張命令セット「FMA3」のサポートなど、さまざまな変更が加えられている。

 GPUコアは最大で384基のStream Processing Units(SP)を備える。GPUコアが備えるSP数は、LlanoベースのA8シリーズのGPUコアが備える400SPに比べて減少しているが、これはVLIW4とVLIW5のアーキテクチャの違いによるものであり、Llanoが備えるGPUに比べスペックダウンしたというわけではない。

 APUの機能としては、自動オーバークロック機能Turbo COREの発展版「AMD Turbo Core Technology 3.0」を新たにサポートした。この機能では、CPUコア部分の自動オーバークロック機能に留まっていた従来のTurbo Core Technologyを発展し、負荷に応じてCPUとGPUの動作クロックを変動させる機能となった。このほか、メモリコントローラがサポートするメモリクロックは最大DDR3-1866とLlanoと同等だが、Trinityでは新たに1.25Vの低電圧DDR3メモリがサポートされた。

Piledriverコアの概要
VLIW4アーキテクチャを採用するGPUコアの概要
AMD Turbo Core Technology 3.0の概要

 第2世代のAMD Aシリーズとして製品展開されるとTrinityでは、従来のAMD A8/A6/A4の各ラインナップに加え、ハイエンドAPUに位置するAMD A10シリーズが追加された。今回AMDより借用した機材に搭載されているTrinityは、ノートブック向けAMD A10シリーズの「A10-4600M」だ。

 A10-4600Mは、2モジュール4コアのCPUコアと、384基のSPを持つ「Radeon HD 7660G」を統合している。A10-4600MはTurbo Core Technology 3.0をサポートしており、負荷状況に応じて、CPUは2.3GHzから最大3.2GHz、GPUは497MHzから最大686MHzの範囲で動作クロックが変動する。そのほか、ノートブックPC向けAPUということでメモリのサポートはDDR3-1600に留まるが、TDPは35Wと、Llanoベースのノートブック向けAMD A8シリーズの45Wより低く抑えられている。

【表1】主な仕様の比較
CPUA10-4600MA8-3520MIntel Core i5-2410M
モジュール数2
コア数442
スレッド数444
CPU動作クロック2.3GHz1.6GHz2.3GHz
Turbo Boost時3.2GHz2.5GHz2.9GHz
L2キャッシュ4MB4MB6MB
内蔵GPUコアRadeon HD 7660GRadeon HD6620GIntel HD Graphics 3000
Streaming Processor384基400基12基
GPUコアクロック497MHz444MHz650MHz
GPUコアクロック(最大)686MHz1,200MHz
TDP35W35W35W

●テスト機材

 さて、それではベンチマーク結果の紹介に移りたい。

 今回AMDから借用したTrinityの評価用PCとの比較対象として、AMD A8-3520Mを搭載したレノボ・ジャパンの「IdeaPad Z575 129995J」と、Intel Core i5-2410M(以下、i5-2410M)を搭載したASUSの「K53E」を用意した。なお、比較用の両製品については、標準仕様ではメモリがシングルチャンネル動作となっているため、今回はDDR3-1333動作の2GBメモリ2枚に変更してテストを行なった。また、Trinityの評価用PCは標準設定のDDR3-1600動作時のデータに加え、DDR3-1333動作時のデータも取得している。

 ノートブックPCを使っての比較ということで、ディスプレイ解像度こそ同じであるものの、画面サイズや搭載HDDなどのスペックは統一されてい。比較結果をご覧いただく際はその点を考慮してご覧いただきたい。

【表2】テスト環境
CPUA10-4600MA8-3520Mi5-2410M
内蔵GPURadeon HD 7660GRadeon 6620GIntel HD Graphics 3000
メモリDDR3-1600 2GB×2
(11-11-12-24)
DDR3-1333 2GB×2
(9-9-10-24)
DDR3-1333 2GB×2
(9-9-9-24)
グラフィックスドライバ8.945-120328a-136239ECatalyst 12.48.15.10.2696
チップセットAMD A70MAMD A60MIntel HM65 Express
ストレージ128GB SSD
(SAMSUNG 830)
640GB HDD
(WD6400BPVT) 
500GB HDD
(HTS545050B9A300)
ディスプレイ解像度1,366×768ドット
OSWindows 7 Ultimate SP1 64bit(英語版)Windows 7 Home Premium SP1 64bit

A10-4600M搭載のTrinity評価用PCA8-3520M搭載ノート「Lenovo IdeaPad Z575 129995J」Core i5-2410M搭載ノート「ASUS K53E」

●CPU処理中心のベンチマークテスト

 まずはCPUベンチマークのテスト結果から見ていく。テストは「Sandra 2012.SP2 18.30」(グラフ1、2、12~15)、「PCMark05」(グラフ3、4)、「CINEBENCH R10」(グラフ5)、「CINEBENCH R11.5」(グラフ6)、「x264 FHD Benchmark 1.01」(グラフ7)、「Super PI」(グラフ8)、「PiFast 4.3」(グラフ9)、「wPrime 2.09」(グラフ10)、「PCMark Vantage」(グラフ11)だ。

 結果を確認してみると、A10-4600Mが比較用に用意したA8-3520Mに対して多くのテストで優位な結果を記録していることがわかる。特に、A10-4600Mが備える4つの整数演算コアと拡張命令セットが活きるSandraのMulti-Media Integerでは、A8-3520Mに対して3倍以上の差をつけている。また、浮動小数点演算コアの数では劣るもののSandraのWhetstone FPUやMulti-Mmedia FloatでもA8-3520Mを上回っており、マルチスレッド処理においては、高い動作クロックと新しい拡張命令セットのサポートによってLlanoベースのAPUを上回るパフォーマンスを実現しているようだ。

 一方、シングルスレッド時は最大2.5GHzで動作するA8-3520Mに差を詰められているテストも少なくなく、拡張命令セットの恩恵を受けられないSuper PIなどの計算系ベンチマークテストでは、A8-3520Mの後塵を拝している。この際、テスト実行中のA10-4600Mの動作クロックを確認したところ、スペック上限の3.2GHzではなく2.7GHz前後で動作している場面が大半だった。このことから、動作クロックのアドバンテージが少なくなったことも、シングルスレッドでA8-3520Mとの差が縮んだ要因となっていると思われる。

 i5-2410Mとの比較においては、ほとんどのテストでi5-2410Mに対して劣勢な結果となっている。Llanoに比べれば多くのテストでその差を縮めているものの、まだCPU性能では追いつけていないという印象を受ける。

【グラフ1】Sandra 2012.SP4 18.45(Processor Arithmetic/Processor Multi-Media)
【グラフ2】Sandra 2012.SP4 18.45(Cryptography)
【グラフ3】PCMark05 Build 1.2.0 CPU Test(シングルタスク)
【グラフ4】PCMark05 Build 1.2.0 CPU Test(マルチタスク)
【グラフ5】CINEBENCH R10
【グラフ6】CINEBENCH R11.5
【グラフ7】x264 FHD Benchmark 1.01
【グラフ8】Super PI
【グラフ9】PiFast 4.3
【グラフ10】wPrime 2.09
【グラフ11】PCMark Vantage Build 1.0.2
【グラフ12】Sandra 2012.SP4 18.45(Memory Bandwidth)
【グラフ13】Sandra 2012.SP4 18.45(Cache Bandwidth)
【グラフ14】Sandra 2012.SP4 18.45(Cache/Memory Latency - Clock)
【グラフ15】Sandra 2012.SP4 18.45(Cache/Memory Latency - nsec)

●3Dゲーム系ベンチマーク(DirectX 11)

 続いて、3Dゲーム系のベンチマークテストの結果を確認していく。まずはDirectX 11対応ベンチマークテストの結果からだ。実施したテストは「3DMark 11」(グラフ16~19)、「Unigine Heaven Benchmark 3.0(DX11)」(グラフ20)、「Lost Planet 2 Benchmark(DX11)」(グラフ21)、「Stone Giant DX11 Benchmark」(グラフ22)、「Alien vs. Predator DX11 Benchmark」(グラフ23)、「Tom Clancy's H.A.W.X 2 Benchmark」(グラフ24)。なお、i5-2410Mについては、内蔵GPUのIntel HD Graphics 3000がDirectX 10.1のサポートに留まるため、スコアは取得できていない。

 Radeon HD 7660Gを備えるA10-4600Mは、Radeon HD 6620Gを備えるA8-3520Mに対して、DDR3-1600動作のメモリとの組み合わせえで20~50%、DDR3-1333動作のメモリを搭載している状態でも10~40%の差をつけている。メインメモリをGPUとも共有するAPUでは、搭載しているメモリの動作クロックがGPU性能を左右するが、同一クロックのDDR3-1333でも差をつけているところを見ると、GPU性能が向上していることが伺える。

【グラフ16】3DMark 11 Build 1.0.3
【グラフ17】3DMark 11 Build 1.0.3(Graphics Score)
【グラフ18】3DMark 11 Build 1.0.3(Physics Score)
【グラフ19】3DMark 11 Build 1.0.3(Combined Score)
【グラフ20】Unigine Heaven Benchmark 3.0(DX11)
【グラフ21】Lost Planet 2 Benchmark(DX11)
【グラフ22】Stone Giant DX11 Benchmark
【グラフ23】Alien vs. Predator DX11 Benchmark
【グラフ24】Tom Clancy's H.A.W.X 2 Benchmark

●3Dゲーム系ベンチマーク(DirectX 10/9)

 DirectX 9世代とDirectX 10世代のベンチマークテストの結果を紹介する。実施したテストは「3DMark Vantage」(グラフ25~27)、「Unigine Heaven Benchmark 3.0(DX10)」(グラフ28)、「BIOHAZARD 5(DX10)」(グラフ29)「3DMark06 Build 1.2.0」(グラフ30)、「MHFベンチマーク 【大討伐】」(グラフ31)、「ファイナルファンタジーXIV オフィシャルベンチマーク」(グラフ32)、「Unigine Heaven Benchmark 3.0(DX9)」(グラフ33)、「Lost Planet 2 Benchmark(DX9)」(グラフ34)だ。

 DirectX 11の結果に続いてA10-4600MがA8-3520Mに優位な結果を示しているが、DirectX 9ベンチ「LostPlanet2」のアンチエイリアシングを切った設定でA8-3520Mに逆転を許しており、全項目でA8-3520Mを上回ることはできなかった。ただし、このテストにおいて、A10-4600Mのスコアはアンチエイリアシングを有効にしてもフレームレートが大きく変動しないという、CPUがボトルネックになっている際に見られる結果を示している。

 また、CPU処理中心のベンチマークでは後塵を拝していたi5-5410Mに対しては、「3DMark Vantage Build 1.1.0」のPhysics ScoreのようなCPU性能を測る項目を除けば、ほぼすべての項目で約2倍の差をつけて圧倒している。CPU処理能力でi5-2410Mが優位性を保っている反面、GPU性能では大きく差をつける結果となった。

【グラフ25】 3DMark Vantage Build 1.1.0
【グラフ26】3DMark Vantage Build 1.1.0(Graphics Score)
【グラフ27】3DMark Vantage Build 1.1.0(Physics Score)
【グラフ28】Unigine Heaven Benchmark 3.0(DX10)
【グラフ29】BIOHAZARD 5(DX10)
【グラフ30】3DMark06 Build 1.2.0
【グラフ31】MHFベンチマーク 【大討伐】
【グラフ32】ファイナルファンタジーXIV オフィシャルベンチマーク
【グラフ33】Unigine Heaven Benchmark 3.0(DX9)
【グラフ34】Lost Planet 2 Benchmark(DX9)

●消費電力比較

 最後にシステムの消費電力を測定した結果を紹介する。消費電力の数値については、バッテリを外した各PCのACアダプタにワットチェッカーを接続して測定した。いつもの検証以上に各環境のパーツ構成が異なっているため、あくまで参考程度の結果として確認して頂きたい。

【グラフ35】消費電力

 A10-4600Mの消費電力は、CPU処理中心のCINEBENCH R11.5実行中はA8-3520Mと大きな差のつかない結果となっているが、3DMark 11など、GPUが3D描画を行なっている際の消費電力は10W近く高くなっている場面が見られた。それぞれ環境が違いすぎるため確実ではないが、GPUクロックが固定されているA8-3520Mに対し、Turbo CoreによってGPUクロックが上昇することが関係しているものと思われる。

●順当に性能向上を果たした第2世代APU

 以上、A10-4600Mを搭載したTrinityの評価機材と現行のノートPCを比較してみると、CPU、GPUとも順当にパフォーマンスアップを果たしたという印象を受ける。CPUに関しては得手不得手がハッキリしていたBulldozerアーキテクチャの特徴を受け継いでおり、StarsコアのLlanoから全面的にパフォーマンスアップしたとは言えないが、新たにサポートされた拡張命令セットが活かせる条件下では大きなパフォーマンスアップを体感できるだろう。

 GPU側はしっかりパフォーマンスアップしており、ノートブック向けであるA10-4600Mであっても、ある程度のゲームプレイが楽しめそうな印象を受けた。多少設定を落とせば、DirectX 11世代でも描画負荷の軽いH.A.W.X 2のようなゲームなら、プレイできそうな印象だ。

 CPU、GPUとも順当に性能向上を果たしたTrinityだが、今後の展開として期待されるのが内蔵GPUをGPGPUとして活用する展開だ。先日発売された「Adobe Photoshop CS6」では、Trinityを使った場合、新機能のぼかしギャラリーで最大10倍の高速処理が行なえるとされている。現時点ではCPU性能でi5-2410Mに及ばなかったA10-4600Mだが、3D描画以外の場面でGPUのポテンシャルを活かせる場が増えれば、いよいよAPUという存在が面白くなってくるだろう。今後のAMDとソフトウェアベンダーの連携に期待したい。

(2012年 5月 15日)

[Reported by 三門 修太]