ニュース

日本AMD、内蔵GPUとの協調性を向上させた新世代APU「Kaveri」を解説

~新Catalystではビデオのマッハバンドを消す機能や高速JPEGデコーダを搭載

Adam Kozak氏
1月14日 開催

 日本AMD株式会社は14日、新APU「Kaveri」の発売に先立ち記者説明会を開催し、米国から来日した担当者が、Kaveriの概要および特徴などについて解説した。

CPUとGPUが協調動作するアーキテクチャ

 まずはKaveriの概要について、AMD クライアント・デスクトップ担当 シニア・プロダクト・マーケティング・マネージャーのAdam Kozak氏が解説した。

 2013年時点のPC出荷を見ると、世界で出荷されるPCの9割が、CPUにGPUを統合したモデルになっているという。そしてAMDとしてはデスクトップやノートPCだけでなく、組み込みとサーバー向けにもAPUラインナップを用意しているとした。

 そのAPUの最新モデルとなるのが今回発売されたKaveriとなる。Kaveriでは後述する革新的なアーキテクチャの採用によりダイ上における演算性能を最大化させ、ユーザー体験を一新できる。特徴としては、合計856GFLOPSに及ぶ演算能力、最大12個のコンピュートコア、HSA対応、TrueAudio、PCI Express Gen3、Ultra HDへの対応などを挙げた。

GPU内蔵CPU搭載PCの増加
AMDのAPUはデスクトップ、ノートPCのみならず、組み込みやサーバー向けにも用意される
Kaveriの概要

 これまでに明らかにされている通り、CPUコアには新設計の「Steamroller」を採用。従来のPiledriverから命令キャッシュのフェッチミスを30%、分岐予測ミスを20%削減し、スケジューリング効率を5~10%改善。また、命令デコーダを1モジュールあたり1基から2基に増やし、スレッドあたりのディスパッチ性能を25%向上するなどの改善を図った。

 これらの改善により、従来のPiledriverと比較して同クロックで10%前後性能が向上したが、実際に出荷されるSKUでは性能と消費電力のバランスを取るためにクロックを10%低下させたとしている(実際、A10-6800Kは4.1GHzだがA10-7850Kは3.7GHzとなっている)。

 一方GPUは最新のRadeon R7/R9と同じGCNアーキテクチャを採用した。ディスクリートのR7/R9シリーズと同様、独自オーディオAPIであるTrueAudioや、マルチディスプレイ出力が行なえるEyefinity(4ディスプレイまで)、ビデオ再生支援のUVD/VCEをサポートする。搭載されるGPUはダイ面積の47%を占めている。

 GCNのGPUコアは、Radeon R7/R9ディスクリートGPUと同じ構造で、1コアあたり1つのスケジューラーを搭載し、SIMD-16×4基のベクターユニット、64KB×4基のベクターレジスタ、64KBのローカルデータシェアメモリ、16KBの共有L1キャッシュなどを搭載。この1コアが独立し、非同期演算を行なえるため、Kaveriでは最大8 GPUコア搭載などの表記となっている。

 KaveriではCPUとGPUの協調動作を開発者で利用しやすくするために、CPUとGPUのメモリアドレスを共通化する「hUMA」と、CPUがGPUに命令をするだけでなく、GPU側からもCPUに命令できる「hQ」を搭載した。これをHSAと呼ばれる仕組みで利用することで、ダイ面積あたりの性能を最大化したという。

Kaveriのアーキテクチャ
KaveriのCPUコア
CPUコアの改善
KaveriのGPUコア
GPUコアはディスクリートのRadeon R7/R9と同等
KaveriのGPUコア構成
hUMAとhQによるHSAアーキテクチャ

最新のベンチマークで競合への優位性をアピール

 実際のベンチマーク比較でも、同価格帯のCore i5-4670Kと比較してPCMark 8で24%、3DMarkで87%、BASEMARK CLで61%の性能向上を実現したという。実アプリにおいては、「Photoshop Creative Cloud」のスマートシャープネス処理で3.3倍、LibreOfficeの表計算処理で5倍強高速化できるという。なお、LibreOfficeについては、HSAのオンとオフで8倍の性能差があるとしており、「オフでは4670Kより遅いが、オンでは4670Kより速く、半導体全体の性能が活かせる意味では優れる」とした。

 またHSAはこれらの日常アプリケーションに加え、ゲームでも有効としている。現在Valveのゲーム配信プラットフォーム「Steam」を利用しているユーザーの35%が、未だA10-7850Kより遅い環境であることを踏まえ、Core i5-4670K+GeForce GT 630ビデオカードを組み合わせたプラットフォームよりも快適に各種ゲームがプレイできるとした。

 さらに、PCI Express Gen3バスを内蔵しているため、Radeon R9 270XのようなミドルレンジディスクリートGPUを増設した場合でも、Core i5-4670Kと同等の性能が実現できるとした。

 ゲームにおいては、新しい独自API「Mantle」への対応によりさらに性能が向上できるという。具体的にMantle対応のゲームエンジン「OXIDE」と、ディスクリートGPUではあるものの同じGCNアーキテクチャのRadeon R9 290Xを利用した「STARSWARM」デモでは、Mantle非対応版だとフレームレートが10fps以下になるところ、Mantle対応版だと30fps以上を維持できるとし、今後3タイトルがこのエンジンを採用するとした。

最新3Dベンチマークスイートの性能比較
Adobe Creative Cloudのスマートシャープネス処理とLibreOfficeのHSA対応版の性能比較
さまざまなゲームにおける対応
Core i5-4670K+GeForce GT 630より概ね高速で、Steamユーザー全体のシステムの35%よりも高速
ディスクリートGPU搭載時もCore i5-4670Kとほぼ同等の性能
OXIDEのゲームエンジンでRadeon R9 290X/Mantleオフ時のフレームレート。重い場面では4fps程度になってしまう
Mantleをオンにすると40fps程度に改善した
OXIDEゲームエンジンのMantle対応/非対応では3倍程度違いが出るという
Mantle対応版のBattlefield 4では性能が45%向上するという

そのほかの機能

 独自のオーディオAPI「TrueAudio」では、多チャンネルオーディオのサポートにより、例えば人物が多く出てくるような映画の場面では、これまでは複数の人が1つのオーディオチャンネルを利用していたが、TrueAudioでは1人あたり1チャネルのオーディオを持つと言ったことが実現できるという。また、ノイズ軽減といった処理もCPUに負荷をかけずに実現できるとした。

 4Kビデオへの対応も強化し、HSAによるHEVCのエンコード(オープンソース)とデコード(ソフトウェアバンドル対応)が可能になる。また従来の1080pコンテンツを4Kにアップスケーリングするといった処理も可能になるという。

 このほか、Kaveriではメモリコントローラが改善され、DDR3-2400まで対応できるようになったという。1,600MHzのメモリに対して、2,133MHzメモリでは約10~30%、2,400MHzメモリでは約12%~40%グラフィックス性能が向上するという。AMDのメモリチームとも開発を協業し、Radeon R5/R7/R9ブランドのメモリを用意するとした(日本で発売されるかどうかは未定)。

 チップセットはSocket FM2+対応のA88X/A78/A55で利用可能だが、新たにTDPを指定するだけで動作クロックをAPUが決定する「Configurable TDP」、RAID構成ソフトウェア「DotHill Raid」が利用可能になるとした。

 なお、Kaveriのダイサイズは245平方mm、トランジスタ数は24億1,000万、製造はGLOBALFOUNDRIESの28nm SHPプロセスで行なわれる。また、A10-7850KとA10-7700KはFPSゲーム「Battlefield 4」とバンドル販売される。

TrueAudioの機能
HSAによりHEVCのエンコード/デコードをサポート
メモリはDDR3-2133以上を推奨、最大DDR3-2400をサポート
対応チップセットと新機能
KaveriのSKU
Battlefield 4とのバンドル販売
Kaveriの製造プロセスとダイサイズ

デュアルグラフィックスとビデオの画質を強化したCatalyst 13.35

Terry Makedon氏

 ドライバやソフトウェアスイートとなるCatalystについて、同社 ソフトウェア・ストラテジー担当 シニアマネージャーのTerry Makedon氏が解説を行なった。

 性能向上やバグフィックスを主な目的に進化してきたCatalystだが、1月末に予定されている13.35ベータでは、2つのGPUを利用した3Dレンダリングで、フレームの長さが不安定になってしまうために、カクカクしてしまう現象を解消する「Frame Pacing」をサポート。ディスクリートGPUが2基のCrossFire X構成時のみならず、KaveriとRadeon R7ディスクリートビデオカードとのデュアルグラフィックス構成時における問題も解消し、快適な3Dゲームが実現できるとした。

 Control Centerのデザインも一新され、インストールされている3Dアプリケーションが自動でリスト化されるようになった。これによりアプリケーションごとのプロファイル設定がより簡易にできるようになったという。

Catalystのこれまでの更新
Frame Pacing問題への対処
Frame Pacingをオンにするとフレームレートが安定する
KaveriとディスクリートRadeon R7のデュアルグラフィックス
3Dアプリケーションのリスト化

 ビデオ再生支援機能も強化され、APUによるポストプロセス処理によって、グラデーションのマッハバンドを軽減する「Contour Removal」、ディテールを強調する「Detail Enhancement」を追加。また、24Hzの映画などを60Hzのディスプレイに映す際、中間のフレームを演算によって補間してよりスムーズに見せる「Fluid Motion」をサポートした。

 また、新しいCatalystでは、独自のJPEGデコーダをビルトインすることが明らかになった。これはWindows標準のJPEGデコーダに置き換わり、自動的にJPEG画像の表示を高速化するという。近年デジタルカメラの高画素化と普及により、一般ユーザーでもJPEGの表示に時間が掛かるといった問題を体験すると思うが、これが改善できるわけだ。

マッハバンドを消去するContour Removalとディテール協調のDetail Enhancement
24Hzの映画などを60Hz化するFluid Motion
Windows標準のJPEGデコーダに置き換わり、処理を高速化

 オーバークロッキングスイート「AMD OverDrive」も強化され、Kaveriをサポート。AMDのテストによればオーバークロックにより性能を約2割向上できるとした。

 最後に、APUとしてA10-7850Kを搭載しつつ、3Dゲーム用にRadeon R9 290Xをさらに搭載するといったユーザーもいるとは思うが、例えばHSAによる物理演算などの処理をA10-7850K側が担当し、グラフィックスのレンダリングをRadeon R9 290X側が担うといった協調動作も実現できるとした。

AMD OverDriveはKaveri対応へ
KaveriとディスクリートGPUの協調動作も良好だという
このほか、自動更新などの機能が加わるという

(劉 尭)