ニュース

ARM、ハイエンド向けGPUのMali-T860などを発表

ARM メディアプロセッシング事業部 シニアプロダクトマネージャ スティーブ・スティール氏

 ARMは、10月30日に品川で行なわれたプライベートイベント「ARM Tech Symposium 2014 Japan」に合わせて記者会見を開催し、同社の新しいIPデザインとなるGPU「Mali-T800」、ビデオエンジンの「Mali-V550」、ディスプレイエンジンの「Mali-DP550」を発表した。

 中でもMali-T800シリーズの最上位製品に位置付けられるMali-T860は、メモリ帯域が有効活用できる仕組みが導入されるなどしたことで、従来世代となるMali-T628に比べて電力効率が45%ほど改善されており、ハイエンドスマートフォン向けなど電力効率が問われるSoCに向けたデザインとなっている。

 また、ビデオエンジンのMali-V550では、最大の8コア構成では4Kで120FPSの動画をHEVC(H.265)エンコードする性能を持っている。これにより、例えばMiracastなどを利用して出力する際に、4K 120FPSの動画をエンコードしてWi-Fi上に乗せて送るという使い方も理論上は可能になる。

 ARMはこうしたIPライセンスの提供を既に始めており、同社によれば、搭載したSoCは2015年の後半~2016年の前半にかけて市場に登場する見通しだという。

ARMが力を入れるGPUのIPライセンス、13年には4億個が出荷される

 ARMは、同社が開発したIP(知的所有権)をSoCベンダーにライセンスするのがメインのビジネスだ。スマートフォンやタブレットの大多数で採用されている、Qualcomm、Apple、Samsung ElectronicsなどのSoCは、同社から提供された命令セットのライセンスに基づいて各社が製造されている。

 なお、ARMが提供するライセンスは、アーキテクチャ・ライセンスとIPライセンスという2つの種類があり、顧客は目的に応じて選択できる。アーキテクチャ・ライセンスは、ARMv7(32bit)やARMv8(64bit)などの命令セットのライセンスを付与する形態で、ベンダーは自社でARM命令セットに基づいたプロセッサを開発し、それを自社製品に組み込める。ARMv7で言えばQualcommのKraitプロセッサ(Snapdragonの多くで採用されているCPU)がこれに該当するし、ARMv8ではNVIDIA Tegra K1の64bit版のCPUであるDenverがこれに該当する。

 これに対してIPライセンスは、ARMが自ら開発したCPUやGPUのコアデザインをベンダーに対して供与する形のライセンスモデルになる。ARMv7のCPUで言えばCortex-A9やCortex-A15などが、ARMv8であればCortex-A57やCortex-A53などがそれに該当する。このIPライセンスを使えば、ベンダーはコストがかさむ自社CPUを開発する必要無く、簡単にARMプロセッサを組み込める。近年ではCPUの設計がどんどん複雑になり、開発コストが増える傾向にあるため、特に低価格向けの製品では有効だ。

 従来、ARMはIPライセンスは主にCPUを中心に提供していたのだが、近年ではCPU以外のラインナップも充実させており、特にメディア処理(グラフィックス、ビデオ、ディスプレイ)向けのIPライセンスを「Mali」というブランド名を付けて提供している。ARM メディアプロセッシング事業部 シニアプロダクトマネージャ スティーブ・スティール氏は「Maliのライセンス数は年々増えており、13年には新しく23のライセンスを付与してすでに100を超えている。我々はAndroidの市場、さらにはデジタルTV向けのSoCに採用されているGPUでは市場シェアがNo.1になっており、11年には5,000万ユニットだった出荷数も、13年には4億個にまで増加しており、14年はさらに増える見通しだ」と述べ、Maliビジネスが順調に成長していることをアピールした。

 また、「スマートフォンなどの市場はより複雑になっている。以前であれば1つの製品でほとんどのセグメントをカバーできたが、現在では細分化されており、それぞれに適した製品が必要になっている。コンテンツも複雑になっており、例えばGoogle Playマーケットでの売り上げの90%はゲームから来ている、モバイルデータ通信の53%はビデオが占めているなどニーズはより複雑になっている」と述べ、端末に求められ機能や性能の細分化のニーズに合わせた製品の投入が必要であり、それを実現するのが今回発表するMaliの新製品であるとした。

Maliのライセンスビジネスの現状、倍々ゲームで成長していることが分かる
現在のモバイルSoC市場は細分化が進んでおりそれに合わせたIPデザインが必要になりつつある
SoCに要求されるニーズも複雑になりつつある
今回ARMが発表した5つの新しいIPデザイン

メモリ帯域への圧迫を最小限にすることで電力効率を改善したMali-T800

 今回ARMが発表したのはGPUのIPライセンスとなるMali-T800シリーズの3製品と、ビデオエンジンのMali-V550、ディスプレイプロセッサのMali-DP550という5製品となる。いずれの製品も、現行製品となるMali-T600/700シリーズ、Mali-V500、Mali-DP500の後継となる。

 いずれの製品でも共通しているのは、メモリ帯域の節約という大きな特徴。「テクスチャ圧縮やフレームバッファ圧縮に加え、無駄を省く機能などを搭載し、メモリ帯域幅を節約することで性能を向上させている」とした。

 具体的には、ARMが発明しKhronos Group(OpenGL開発元)に提供したことでオープンな規格となったASTC(Adaptive Scalable Texture Compression)や、AFBC(Arm Frame Buffer Compression)といったデータ自体を圧縮してメモリ帯域への圧迫を防ぐ手法に加え、TE(Transcational Elimination)、SC(Smart Composition)、MSE(Motion Search Elimination)、PLS(Pixel Local Storage)といった無駄を省く手法を活用し、性能を向上させたり、電力効率を改善しているとした。

 Mali-T800シリーズは、3つのSKUが用意されており、現行製品のMali-T760の後継となるハイエンド向けのMali-T860、現行製品のMali-T720の後継となるMali-T820、さらに、860と820の間でミッドレンジ向けとなるMali-T830という3つのSKUが用意される。

 Mali-T860はT760と同じように最大16個の演算エンジン(シェーダーコア)を搭載でき、SoCベンダーのニーズに応じて4個や8個など、スケーラブルに変更できる。4Kやそれを超える解像度を意識した設計になっており、ネイティブで10-bit YUVの入出力をサポートしている。APIは、OpenGL ES 3.1/3.0/2.0/1.1、OpenCL 1.2/1.1、Direct3D 11.1、RenderScriptに対応している。Mali-T628に比べて45%ほど電力効率が改善しているという。

 ミッドレンジ向けのMali-T830、ローエンド向けのMali-T820は、最大で4つの演算エンジンを実装できる。T860と同様に1つや2つなどの構成が可能なスケーラブル仕様。Mali-T830とMali-T830の違いはパイプライン構造で、T820が前世代と1つの演算エンジン当たり1つのALUがあるという構造になっているのに対して、T830の方は1つの演算エンジン当たりに2つのALUがあるという構造になっていう点。このため、T820がUIの3D表示とカジュアルゲーム向けになるのに対して、T830の方はより高い処理能力を持ち、3Dゲームにも耐えうるようなデザインになる。

 なお、前世代では10-bit YUVが標準で用意されていたが、実際には利用されることは少なかったので、T830/820ではこれはオプションになっているという。APIは、OpenGL ES 3.1/3.0/2.0/1.1、OpenCL 1.2/1.1、Direct3D 11.1、RenderScriptに対応している。性能はMali-T830がMali-T622に比べて55%性能が向上し、さらに電力効率が50%改善しているとした。

 ARMはIPデザインだけでなく、実際の物理デザインをファウンダリの製造プロセスルールに最適化したノウハウも別途SoCベンダーに提供するサービス(POPと呼ばれる)もあるが、今回の製品に関してもTSMCの28nmや、14/16nmなども含めて最適化のノウハウが提供される予定だ。

新製品の最大の特徴はメモリ帯域の節約に成功したこと
Mali-T860の特徴、16個の演算エンジンを内蔵し、それそれのエンジンに2つのALUが用意されている。Mali-T628に比較して45%も電力効率が改善している
MaliーT820とMali-T830の特徴。T820とT830の違いは、演算エンジンに内蔵されているALUの数。T820はコアあたり1つのALU、T820はコアあたり2つのALU

Miracastで4Kの無線転送を可能にするMali-V550

 ARM ゲーミング・ミドルウェア担当ダイレクタ- クリス・ポートハウス氏は、ビデオエンジンMali-V550、ディスプレイエンジンMali-DP550に関する解説を行なった。

 Mali-V550は、動画のデコード、エンコードなどを行なうビデオエンジンだ。近年ではGPUにこうした動画のハードウェアエンコーダ/デコーダを搭載するのがトレンドになっており、CPU/GPUで行なうよりも高速に、かつ低い消費電力で処理できる。Mali-V550は、ARMのビデオエンジンのIPデザインであるMali-V500の後継となる製品で、内部に最大8つの演算器を実装して、動画の処理を行なうことが可能になっている(SoCベンダーのニーズにより演算器を減らすこともできる)。

 Mali-V550の最大の特徴は、従来製品のMPEG-4 AVC(H.264)までの対応だったのに対して、HEVC(H.265)に対応したことだ。特に、最大の8コア構成にした場合には4K 120FPSの動画をリアルタイムに処理できる性能を備えている。このため、Wi-Fiの帯域が十分であれば、MiracastのようなWi-Fi Directを利用した無線でのディスプレイ出力で、4K 120FPSの出力が可能になる。なお、1080p 60FPSであれば1コアでエンコードできるので、コアが複数あれば動画を同時にリアルタイムエンコード/デコードできる。

 Mali-DP550は、現行製品となるMali-DP500の後継製品で、最大で7レイヤーの処理が可能になるため、4Kの解像度でも楽々と処理できる性能を持っている。また、顧客がサードパーティないしは自社のスケーリング技術などを組み込みたい場合にも、それを可能にする口が開けてあり、SoCベンダーが自社のIPをMali-DP550に実装して利用することも可能だという。Mali-DP550はシングルないしはデュアルディスプレイにまで対応可能で、現在あるメジャーな全てのディスプレイ出力に対応可能だとポートハウス氏は説明した。

 なお、ARMによれば、これらのライセンスはすでに提供が開始されており、2015年の後半~2016年の前半にかけて搭載するSoCなどが登場する見通しだということだ。

Mali-V550の特徴。8つのコアを内蔵可能で、8つのコアを利用した場合、4K 120FPSの動画をHEVC(H.265)へリアルタイムエンコードが可能に。4KのMiracastなどが実現できる
Mali-DP550の特徴、4Kへの対応やサードパーティのIPを組み込むことができる
メモリ帯域の節約がどのIPデザインに使われているかを示す図

(笠原 一輝)