理研とNVIDIA、HPC用途でのGPUアクセラレートの討論会を開催
~NVIDIA CEOがGPUコンピューティングの可能性をアピール

「量産版」として紹介したFermiベースのTesla

1月28日~29日 開催



 独立行政法人理化学研究所(理研)とNVIDIAは、「Accelerated Computing」と題したカンファレンスを1月28日および29日の日程で開催した。これは、HPC分野に携わる人々に超並列アクセラレータの可能性を討論する場を提供するものだ。初日の基調講演には、NVIDIA CEOのジェンスン・フアン氏が登壇した。

●HPCのコモディティ化と新アーキテクチャへの要求
NVIDIA CEOのジェンスン・フアン氏

 フアン氏は今回の講演において、3つのトピックに分けてGPUコンピューティングを紹介した。「Why supercomputing needs new architecture? (なぜ、スーパーコンピューティングは新しいアーキテクチャを必要としているか?)」、「Why GPU is the best choice? (なぜ、GPUがベストの選択なのか?)」、「Why NVIDIA is so passionate abour GPGPU? (なぜ、NVIDIAはGPGPUに情熱的なのか?)」というお題であるが、重複する部分も多かった。

 まずフアン氏は、NERSC(National Energy Research Scientific Computing Center)の研究内容を紹介。これによると、2008年以降"シミュレーション”に対する需要の高まりから、コンピューティングのリソースが絶対的に不足しているという。シミュレーションは科学分野だけでなく、工業分野におけるプロトタイプ制作段階など、さまざまなジャンルで広く用いられるようになったというが、そのリソースが圧倒的に不足している。

 一方でHPC(ハイパフォーマンスコンピューティング)のプロセッサは、'99年以後、それまでと大きく異なる発展をした。'99年以前はベクタであったり、SIMDやMIMD、マルチプロセッサなど、さまざまなアプローチのプロセッサをスパコンメーカーが開発して、ビジネスを行なうという状況だった。

 しかし、'99年にベクタインストラクションであるSSEをIntelが発表。以後、x86系CPUを多数用いたスパコンがシェアの大半を占めるようなり、ここにスパコンプロセッサのコモディティ化が始まった。ムーアの法則により、18カ月で2倍の性能を得ることができ、同時に価格低下にもつながったとフアン氏は述べた。

 しかし問題が発生した。それは、そのプロセッサのスケーリングが止まってしまったことだ。フアン氏は、バークレー大学のデビッド・パターソン氏が提唱した「The Brick Wall」を紹介。これは命令レベルでの並列性の壁、メモリの壁、消費電力の壁という3つの壁によって、コンピュータの性能に大きな壁(それをレンガの壁に例えている)が生じているとしたものだ。

 この例では、年率52%で伸びてきたプロセッサの性能が、2002年ごろを境に“壁”にぶつかり、以後は年率20%の伸びへと減衰。この性能向上の後退は、年率52%を維持していたと仮定すると、2016年には1,000倍分の性能が失われた計算になるという。

 こうした事情から、ソフトウェア開発者にも対応が求められているとフアン氏はしている。それまでのソフトウェアパッケージは、ベースとなる部分のコードには触れず、主に機能追加で次の製品を投入してきた。機能追加によって遅くなったとしても、18カ月で2倍の勢いで伸びてきたプロセッサの性能が、それを相殺してきたのだ。しかし、そのプロセッサのスケーリングが止まった今、コードを書き換える必要が生じている。

 現在はプロセッサのマルチコア化という新しいアーキテクチャが生まれており、ソフトウェア開発者も当然それを意識しなければならない。フアン氏は、この流れに沿う、多数のパラレルプロセッサを持ち、性能の成長が著しいGPUコンピューティングに高い可能性があるとアピールしているわけである。

科学、産業界でシミュレーションが当たり前になったことで、2008年以降にコンピューティングリソースのニーズが上昇。HPCの進化で性能は向上したが、満たせていないニーズも大幅に増しているシミュレーションにおいては強力な浮動小数点演算能力が求められることを、細胞のシミュレーションを例に示したもの。現在の世界最速スパコンは1PFLOPS台
SSEの登場以後、x86系CPUを採用するスパコンがシェアを拡大。パフォーマンス当たりのコストを重視した、コモディティCPUによるスパコンが当たり前になったマルチコアCPUに比べて、GPUの性能向上が目覚ましいことをアピールした図

●GPUコンピューティングの活用事例などを紹介

 フアン氏はGPUのコンピューティングの活用事例についても紹介した。700万個の光子を使った「力技のシミュレーション」であるレイトレーシングのデモでは、旧世代のGT200に対して、次世代のFermiでは4倍の性能が出せる点をアピール。併せて、テッセレーションの例も示した。

レイトレーシングのデモ。700万のフォトンをシミュレーションしたものこちらはFermi世代で搭載されたテッセレータを使ったデモで、ディスプレイスメントマップを組み合わせて水面の波を表現している

 AdobeのMercury Playback Engineは、Adobe Premiere CS5に搭載される予定の動画編集アクセラレーションエンジンだが、CUDAを用いることでリアルタイムでプレビューをしながら動画編集ができることも紹介された。学術分野での事例も示された。

 GPU活用におけるコストパフォーマンスもアピールしている。コモディティなシステムであるXeon環境に、2枚のTeslaを搭載した際に、分子動力学計算で19倍、分子モデリングで25倍の性能向上。パフォーマンス当たりのコストは、それぞれ14倍、19倍になるとした。

 このほか、CUDAの成長についても紹介された。CUDAがリリースされたのは2006年であるが、その翌年のSuperComputing07ではCUDA関連のブースが、NVIDIAだけであったのに対し、2009年には75ブース、90の関連ポスターが開かれるまでになった。また、300の大学・企業がCUDAを教育するに至っているという。何人ものユーザがすでにNVIDIAのCUDA対応GPUを使用していることから、CUDAを用いたアプリケーションがすぐにでも利用できるユーザーが多いことも説いている。

 さらにNVIDIAは、Visual Studioでのヘテロジニアスプラットフォームでのアプリケーション開発環境である「NEXUS」をリリースして開発者を支援。HPC市場はますます大きくなると予想していることから、これまで同様、GPUコンピューティングに対して多額の投資を続けていくとした。

次期Adobe Premiereで搭載されるMercury Playback EngineはCUDAを用いて動画編集処理をアクセラレーションするTeslaを導入する追加コストに対して、得られるパフォーマンスが大きいことで、結果的にコストパフォーマンスが良い環境ができることをアピールGPUコンピューティングに対する研究開発費の投資。不況時にも投資額を伸ばしたことを示し、この分野への注力をアピールした

(2010年 1月 29日)

[Reported by 多和田 新也]