東大の研究者が医療現場でのNVIDIA Tesla採用の実例を紹介
|
NVIDIAのスミット・グプタ氏 |
7月23日 開催
米NVIDIAは23日、同社のGPGPU(General Purpose GPU、汎用GPU)についての取り組みや成果について説明会を開催。同社Tesla GPUコンピューティング担当シニアプロダクトマネージャのスミット・グプタ氏が説明を行なったほか、実際にシステムの開発を行なった東京大学の研究生が実例を紹介した。
●GPUの並列処理性能を活用するGPGPU
GPGPUとは、その名が示す通り、GPUを従来のグラフィックス以外の用途にも幅広く応用することを意味し、GPUコンピューティングと称されることもある。NVIDIAは2002年頃からGPGPUの概念を語り始め、2004年頃からGPGPUを主要事業の1つに掲げ、ハードウェア/ソフトウェアの両面からGPGPUを念頭に置いたGPUの開発を開始。そして、2006年にGeForce 8シリーズ以降でGPGPUを可能にする開発プラットフォーム「CUDA」をリリースした。
同社の考えるGPGPUモデルは、ヘテロジニアス(異種混合)型で、CPUとGPUを組み合わせて利用する。元来、さまざまな計算処理はCPUが行なってきた。CPUは、ユーザーからの入力を受けて、次の処理へと進むといったシリアル(直列)な処理を得意とする。一方、GeForce 8000シリーズなど、世代的にはDirectX 10対応のGPUは、プログラマビリティが格段に向上したことで、グラフィックス以外の分野でも大規模なデータをパラレル(並列)な処理をすることが可能となった。CUDAとは、このそれぞれの得意分野の作業をCPUとGPUにうまく振り分けて処理させるプログラムを開発するためのプラットフォームとなる。
グプタ氏の説明によると、CUDAの利点は、多数のCPUを搭載し、高額で大規模なクラスタを従来のワークステーションクラスの小規模なシステムに置き換えできる点にあるという。
CUDAは、GeForce 8シリーズ以降のGPUで動作するが、同社ではGPGPU専用として「Tesla」ブランドの製品を用意している。Teslaは、チップ自体はGPUと変わらないが、ディスプレイ出力端子がないという点でGPGPU専用になっており、通常のGPUよりクロックが高かったり、最大搭載メモリ容量が大きいという違いがある。
また、提供形態も、グラフィックスカードそっくりのPCI Expressカード型以外に、2枚のTeslaカードを内蔵した外付け型や、4枚のTeslaカードを内蔵した1Uラックマウント型がある。GTX 200シリーズをベースとした第2世代Teslaの1Uタイプは、これ1台で4TFLOPSという高い演算性能を発揮する。これは単純計算ではクアッドコアCPUを1,400個積んだシステムに相当する。
カード型Tesla。見た目はビデオカードそっくりだが、ディスプレイインターフェイスがない | こちらは1Uラックマウント型。4GPUを内蔵し、4TFLOPSの演算性能を実現 |
つまり、同じ設置面積で考えると、アプリケーションにもよるがTeslaシステムはCPUのみのシステムに対し10倍から100倍以上の性能を発揮し、同じ性能という観点でTeslaシステムは、コストや消費電力を1/10以下に抑えられる。
またグプタ氏は、分散コンピューティングでタンパク質の構造解析を行なう「Folding@home」において、GeForce 8をベースとした前世代のTeslaは、AMDのGPGPU製品の約2.5倍、新Teslaは約4.3倍の性能を発揮するとの資料を示した。
質疑応答で明らかになったのだが、実はここで引き合いに出したAMDの競合製品は世代が1つ前(Radeon HD 3000ベース)のものであり、現世代(Radeon HD 4000ベース)のものは、これよりも性能が落ちるのだという。
これについてグプタ氏は、AMDのGPGPU開発プラットフォームである「Close To Metal」のGPUアーキテクチャに対する依存度が高く、現世代のものに最適化されていないことを指摘。また、ハードウェアアーキテクチャもGPGPUには適していないとの見解を示した。
ちなみに、GeForce 8をベースとした前世代のTeslaに対し、新Teslaは、理論性能では約2倍となるが、アプリケーション上での実性能は2倍を超えることが多いという。これは、旧Teslaが1GPU当たり1.5GBまでのメモリしか搭載できなかったのに対し、新Teslaが4GBまで搭載できるようになったことに起因するという。
100TFLOSPを実現するのに必要なCPUのみのシステムと、Teslaを使ったシステムの比較 | 旧Teslaと新Teslaの実アプリケーション上での性能比較。メモリが増えたことで2倍以上高性能になることも | Folding@homeでx86 CPU、Cell、AMD GPU、Teslaを使った場合の性能比較。ここでのAMD製品は1世代前のもの |
●東京大学での実際の応用例
東京大学のニコラス・ヘルランバン氏 |
こういった理由から、CUDAのリリースから1年以上が経過した現在、物理、映像、金融、医療、科学など多岐にわたる分野で、CUDAを利用したアプリケーションの開発や移植が進み、実務にも利用されるに至った。
東京大学で先端治療福祉工学研究室に所属するニコラス・ヘルランバン氏も、従来CPUだけで処理していた医療システムをCUDAでTesla用に移植した開発者の一人。ヘルランバン氏が取り組んでいる研究の1つが、超音波やMRIでスキャンした人体の内部情報を、患者の身体上に表示させ、施術者がより正確に体内の患部を把握できるよう支援するもの。施術する場所の切開を最低限に抑えられるほか、裸眼による立体視にも対応するなど最先端の医療システムだ。
ヘルランバン氏も、Teslaを用いることで、性能が最大で約80倍にまで向上したと、その性能を高く評価している。この医療システムでは、正確性が重視されるため、高解像度な3D画像を扱う必要があるが、解像度を上げるにつれて、CPUに対する性能向上の度合いが増していったことにもメリットを感じたという。
特にCPUのみでは1fpsを遙かに下回っていたものが、Teslaによって数~十数fpsにまで引き上げられたという事実が非常に重要だとヘルランバン氏は語る。
というのも、人体の器官で最も激しく動く心臓はおよそ1秒に1回拍動する。そのため、1fps以下の従来のシステムでは静止画しか表示できなかった。これが、1fps以上になったことで、拍動をアニメーションで再現できるようになり、より正確な施術が可能になった。つまり、単に性能が向上したというのを超えて、CPUのみではできなかった処理がGPUによって可能になったと言う点をヘルランバン氏は強調した。
プログラム言語にCを使っていること、そしてWindowsのみならずMac OSやLinuxにも対応していることもCUDAならではの利点だという。
ヘルランバン氏は、当初AMDのGPGPU開発プラットフォームである「Close To Metal (CTM)」や、Cell Broadband Engineなどの利用も試みたが、使い慣れたC言語に比べると複雑すぎてすぐに断念したという。また、実際の現場では複数のOSが使われているが、CUDAで開発したアプリケーションは移植作業が不要な点も長所の1つとして挙げている。
なお、ヘルランバン氏の研究成果は、8月1日~2日に東京大学で開催される「Medical Imaging and Augmented Reality (MIAR)」というワークショップで披露される。
ヘルランバン氏の研究内容。スキャンした体内の映像を患者の人体上に投影し、それを見ながら施術できる医療支援システム | 演算や画像処理に携わるのシステム構成内容 |
旧来のCPUのみのシステムとの比較。1fpsを超えたことの意味合いが大きいという | マルチプラットフォームで動作するのも大きな利点 |
●CUDAの今後の展開
CUDAの今後の展開としては、8月にもマルチコアCPU対応版をリリースする。グプタ氏によると、並列コンピューティング向け開発環境として業界初のマルチコアCPU対応ソリューションになるという。
その後は、FortranやC++といった他の言語への展開や、マルチGPUへの対応、デバッガやプロファイラの強化などが予定されている。
このマルチGPU対応というのは、現在でも複数のGPUの利用には対応しているが、現在GPU同士の通信の際にCPUやシステムメモリへのアクセスが発生し、バスがボトルネックになっているものを解消し、より直接的にGPU同士を通信させる仕組みを指す。
プロジェクトとしては、Teslaを採用したシステムで、スーパーコンピュータの性能ランキング「TOP500」にランクインできるものも計画されているという。ちなみに、TOP500で用いられている性能指標テストLINPACKは倍精度の演算を利用している。新Tesla 1台で約4TFLOPSという性能は単精度演算時のものであり、倍精度では350GFLOSP程度に留まる。それでも、グプタ氏はランキングトップ10を目指せるシステムになるだろうとの見込みを示した。
また、国内でもCUDA採用への気運の高まりを受け、8月初旬を目処に、日本語サイトのCUDA関連情報を米国サイトと同じ内容にアップデートする予定。
□NVIDIAのホームページ
http://www.nvidia.co.jp/
□CUDA ZONE
http://www.nvidia.co.jp/object/cuda_home_jp.html
□東京大学での事例の紹介
http://www.nvidia.co.jp/object/cuda_success_jp.html
□先端治療福祉工学研究所のホームページ
http://www.atre.t.u-tokyo.ac.jp/jp/
□MIARのホームページ(英文)
http://www.miar.org/2008/
□関連記事
【7月7日】【海外】GeForce GTX 200(GT200)のパフォーマンスの秘密
http://pc.watch.impress.co.jp/docs/2008/0707/kaigai452.htm
【2006年11月9日】【海外】これがGPUのターニングポイントNVIDIAの次世代GPU「GeForce 8800」
http://pc.watch.impress.co.jp/docs/2006/1109/kaigai316.htm
(2008年7月24日)
[Reported by wakasugi@impress.co.jp]