イベントレポート

【NVIDIA Manufacturing Day 2013レポート】(前編)
製造業分野におけるGPUコンピューティングの利用が本格化

会期:1月17日

会場:アカデミーヒルズ タワーホール

 1月17日、エヌビディアジャパン(以下NVIDIA)が主催する「NVIDIA Manufacturing Day 2013」が東京六本木のアカデミーヒルズタワーホールで開催された。

 NVIDIA Manufacturing Day 2013は、自動車メーカーや家電メーカーなど、製造業分野を対象とするカンファレンスであり、国内での開催は今回が2回目となる。このカンファレンスでは、NVIDIAの担当者による、NVIDIAの製造業向けの取り組みや製造業におけるGPUコンピューティングの最新情報、レノボ・ジャパンや日本HPによる製品や導入事例の紹介、東京工業大学によるTSUBAME 2.0の産業利用の紹介、CAEベンダーによるGPUコンピューティングへの対応状況といった講演が行なわれたほか、特別講演として、日本自動車工業会によるGPUコンピューティングへの取り組みの紹介が行なわれた。興味深い話題が多かったので、それぞれの講演内容をレポートしたい。まずは、午前中の講演の内容を紹介する。

スーパーコンピュータTOP500のうち50システムにTeslaが搭載

エヌビディアジャパンTesla Quadro事業部事業部長杉本博史氏

 午前中の3講演は、すべて主催者のNVIDIAによるものであった。最初に行なわれたのが、NVIDIAのTesla Quadro事業部事業部長の杉本博史氏による「NVIDIA GPUコンピューティング最新情報 ~世界最速のHPCアクセラレーターTesla K20ファミリー製品のご紹介~」と題する講演だ。

 杉本氏はまず、NVIDIAの会社概要を紹介し、同社の中核技術はグラフィックスであり、グラフィックスはさらに、GPU、モバイル、クラウドの3分野に分けられるとした。NVIDIAは、今年(2013年)創立20周年を迎え、今期の売り上げは過去最高であり、今年はクラウドに特に注力していくと述べた。

 NVIDA GRIDは、GPUを仮想化し、その能力をリモートで使えるようにする技術であり、ものづくりのあり方を大きく変える可能性を持つ。ワークステーション向けのGPUであるQuadroは、製造業において90%以上という、非常に高いマーケットシェアを獲得しており、HPC(High Performance Computing)向けのTeslaは、現時点世界最速のスーパーコンピュータである米オークリッジ国立研究所の「Titan」への搭載をはじめ、スーパーコンピュータ性能ランキングTOP500のうち、50システムが採用するなど、HPC市場においても採用例が増えているとのことだ。ちなみに、TitanのLinpack性能は17.59PFLOPSであり、日本最速スーパーコンピュータで、一時は世界最速の称号を手にした「京」の約1.7倍となる。

 スーパーコンピュータの設計において最も大きな問題となるのが、消費電力であるが、GPUはCPUに比べて、電力あたりの性能が高いことが利点である。Titanは、最新のTesla K20Xを18,668個搭載することによって、従来のシステムであった「Jaguar」に比べて約8倍のパフォーマンスを実現していながら、消費電力は8.2MWと20%程度しか増えていないのだ。最新のTesla K20X/K20ファミリーでは、浮動小数点演算ユニットの数を増やし、動作周波数を下げることで、電力あたりの性能が大きく向上させている。パフォーマンス自体も、前世代のFermiに比べて約3倍に向上しており、より大規模な演算を高速に行なうことが可能になる。

 また、杉本氏は、NVIDIAのGPUコンピューティングプログラミング環境であるCUDAについて、世界で最も普及した並列プログラミングモデルであり、CUDA開発者がいる組織は世界に8,000あり、CUDA対応GPUの出荷総数は3億9,500万にも達していると述べた。

 CUDA対応アプリケーションも年々増加しており、2011年から2012年にかけてはアプリ数が61%も増加したという。単に数が増えているだけでなく、各分野での主要アプリケーションの多くがCUDA対応を果たしていることも大きい。例えば、流体解析では「ANSYS Fluent」、構造解析では「MSC Nastran」、ライフサイエンス分野では「CHARMM」といった、リーディングアプリケーションがCUDAに対応しているので、GPUコンピューティング対応システムの導入によって、大きなパフォーマンス向上が期待できるのだ。

NVIDIAの中核技術はグラフィックスであり、GPU、モバイル、クラウドの3つの分野に注力している
デザインとシミュレーションを同時に行なえるのが、QuadroとTeslaの2枚差しによって実現されるNVIDIA Maximusである
NVIDIA GRIDは、GPUを仮想化し、グラフィックス、シミュレーション、モバイルをシームレスに繋ぐ技術である
開発コードネームKeplerは、世界最速、最速効率のHPCプロセッサである
現時点世界最速のスーパーコンピュータ「Titan」には、18,668個のTesla K20X GPUが搭載されており、性能の90%はGPUによるものだ。また、スーパーコンピュータ性能ランキングTOP500のうち、50システムがTeslaを利用しているという
スーパーコンピュータで最大の問題となるのが消費電力だ。Titanの前のシステムであるJaguarシステムの消費電力は7MWであり、実に一般家庭7,000軒分に相当する
もし、CPUのみのJaguarシステムを拡張して27PFLOPSを目指すと、消費電力は82MWにもなってしまう
Kepler世代のTesla K20X/K20は、世界最速のアクセラレーターであり、世界最高効率を誇る。また、CUDAは世界で最も普及した並列プログラミングモデルである
Tesla K20XおよびTesla K20は、前世代のTesla M2090に比べて、約3倍の性能を実現している
前世代のFermiから浮動小数点演算ユニットを増やし、動作周波数を下げることで、電力効率を改善している
CUDAの普及状況。CUDA開発者がいる組織は世界中で8,000もあり、CUDA対応GPUの出荷総数は、3億9,500万にも達している
CUDA対応アプリの増加状況。2012年には、対応アプリ数が前年から61%も増加。各分野でのキーとなるアプリケーションの多くがCUDAに対応済みであり、現在開発中のアプリケーションも多い
流体解析、構造解析、ライフサイエンスの分野では、リーディングアプリケーションがすでにCUDAに対応済みである

シミュレーションへのGPUソリューション導入はコストメリットも大きい

NVIDIA製造業担当ゼネラル・マネージャー Andrew Cresci氏

 次に、NVIDIA本社で製造業担当ゼネラル・マネージャーを務めるAndrew Cresci氏が、「NVIDIAの製造業向けの取組み」と題して講演を行なった。

 Andrew氏は、GPUでシミュレーションを加速することが、製造業にとって大きなメリットとなるとし、そのために、NVIDIAでは150名からなるチームが、ソフトウェアベンダーと協力してアプリケーションの最適化のサポートを行なっていると述べた。最上の設計体験を実現するために、NVIDIAは、「デザイン」、「シミュレーション」、「リアリズムの追求」、「高度なレンダリング」の4項目に注力している。

 デザイン分野においては、高性能なQuadroによって、「Solidworks」や「Inventor」「CATIA」などの3次元CADのパフォーマンスを大きく向上させることが可能である。

 構造解析などのシミュレーション分野では、TeslaによるGPUアクセラレーションが高い効果を発揮する。例えば、ロールス・ロイスが行なったテストによれば、6コアCPUシステムのパフォーマンスを基準としたときに、2GPUを追加するとパフォーマンスは3.1倍に、CPUを24コアに増やすとパフォーマンスは3.2倍になる。ここで注目したいのが、必要なトークンの数で、6コアCPU+2GPUの場合は12トークンですむが、24コアCPUでは19トークンが必要になるため、GPUを利用したほうがコストを抑えられる(Abaqusのライセンスはトークン制になっている)。なお、このシミュレーションはかなり演算量が多く、6コアCPUのみだと約12時間かかるが、48コアCPU+8GPUでは、約1時間まで短縮されるという。リアリズムの追求においては、レイトレーシングに近いレベルの3Dグラフィックスをリアルタイムに描画するデモが行なわれた。

 同氏は、NVIDIA Maximusの導入事例の1つとして、メルセデスベンツの例を挙げた。メルセデスベンツでは、NVIDIA Maximusの導入によって、デザイナーの生産性が10倍に向上したという。製造業におけるNVIDIAのテーマは、最高クオリティのデザイン環境やリーディングアプリベンダーとの強固な関係、より良いデザインのためのシミュレーションの加速、リアルタイムビジュアライゼーション、Maximusによるワークフローの最適化、グラフィックスのリモート化による、セキュリティの向上やリモートアクセス、デザイナー以外の人からのアクセスの実現であり、今後も継続的に注力していくと述べた。

NVIDIAがカバーする製品領域。PCやサーバーだけでなく、タブレットやスマートフォン、クラウドまで領域を広げている
NVIDIAの戦略的パートナー。ANSYSやAutodeskなどの大手アプリケーションベンダーがパートナーになっている
NVIDIAは、製造業の設計体験を向上させるために、「デザイン」、「シミュレーション」、「リアリズムの追求」、「高度なレンダリング」の4項目に注力している
デザイン分野では、Quadroによって3次元CADのパフォーマンスを大きく向上させることができる
CATIA V5 R23でのベンチマーク結果。Quadro 6000は、Quadro FX 1800の3倍以上のパフォーマンスを実現する
シミュレーション分野でのベンチマーク結果。ロールス・ロイスが、有限要素解析ソフトAbaqus 6.12を利用して、471万自由度のモデルを解析した時の結果。6コアCPUシステムのパフォーマンスを基準としたときに、2GPUを追加するとパフォーマンスは3.1倍に、CPUを24コアに増やすとパフォーマンスは3.2倍になる。ここで注目したいのが、必要なトークンの数で、6コアCPU+2GPUの場合は12トークンですむが、24コアCPUでは19トークンが必要になるため、GPUを利用したほうがコストを抑えられる
第2世代のNVIDIA Maximusは、Quadro K5000とTesla K20の組み合わせで、世界最強のビジュアルスーパーコンピューティングプラットフォームとなる
導入事例の1つ。メルセデスベンツでは、NVIDIA Maximusの導入によって、デザイナーの生産性が10倍に向上したという
NVIDIA GRIDにより、リモートワークステーションや複数拠点でのコラボレーションなどが実現できる
NVIDIA GRIDの対応ソリューション。2013年上半期には、「VMware vDGA」「VMware vSGA」が利用可能になる
製造業におけるNVIDIAのテーマ。
【動画】リアリズムの追求の実例。レイトレーシングに近いレベルの3Dグラフィックスを自由に動かすことが可能だ

CAE分野の主要アプリケーションがGPUコンピューティングに対応

NVIDIA HPCアプリケーションアライアンスマネージャー Srinivas Kodiyalam氏

 続いて、NVIDIA HPCアプリケーションアライアンスマネージャー Srinivas Kodiyalam氏が、「CAEアプリケーションにおけるGPUコンピューティングの活用最新情報」と題して講演を行なった。

 Srinivas氏は、まず、CAEアプリケーションは、大きく、CSM(構造解析)、CFD(流体解析)、CEM(電磁界解析)の3分野に大別でき、CSMはさらにアルゴリズムによって、一般的な強度や振動の解析が可能な陰解法と衝突時の挙動を解析できる陽解法に分けられるとし、GPUコンピューティングによる高速化は、特に陰解法に有効だと述べた。主要CAEアプリケーションがすでにGPUコンピューティングに対応しているほか、現在対応作業中であり、2013年中に対応製品がリリース予定となっている製品も多い。

 同氏は、NVIDIA製GPUと同時期に登場したIntel製CPUの倍精度浮動小数点演算性能とメモリバンド幅の比較を示し、GPUの方が遙かに性能が高く、その差はさらに広がっていることを指摘した。

 また、NVIDIAとANSYSの協業ロードマップを示し、構造解析ソフトの「ANSYS Mechanical」がすでにマルチGPUとKeplerをサポートしており、2013年第4四半期登場予定のRelease 15.0では、KeplerのCUDA 5への最適化が行なわれることを明らかにした。ANSYS MechanicalにおけるGPUアクセラレーションの効果は大きく、Tesla K20の追加によって、パフォーマンスは約1.9倍に向上するという。

 さらに、先ほどのSrinivas氏の講演でも触れられていたが、AbaqusではGPUコンピューティングの導入により、パフォーマンスが向上するだけでなく、トークンを節約できるというメリットが大きいことを詳しく解説した。そのほか、流体解析の分野においても、やはりGPUコンピューティングの導入は効果が大きいことを示し、今後も、NVIDIAはこの分野への投資を積極的に続けていくと述べた。

CAEアプリケーションは、CSM(構造解析)、CFD(流体解析)、CEM(電磁界解析)の3分野に大別でき、CSMはさらにアルゴリズムによって、一般的な強度や振動の解析が可能な陰解法と衝突時の挙動を解析できる陽解法に分けられる
CAEアプリケーションのアルゴリズムの分類。CUDAによる高速化は、特に陰解法に有効である
CAEアプリケーションのGPUコンピューティング対応状況。ANSYS MechanicalやAbaqus/Standardなど、著名なソフトがすでにGPUコンピューティングに対応しているほか、2013年中に対応製品をリリース予定のものも多い
NVIDIA製GPUとIntel製CPUの倍精度浮動小数点演算性能およびメモリバンド幅の推移。CPUよりも遙かにGPUの方が高性能であり、その差はますます開いていることがわかる
ANSYSとNVIDIAの協業ロードマップ。構造解析ソフトのANSYS Mechanicalは、2010年12月に登場したRelease 13.0で初めてシングルGPUに対応し、2012年11月の14.5で、マルチGPUやKeplerをサポート。さらに2013年第4四半期登場予定の15.0では、KeplerのCUDA 5への最適化が行なわれる。流体解析ソフトのANSYS Fluentは、2012年11月の14.5で、シングルGPUに対応。2013年第4四半期登場予定の15.0では、マルチGPUとKeplerのCUDA 5への最適化が行なわれる
ANSYS Mechanical 14.5におけるGPUアクセラレーションの効果。Xeon E5-2687W搭載システムにTesla K20を追加すると、パフォーマンスは約1.9倍に向上する
Abaqus/StandardのGPUコンピューティングへの対応状況。最新バージョンのAbaqus 6.12でマルチGPUに対応済みである
Abaqus 6.12におけるGPUアクセラレーションの効果。6コアCPUを24コアCPUにすると、パフォーマンスは3.2倍になるが、CPUが6コアのまま2GPUを追加することで、パフォーマンスは3.1倍と、ほぼ同じになるが、必要なトークンは24コアCPUの場合が19個、6コアCPU+2GPUでは12個なので、GPUの方がトークンを節約できる
Abaqusのライセンス体系。CPUが1コア増えるとトークンも1つ追加で必要になるが、GPUの場合は、1チップでトークン1つの追加となるので、コストパフォーマンスが良い
GPUアクセラレーションの効果が発揮されるための要件として、十分な計算量、十分なメインメモリ、十分なGPUメモリ、直接スパース法の利用が挙げられる
CAEアプリケーションのGPU対応状況に関するまとめ。GPUコンピューティングは、HPCテクノロジー分野で普及しはじめており、この分野におけるリーディングソフトウェアがGPUへの対応を果たしている。また、GPUの性能はさらに向上していき、NVIDIAもアプリケーションベンダーへの投資を続けていく

レノボ・ジャパンの「ThinkStation」では、SFFでもQuadroを搭載可能

 次に、ランチセッションとして、レノボ・ジャパン株式会社製品事業部ビジネス開発マネージャ 田中秀明氏による講演「レノボ・ジャパンの製造業への取組みとワークステーション製品のご紹介」が行なわれた。

 田中氏は、レノボ・ジャパンのワークステーション「ThinkStation」の最新製品ラインナップを紹介し、すべてのモデルでQuadroを搭載可能なことをアピールした。特に、新製品の「ThinkStation E31 SFF」は、容積わずか11Lというスモールフォームファクターワークステーションでありながら、Quadro 600の搭載が可能であり、CADやBIMにも最適なパフォーマンスを持つ。また、ハイエンドのタワーモデルでは、Quadro+TeslaのNVIDIA Maximus環境も実現可能であり、Adobe CS6 Premiere Pro/After EffeectsによるMaximusの検証結果を紹介した。検証では、Maximusを有効にすることで、レイトレース3Dの処理速度が20倍以上も高速化されたという。

レノボ・ジャパン株式会社製品事業部ビジネス開発マネージャ 田中秀明氏
レノボ・ジャパンのワークステーション「ThinkStation」の製品ラインアップ。すべてQuadroを搭載可能である
新製品のThinkStation E31 SFFは、省スペース性に優れたコンパクトワークステーションであり、CADやBIMに最適なパフォーマンスと信頼性を実現する
各アプリケーションごとの認証が行なわれているため、安心して利用できる
Adobe CS6 Premiere Pro/After EffeectsにおけるMaximusの検証結果。レイトレース3Dの処理時間が、Maximus無効時は20分47秒もかかったのに対し、Maximusを有効にすることで、1分1秒と、20倍以上も高速化された
レノボ・ジャパンのWebサイトで用途別のおすすめ構成が紹介されている

(石井 英男)