ニュース
NVIDIA、TPCx-BBベンチマークをGPUで処理可能に
2020年6月22日 21:40
NVIDIAは22日、AIインフラストラクチャなどスーパーコンピュータ向けシステムの「DGX A100」を使い、ビッグデータ解析用ベンチマークである「TPCx-BB」をGPUで処理可能にし、CPUシステムを大きく上回る性能を発揮可能になったと発表した。
TPCx-BBは、現実世界の ETL(抽出、変換、ロード)および機械学習のワークフローを対象とした、エンタープライズ向けのビッグデータ ベンチマーク。そのクエリには、在庫管理や価格分析、販売分析、レコメンデーション システム、顧客セグメンテーション、センチメント分析といったユースケースが含まれる。分散コンピューティングシステムは、これまで着実な進歩を続けているにもかかわらず、こういったビッグデータのワークロードはいまでも、CPUで処理するさいのボトルネックになっている。
そういったなかNVIDIAは、オープンソース データサイエンスライブラリのスイートであるRAPIDSソフトウェアのエコシステムとDGX A100システムを組み合わせ、GPUでのビッグデータの大規模処理を可能にした。
16基のDGX A100で、TPCx-BBベンチマークでSF10K(10TBのデータ処理)を実行。CPUシステムでは4.7時間かけて処理できたこのベンチマークを、DGX A100では19.5倍の性能となるわずか14.5分間で処理。また、3分の1の消費電力で実現しており、従来CPUでの処理では解析要素が複雑になるほど実行時間が跳ね上がり、結果としてサーバーの増強や消費電力上昇、冷却強化といったコストも増加しがちだったが、GPU処理が可能になったことで、大規模な解析を高コストパフォーマンスに実現できるようになったとしている。
ベンチマークで使用されたGPUシステムには、合計128基のNVIDIA A100が搭載された16台DGX A100で構成されており、Mellanox InfiniBandネットワークで接続されている。A100については別記事(NVIDIA、7nmプロセスのAmpere採用GPU「A100」。Voltaから20倍性能向上)を参照されたい。
MellanoxはNVIDIAが今年(2020年)4月に買収完了を発表した高性能ネットワーク技術を持つ会社であり、Mellanox InfiniBandのネットワーク機能を採用するシステムは、NASAなどを筆頭とする世界中の気象予報スーパーコンピュータに実装されている。