ニュース

NVIDIA、Ampereベースのスパコン「Selene」を稼働開始

NVIDIA Selene

 NVIDIAは23日、同社のGPUコンピューティングシステムであるDGX A100を採用したスーパーコンピュータ「Selene」を発表した。

 SeleneはAmpereベースのGPUであるA100を8基内蔵したDGX A100サーバー280基で構成され、システム間をつなげる494個のMellanox HDR 200G InfiniBandスイッチを実装。56TB/sのネットワークファブリックを実現するほか、7PBの高性能フラッシュストレージを採用している。CPUにはAMD EPYC 7742(64コア)が使われている。

 SeleneはAI性能では1EFLOPS(エクサフロップス)を超える性能を発揮可能で、別記事(NVIDIA、TPCx-BBベンチマークをGPUで処理可能に)にあるように、ビッグデータ用ベンチマークのTPCx-BB(SF10K)を16基のDGX A100で処理した結果はCPUベースのシステムに対して20倍近い性能差を発揮する。

 なお、Seleneは本日公開された世界スパコン性能ランキングTOP500において7位(27.5PFLOPS)を、消費電力性能ランキングのGreen500では2位(20.5GFLOPS/W)を獲得した。

 TOP500トップ10のうち8台がNVIDIAのGPUかInfiniBandもしくはその両方を採用し、333台がNVIDIAのMellanoxを組み合わせたシステムを採用している。

 さらに、最新のInfiniBandを使うシステムの74%がMellanox HDR 200G InfiniBandスイッチを採用しており、前回(2019年の11月)のスパコンランキングからほぼ倍増している。

 NVIDIAによると、消費電力性能で見た場合、SeleneはNVIDIA製GPUを搭載しない平均的なTOP500のシステムよりも6.8倍効率的。この性能と電力効率はA100に採用されている第3世代のTensorコアが実現しており、シミュレーション向けの従来の64bit演算と、AIのための低精度処理の両方の性能を向上させているという。

 NVIDIAはSeleneにはモジュラー形式のリファレンスアーキテクチャが使われており、4週間かけずにシステムを構築し、即席で用意できるシステムとして、今回のランキングの結果は目を見張るものであるとアピールする。

 Seleneは現在、米国立衛生研究所とテキサス大学オースティン校で稼働している。