ニュース

「富岳」が世界スパコンランキングで9期連続首位獲得。HPCGとGraph500の2部門

大河原克行

2024年5月14日 06:01

富岳

　ドイツ・ハンブルクのコングレス・センター・ハンブルクで開催されているHPCの国際会議「ISC High Performance 2024」において、世界スパコン主要性能ランキングが発表され、国産スーパーコンピュータの「富岳」が、「HPCG(High Performance Conjugate Gradient)」および「Graph500」において、9期連続の1位を獲得した。

　また、「TOP500」では4位、「HPL-MxP」(旧名称はHPL-AI)でも4位となった。ランキングはいずれも半年に1回発表されており、9期連続の1位は、4年半という長期間での首位継続になる。

　理化学研究所計算科学研究センターの松岡聡センター長は次のようにコメントしている。

　「実際のアプリケーション性能で最も重要なベンチマーク指標であるHPCG、ビッグデータの指標であるGraph500で1位を維持し、伝統的な指標のTOP500では4位、AIの指標であるHPL-MxPでも4位となり、継続的に世界トップクラスの総合的な実力の高さを示している。

　世界各国で、官民をまたいで新しいスパコンの開発が繰り広げられ、特に昨今の生成AIの登場で、それがヒートアップする中、4年の長期間に渡って世界トップクラスの性能を維持できているのは、富岳の元来のハードウェア設計に加えて、理化学研究所計算科学研究センター(R-CCS)による、たゆまない富岳の高度化研究の成果であると認識している」。

理化学研究所計算科学研究センター松岡聡センター長

　富岳が9期連続で1位を維持したHPCGは、産業利用などの実際のアプリケーションでよく使われる「疎な係数行列から構成される連立一次方程式を解く計算手法の共役勾配法」を用いたベンチマークプログラムで、2014年11月から採用されている。つまり、実際のアプリケーション利用における性能の高さを裏づけるものとなっている。

　富岳の432筐体、15万8,976ノードを用いて、16.00PFLOPS(ペタフロップス)のスコアを達成。2位の「Frontier」(米国)の14.05PFLOPSに比べて、約1.1倍の性能差を付けている。

Frontier

　同じく1位を獲得したGraph500は、大規模で、複雑なデータ処理が求められるビッグデータの解析における指標であり、今回は、富岳全体の約95.7%にあたる15万2,064ノードを使用して、約4兆4,000億個の頂点と、70兆4,000億個の枝から構成される超大規模グラフに対する幅優先探索問題を、平均0.42秒で解いたという。

　ベンチマークのスコアは、16万6,029GTEPS(ギガテップス)で、前回のランキングが発表された2023年11月の性能から、2万7,162GTEPS向上しており、約20%も改善している。

　この性能向上には、BFS(Breadth-First Search＝幅優先探索)の結果に影響を与えずに、不要な頂点を削除する前処理を新規に導入したことが影響しているという。また、グラフデータの新しい圧縮技術を開発したことで、利用メモリ量を大幅に削減することができたという。

　富岳のグラフ解析性能は、チューニングによって、さらに進化を続けていることが分かる。

　一方、TOP500は、LINPACKの実行性能を指標として世界で最も高速なコンピュータシステムの上位500位までを定期的にランク付けするもので、富岳も、2021年11月までは4期連続で首位を維持していた。

　今回のランキングでは、前回同様、4位となり、442.01PFLOPSの性能を発揮。実行効率は82.3%となっている。TOP500の1位は「Frontier」(米国)で、1206PFLOPSのスコアを達成。2位の「Aurora」(米国)は1012 PFLOPS、3位の「Eagle」(米国)は561.2 PFLOPSとなっている。

　また、HPL-MxPは、AIの計算などで活用されている単精度や半精度演算器などの能力も加味した計算性能を評価する指標であり、2019年11月からランキングが開始されている。

　富岳では、432筐体、15万8,976ノードを用いて、2.000EFLOPS(エクサフロップス)のスコアを記録。前回より順位を1つ落として4位になった。1位になったのは「Aurora」で、スコアは10.6EFLOPSを記録している。

　今回の世界ランキング発表に併せて、理化学研究所では、今後の取り組みについても発表している。

　理化学研究所の松岡センター長は、「富岳に次ぐ、次世代の計算基盤の研究開発に関して数多くのプロジェクトを立ち上げ、推進している」とし、具体的な活動として、富岳のソフトウェアを仮想化し、その成果を世界中に広く普及させる「バーチャル富岳」、従来のシミュレーション科学とともに、AIによる科学の劇的進化を目指す理研「AI for Science」を推進。

　富岳の1万3,824台の計算ノードを使用して、約4,000億トークンのデータで学習し、開発した大規模言語モデル「Fugaku-LLM」、生成AIによって科学のイノベーションを図ることになる「TRIP-AGIS」プロジェクト、量子計算とスーパーコンピュータを密に連携させ、新たに計算可能領域を広げる「JHPC-quantum」なども推進する。

　一方、「富岳に次ぐ次世代のスーパーコンピュータ技術を検討する研究開発などが、国内外のトップ機関との連携で進められている。今後、これらの研究開発が、日本の科学技術研究全体の邁進に貢献するのはもちろんのこと、産業界での活用や早期の社会実装に向けて、おおいに貢献するものと期待している」と述べている。

　すでに次期富岳に向けた検討が始まっている段階であり、2029年度以降に実用化されることになりそうだ。

　なお、Fugaku-LLMの開発においては、「日本の計算機技術を用いて開発した日本語能力に優れた大規模言語モデルであり、一から独自のデータで学習しているため、全学習工程を把握でき、透明性と安全性に優れている大規模言語モデルとなる。外国製GPUに頼らずに、国産のハードウェアによって開発できた。純粋な国産大規模言語モデルである」(東京工業大学学術国際情報センターの横田理央教授)と位置づけている。

　2024年5月10日から、GitHubおよびHugging Faceを通じてモデルやソースコードを公開し、商用利用が可能なライセンスとして提供。また、富士通のFujitsu Research Portalを通じて無償で試用することができる。

　この開発過程においては、CPU上の行列積の計算を高速化するチューニングを行ない、110秒かかっていたものが18秒に短縮。6倍の高速化を図ったほか、富岳向けにTofuインターコネクトD上での集団通信の最適化を行なったことで、通信速度を3倍に高速化した成果があがっている。

　理化学研究所の松岡センター長は、「もともと富岳は、AIや大規模言語モデルの開発に向けて作られたものではないが、この分野に応用すると、技術的改善の余地があることが分かった。チューニングによって、演算速度で6倍、通信速度で3倍といった大幅な高速化が図れた。次世代計算機に向けた技術力を高めることができた」と述べている。

　富岳の進化はさらに続いており、今回のランキングでも、Graph500では、半年間で性能が20%向上したという成果があがっている。また、HPCGやGraph500といったアプリケーションの実行や、ビッグデータの活用といった実利用領域において、首位を維持している点も特筆できる要素だ。実際の利用シーンにおいて活用され、多くの成果を出している富岳が、それを裏づける指標であるHPCGとGraph500の2分野において、半年後に、10期連続の首位を獲得できるかが注目される。