ニュース
スパコン「富岳NEXT」は現行富岳の約100倍、50EFLOPS以上の実効性能に
2025年2月5日 06:15
スーパーコンピュータ「富岳」の次世代となる「富岳NEXT」(開発コードネーム)の開発、整備の状況などについて、理化学研究所(理研)が説明を行なった。
理研は、新たなフラグシップシステムの開発主体に指名され、計画から前倒ししてプロジェクトをスタート。2025年1月から富岳NEXTの開発および整備を開始したところだ。2025年4月には理研の中に次世代計算基盤開発部門を新設する予定で、国内外の研究者や企業と連携してプロジェクトを推進する方針を明らかにしている。
富岳NEXTでは、現行の富岳と比べて、既存のHPCアプリケーションで5~10倍以上の実効計算性能を目指し、AI処理でゼタ(Zetta)スケールのピーク性能を念頭に、50EFLOPS(エクサフロップス)以上の実効性能を実現するシステムの開発、整備を目指している。
今回の説明では、プロジェクトの状況や想定されるシステムのハードウェア機能、仕様概要などについて解説した。
富岳NEXTは2030年頃の稼働を目指す
2025年4月に、次世代計算基盤開発部門の部門長に就任予定の理化学研究所 計算科学研究センター 次世代高性能アーキテクチャ研究チーム チームリーダーの近藤正章氏は、「50EFLOPSは、富岳の約100倍の実効性能となり、意欲的な目標になる。運用開始時点では、世界最高水準のAI処理基盤の実現を目指す」とした。
一方で、「特定の指標だけでトップを目指すものではない。また、時代によって求められる指標が変化することも想定される」と語り、LINPACKの実効性能をもとに、世界で最も高速なコンピュータをランク付けするTOP500において、トップを狙うことにはこだわらない姿勢を示した。
富岳NEXTは、遅くとも2030年頃の稼働を目指して開発している次世代スーパーコンピュータである。
理研の近藤氏は、「生成AIの進展を始めとして、計算科学だけでなく、科学技術やイノベーション全体の推進、産業競争力強化の観点などから、計算基盤の重要性はさらに増している。今後、計算資源の需要はさらに増大するだろう。また、求められる機能も多様化していくことが予想される。
全国の大学などに設置された情報基盤センターのスパコンの強化により、日本全体の計算資源は増加し、2030年頃には、富岳と情報基盤センターの計算資源はほぼ同等規模になることが想定されている。だが、それを併せても必要とされる計算資源需要に対しては大幅に不足する」と指摘。2030年頃の計算資源需要は、2023年比で5倍以上となり、それを埋めるためにも、次世代フラグシップシステムが必要となる。
文部科学省の「次世代計算基盤に関する報告書最終取りまとめ」では、「自国の技術を中心にスーパーコンピュータを開発、整備する能力を国内に維持し、国内人材育成や産業競争力の維持、発展に資するために、京や富岳の開発において蓄積してきたCPUの開発およびシステムのインテグレーションに加えて、メモリ実装技術の開発をコア技術と位置付けて、継続的に開発を行なうべきである。また、さらなる性能向上や生成AIへの対応を図るため、加速部を導入するべきである。そして、最先端のメモリ技術を採用し、利用者にとってさらに魅力的なシステムとなることを期待している」としている。
AIを含めたアプリケーション性能の向上
加えて、「システムソフトウェア開発においては、アプリケーションやAIなどの研究開発のプラットフォームとして、世界で使われている基本的なアプリケーションが、これまで以上に、多様かつ円滑に利用できるように設計し、運用開始後も継続してシステムソフトウェアの改善を図るべきである」としており、これが富岳NEXTに求められる基本機能になる。
理研ではこれに対応するために、以下の6点を開発方針の前提として掲げている。
- データ移動の効率化を含めた実効性能重視のアプリケーション・ファーストなシステム
- AI for Scienceの実現に向けたHPCとAI技術の高度な融合
- エコシステムへ訴求が可能、かつ富岳NEXTのみならず、広く利用される構成の探求
- 富岳の知見やソフトウェア資産の有効活用と継続的な研究開発
- 量子コンピューティングとのハイブリッド利用を見据えたプラットフォームの実現
- 次の技術開発を中長期的な技術評価、研究開発を継続し、将来のシステムの入れ替え、拡張への対応
富岳NEXTでは、AIを大幅に加速する各種技術のさらなる発展と、それによるアプリケーション性能の向上、高帯域およびヘテロジニアスなノードアーキテクチャの採用、先進的なメモリ技術の採用、AI for Scienceを始めとした今後の発展が見込まれる新たな計算資源需要に対応したシステム設計を実現するほか、標準規格や既存のエコシステムとの親和性が高いシステムの構築、継続的なシステム構築および運用環境の実現に向けた研究開発環境の整備、運用技術の高度化による省エネルギー化の実現も目指す。
近藤氏は、「富岳NEXTは、シミュレーションとAIの双方で、世界最高性能の達成を目指す。これによって、仮説生成や実証などのサイエンスの自動化、高度化によるAI for Scienceを通じた科学研究の加速、混合精度演算やサロゲートモデルの利用によるデジタルツイン実効性能の大幅な向上を実現する。また、導入時点で入手可能な最先端の積層メモリ技術の利用し、データ移動の効率化による実効性能と電力効率の大幅な向上も図る」とコメントした。
さらに、「Made with Japan」を推進する姿勢も示す。
ここでは、世界的に訴求力を持つ国産技術の高度化、技術継承を進めることによる情報産業での戦略的不可欠性の確保、グローバルマーケットへの展開、国内および国外の技術や人材の連携などによる国際協調を通じたプロジェクトの推進を盛り込んでいる。
「国産技術を取り入れたCPUおよびGPUなどのアーキテクチャの採用、Made with Japanのシステム構築による国内技術力の強化と育成も推進する。加えて、既存のシステムソフトウェアとの互換性を担保。富岳NEXT専用ではなく、クラウドなどに展開できるシステムを探求する」とも述べた。
現時点では、国産技術については「具体的なものがあるわけではない」としたほか、「GPUについても、NVIDIAに限定したものではない」と述べた。
富岳のCPU部と加速部
富岳NEXTは、CPU部と加速部(GPU)で構成されることになる。
次世代計算基盤開発部門 次世代計算基盤システム開発ユニット ユニットリーダーに就任する予定の理化学研究所 計算科学研究センター プロセッサ研究チーム チームリーダーの佐野健太郎氏は、「富岳NEXTは、分散メモリ型の並列計算機であり、電力効率の高いCPU部と、帯域重視の演算処理加速部で構成する。合計ノード数は3,400ノード以上となる」と説明。
さらに、「高帯域およびヘテロジニアスなノードアーキテクチャを基本構成としたシステムであり、CPU-GPU間は、キャッシュコヒーレンスを有する高速リンクにより、低遅延かつ高バンド幅で接続することができる」とする。
富岳NEXTに採用するCPUは、Arm命令セットのメニーコアアーキテクチャであり、富岳とはバイナリレベルで互換性を持つ。FP64のベクトル演算に加えて、AIの推論を高速化するために低精度行列演算(FP16、BF16、FP8、INT8など)をサポートする。
加速部は、大規模スパコンで活用実績があるGPUに基づくアーキテクチャの採用を検討する考えであり、FP64ベクトル演算性能や、FP16、BF16、FP8、INT8などの行列演算性能を向上。導入時期における先端メモリ技術を採用するほか、DDR系の大容量メモリも検討する。複数のGPUインスタンスへの分割や仮想化をサポートすることも検討する。システム全体で数万規模の加速部ソケットを搭載する予定だ。
これにより、理論FP64ベクトル性能は、CPU部が48 PFLOPS以上、加速部が3.0 EFLOPS以上を目指す。また、理論FP16/BF16行列演算性能はCPU部が1.5 EFLOPS以上、加速部が150 EFLOPS以上、理論FP8行列演算性能はCPU部が3.0 ELOPS以上、加速部が300 EFLOP以上を目指す。
さらに、メインメモリサイズは、CPU部、加速部がそれぞれ10 PiB以上、メインメモリバンド幅はCPU部が7 PB/s以上、800 PB/s以上を想定している。
一方、富岳NEXTのストレージシステムでは、データサイエンスや大規模チェックポインティングなどの従来型I/Oや、AI for Scienceなどの新たなI/O要求に対応可能な最先端ストレージシステムを検討。開発者へのヒアリングに基づいたストレージシステムの性能および容量の検討も進める。
第1階層ではローカルストレージとして、ファイルシステムはCHFSなどを検討。バンド幅は総メモリダンプ時間で1分以下、IOPSは1秒以下、容量は総メモリサイズの2倍以上とする。
第2階層は共有ストレージとし、ファイルシステムはLustreや DAOSを検討している。バンド幅は総メモリダンプ時間で5分以下、IOPSは第1階層の10分の1とし、容量は総メモリサイズの30倍以上を目指す。
「富岳から、富岳NEXTへの円滑なデータ移行を進める一方で、ストレージノードのメモリ枯渇によるI/O性能の不安定性を解決。安定した性能を実現するためのハードウェアおよびソフトウェア設計を推進する。持続可能なファイルシステムソフトウェアの開発も進める」という。
システムネットワークは、加速部の相互接続Scale-upネットワークと、ノードの相互接続のScale-outネットワークを組み合わせで構成する。Scale-up ネットワークは、ノード内の複数のGPUを相互に接続するほか、複数ノードのGPUをスイッチで相互接続し、Podを構成。Scale-out ネットワークでは、IPやRDMAをサポートするオープンな仕様のものを検討し、多段のスイッチを用いた間接網などを検討するという。
なお、富岳NEXTの合計消費電力は、計算ノードおよびストレージを含めて40MW以下とする。富岳の消費電力は約30MWであり、富岳NEXTでは、大幅な性能向上に対して、消費電力の上昇幅を抑える。
端境期を作らずに柔軟なシステムに
一方、富岳の開発と運用における課題解決に対応することも打ち出している。
その1つが、京から富岳へと移行した際に、システムの入れ替えによる「端境期」が生じ、日本における計算資源が一時的に減少したことへの反省である。
理研の近藤氏は、「システムの入れ替えによる端境期を極力生じさせず、利用環境を維持することが大切である。新旧システムの稼働時期をオーバーラップさせ、世界最高水準の計算性能と計算資源量を継続し、安定的に提供することを目指す」とする。
富岳NEXTの設置場所は、現時点では正式には決定していないが、端境期を作らずに、富岳を半分停止させながら移行を図るなど、さまざまな方法を検討するという。
さらに、最新の技術動向に対応するために、適切なタイミングで、柔軟にシステムを入れ替えたり、拡張したりできるようにし、進化し続けるシステムになることを目指す。
近藤氏は、「近接施設での一体整備や運用によって、既存の運用体制および施設と共通化できる部分が多くなり、効率化ができ、最新設備へのアップグレードも容易になる。半導体産業を始めとする国内外の製造技術の成熟状況を随時見極めて、導入する技術を検討していくことになる」という。
アプリケーション・ファーストの使いやすさ
富岳NEXTでは、「アプリケーション・ファースト」を理念としているのが特徴だ。
富岳から富岳NEXTへと、ユーザーが違和感なくアプリケーションを利用できるとともに、新たな技術の取り込みを可能とするシステムソフトウェアの構築を目指しており、CPUと加速器を効率よく利用するためのプログラミング環境やソフトウェア環境を整備。科学シミュレーションとしての活用だけでなく、AI for Scienceや、量子コンピュータとの連携を可能にする最先端のソフトウェア環境の整備も進める。
また、Exascale Computing Projectを始めとする国内外のコミュニティと連携したソフトウェアエコシステムの開発や、OSSの利活用の促進も行なう。
近藤氏は、「HPCIコンソーシアムでは、次世代計算基盤を利用した成果の最大化に向けた提言を行なっており、そこで示された内容は、富岳NEXTで打ち出したアプリケーション・ファーストによるシステム設計に合致している」とし、「富岳では、システムとアプリケーションとの協調設計(コデザイン)を行なったが、富岳NEXTでもこの手法を踏襲。適切なタイミングで、幅広い関係者に情報発信を行ない、アプリケーションへの対応力を強化する。コンパイラやライブラリなどの継続的な整備、業界のデファクトスタンダードであるOSSや商用アプリケーションの利用環境の構築も進めていく」と述べた。
基本設計は2025年度中に、順次開発を進める
富岳NEXTの開発、整備に向けた想定スケジュールについても明らかにした。現在、富岳NEXTのプロジェクトは、基本設計のフェーズにあり、これを2025年度中に完了させる。
基本設計では、2025年3月までに開発ベンダーの選定を行なうための意見招請、入札を行ない、4月以降に開発ベンダーとの契約手続きを行なう。5月以降には、ベンダーによる基本設計を開始する一方、この時点から理研が主体となってシステムソフトウェアの設計開発や、アプリケーション開発の準備などを進めることになる。2026年1月以降に詳細設計に向けた準備を進める。
さらに、2026年度からは詳細設計を開始。2028年度には完了させて、2029年度から製造、設置、調整を行ない、2030年度から運用を開始することになる。いよいよ富岳NEXTの構築に向けた動きが始まった。今後の進展を注視しておきたい。