ニュース

新GPU「Blackwell」など、NVIDIAのソリューションを網羅したGTC基調講演

NVIDIAが発表したNVIDIA B200 Tensor Core GPU(左)とNVIDIA GB200 Superchip(右)

 NVIDIAは3月18日~3月20日(米国時間)の3日間にわたり、同社のAIやデータセンター向け半導体などに関する話題を扱うフラグシップ年次イベント「GTC」を、米国カリフォルニア州サンノゼのサンノゼコンベンションセンターにおいて開催する。3月18日13時からは、同社の共同創始者でCEOのジェンスン・フアン氏による基調講演が行なわれ、新しいGPU「Blackwell」を含む、いくつかの新発表が行なわれた。

 また、NVIDIA Enterprise AIの最新バージョンとなる5.0から提供されるNIM(NVIDIA Inference Microservice)が発表された。さらに、同社がメタバース環境向けに提供している「Omniverse」がApple Vision Proに対応したことや、同社のロボット開発環境「Isaac Robotics Platform」の拡張としてヒューマノイド向け開発キット「Project GR00T」が発表されるなどAI向けの最新GPUから、メタバースを利用したデジタルツイン、そしてロボットまで多数の話題が紹介された基調講演になった。

5年ぶりに対面で開催されたNVIDIAのGTC、基調講演はSAPセンターへ移動

SAPセンターの会場、元々はアイスホッケーの会場であるため、アリーナ席とスタンド席があり、確かにコンサート会場のようになっている

 通例であれば、GTCの基調講演はメイン会場となるサンノゼコンベンションセンター(SJCC)の最も大きなホール(展示会場)を使って行なわれるが、今回はSJCCの一番大きなホールにも入りきれないぐらいの参加者の登録があり、SJCCの近くにあるアイスホッケーチーム「サンノゼ・シャークス」の本拠地であるSAPセンターにおいて行なわれた。NVIDIAの発表によれば、基調講演の参加者は11,000人を超えており、従来のGTCでは数千人単位での参加者だったことをみれば、規模が拡大してイベントが開催されていることが分かる。

 といっても、実は今回のGTCは、対面での開催は2019年の3月以来となり、実に5年ぶりとなっている。2020年のGTCは、当初3月末に開催される予定だったのだが、1月の末から新型コロナウイルスが全世界的に流行したことで、開催直前に中止になってしまったのだ。そこからGTCはバーチャルで開催され、これまで対面では開催されてこなかったのだ。今回は5年ぶりに対面での開催となり、多くの参加者がSJCCやSAPセンターに詰めかけることになった。

NVIDIA 共同創始者 兼 CEO ジェンスン・フアン氏、今回もトレードマークの革ジャンをキメテいた

 そうした中で、トレードマークの革ジャンを着て多くの聴衆の前に姿を見せたNVIDIA 共同創始者 兼 CEOのジェンスン・フアン氏は、多くの拍手に迎えられると「今日はスターのコンサートではなくて、テクノロジーカンファレンスだけど?」といつものフアン節のジョークを放つと、会場は大きな笑いに包まれた。

 フアン氏がこうした聴衆の前に対面で姿を見せるのは、コロナ禍明けで今回が初めてというわけではなく、昨年(2023年)の5月末に台湾で行なわれたCOMPUTEX 2023の基調講演に登壇したり、顧客となるCSP(クラウド・サービス・プロバイダー)のイベントにゲストとして登壇したりしている。しかし、やはり自社のフラッグシップの年次イベントであるGTCは「ホーム感」があるのか、いつものジェンスン節がバンバン飛び出す基調講演となった。

FP6やFP4などに対応するなどソフトウェア的にも進化している新GPU「Blackwell」

Blackwell(左)とHopper(右)を手に持つフアン氏

 そうした基調講演で最も注目を集めたのは、言うまでもなく新GPUアーキテクチャとなる「Blackwell」ことNVIDIA B200 Tensor Core GPU(以下B200)に関しての話題だ。Blackwellは2022年にNVIDIAが発表した、「Hopper」ことNVIDIA H100 Tensor Core GPU(以下H100)の直接の後継となる製品だ。

 現在NVIDIAのH100(およびそのHBM3e版となるH200)は、生成AIの需要が高まるに比例して需要が高まっており、NVIDIAの代理店に入荷するたびに右から左へと売れている状況となっている。このため、その後継がどういう製品になるのか、今回のGTC最大の焦点となっていたが、それが正式に発表された形となる。なお、Blackwellの詳細に関しては別記事に詳しいのでそちらも合わせてご参照いただきたい。

 フアン氏はそうしたB200の詳細をビデオで紹介した後で、B200の実チップを公開した。比較対象としてH100も用意され、パッケージのサイズが大きくなりH100クラスのダイが2つ搭載されている様子が確認できた。

GB200の開発ボード(左)と製品版のモックを手に持つフアン氏
GB200の性能

 また、NVIDIAが開発したGrace CPUが1つ、Blackwell GPUが2つ、モジュール上に実装されたGrace Blackwell(製品名はNVIDIA GB200 Superchip、以下GB200)も紹介し、開発中で最終版に比べてやや大型なGB200と、製品版のモックアップとなるGB200を公開し、そのGB200の性能をフアン氏は紹介した。

 それによればFP8(Tensorコア)で20PFLOPSとHopper(H100)に比べて2.5倍、新しくサポートされるFP6でも20PFLOPSと2.5倍、同じく新しくサポートされるFP4では5倍の性能を実現すると紹介し、現在H100ベースになっている製品をGB200に切り替えることで、大きな性能向上が期待できると紹介した。

Pascal世代のFP16から、Blackwell世代のFP4での20PFLOPSでAI推論性能が1,000倍に

 フアン氏は「このFP4での20PFLOPSは、2016年のPascal世代においてFP16で演算したのと比較すると、AI推論処理が1,000倍高速になっている」と述べ、NVIDIAのGPUが急速に性能を引き上げていることを強調した。

DGX G200 NVL72は1ラックで1EFLOPSを超える性能を実現

 さらに、DGX G200 NVL72という72基のBlackwell GPUが1ラックで実現しているラック製品を紹介し、FP4で推論処理を行なった場合には1.44E(エクサ)FLOPSと、「初めて1ラックで1EFLOPSを超える性能を実現した」と強調した。

Hopperであれば8,000基のGPUで15MWの消費電力がかかり90日かかる学習が……
Blackwellであれば2,000基のGPUと4分の1で、4MWと消費電力も4分の1になる

 また、1.8兆パラメータのGPTモデルを利用した学習に、Hopperであれば8000基のGPUで15MWの消費電力がかかって90日かかる、Blackwellであれば2000基のGPUで4MWの電力で済み、同じ処理能力であれば電力は4分の1に削減されると説明した。

FP4の導入などソフトウェア側の進化も組み合わせて性能が強化されている

 そして、今回のBlackwellではFP4による推論を導入したように、ソフトウェア側の強化を組み合わせて行くことで、GPUの性能をこれからも引き上げて、高まるばかりの生成AIへのニーズに応えていくと強調した。

 なお、NVIDIAはBlackwellの詳細をさらに紹介するセッションを3月19日に開催する予定にしており、そこでさらなる詳細が明らかになる見通しだ。

新しいマイクロサービスとなるNIM、OmniverseのApple Vision Pro対応、Jetsonロボットなどが紹介される

NVIDIAのNIM

 また、フアン氏は新しい推論用のマイクロサービスが導入された「NVIDIA AI Enterprise 5.0」について、同社のメタバースやデジタルツイン向けの「Omniverse」(オムニバース)、さらにロボット開発環境「Isaac」(アイゼック)向けの新しいソリューションを公開した。

 NVIDIA AI Enterpriseは、NVIDIAが大企業向けに提供しているAIソフトウェアの開発環境で、クラウドやオンプレミスのデータセンターなどでAIアプリケーションの構築が容易にできるようになっている。その最新版の5.0では、新たにNIM(NVIDIA Inference Microservice)が提供されることが明らかにされた。フアン氏は「NIMにより、AI推論のアプリケーションがより簡単に構築できるようになる」と述べ、大企業がAI推論のアプリケーションを構築するのがより容易になると説明した。

OmniverseがApple Vision Proに対応
日産自動車のOmniverseとApple Vision Proを利用した産業用メタバースの事例

 また、同社のメタバース向け開発環境となるOmniverse関連では、「Apple Vision Pro」に対応することが明らかにされると、会場からは大きな歓迎の拍手が起きた。

 NVIDIAのOmniverseでは、既に産業向けのさまざまなアプリケーションが存在しており、それがApple Vision Proで利用できるようになることは大きなメリットになる。フアン氏は「Apple Vision ProにOmniverseのコンテンツがストリーミングで再生することが可能になる」と述べ、その具体的な事例として日産自動車が自動車の開発などに活用している事例を紹介した。

フアン氏とJetsonベースロボット(右手前)、奥に写っているのはProject GR00Tのヒューマノイドのデジタルツイン版
Project GR00Tではデジタルツインのヒューマノイドを作成できる

 また、ロボットの開発環境であるIsaacのアップデートでは「Project GR00T」が紹介され、ヒューマノイド(人間の形をしたロボット)が容易に開発できるようになる開発キットであると紹介され、また、実際に動作している例としてNVIDIAの開発ボード「Jetson」を利用して作られた小型ロボットをゲストとして紹介して講演を終えた。