西川和久の不定期コラム
GeForce RTX 5090降臨!現時点最強AI PCへ!?
2025年2月26日 06:16
これまでメインのAI PCはGeForce RTX 4090(24B)を使っていたが、何とかGeForce RTX 5090を購入できたので、入れ替えの様子と、簡単なベンチマークテストなど、ファーストインプレッションをお届けしたい。
巨大なGPUボードに驚くばかり
見積/発注前に以下の記事を読んでいたので「お!GeForce RTX 5090は、消費電力はともかく薄くなって2スロットか!」と喜んでいたところ、実際各社から発表のあったスペックだとほぼ全部3.5スロット占有。しかもファンは3つ。この差は何!?といった感じだ(笑)。
何にするか迷っても仕方なく、GeForce RTX 4090がZOTACだったので、同じメーカーを選んだ次第。「SOLID」、「SOLID OC」、「AMP Extreme INFINITY」と3モデルある中、AI用途ということもあり普通のSOLIDにした(GeForce RTX 4090はINFINITY OC)。主な仕様は以下の通り。
「ZOTAC GAMING GeForce GeForce RTX 5090 SOLID ZT-B50900D-10P」の仕様 | |
---|---|
GPU | GeForce GeForce RTX 5090 |
CUDAコア | 21,760基 |
メモリ | GDDR7 32GB |
メモリインターフェイス | 512bit |
ブーストクロック | 2,407MHz |
メモリクロック | 28Gbps |
バスインターフェイス | PCI Express 5.0 x16 |
ディスプレイ出力端子 | DisplayPort 2.1b×3、HDMI 2.1b×1 |
補助電源 | 12v-2x6×1 |
消費電力 | 最大575W |
推奨電源容量 | 1,000W |
外形寸法 | 約329.7×137.8×67.8mm (3.5スロット厚) |
付属品 | グラフィックボードガイド、SPECTRA Linkケーブル、8ピン×4 to 12v-2x6電源ケーブル、ユーザーマニュアル |
GeForce RTX 4090と大きく違うのは、CUDAコア数が16,384基から21,760基へ、VRAMはGDDR6X(21Gbps) 24GBからGDDR7(28Gbps) 32GB、TGP 450Wから575W、FP4対応などがあげられる。すべて速度に関係するが、FP4対応はモデルのファイルサイズが小さくなり、生成速度も上がるので生成AI画像/動画関連としてはうれしい対応となる。詳細は以下をご覧いただきたい。
なおバス幅384bitから512bitへ、帯域幅1,008GB/sから1,792GB/sへ。この関係でPCI Express 4.0から5.0になっている。従ってフルパフォーマンスを出すにマザーボードは5.0対応のものを使いたいところ。
今回もちろん自腹購入だが、今期(2024年4月〜2025年3月)は「MacBook Pro 14(M4 Max/128GB/1TB)」、GeForce RTX 4080 Laptop GPU搭載17型ノートPCに次ぐ大きな買い物となった。
実際ものが届いてパッケージを持ったところズッシリ重い。そして確かに長さは今使っているGeForce RTX 4090よりも若干短くなっているものの厚みが少し増えているので、全体的にはゴロっとした何か塊の様な雰囲気がある。
サポーターで下から支えるにしても、普通にPCを立てて使った場合、PCIe x16コネクタは大丈夫なのか?とちょっと不安になるほどだ。
……と、眺めていても意味がなく早速装着開始となった。
元々GeForce RTX 4090の入っていたAI PC(Ubuntu 22.04)へ投入
最近まで使っていたメインのAI PCは、以前記事にした中華マザー搭載マシンだ。プロセッサはモバイル用Core i7-12650H(10コア(6P+4E)/16スレッド/最大4.7GHz)で、ほかは当時より少しパワーアップし、64GB(DDR4)、M.2 SSD 512GB+1TB+2TBとなっている。電源は1KW。これにGeForce RTX 4090が入っていた。
が、ご存知のように、Beelink GTi13 Ultra + PCIe x8が使えるドッキングステーション側にGeForce RTX 4090を移したためdGPU不在に。
ここへ今回のGeForce RTX 5090を投入となる。サイズ的には若干短く、若干厚くなっただけなので、問題なくサクッと入れ替えることができた。8ピン×4 to 12v-2x6電源ケーブルは念のため同梱のものと交換している。
もともと何もなかったPCIe x16へGPUを差し、電源ケーブルを接続するだけなので作業自体は簡単。電源ONで無事起動した。後はドライバなどソフトウェア関係の再インストールとなる。
ドライバなどの更新とベンチマークテスト
前回はWindowsのDockerで環境構築したが、今回はUbuntu 22.04ネイティブでの設定。Ubuntuでの手順はWindowsと比較して少し面倒だが、と言って難しいわけでもない。
まず既存のNVIDIA関連をアンインストールし再起動。
$ sudo apt-get purge nvidia*
$ sudo apt-get purge cuda*
$ sudo apt-get autoremove
$ sudo reboot
次にドライバとCUDA Toolkitのインストールそして再起動。今回ドライバはapt installせず、NVIDIAのサイトにあるのを利用した。ただWindows版は572系になっていたが、Ubuntu版は初期の570系。このドライバはビデオカードが文鎮化する可能性があるというのでちょっと怖かったものの、無事起動、一安心と言ったところ。
$ chmod +x NVIDIA-Linux-x86_64-570.86.16.run
$ ./NVIDIA-Linux-x86_64-570.86.16.run
$ wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
$ sudo dpkg -i cuda-keyring_1.1-1_all.deb
$ sudo apt-get update
$ sudo apt-get -y install cuda-toolkit-12-8
$ sudo reboot
確認はnvidia-smiとnvcc。
$ nvcc --version
nvcc: (R) Cuda compiler driver
Copyright (c) 2005-2025 Corporation
Built on Wed_Jan_15_19:20:09_PST_2025
Cuda compilation tools, release 12.8, V12.8.61
Build cuda_12.8.r12.8/compiler.35404655_0
これで準備OKだ。なお、GeForce RTX 5090はドライバのバージョン57x系(以上)、CUDA 12.8系(以上)でしか動作しない。これに伴いPyTorchも/whl/nightly/cu128にしなければならず、conda activateで使用するアプリの環境ごとに更新する必要がある。
$ pip install -U --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
普段使っているComfyUIとSwarmUIに関しては、conda activateで環境を切り替えた後、前者は普通に「pip iinstall -U」、後者は、SwarmUI/dlbackend/ComfyUIで「./venv/bin/python -m pip install -U」とする。これは環境をvenv側に持っているためだ。どちらも動作を確認!
期待のベンチマークテストは、まず筆者普段のWorkflowで比較すると……。
同一生成設定で(FLUX.1 [dev] 832x1216、Wave Speed/前段使用、20steps)の比較
- GeForce RTX 4090 20/20 [00:05<00:00, 3.62it/s] Prompt executed in 6.74 seconds
- GeForce RTX 5090 20/20 [00:03<00:00, 5.70it/s] Prompt executed in 3.82 seconds
というように、2倍とは行かないものの約1.8倍ほど速くなっている(操作感的には倍)。ちょうどGeForce RTX 3090とGeForce RTX 4090も同じような差なので納得感がある。
次にいつもの神里綾華ベンチマークは、もうAUTOMATIC1111の環境がなく、ComfyUIでできるだけ条件合わせて6.4秒(1回平均0.64秒x10)。GeForce RTX 4090が10秒。FLUX.1 [dev]と似たような結果となった。
ただしこれは使用したシステムの都合上、PCI Express 4.0での結果である。5.0だともう少し速くなる可能性が残されている。
まだ触り出したから日も浅いためこれ以上のことは書けないが概ね良好。加えてVRAMが+8GBになったのは大きく、たとえば学習のsd-scriptsや動画生成など、パラメータを触って精度などを上げると、24GBをほんの少しオーバーして動かない……ということが結構ある。しかし+8GBの32GBだとこれらは余裕で通ってしまう。嬉しい限りだ。
気になる消費電力はnvtopで軽く確認したところ、アイドル時は10W未満なのだが、GPUが動き出すと550〜565W程度まで跳ね上がる。噂通りの大食らいだ。強目のデスクトップ用プロセッサを搭載していると電源1KWでも危ういかも知れない。温度は季節柄もあるだろうが通常38℃。動き出しても70℃までは行かない感じか。GeForce RTX 4090よりも気持ち低め!?
筆者のシステムは上記したようにモバイル用Core i7-12650HでTDP 45W。最大でも115W。M.2 SSDを3基搭載しているとは言え、ハイエンドなミニPCと変わらない(笑)。従って電源1KWだと余裕かと思われる。生成AI系は使ってみると分かるが、CPUはあまり使用しないのでこのクラスでも問題ない。
このように予想通りパフォーマンスが大幅に向上し大満足なのだが、GeForce RTX 5090に関しては良い話ばかりでなく、電源コネクタが溶ける、ドライバによる文鎮化、ROPが少ない(176対して168のものがある)など、結構な不都合が挙がっている。
電源コネクタに関してはGeForce RTX 4090の時にもあったが、TGPが125W増えている分、確率が高くなった感じだろうか?文鎮化に関しては初期のドライバ570の不都合だったらしく、最新の572だと直っている。
問題はROP(Render Output Unit)の数が少ないケース。これはWindows環境だとGPU-Zで確認できる。
ROP数が176であればスペック通り、168であれば問題があるケースとなる。ゲームで168だと5%程度性能が低下するらしい。とは言え、AI用途的には無関係。筆者のケースだとどうでもいいのだが、もし中古で売る時、不良品扱いになってしまう可能性があるので、168だと初期不良で交換したいところだ。
ただUbuntuにはGPU-Zに相当するものがなく(nvidia-smi、inxi、hwinfoいろいろ試した)、確認することができない。と言って、これだけのためにWindowsをインストールというのも勘弁。そもそもNVIDIAの品質管理問題なので、NVIDIAから何だかのチェックツールを出してほしいところ。
以上、簡単だがGeForce RTX 5090のファーストインプレッションをお届けした。Blackwellアーキテクチャを採用した民生用としては最上位のGPU、GeForce RTX 3090からGeForce RTX 4090へもそうだったように、一度速いのに慣れてしまうともう元へは戻れない。
最大の問題は約40万円を超える価格と、現在も入手困難なこと。前者は円安も影響しており、加えてAI特需……である意味最悪の状況下でのリリースとなってしまった。品薄に関しては3月中旬になれば的な話も出ているが、どうなることやら……。
さて、次の大物は「Project DIGITS」狙いか!?その分、余計に仕事しないと(笑)。