VRAMを96GB割当可能なため、思いっきりVRAMに振って、gpt-oss-120bをロードしてみた。コンテキストサイズは最大である。これで約72GB程度使われる。GeForce RTX 5090といったハイエンドカードでもここまでのVRAMは持っていないので、Ryzen AI Maxだけの特権だ