ニュース

MINISFORUM、MS-S1 MAXを4台連結して“非蒸留”のDeepSeek-R1 671Bを駆動

MS-S1 MAXを4台連結させたデモ

 MINISFORUMは12月10日(北京時間)、AMDと共同で新製品発表会を開催。この発表会の展示の中でRyzen AI Max+ 395/メモリ128GBを搭載したミニPC「MS-S1 MAX」を4台クラスターで構築し、パラメータ数671B(6,710億)のDeepSeek-R1の推論を初めてデモしたと発表した。

 DeepSeek-R1は2025年初頭に登場したLLM。パラメータ数は671Bと膨大なため、一般的なPCでローカル動作させるために、小型のQwenまたはLlamaをベースとした「蒸留モデル」が用いられることが多い。今回のデモでは4台のMS-S1 MAXを用いてクラスターを構築し、“非蒸留モデル”を動作させたのがポイントだ。

 ただ、DeepSeek-R1 671Bは精度が高いBF16フォーマットの場合、容量が優に1TBを超え、MS-S1 MAX 4台分のメモリ(計512GB)に収まらないため、実際に用いたのはDeepSeek-R1のQ4_K_M量子化モデル(約400GB)であるとされる。相互接続にはUSB4またはUSB4 Version 2.0を採用し、llama.cppで分散処理させた。速度は11tok/sだった。

 具体的な構築法については非公開としているが、GeForce RTX 5090の5U構成と比較して、体積を約65%、消費電力を約80%、総コストを最大77%削減できることを謳っている。

 このほか発表会では、AMDとの協業強化について語られたほか、Ryzen AI 9 HX PRO 370を搭載した「AI NAS N5 Pro」のデモも行なった。

AI NAS N5 Pro
発表会の模様