眠っているIntelのNPUをLLMで叩き起こしてみた
(9/10)
前の画像
(9/10)
次の画像
記事へ
回答や全体の会話の長さにも左右されるが、トークンの出力速度はおよそ8tok/s前後といった印象
前の画像
(9/10)
次の画像
記事へ