ニュース

ローカルLLMを高速化。LM Studioの「MTP」が安定版に

 Element Labsは5月22日、MTP Speculative Decodingの安定版リリースを含むローカルLLMソフトの最新版「LM Studio 0.4.14(Build 4)」を公開した。現時点ではQwen 3.6の対応モデルなどで利用できる。

 MTP(Multi-Token Prediction) Speculative Decodingは、軽量なモデルで将来のトークンを予測し、ターゲットモデルでそれを検証することで、出力品質を保ちながら高速化を図る仕組み。現時点ではQwen3.6-35B-A3B-MTP-GGUFまたはQwen3.6-27B-MTP-GGUFなどといったモデルで利用できるとしているが、GGUFやllama.cppモデルもサポートしており、今後対応モデルは拡充されていくという。

 加えて本ビルドでは、MTPが有効になっている際に、非MTP Speculative Decodingのエラーが発生する問題や、「lms get gemma4」のコマンドで結果が表示されない問題を修正したほか、「lms chat」コマンドで各リモートモデルがどのLM Linkデバイスにあるか確認できるようになった。