ニュース

ローカルLLMを高速化。LM Studioの「MTP」が安定版に

宇都宮充

2026年5月25日 12:31

　Element Labsは5月22日、MTP Speculative Decodingの安定版リリースを含むローカルLLMソフトの最新版「LM Studio 0.4.14(Build 4)」を公開した。現時点ではQwen 3.6の対応モデルなどで利用できる。

　MTP(Multi-Token Prediction) Speculative Decodingは、軽量なモデルで将来のトークンを予測し、ターゲットモデルでそれを検証することで、出力品質を保ちながら高速化を図る仕組み。現時点ではQwen3.6-35B-A3B-MTP-GGUFまたはQwen3.6-27B-MTP-GGUFなどといったモデルで利用できるとしているが、GGUFやllama.cppモデルもサポートしており、今後対応モデルは拡充されていくという。

　加えて本ビルドでは、MTPが有効になっている際に、非MTP Speculative Decodingのエラーが発生する問題や、「lms get gemma4」のコマンドで結果が表示されない問題を修正したほか、「lms chat」コマンドで各リモートモデルがどのLM Linkデバイスにあるか確認できるようになった。

MTP is available in LM Studio 0.4.14.

Sound on.pic.twitter.com/jMWv6OUp78
— LM Studio (@lmstudio)May 22, 2026

「LM Studio」関連書籍 Amazonで購入