ニュース

最大6倍速、オープンウェイトLLM最強クラス「Kimi K2.7 Code」に新モード

竹元かつみ

2026年6月15日 22:41

　コーディングタスクで毎秒180トークン、短いコンテキストなら毎秒260トークン——。Moonshot AIは6月15日、オープンウェイトのコーディング特化AIモデル「Kimi K2.7 Code」に、推論速度を最大6倍に引き上げる高速モード「Kimi K2.7 Code HighSpeed」を追加した。

　注目すべきは、HighSpeedが別のモデルではないという点だ。同社の公式ドキュメントでは「Kimi K2.7 Codeと同一のモデル」と明記されている。つまりモデルそのものを変えたのではなく、サービング基盤(推論インフラ)の最適化によって同じ1兆パラメータのMoEモデルから6倍の速度を引き出した格好だ。

　Kimi K2.7 Codeの重みは、Hugging FaceでModified MITライセンスのもと無償公開されている。オープンウェイトとして公開済みの同一モデルであるため、サービング技術の再現次第ではローカル環境での高速化にもつながる可能性がある。

　APIからの利用時のモデルIDは「kimi-k2.7-code-highspeed」で、コンテキストウィンドウは通常版と同じ256Kトークン。提供対象はKimi Code Beta Programの参加者、Kimi APIの開発者、およびKimi Businessユーザーで、キャパシティの制約から当面はアクセスが制限される。Beta Programへの参加に招待は不要で、参加登録すればアクセス権を得られる可能性がある。APIの高速版/通常版の料金は、入力100万トークンあたり1.9ドル/0.95ドル、出力100万トークンあたり8ドル/4ドル、キャッシュヒット時は0.38ドル/0.19ドル。

　Kimi K2.7 Code自体は6月12日に公開されたばかりのモデルで、総パラメータ数1兆、アクティブパラメータ数320億のMoEアーキテクチャを採用する。4億パラメータのビジョンエンコーダ「MoonViT」を搭載し、マルチモーダルモデルとして画像や動画の入力にも対応する。前世代のKimi K2.6に比べてコーディング性能が大幅に向上したほか、推論時のトークン使用量を約30%削減しており、「考えすぎ」の抑制とコスト削減を両立した。MCPサーバーとの連携を評価するベンチマーク「MCP Mark Verified」は81.1%で、Claude Opus 4.8(76.4%)を上回る結果を出している。

🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced!

🔷 Improved coding & agent performance over K2.6: +21.8% on Kimi Code Bench v2, +11.0% on Program Bench, and +31.5% on MLS Bench Lite.
🔷 Reasoning efficiency: Less overthinking, with 30% lower…pic.twitter.com/jFS7I40avs
— Kimi.ai (@Kimi_Moonshot)June 12, 2026

「AI」関連アイテム Amazonで購入