ニュース

最大6倍速、オープンウェイトLLM最強格「Kimi K2.7 Code」に新モード

 コーディングタスクで毎秒180トークン、短いコンテキストなら毎秒260トークン——。Moonshot AIは6月15日、オープンウェイトのコーディング特化AIモデル「Kimi K2.7 Code」に、推論速度を最大6倍に引き上げる高速モード「Kimi K2.7 Code HighSpeed」を追加した。

 注目すべきは、HighSpeedが別のモデルではないという点だ。同社の公式ドキュメントでは「Kimi K2.7 Codeと同一のモデル」と明記されている。つまりモデルそのものを変えたのではなく、サービング基盤(推論インフラ)の最適化によって同じ1兆パラメータのMoEモデルから6倍の速度を引き出した格好だ。

 Kimi K2.7 Codeの重みは、Hugging FaceでModified MITライセンスのもと無償公開されている。オープンウェイトとして公開済みの同一モデルであるため、サービング技術の再現次第ではローカル環境での高速化にもつながる可能性がある。

 APIからの利用時のモデルIDは「kimi-k2.7-code-highspeed」で、コンテキストウィンドウは通常版と同じ256Kトークン。提供対象はKimi Code Beta Programの参加者、Kimi APIの開発者、およびKimi Businessユーザーで、キャパシティの制約から当面はアクセスが制限される。Beta Programへの参加に招待は不要で、参加登録すればアクセス権を得られる可能性がある。APIの高速版/通常版の料金は、入力100万トークンあたり1.9ドル/0.95ドル、出力100万トークンあたり8ドル/4ドル、キャッシュヒット時は0.38ドル/0.19ドル。

 Kimi K2.7 Code自体は6月12日に公開されたばかりのモデルで、総パラメータ数1兆、アクティブパラメータ数320億のMoEアーキテクチャを採用する。4億パラメータのビジョンエンコーダ「MoonViT」を搭載し、マルチモーダルモデルとして画像や動画の入力にも対応する。前世代のKimi K2.6に比べてコーディング性能が大幅に向上したほか、推論時のトークン使用量を約30%削減しており、「考えすぎ」の抑制とコスト削減を両立した。