ニュース
メモリ16GBでOK!音声も画像も対応する賢いLLM「Gemma 4 12B」無償公開
2026年6月4日 10:42
Googleは6月3日(米国時間)、メモリ16GBでも動作し、より大規模な上位モデルにも匹敵する性能を実現したLLM「Gemma 4 12B」を公開した。Apache 2.0ライセンスでHugging FaceおよびKaggleで公開しており、無償で入手できる。LM Studio、Ollamaをはじめ、さまざまなソフトウェア上で動作可能。
Gemma 4 12Bは、エッジコンピューティング向けの「Gemma E4B」とより高度な「Gemma 26B MoE」の中間に位置するモデル。メモリ使用量を抑えることにより、16GBのVRAMまたは統合型メモリを持つPCで動作可能で、ノートPCにも対応できる。また、エンコーダレスの統一アーキテクチャにより、ミドルサイズとして初めてネイティブの音声入力をサポートする。
標準的なベンチマークにおいては、より大型の26B MoEに匹敵する性能を実現しながら、メモリ消費量を半分以下に抑えたことで、メインストリームのノートPCでパワフルなマルチモーダル体験/エージェント体験を実現する。
また、ビジョンエンコーダを単一の行列演算、位置埋め込み、正規化からなる軽量埋め込みモジュールに置き換えることで、LLMバックボーンが視覚処理を引き継げるようにした。さらに音声エンコーダを完全に削除し、生の音声信号をテキストトークンと同じ次元空間に投影して処理を簡素化した。




















