ニュース

GoogleのオープンモデルAI「Gemma 4」は商用解禁。動画・音声対応で大幅強化

 Googleは4月2日、オープンモデルの最新LLMとして「Gemma 4」を発表した。Androidデバイス、ノートPCのGPU、そしてワークステーションやアクセラレータまで、あらゆるハードウェアで効率的に動作し、微調整できるよう特別に設計されているという。

 特筆すべき点として、ライセンス形態が商用利用可能なオープンライセンスのApache 2.0に移行されたことも挙げられる。これによりGemma 3よりも活用の幅が広がったといえる。

 Gemma 4は、以下の4つのサイズを展開。31Bのモデルについては、Arena AIにて世界3位のオープンモデルにランクインしている。なお、前世代のGemma 3は1B/4B/12B/27Bのサイズを展開していた。

・Effective 2B(E2B)
実効パラメータ数2.3B(埋め込みを含む総パラメータ数は5.1B)

・Effective 4B(E4B)
実効パラメータ数4.5B(埋め込みを含む総パラメータ数は8B)

・26B Mixture of Experts(MoE)
総パラメータ数25.2B(推論時の有効パラメータ数は3.8B)

・31B Dense
総パラメータ数30.7B

ベンチマーク結果

 Gemma 4ではパラメータあたりの性能が向上。マルチモーダル処理において、これまでのテキストと画像だけでなく、全モデルで動画をネイティブ処理可能になった。また、E2BおよびE4Bモデルでは音声入力もネイティブ対応している。コンテキストも最大256Kトークン(26Bと31Bの場合)を扱えるようになったほか、精度を高める思考モードにも対応している。