ニュース

Google、最大4倍高速なLLM「DiffusionGemma」無償公開

宇都宮充

2026年6月11日 14:18

DiffusionGemma

　Googleは6月10日、テキスト拡散(text diffusion)と呼ばれる手法により、テキスト生成速度を最大4倍高速化できるというマルチモーダルLLM「DiffusionGemma」を発表した。現時点では実験段階となっている。Apache 2.0ライセンスでHugging Faceで公開しており、モデルウェイトを無償でダウンロードして利用できる。

　DiffusionGemmaは、総パラメータ数260億、アクティブパラメータ数40億のエキスパート混合モデル(MoE)。テキストだけでなく、画像や動画の入力にも対応しており、これらを混在させたプロンプトを処理してテキストを出力できる。

　一般的な大規模言語モデル(LLM)がトークン単位で逐次処理を進めていくのに対し、テキストのブロックを同時に並列生成して処理することで、GPUやTPUの待ち時間を減らし、処理の効率化と高速化を図る。最大4倍高速にトークン出力を生成でき、NVIDIA H100の場合で1,000トークン/秒以上、GeForce RTX 5090の場合で700トークン/秒以上になるという。

　テキストブロックの生成にはテキスト拡散と呼ばれる手法を採用。AI画像生成に用いられる拡散の仕組みをテキスト生成に応用したものとなる。ランダムなプレースホルダートークンで構成されるテキストブロックを用意し、反復的に精緻化していくことで、高品質なテキストブロックを出力する。

　同社によると、インライン編集や高速なイテレーションなど、速度重視の用途やインタラクティブなローカルワークフローに好適だという。なお、速度を優先した設計となっているため、全体的な出力品質はGemma 4と比べて低いとしている。