ニュース

Google、画像からプレイ可能な3Dワールドを生成するAI「Genie 2」

劉尭

2024年12月5日 12:49

　Google DeepMindは12月4日(米国時間)、テキスト生成された画像から、実際にプレイヤーがその世界に入ってプレイできる3Dワールドが生成できるAI「Genie 2」を発表した。

　Genie 2は大規模なビデオデータセットを利用してトレーニングされた、自己回帰潜在拡散モデルとなっている。画像を1枚入力すると、さまざまなリッチな3Dワールドを生成し、ジャンプや水泳といったプレイヤーのアクションの結果を含む仮想世界をシミュレートできる。オブジェクト間の相互左右、複雑なキャラクターアニメーション、物理学、ほかのエージェントモデルの動作をモデル化して予測する機能などが実装されている。

　たとえば、キーボードのW/A/S/Dを利用したキャラクターの自由な移動はもちろんだが、ワールド内においてたとえば風船の破裂、ドアを開ける、爆発物を爆発させるといったオブジェクトの相互作用もモデル化され、水や煙、重力、ライティング、反射などの効果もモデル化される。