ニュース

NVIDIA、複数の2D画像から瞬時に3Dシーンを生成する技術

 NVIDIAは、AIを活用して複数の2D写真をもとに即座に3Dシーンを生成するニューラルレンダリングモデル「Instant NeRF」を開発した。

 Neural Radiance Fields(NeRF)は、複数の2D画像の入力とそのカメラアングル情報に基づいて、リアルな3Dシーンを表現する技術。従来の手法では、AIを取り入れてもトレーニングに数時間程度、鮮明なシーンのレンダリングに数分程度の時間がかかっていた。

 Instant NeRFでは、同社が開発した新たな入力エンコーディング手法の「マルチ解像度ハッシュグリッドエンコーディング」を活用。これまでで最速なNeRFの手法と比べて、場合によっては1,000倍以上の高速化を達成したとする。数十枚の写真とそのカメラアングルデータを用いた場合では、トレーニングに数秒、3Dシーンのレンダリングに数十ミリ秒しかかからなかったという。

 NVIDIA CUDA ToolkitとTiny CUDA Neural Networksライブラリを使用して開発しており、ニューラルネットワークも軽量なため、1基の同社製GPUでトレーニングや実行が可能。NVIDIA Tensorコア搭載GPUでも高速に実行できる。ロボットや自動運転のほか、建築やエンターテインメント分野での活用を見込んでいる。

NVIDIA Instant NeRF: NVIDIA Research Turns 2D Photos Into 3D Scenes in the Blink of an AI