ニュース

OpenAI、文章や画像から高度な動画を生成できるAI「Sora」

生成された動画の1フレーム

 OpenAIは15日(米国時間)、テキストや画像から最大60秒の動画を生成できる動画生成AI「Sora」を発表した。同AIモデルは15日時点では開発段階で、一部の専門家やクリエイターのみ利用を許可されており、一般公開はされていない。

 Soraは、ユーザーの要求を理解するだけでなく、その要求が現実世界でどのように表現されるかも把握でき、複数のキャラクターや特定のモーション、詳細な背景を含む複雑なシーンを生成できるという動画生成AIモデル。

 動画内での被写体の時間的な一貫性を保持できないという、動画生成AIにおける課題にも対応しており、被写体が一時的にフレーム外に出て見えなくなったとしても、高確率で同じ状態を維持することができる。

 静止画から動画を生成する機能も備えており、画像の細部に至るまで正確なアニメーション化が可能。既存の動画をもとに、前後を伸ばしたり、欠けているフレームを補完することもできる。

被写体はシーンが変わっても高確率で同じ状態が維持されている

 このほか、ループ動画の作成や、2つの動画をシームレスにつなげるトランジションの生成、最大解像度2,048×2,048ドットでの画像生成も可能。現時点では弱点も存在し、たとえばクッキーをかじった後に噛み跡が残らないなど、原因と結果の関係を正確に理解できない場合や、物理的にあり得ない動きをする動画を生成する可能性があるという。

物理的にあり得ない動画が生成される場合も