SAM 2の動画におけるオブジェクト認識のため、51,000のビデオや60万枚以上のマスクを利用した

SAM 2の動画におけるオブジェクト認識のため、51,000のビデオや60万枚以上のマスクを利用した