処理したいフレーム(左)は、RGBの3つチャンネルに分離されたあと、前フレームのマスク(中央)と連結されてからニューラルネットワークへ入力される。このとき、前フレームのマスク結果を参照しているために、マスク結果(右)は前フレームと時間的整合性をもつ

処理したいフレーム(左)は、RGBの3つチャンネルに分離されたあと、前フレームのマスク(中央)と連結されてからニューラルネットワークへ入力される。このとき、前フレームのマスク結果を参照しているために、マスク結果(右)は前フレームと時間的整合性をもつ