Google、スマホカメラでリアルタイムに被写体と背景を分離できる技術(2/3)

処理したいフレーム(左)は、RGBの3つチャンネルに分離されたあと、前フレームのマスク(中央)と連結されてからニューラルネットワークへ入力される。このとき、前フレームのマスク結果を参照しているために、マスク結果(右)は前フレームと時間的整合性をもつ