速く進むと報酬が得られ、速度衝突すると罰を受けるようにし、得られる報酬が最大になるように行動を学習させる

速く進むと報酬が得られ、速度衝突すると罰を受けるようにし、得られる報酬が最大になるように行動を学習させる