NVIDIAのAmpereで対応した新技術「プルーニング」(10/23)

クラウド側でインファレンスを走らせる場合の問題。NVIDIAが主催するGPUコンピューティングカンファレンスGTC(GPU Technology Conference) 2016で行なわれたDeep Compressionのセッション「S6561 Deep Compression and EIE: ——Deep Neural Network Model Compression and Efficient Inference Engine」(S. Han, Stanford University, GTC 2016)のスライド