CNNの模式図例。512×512ピクセルの入力画像を256×256ブロックで畳み込み演算を行ない、その結果をさらに128×128ブロックで畳み込み演算を行なう。これを繰り返していくことで、入力画像ジャンルごとの特徴データが得られる。この特徴データの分類集積が実質的な学習ということになる。CNN基礎理論の発案は1970年代に行なわれていたが、演算量が膨大であったことから近年になってやっと実用レベルの技術に進化した