森山和道の「ヒトと機械の境界面」

NHKエンタープライズ、AIジュニアスクール「ディープラーニングの学校」を開催

~AIを恐れず使いこなせる人材育成を目指して

 株式会社NHKエンタープライズ、ライフイズテック株式会社、株式会社Qosmoは、2018年2月17日~18日の2日間の日程で、東京都渋谷区にあるNHKエンタープライズ本社にて、中学生・高校生向けの無料AIジュニアスクール『ディープラーニングの学校』を開講した。

 実際にプログラムをさわって動かすことで人工知能がどのように動いているのかを学ぶことができる体験型ワークショップ。「人工知能を使いこなす」次世代の人材育成を目指し、中学生や高校生が実際に触りながら、ディープラーニングのメカニズムを体感できる、教育用のシステムとカリキュラムを新たに開発した。

 参加者たちは希望者から抽選で選ばれた中学1年生から高校3年生。3社の役割分担は、企画・運営が株式会社NHKエンタープライズ、AIスクール運営協力がライフイズテック株式会社、技術監修が株式会社Qosmo。2日目の特別レクチャーの講師は東京大学大学院情報理工学系研究科准教授の山崎俊彦氏が務めた。

 今回の仕掛け人であるNHKエンタープライズの真藤忠春氏や田中孔一氏、澤田隆司氏らによると、初日にはチーム作りを行なったあと、ウェブ上で体験できるAIツール各種(Sketch-RNNAutoDrawなど)をさわってもらったとのこと。

 そのあと、今回の教室向けに独自に開発された、「構造理解」のためのワークを実施したそうだ。ある人がさまざまな写真のなかからランダムに選び出した写真を、別の人が単純化された記号を使って表現し、それを見たまた別の人がなんの写真だったかあてるというもの。このほか、犬などの写真を見て、何をもって犬だと認識しているのか言葉にしたあと、AIの画像認識はまったく異質であることを教えたという。

さまざまな動物の写真から一枚を選ぶ
それを抽象的な記号で表現する

犬猫画像判定器をJupyterを使って作る

 実際に取材に訪問した2日目は身体を使って互いに触れ合うミニゲームで空気をあっためたあと、実際に犬と猫の画像を判定させるプログラムを組んでみる作業からはじまった。ライフイズテック社製のレッスンアプリを見ながら、ブラウザ上で動作する実行環境「Jupyter」を使ってPythonのコードを書いていき、16の畳み込み層などからなる画像認識モデル(VGG16ベース)を学習させる。

 サンプルコードはあるのだが、コピペさせるのではなく、敢えて1つ1つ打ち込ませていく。ライフイズテックの橋本善久氏によれば「実感を持たせるため」だという。

ミニゲームでチーム内の空気をあたためるところから
レッスンアプリ「MOZER」
ブラウザ上でjupyterを動かしたり、チュートリアルに戻ったりしながら学んでいく

 繰り返しになるが、参加者は中学生から高校生までともともと幅があり、なかにはパソコンの使い方に慣れている子もいれば、決してそうでない子もいる。馴れないMacの操作そのものや英単語のスペルや大文字小文字に手間取っている子もいれば、逆にあっという間にコンパイルまでやってしまう子もいた。

チュートリアルはパソコンの使い方やAIの基礎からはじまる
かなり丁寧な解説でステップバイステップで進んでいく

 もちろん各班にはメンターがついており、わからないところを指導していく。チュートリアルも引っかかりやすいところを見越した、かなり丁寧な作りになっていて、たとえば「エラーになった場合はスペルミスをチェックしろ」とキャラクターが教えてくれるようになっていた。

モデルをトレーニングする
最初は試行回数1から

 判定器を作る準備が済んだら、次は学習させるデータセットを読み込ませる。そのためのフォルダパスなどもチュートリアルで教えてくれる。こうやって徐々に作業を進めていくなかで、人工知能とは何か、「コードを書く」こと、レイヤーを重ねて特徴量を抽出していくディープラーニングの仕組み、「モデル」や「エポック(繰り返し学習回数)」などの概念を同時並行で把握させながら、プログラミングの基本を学ぶ。

 なお学習のためのデータセットは、既存の学習用データセットを利用したもので、犬猫それぞれの画像1,000枚ずつくらいとのこと。そのデータが学習を繰り返すときに、拡大縮小や反転、回転、汚しなどの処理を自動で施されて、学習を積み重ねて、各レイヤーが変化していき、判定器の性能が変わっていく。単純に試行回数を増やせば判定正解率が上昇するわけではないことも学ぶことができる。

データセットを学習させる
学習回数を増やす
各班にはメンターが付く

 とりあえず判定器を作ったら、画像判定をテストさせる。テストに用いるのもネット上の画像だ。適当にGoogle検索した画像のURLを入力して、その画像が犬猫だけで判定させるとどっちなのか判定させていく。なお実際に判定させる画像は別に犬猫にかぎらず、なんでも構わない。あくまで、事前に学習させた判定器にとって、その画像がどちらよりなのかを判定させるわけだ。みんなさまざまな画像でテストを楽しんでいた。

 午前中の作業は、犬と猫の特徴の学習をエポック数30で開始させるところまで。学習中はランチタイムだ。なお実際の学習は今回の教室のために契約したAWS上で行なっている。学生たちには、いわばそのセッティング作業をやってもらったことになる。

横軸は試行学習回数。必ずしも直線的に向上していくわけではない
各レイヤーが何を表現しているのかを可視化した画像を見ることもできる

 午後は学習が終了した判定器を使って、犬や猫だけではなく、さまざまな画像--ほかのいろいろな動物や芸能人、アニメキャラクター、自分たち自身の写真など--を犬猫判定器に入れてみる。そして結果を見ることで、作ったAIが画像のどんなところを見て判定しているのかといったことを考察していくところからはじまった。

ネット上の画像を判定させる
メンターが指導しながら作業を進める

 たとえば猫画像は屋外で撮影されたものが多い。そういった偏りを考えずにトレーニングに使うと、屋外の画像=猫と判定する判定器ができてしまう。逆に顔のアップばかりを学習データに使うと、性質の違う判定器ができる。あるいは学習するたびに各レイヤーは異なるかたちで変化していくので、そのたびに判定器の性能は変わる。こういった過程を通し、AIと人間の違いや共通点を体感しながら学ぶわけだ。

判定器が画像のどこの部分を重視して判定したのかを示すヒートマップ
レイヤーごとにヒートマップは異なる

 ひとしきり判定器で遊んだあとは、また新しい判定器を作る。午前中は犬猫だけだったが、午後は3種類の物体の判定器を分担して作る。手順は基本的に同じなので、こちらは比較的さくさくと進んでいたように思えた。

別の判定器を作る
作成中の様子

魅力を定量化してフィードバックすることも可能

東京大学 情報理工学系研究科 電子情報学専攻 准教授 山崎俊彦氏

 判定器の学習中の時間を利用して、東京大学 情報理工学系研究科 電子情報学専攻 准教授の山崎俊彦氏の講演が行なわれた。山崎氏は囲碁や自動運転、チャットボット、医師や弁護士の手助け、タクシー需要予測、エネルギーの最適化などの人工知能の成果を紹介。中学生や高校生に身近なAI関連技術ということで、ファッションのリコメンドや、「SENSY」のようなコーディネートサービス、漫画レコメンド、flickrなどでの写真への自動タグ付け、人の笑顔を認識して料金を請求するバルセロナTeatreneu劇場の「PAY-PER-LAUGH」などの例を挙げた。

Pay per Laugh | TeatreNeufromedududuonVimeo.

 さらに時事ネタとして最近話題になった、日本銀行の黒田総裁の記者会見時の表情を解析した研究例も紹介した。何か大きな政策変更を発表する直前は黒田総裁がストレスを感じていることが表情の解析だけからわかったという。このほかレンブラントの絵を機械学習で解析してAIにそのタッチで画風を再現させた「The Next Rembrandt」などを示した。

 山崎氏は「AIと遠そうな業界はどこか」と問いかけて、一例として漁業を挙げた。海水温のデータを使うことで、プロの漁師の勘よりも魚が獲れる場所を予測することができたという。このほか、手書き文字、音声認識、自動翻訳などの成果を紹介した。AI技術はさまざまなところで活用されはじめている。

漁場予測
手書き文字の読み取り

 次に山崎氏は、AIや深層学習がいまブレイクした理由として、インターネット時代になり、ウェブ上に膨大なデータが蓄積され、容易に入手できるようになったことを挙げた。多くの人がスマートフォンを使って写真を撮り、インターネット上に投稿する時代になっている。

 もう1つは圧倒的な計算資源だ。ディープラーニングの基本コンセプトは1979年にNHK技研の福島邦彦氏によって提唱された「ネオコグニトロン」である。つまり、40年近く前である。それが今になってブレイクしたのは計算能力が大幅に向上したからだ。計算機の能力は大雑把に3年で4倍になるとされているが、30年でおおよそ100万倍になる。40年経つと6,400万倍になる。だから当時は理論でしかなかったものが、いまや現実的な時間で計算が終わるようになった。

 3つ目に山崎氏が挙げたのがクラウドソーシングによる労働力調達だ。クラウドソーシングで、画像データへのタグ付けなどの作業が安価かつ大量に行えるようになった。これらが組み合わさることでAIブームが起きたのではないかと山崎氏は述べた。

 AIができることは何か。AIが得意としているのは数値化された大量の経験に基づいているものだ。だから医者や弁護士の仕事は得意だ。大量の経験を自ら計算機内で作り出すことができる囲碁や将棋のようなゲームも得意だ。また、たんぱく質の結合など、人間には気づけないがルールがあるものはやりやすい。

膨大な量のデータがネットに
計算能力の大幅な向上
クラウドソーシングによって正解タグ付きデータも安価に入手可能に
AIが得意な領域

 山崎氏自身の研究成果も紹介された。山崎氏は「魅力工学」を標榜して研究を行っている。魅力を定量化し、予測・解析、強化する工学だ。事例として3つ挙げた。1つ目は喋り方の上手い下手の定量化。AIを相手に講演や面接の練習ができる時代が来るかもしれない。2つ目はTV CM。より人の印象や記憶に残りやすいCMを予測させることができる。3つ目は人の顔の魅力度判定だ。人間とほぼ同等の判定ができるという。これを使うことでどう化粧すればより魅力的に見えるのかといった提案や、自動メークアップの提案ができる。

 なお、山崎氏は共同研究や事業化するパートナー企業を募集中とのことだ。

魅力工学
講演の上手下手を定量化
印象に残りやすい映像を予測
魅力度判定をもとにした自動メークアップ

 自宅でAIを勉強したいと思う中学生・高校生はどうすればいいのか。山崎氏は「まずは落ち着いて数学、英語、国語を勉強してほしい」と語った。プログラミングについては、いまは無料ツールがダウンロードできるので、それらを活用してほしいと紹介した。ただ、ディープラーニングを行わせるためにはGPUボードを搭載したハイエンドPCや、クラウドサービスを使う必要があり、それらはまだまだ若い学生たちにはハードルが高いのが実情だ。

 質疑応答では、魅力について研究するようになったきっかけは何か、AIを作るAIは可能なのか、AIや自動化がさらに進んだときに人は何をすればいいのか、過学習の課題といった質問が上がった。AIと人との今後の関係について山崎氏は、車と人との関係になぞらえて説明し、車ができたからといって人の仕事がなくなったわけではないと述べ、「むしろAIを使いこなす人材がどんどん必要になる、AIに使われず、AIを使ってやるくらいのつもりで勉強してほしい」と呼びかけ、「今の子供たちが羨ましい、自分も20年若かったら」と語った。

AIを勉強したい中学生・高校生はまずは基礎力として数学・英語・国語を
ディープラーニングのための環境はまだ高い

ハンズオンAIで未来をつかめ

保護者の方も合流して作成したAIで画像認識体験

 講演が終わったあとは、講演中に学習させていた「海の動物」や「フルーツ」、「乗り物」などの判定器を使って、ネット画像を判定させたり自分の顔を判定させた。途中からは保護者の方々も合流し、和気藹々とした雰囲気で、AI体験が進められた。

 最後には各班での感想取りまとめが行なわれた。各班代表からは、以下のような感想が述べられた。

・「初めてのプログラミングだったが、『もっともっと』という感覚があった」
・「学校はつまらないが、こういう学びの場所もあることを知ることができた。こういうところを目指したい」
・「これまで自分のAIについての考えは漠然としていた。今回体験することで、そんなに恐怖心を持つ必要はないとわかった」
・「初めてコードを書いた。難しかった。だがみんなと自分のペースで勉強していくことができ楽しかった」
・「自分はキーボードを打つのがすごく下手でメンターに迷惑をかけたと思う。だがエラーも直してくれてプログラムを動かすことができ、楽しい2日間になった。すごくプログラミングに興味を持った」
・「自分は以前からAIに興味があった。仕組みも自分で勉強していたが、実践は家では難しい。今回できてよかった」
・「1日目はレク要素、2日目はすごく実践的で、技術的な観点からAIを見つめられたが、ほかの観点から見るとAIの見え方も違うと思う。AIが今後の僕らの生活において大きな意味を持つ技術になるのは確かなので、色々な観点で注目していきたい」

 NHKエンタープライズによる「ディープラーニングの学校」プロジェクトは、次世代の人材育成を促進するため、2018年以降も中高生向けのAIジュニアスクールを開催する予定だ。2020年にはAIプログラミング・コンテスト実施も検討中とのことだ。

みんなで記念撮影
2020年にはAIプログラミングコンテスト実施を目指す