森山和道の「ヒトと機械の境界面」

NII、「人工頭脳プロジェクト」キックオフシンポジウムレポート
〜ロボットは東大に入れるか



「人工頭脳プロジェクト」キックオフシンポジウムレポート

 「ロボットは東大に入れるか。国立情報学研究所『人工頭脳プロジェクト』キックオフシンポジウム」が2011年12月14日、学術総合センタービルの一橋記念講堂で行なわれた。主催は国立情報学研究所(NII)、後援は情報処理学会、人工知能学会、言語処理学会、日本ロボット学会。協力はベネッセコーポレーション、東京書籍、Wolfram Research、ジェイシー教育研究所。

 はじめに司会の東京大学情報理工学系研究科 情報科学科の松崎拓也氏は、「将来の情報学を担う若者に夢をあたえる、国際連携を前提にしたプロジェクトだ」と概要を紹介。続けて主催者挨拶として国立情報学研究所所長の坂内正夫氏が「ぶっとんだ提案をしてくれということで新井紀子教授から出てきたのがロボットを東大に入れようというプロジェクトだった」と述べた。「本当にできるのか」、「技術的にIBMの「Watson」の二番煎じでは困る」、「受験を対象にすると社会的に物議をかもすのではないか」といった論点から議論をした結果、面白い切り口だと判断したという。

 特に若者ならびに「若々しい方」が熱意を持って参画していると語り、このプロジェクトはNIIによる「情報研究のオープンプラットフォーム」というコンセプトにぴったりだと述べた。このプロジェクトを通して情報技術の発展のみならず、大学入試、受験についても問いかけていきたいという。


東京大学 情報理工学系 松崎拓也氏 国立情報学研究所所長 坂内正夫氏

●基調講演「人工知能のグランドチャレンジ チェス、サッカー、クイズから東大入試へ」
公立はこだて未来大学教授 松原仁氏

 続けて講演が4本行われた。基調講演は、公立はこだて未来大学教授の松原仁氏。「人工知能のグランドチャレンジチェス、サッカー、クイズから東大入試へ」と題して、これまでの人工知能のチャレンジについて紹介した。コンピュータやロボットを道具として知能について探求している人工知能研究は、人工物に人間のような知能を持たせることを目標としている。1950年前後に研究が始まり、1956年にダートマス会議でこのような研究分野に対して「人工知能(Artificial Intelligence)」という名前があたえられた。

 「グランドチャレンジ」とは、それ自体は役に立たなくても世の中で注目を集める象徴的な目標を立てて挑むことで大きく飛躍をとげるような研究チャレンジのことだ。人工知能についてはチェスのチャンピオンを破るのが最初のグランドチャレンジだった。チェスの人工知能研究は探索手法の技術発展に大きく役立ったという。最初は人間の真似をしたアルゴリズムをコンピュータに入れようとした。1960年代後半にはアマチュア初段レベルになった。一方、コンピュータなりのやりかた、すなわちルール上可能な打てる手を全部探索するという方式が1970年代からは主流になり、1980年代にはチェス専用スパコンが登場した。この時代には「頭ではなくお金を使っている」という悪口もあったという。

 そして1989年にIBMがプロジェクトを開始。1990年に世界チャンピオンのカスパロフと対戦。当時は大差で敗退したが、その後急激に強くなり、1997年にカスパロフと6戦した。彼のミスもあり2勝1敗3引き分けとなった。このときは一秒間に2億手読んでいた。なお今でも人間のチャンピオンとの対戦は行なわれており、最近はコンピュータ側の圧勝だという。しかも当時はスパコンを使っていたが今はPCで、将来はスマートフォンでも人間との対戦に勝てるのではないかと言われているそうだ。そのほか、チェッカー、オセロ、将棋、囲碁などでもチャレンジは行なわれている。なお将棋で人間を破るのに「2015年まではかからない」と松原氏は断言した。なお囲碁もあと十数年だという。

 松原氏はロボットサッカー「RoboCup」立ち上げにも参加したことで知られている。1990年から検討を行なって1993年ごろにサッカーに絞込み(当時はロボットJリーグという名前だった)、15年に「RoboCup」と改称して構想を国際的に発表。日本発で世界標準のグランドチャレンジとすることを目指した。サッカーは団体スポーツであり、時々刻々と状況が変化すること、分からない情報を補う必要があること、なんとかロボットにもチャレンジできそうであること、そして何より、世界で人気のあるスポーツであることが大きかったという。RoboCupはその後、「レスキュー」リーグや、家庭のなかで作業する「@home」リーグなどができている。なお2050年にFIFAのルールでワールドカップチャンピオンチームに勝つヒューマノイドチームをつくることを目標にしている。

チェス・チャンピオンのカスパロフとの対戦 将棋ソフト・あから2010と清水女流王将との対戦は将棋ソフトの勝ちだった。 RoboCupヒューマノイドリーグの模様

 そして最近のグランドチャレンジとして注目されたのが、2011年、クイズ番組「ジョパディ!」でクイズ王にIBMのWatsonが勝ったという話題だ。単にクイズを答えるだけではなく、何ドルの問題を選んで正解を勝ち得て、掛け金を計算して決めてといった、ゲームにも勝利したというところが大きな点だ。

 Watsonのチャレンジについての詳細は、本連載の以前の記事をご覧いただきたい。

 今回の「東大に入れるか」プロジェクトについて、面白いのは「人工知能」ではなく敢えて「人工頭脳」としているところだと松原氏はコメントした。知能だけではなく、頭脳全体を対象にしているという意味だ。またクイズよりは東大入試のほうが難しいが、その一方で、京大の問題ほどくせがないので東大のほうがコンピュータ向けにはいいのではないかと考えられると述べた。また今回のチャレンジでは実際にはロボットは使われないだろうが、「いつか、本物のロボットがエンピツを握って人間と一緒に受験してほしい」と語った。

 またこのプロジェクトが成功すると、研究の進歩が目に見えてわかるし、事務のある程度がコンピュータで代行できるし、入試問題の難易度の客観的指標ができるし、「東大入試の幻想」がなくなるのではないかと述べた。

●「ロボットは東大に入れるか」プロジェクト概要
NII社会共有知研究センター 新井紀子氏

 続けて「ロボットは東大に入れるか」プロジェクト概要説明が、プロジェクトディレクターであるNII社会共有知研究センターの新井紀子氏から行なわれた。新井氏は過去の入試データ、教科書のデジタルデータを多数の企業から提供してもらったことなどに謝意を示して講演を始めた。このテーマには受験生をもつ親御さんなど多くの人から興味をもたれているという。

 今回のプロジェクトにおいては、物理的なロボットが歩いて東大に入るわけではない。ちなみに受験要項には「電子機器は電源を落とすように」と書かれているそうだ。人工知能研究者が非常に真面目に、一里塚として必要な問題だと思って取り組みたいと思っているという。

 プロジェクトでは実際のテスト用紙をデジタルデータ化、アノテーションを施して入力する。そして制限時間内にどれだけ正当できるかを問う。東大に入ることが究極の知能なのか、という批判的意見も多数あったという。だがそうは思っていないという。ではどうしてこのチャンレジなのか。大学入試が素材として興味深かったからだという。

 大学入試には前提となる知識源がある。試験は口頭試問ではなく、テキスト、画像、音声の3つによって提示される。人とのインタラクションはない。そのため試験問題はなるべく、誤読が生じないようにコントロールされた日本語で書かれている。ここがポイントだ。雑な文章ではないのである。もう1つは、試験問題には必ず正解がある、という点も大きなポイントだ。数学だけではなく、国語や倫理などの試験にも正解があるのだ。多くの人が、これが正解なんだなと思うような正解が存在する。大学入試は健全な常識と論理をもった18歳ならば、正解できるということが暗黙に規定されている。それが大量に蓄積されている。日本では50万人を超える若者が受験に挑戦している。結果は大量のデータと比較することができる。これが、研究対象として選んだ理由だという。

 コンピュータは大量の記録を持てる。USBメモリ1本に、過去の入試問題、教科書、辞典、辞書などがすべて収まってしまう。でもそれをコンピュータにさしても入試問題は解けない。「京」を使ったからといって、解けるわけではない。入試問題は全文探索をすれば解けるというわけではないからだ。既存技術を投入するだけであれば、人間の平均点は600点だが、それには遠く及ばない。よってこれはグランドチャレンジだといえる。

 センター入試でさえコンピュータに難しいのはなぜか。特に人間が持つ常識がないからだ。人間が知的な判断をするときに、知識や論理的な演繹は重要だが、それだけがすべてではない。身体性に基づいていること、そして社会的な存在であることから生まれる常識。それらが渾然一体となっていることが人間の知的な判断を支えているという。人工知能は科学の一分野であり、数学で記載されている。数学で書けなければコンピュータに搭載できない。未だに常識は数学で記載できないのだ。


ある一家の1日。人間はイラストを見た瞬間、意味が分かる

 新井氏は具体例を示した。ある一家の1日を英語の文章で表現し、それが意味しているものと合致するイラストを選べ、というものだ。正解は4番。家族の1日がイラストで表象されるというのはどういう意味なのか、漫画を見た瞬間にどれがお父さんだとすぐにわかるのか。こういう問題は1980年代以降、避けられてきた。人工知能研究はターゲットを絞り込み、多くの成果を挙げた。人工知能という大きな領域を複数に分割して、細分化した。今回のプロジェクトは、各人工知能分野が、そろそろもう一度融合しないかという呼びかけでもあるという。

 そのためには各分野にとって、適切な問題設定が必要だ。大学入試は適切な問題なのだと新井氏は語った。リスニングのように既に解かれた問題もある。だが普通の問題をどのように適切に変形すればいいのか、まだ解かれていない問題が多い。このプロジェクトを通して、自然な融合が行なわれることを期待しているという。

 今の若い研究者たちは、人工知能の面白さだけではなく、ほろ苦さも痛感している世代でもあるという。彼らがどのように料理するかに注目してほしいと語った。また、これは日本にとって「ブルーオーシャン」だという。個別の筆記試験を課していて、毎年作り直す、そして検定教科書があるような国はそれほど多くないからだ。問題にもいろいろな取っ掛かりがある。NIIは国際研究ワークショップや、統合研究実験基盤、プログラミングコンテストなどの枠組みで、共同研究を受け入れている。そして自然に融合することで、社会的に合意している「優秀さ」はプログラミング可能なのかに1つの結論が出るのではないかと考えているという。

 新井氏は最後に、このプロジェクトの本当のタイトルは、「東大入試に迫るコンピュータから見えてくるもの」であると語り、多くの若者にこのプロジェクトに参加してもらいたい、とまとめた。


●「人工知能にとってなぜ大学入試はチャレンジングか」
NII 稲邑哲也准教授

 サブプロジェクトディレクターであるNIIの稲邑哲也准教授は「人工知能にとってなぜ大学入試はチャレンジングか」と題して講演。稲邑氏はロボットの研究者、特に人間とのインタラクションを中心とした研究者である。稲邑氏はまずロボット研究と人工知能研究の関係について紹介した。シンボル情報処理だけでは本当の人工知能は難しかった。そしてロボットのコミュニティでは、曖昧なシンボルの意味や解釈を行なうために、身体性に根付いた情報処理をしようというアプローチがある。実世界の空間や、生情報にもとづいた情報処理をやるのがロボット研究のミッションだ。

 だが問題は山積している。ロボットにとっても人工知能研究が取ったようなターゲットの絞込みは有効で、特定のタスクだけをこなすロボットはあるし、限られた領域で人間と対話するといったことは可能になっている。だが、昔の人工知能研究が目標としていた問題には、まだ到達できていない。つまり、本当に高次レベルの記号や、抽象的な思考と、センサーやアクチュエーターからなる身体の情報処理層を結ぶことには成功していない。

 人工知能は高次レベルの記号を扱うことに長けている。そしてロボットは下位レベルの処理に長けている。だがこの2つの潮流は個別に進化していて、分断されているという。東大入試突破は、融合にちょうどいい題材なのではないかと考えていると語った。

稲邑氏のこれまでの研究例 ロボットと人工知能研究の現状イメージ

 稲邑氏は国際数学・理科教育動向調査の問題を例として示した。「金属の定規にバターで豆をくっつけた。定規の一方の端を暖めた場合、豆はどの順番で落ちるか?」という問題だ。小学校4年生は92%が解ける。だがコンピュータには難しい。バターの融点や重力の方程式を計算していても解けないが、常識では簡単に解けるのだ。教科書にある断片的知識と、実世界で生きてきた経験などを思い返して、何をするとどういうことが起こるかといったことを、過去の経験を思い返しながら推論する、というプロセスを人間はやっているが、今のコンピュータはそういうことはしていない。だから初めて遭遇するような状況や経験が不可能な状況についても、経験を論理的思考に接続できる能力が問われる。

 単に東大に入ることだけを目的にするのであれば、暗記科目だけを選べばいい。だがこのプロジェクトではあえて茨の道を歩む。そこで、主に物理・地学に集中する方針だ。実世界を理解する知性に挑戦したいという。

人工知能とロボティクス、双方の流れが解くべき問題の例。いずれも人間が言う常識や経験が必要

 研究テーマとしては、画像理解と自然言語処理の統合があげられる。図を見て物事がどうなっているのかを理解するのと、文章を読んで理解するのは大事だが、2つの融合はあまり活発に研究されていない。そこで、図と文章からの物理モデルの再構成を目指す。また、3次元モデルの構築と、物理シミュレーションによる将来予測を行なえるようにする。今のことだけではなく、10秒後、1時間後、あるいは1年後どうなるかといったことを考えさせる。

 具体的には、画像から見られる意味のグラフ化、自然言語から得られる意味のグラフ化、そして双方のグラフ構造が整合性の取れるように解釈を調整するといったテーマが考えられる。物体の配置を図から読み解くことも重要だ。人間ならば一瞥するだけで理解できるが、コンピュータには、どこがどう動いて、どこが固定されているのか理解して将来を予測することは難しい。特に説明文と画像の両方を見ながら理解する研究は少ないのではないかという。

 1970年代には「SHRDLU」という実世界接地型の自然言語対話システムが研究されていた。だがやはり曖昧な情報をどうするか、物理モデルや法則をすべて書き下してインプットしなければならなかったこと、将来予測ができないことなど、すぐに課題にぶつかってしまった。今回のチャレンジでは、大学入試という限られた量の物理モデルを対象にすればいいので、ある程度ならばクリアできるのではないかと考えているという。その1つが計算機パワーを使ったシミュレータによる未来予測だ。

図と文章の認識を組み合わせて問題文を理解させる テリー・ウィノグラードが開発した「SHRDLU」

 だが、まだどうやって解いていいのかわからない問題もあるという。たとえば月面のクレーターに影があるものとないものがあるが、クレーターの深さは直径に比例するという仮説を支持するのかしないのか、といった問題は難しい。また図や文章の中に暗黙の了解があったり、過去の経験を使うような問題も困難だ。

 研究のスケジュールとしては、今後10年。最初は選択試験、その後は筆記試験へと進んでいく予定だ。実世界の経験にもとづいた処理をすることはロボットにとっても人工知能にとっても重用であると述べ、東大入試はマイルストーンの1つであり、そのあとは人間の発達段階を逆に遡っていきたいとまとめた。

難しい問題の例 前半5年の研究スケジュール 後半5年の研究目標

●知識を問う問題にコンピュータはどれだけ答えられるか
NII准教授 宮尾祐介氏

 同じくNII准教授で自然言語処理の研究者である宮尾祐介氏は「知識を問う問題にコンピュータはどれだけ答えられるか」と題して、主に自然言語理解の観点から講演した。問題には知識を問うものがあるが、そういう問題は、いわば教科書を持ち込めば普通の日本人ならば解くことができると考えられる。コンピュータは記憶は得意だし、知識を問う問題ならば、得意なはずだ。だが、そうはいかない。コンピュータが得意なのは記憶ではなく実際には「丸暗記」だからだ。

 人間にとって意味のある記憶とは、言葉そのものではなく「言葉が表す内容」なので、丸暗記を問うような問題は出題されない。だから、言葉を、意味や知識のレベルで扱わなければならない。これがコンピュータには難しい。そもそも、どういうときに人間は「意味が同じ」だと考えるのか。

 ともかく知識を問う問題とは、記憶していることと問われていることが意味的に一致しているかどうかを認識することだといえる。人間は無意識に認識しているのである。人間とコンピュータでは、得意とすることがさかさまだ。このような問題は自然言語処理は「含意関係認識」といわれている。2つの文の間に含意関係が成り立つかどうかを判定する問題で、ここ数年の自然言語処理でホットな研究テーマだという。

コンピュータが得意なのは丸暗記 どんなときに人は文章の意味が同じだと考えるのか 含意関係認識

 宮尾氏らはNIIが主催している国際ワークショップ「NTCIR」で含意関係認識のタスクに参加。これまでは新聞から抽出した2文について含意関係認識を行なうが、センター試験の問題とWikipediaのテキストを使ったタスクを新規に設定。なかでも主に社会系の科目を使って、6チームが参加、十数個のシステムが共通データを使ってチャレンジした。

 そのシステムを使って、実際に問題を解かせたところ、IBMのシステムが最高点で、正答率57.7%を出した。含意関係認識と正答率の間には高い相関があり、それが向上すれば、試験の正答率向上も期待できるという。なお東大入試では少なくとも9割は解かなければならない。また、含意関係認識が100%になっても、東大に入れるわけではない。含意関係認識は人間の自然言語処理の一部でしかない。

 難しい例として宮尾氏も倫理の問題の例を出した。抽象概念と具体的状況の認識を一致させる必要があるという。また関連知識の検索、出題意図の認識、回答方法の指定の認識などが組み合わされた問題も難問だ。関連する事項を統合して答えなければならないからだ。またこの先に、数式処理や理解、シミュレーション、知識の統合、時間空間情報の推論、因果関係の認識・推論、さらにその先に何があるのかが問われる。今、分析を進めているところであり、興味のある研究者にはぜひ参加してほしいと呼びかけた。

現段階での評価結果、そして認識精度と正答率の相関 倫理のような難しい問題も

●パネルディスカッション「知性と知識のはざまで」
パネリストたち

 第2部はパネルディスカッション。「知性と知識のはざまで」と題して、日本学術振興会の安西祐一郎氏東京大学生産技術研究所 教授の喜連川(きつれがわ)優氏、そして第1部で講演した松原仁氏、新井紀子氏が参加した。司会は作家の瀬名秀明氏。

 長年、人工知能研究やヒューマン・ロボット・インタラクション研究に携わってきた安西祐一郎氏は、認知科学と人工知能研究が乖離していった歴史を振り返り、相互の研究の今のスタンスの違いを再確認。また入試をどうするべきかという議論についても触れた。大学入試においては受身から能動的な学びへと変わっており、一直線の出世街道主義から脱却しようというのが今の現状だという。つまり大学の入試自体が変わっていくだろうと見ており、チェスのようにルールが変わらないゲームとは異なると述べた。そのことは科学者たちも社会に繋がっているものとして考えておかなければならないと釘をさし、認知科学面では、意識下の思考や経験からの学習などの情報処理メカニズムに挑んでほしいと述べた。

 FIRST(最先端研究開発支援プログラム)にも選ばれている喜連川氏はデータベース研究者として、基礎研究のゴールは、極めてシンプルで誰にでも分かるものではなければダメだと考えていると述べた。そういう面では「東大に受かる」というのは誰にでも分かるテーマだと言える。またアメリカではNSFとDARPAという大きな研究資金の流れがあるが、NSFは好奇心ドリブンで、DARPAはハッとさせるような研究、すなわち、普通の人からはまだまだ遠いと考えられるような課題を、なりふりかまわず要素技術を融合させて実現するようなものがプロモートされており、日本ではこの手の研究が苦手だったのではないか、IBMはそこをうまくやったと述べた。IBMはテーマの選択とorchestration(組織化、編成、統合)がすごくうまいという。つまり、今のこの時代にピタッと合うような問題と技術チャレンジをうまく選択して実行したという意味である。

 また、大きな研究を推進していく中では魅惑的なテーマが横道にいっぱい出てくるが、「王道」を忘れず、基礎研究を積み重ねて行くことが大事だと強調した。このプロジェクトそのものについては、これを1つの傘として、どういう要素技術を研究するか、定量感のある問題を作っていくかが大事だと述べた。

司会を行なった作家の瀬名秀明氏 喜連川優 氏 喜連川氏からのエールのスライド
安西祐一郎氏

 安西氏は、厳しい意見をぶつけた。人工知能研究にはこれまでにも多くの積み重ねがあり、さまざまなアプローチが行なわれて来た。それらをどのくらい踏まえて、既存の課題を乗り越え、研究として成立、貢献する技術を生み出せるのかという問である。それに対して新井氏は、今回のプロジェクト発案のきっかけとして、若手の研究者達に目指すものについて取材したときに、それを本当に目指しているのであれば、かなり手前で東大入試なんかはクリアできなければならないといった感覚を得たこと、そしてそれぞれの研究分野が細分化されていて交流もないが、今こそもう一度融合して人工知能を目指してやってみることが大事なのではないかと思っているといったことを述べた。

 またこのプロジェクトではオープンソースで実現することを目指しており、プラットフォームとAPIを提供して、それぞれが開発した知能モジュールを組み込んで精度を実際に試していくようなやり方で進めることを考えているという。そういうみんなで一緒にやりましょうといったプロジェクトでは、具体的で、分割可能な問題じゃないと難しく、東大入試はちょうどいいと考えていると改めて強調した。

 また後半は、このプロジェクトを通して教育とは何か、入試とは人間の何を測っているのかといったことを問えるかというテーマになった。だが教育というのは人それぞれ一家言があるテーマであり、見方もみな異なり、まとまらなかった。むしろ、このプロジェクトではそのようなテーマとは切り離して、純粋に技術的なテーマとして取り組んだほうが技術的に意味のある成果を出せるのでないかという方向に話は向かった。詳細は割愛する。

 最後に瀬名氏は実際の東大に入った学生たちは、入ることそのものにはあまり苦労しておらず、また面白い人たちがいっぱいいることに刺激を受けており、それを評価しているという話を語り、「ロボット君が東大に入ったあとでどうなるのかを考えながら終わりたい」とまとめた。

 最後にNII副所長の東倉洋一氏は「若い方を中心に、情報学に参加してくれることを願っている。人材育成・教育と、東大入試に挑戦する技術チャレンジは別個の問題。それはこのプロジェクトの成果から、示唆するものを汲み取ってもらうのはかまわないが、我々は要素技術の展開に力を注いでいきたい」と閉会の挨拶を述べた。

新井紀子 氏 松原仁 氏 NII副所長 東倉洋一氏

 最後に個人的な感想を付け加えると、今回のシンポジウムを聞いただけの現時点ではなんともいえないというのが率直な筆者の感想である。たとえばIBMの「Watson」の場合は、医療現場などでのQAシステムとして活用しようという目的が最初からあったが、今回のプロジェクトでは、東大入試を突破できるシステムができたとしても、そのシステムをその後どう活用するのかという点についてはまだ何もプランがないようだった。

 それはともかく、「コンピュータが東大入試問題を解けるのか」というのは、誰にでも分かりやすい良いテーマだ。それだけに、何のために何を研究してどんなものを実現しようとしているのかが気になる。今後も注目していきたい。