森山和道の「ヒトと機械の境界面」

今の人工知能に解ける問題と解けない問題

〜AIによる東大合格を目指すプロジェクト成果発表会レポート

全体講評を行なう代々木ゼミナール 入試情報センター本部長 坂口幸世氏

 国立情報学研究所(NII)による人工知能プロジェクト「ロボットは東大に入れるか」の2014年の成果発表会(第2回代ゼミ模試タスク発表会)が2014年11月2日、新宿の代々木ゼミナール(代ゼミ)で開かれた。大学の入試問題試験を解ける人工知能を作ることを通して、新たな可能性を探索し開拓することを目指すプロジェクトである。2011年にスタートし、2016年までに大学入試センター試験で高得点を獲得すること、そして2021年に東京大学の入試を突破することを目標にしている。詳細はキックオフシンポジウムのレポートなどを参照してほしい。

 今、人工知能はビジネス面からも再び熱い注目を浴びるなど盛り上がりを見せている。また今回、通称「東ロボくん」は代ゼミ模試において偏差値47.3をマーク。一部科目では受験生平均を上回り、国立私立あわせて476大学1,098学部で合格可能性8割以上と判定される結果を出した。しかし成果発表会を聞くと、やはり苦手とする課題はそれほど変わってないことがよく分かった。結果だけ取りあえず知りたいという方は、このテキストの下のほうの全体講評の項をご覧頂きたい。

 成果発表会では研究メンバーによる各科目への取り組み解説に続いて、代ゼミの各講師による講評が行なわれた。代々木ゼミナール副理事長の高宮敏郎氏は、「このプロジェクトに協力して得られた知見を受験生に還元したいと考えている」と挨拶した。

「統計的手法とロジックを現代的センスで繋いだハイブリッド」でリアルタスクに挑む

国立情報学研究所 新井紀子氏

 プロジェクトリーダーであるNIIの新井紀子氏は、「AIあるいはロボットは今、第3のブーム。ビジネスでもAI、ビッグデータと機械学習によって人間の知能を上回るのではないかと喧伝されている」と話を始めた。新井氏らが2010年のクリスマスにグランドプロジェクトを考えた時には「入れるか」の「か」の部分が大事だったという。ビッグデータとパラレルコンピューティング、機械学習で実際に本当のデータに直面したときにAIは今あるいは近未来の技術でどこまで問題が解けるのか誠実に研究しようという気持ちからプロジェクトは始まった。

 つまり「タスクのためのタスク、デモのためのデモではない」。リアルデータを用いて、何ができるかはっきりさせて真のブレークスルーに挑戦するプロジェクトだ。そこで、2016年度までにセンター入試で高得点を取り、2021年度に東大合格を目指すという縛りをかけた。

 どこが難しいのか。例えば「社会科問題は暗記」と言われるが、実際には教科書に書かれたことと、問題に書かれたことは内容は同じでも表面上の表現が異なる。それを理解できるのかという含意関係認識の問題がある。機械翻訳は単に英語を翻訳するだけではない。数学や物理の問題を数学シミュレーションに渡すことができるくらいの機械翻訳技術が必要になる。数式処理に接続できるような自然言語処理技術も必要である。会話文を読んで、心の機微を読み取ることができるような技術や、小説、旅券、広告のチラシなど不定形文書の理解も必要である。社会科や国語では書かれた文書を30文字以内に要約するような能力も必要だ。

 こんなAIができれば、文章を読んで、PowerPointを作ることもできてしまう。既にAPは経済短報を一部、AIに書かせている。新井氏は「皆さんの生活にも直結することだから恐ろしいことだなあと思っている」と語った。

 今のAI技術は、既にビッグデータを大量に集約しているところが強く、技術的にも市場的にも既にレッドオーシャンになっているという。NIIは若い研究者が多い。彼らが希望を持つためにはレッドオーシャンを乗り越える必要があり、また、機械学習とビッグデータだけではサチュレーションし始めている。これが、2010年にこの統合的タスクプロジェクトを始めようとした理由だという。差別化を図るとすれば青い海を目指すしかないというわけだ。そのために「分野横断による総合的知的タスクに挑戦」しようと考えたのだという。

 そのためのアプローチ手法は「統計的手法だけではなく、ロジックを現代的センスで繋いだハイブリッド」だ。それと「人間と機械を協調させるためのインターフェイスが必要」だという。新井氏は「どこまで機械はやれてやれないか。人間はどのように歩み寄らないといけないか。そこに経済成長の鍵がある」と述べ、「東ロボくんは着実に歩んできた。機械がどこまでできるかを明確にしたあと、人間が機械と一緒になって、機械と一緒に問題解決を図った時にどこまでいくかを研究していきたい」と語った。

プロジェクト概要
世界各国で始まっているAIプロジェクトに統合的タスクで挑む

人間による前処理が必要

 タスク設定についてはNIIの藤田彬氏が概説した。今の「東ロボくん」は問題をそのまま人間のように見て、例えば画像処理のようなことを行なって解いているわけではない。問題を問題として認識させるために、前処理が必要なのだ。具体的には人間が計算機向けにマークアップ言語のような形式表現で記述してやり「どんな問題なのか」ということを教えている。画像も人手で「どんな何を示した図なのか」を教えているという。なお、計算機に教えているのはあくまで、どんな問題なのかということだけだ。

国立情報学研究所 藤田彬氏
人力で問題文を計算機向けデータ形式に変換して入力している

共通評価タスクの運営

 関連タスクの紹介はNIIの宮尾祐介氏が行なった。「東ロボくん」プロジェクトは、東大入試だけをやっているわけではないのだ。AI研究業界では共通データタスクを使って性能を評価し、世界中の研究者が技術を競い合う。このプロジェクトでも問題の一部を切り出して、共通評価タスクを運営し、国内海外の各グループが参加しているという。

 例えば社会科の問題では正しい文章を選べといった選択問題を、教科書の意味内容と、各選択肢が合ってるかどうかを見させる事実検証タスクとして使っている。教科書の内容が正しいとして、他が正しいかどうかを判断させるわけだ。英語の読解は社会科のタスクと似ているが、直接的に答えが書かれてないことが多いため、数段の推論が必要となり、さらに難しい問題となるという。宮尾氏は「自分たちだけでやるのは限界がある。是非チャレンジしてもらいたい」と呼びかけた。

国立情報学研究所 宮尾祐介氏
東ロボプロジェクトから共通評価タスクを作成

数学 国語力と数学力の関係

NII/富士通研究所 岩根秀直氏

 この後は、各科目の研究成果報告となった。まず最初は数学から。株式会社富士通研究所とNIIを兼務する岩根秀直氏が解説した。数学では「東ロボくん」は問題文を一階述語論理式にして、数式処理アルゴリズムで解いている。まず各単語の構造を解析して、文章構造のツリーを作成する。そして最後にソルブボタンを押すと一気に解いてPDFを吐き出すという手順だという。

 メインソルバは富士通研究所が開発したSyNRAC。処理には実閉体(RCF)上の限量記号消去法(quantifier elimination:QE)というアルゴリズムを用いている(RCF-QE)。限量記号のついた一階述語論理式を入力として、それと等価の限量記号なしの論理式を出力するアルゴリズムだ。なお現段階では三角関数や指数対数は対象としていない。

 関数はもちろん図形の問題もとにかく全てを式にして解いているわけだが、現在の「東ロボくん」は冗長な式が多く、問題を解くのに非常に時間がかかってしまう。うまく途中の計算で出てくる式を簡単化することが課題だが、東京理科大のメンバーとも協力して新しいQEを追加、その結果一部の問題に強くなり、去年の模試では解けなかった問題が10分程度で解けるようになったという。

 岩根氏は「QEの効率化は効果が確認できた」としつつ、「今後は三角関数のようなRCF-QE以外の問題への対応を広げることが課題。将来的には完全に自動で解きたいと考えている」と述べた。

 なお数学の回答形式についてだが、証明題のような論理的な答えを書く時はどうするのかという会場からの指摘があった。これについてはまずは人が見て理解できるかどうかよりも、正しい機械翻訳を行なって「等価の述語論理式」を出すことを目指しているという。また、人間が書く証明は実際にはギャップだらけで、どこを飛ばしていいかを決めるのは困難で、自然言語処理による要約系の技術開発はこれから重要になると考えていると述べた。

数学ソルバーの解き方の流れ
実際の問題解答のやり方
実閉体上の限量記号消去法(RCF-QE)
人間と東ロボくんの解き方の違い
入試問題対策を検討した
今年度の対策
今後の課題
こんなミスもしてしまう
代々木ゼミナール 湯浅弘一氏

 代ゼミの湯浅弘一氏は「見方がぜんぜん違う」と感じたと講評した。というのは「受験生は全てを幾何的にする」のに対し「東ロボくんは全てを数式にする」。つまり真逆だというのだ。だから今年(2014年)の問題が難しかったのではなかったかと述べた。解答については「とれるものについてはとれていた」。ただ、「センターの数学は国語力が半分を占める。東ロボくんは『このとき』とか『また』『よって』『したがって』という言葉の意味が分かってないのではないか。その辺で点数を落としたのではないか」と指摘。

 また素因数分解を間違えているなど、公式に弱く、数列もできない。公式を使えば簡単にこなせる問題でも、公式にあてはめるということができない。一方、図形が苦手なのでベクトルが苦手なはずだが、ベクトルを数式化して解いてしまっているなど、実際の受験生とは真逆の傾向があったと再度指摘した。現役の学生は図形を描くことで解き方を発見する学生が多い。ただし、一部の問題について多くの学生が解けなかった問題を、できる学生は数式処理で解いていたものがあったという。このことから「普通の受験生でも問題が解けなくなったら数式に走ればいいんだなと思った」と語った。

 また、受験生は頭の中でいわば問題を「カラー映像化」して、「ここが大事だから、ここを太線にして取り出して」という作業ができるが、「東ロボくん」は全てが白黒で、全部を一般化して解いていると感じたという。そして「公式はきちんと覚えて受験してもらいたい」と語った。

物理 想像力のなさは致命的

国立情報学研究所 稲邑哲也氏

 次は物理。NIIの稲邑哲也氏が解説した。残念ながらソフトウェアのバグが原因で取れるはずの問題を逃してしまったという。物理は文章題と図形からなっているが、まずこれをやはり人力で計算機に入力出来る形式表現にして、システムに与える。これを物理シミュレータにかけて解くという方式だ。今年は「シミュレータのソフトウェアモジュールをどんどん書いた」ことで状況の理解とシミュレーションは比較的よく動いており、形式表現と解釈があたっていれば解けているという。

 だが、「一般常識が暗に埋め込まれている問題は解けない」。例えば「金属の棒を折り曲げて云々」といった問題があったとする。計算機には金属は固体で変形しないんだけど変形することもあり、変形した後は変化しない、といった基本的常識がない。「折り曲げる」とは何なのかが分からない。自然言語をうまく形式表現に変化させることができない。そういう問題を出されると現状ではお手上げだという。

 エネルギー保存の問題も解けなかった。実際にはシミュレーションをする必要はなく、方程式を立てて解けばいいような問題であっても、そうすればいいということが分かってないので解けない。本質的な物理センスを問うような問題も、しらみつぶし作戦で解いている。今は図の理解はしないという前提だが、実際には図の理解と文章の理解の結合が必要だ。稲邑氏は「なるべくガチンコ勝負に対応しようとしている」と述べた。

 また「ロボットとの共通点」として、「物理の試験問題は、ロボットが人間の指令を受けて動く作業とよく似ている」という。どういう表現が機械にとって最適なのか考えることと似ているというのだ。稲邑氏はDARPAロボティクスチャレンジの様子を見せて「現在は基本的に人間が遠隔操作をしている。瓦礫を除去するというタスクがあった時に、それと物理の問題を解くというのは似ている」と、ロボットの研究者としての思いを語った。

「東ロボくん」の物理の解き方
一般常識が埋め込まれている問題は苦手
方程式で解く問題も苦手
シミュレータのソフトウェアモジュールを増やした
図が理解できない
将来的には形式表現ではなくガチンコ勝負したいという
ロボットと物理との共通課題
災害現場でのミッション対応と似ている
人間との協調にも応用
代々木ゼミナール 小林裕規氏

 物理の講評は代ゼミの小林裕規氏が行なった。小林氏は「全体平均には及ばなかったが、偏差値は43から49に上昇。一定の成果は出た。新課程の第4問については平均点を上回った」と評価した。また典型問題が解けていたことから「受験生としてみると基礎力はついている」。だが昨年(2013年)に引き続き、「2つの要素が絡むととたんにできなくなる」。例えば時間の経過が絡む問題と、図が絡む問題は全くできていないという。波動のように図が多く時間の経過による状態の移り変わりを捉えさせて解かせる問題はできておらず「想像力がない」と評価した。一方現役受験生においては波動はボーナス問題だと思って解く人が多いのだという。だが東ロボくんは「想像して数式を組み立てる問題は苦手」で、グラフ選択問題や初見問題も正答率が悪い傾向があるという。

 また、取れるところは確実にとるのが受験では重要だが、力学的エネルギー保存則を使えば解ける問題が解けないなど、基本的な問題も落としていた。エネルギー保存則は状態を2つ繋げるわけだが「何が何に変わるのか」と考えるにはイメージの力が必要で、それを養うことが大事と再度指摘した。

 さらに、東大を目指すにおいて、一番大事になることとして「東大の入試問題は見慣れない問題がほとんど。問題集にのっているような問題はあまり出ない。そのため、物理的思考力を問う問題を最終的に解けるようにならないといけない」と指摘。以下の3ステップが重要だと述べた。

1)大きく正確な図を描いて、何がどうなっているか把握する。
2)それに対して物理法則を適用する。適用の際に根拠を意識しないといけない。なぜその法則が適用できるのか意識する。
3)それを元に正確に計算する。答えが出てくるが、必ず検算をする。現実的か、次元が正しいか。必ずチェックする。

 この3つを意識すれば正答率が上がるという。

英語 意味内容を理解しておらず「素直すぎる」が故に落ちる罠

NTT 東中竜一郎氏

 英語はNTTの東中竜一郎氏が解説した。英語には常識を問う問題が非常に多い。そのため人間のもっている一般常識をどうやって教えるかがキーになる。特に教科書にないような常識問題を解くことは大変だという。教科書に明文化されていないからだ。NTTではこの課題におおよそ3カ月取り組み、それなりの成果を出したと考えているという。ただ短文問題はそれなりに解けたが、長文問題はまだまだ「鉛筆を転がすレベル」に留まった。

 「東ロボくん」は「言葉の流れ」がどのくらい一般的かということを統計情報から把握して並べていくという方法で解いている。つまりこの言葉のあとにはこんな言葉が来ることが多い/少ないということを把握してスコア付けし、より常識的な文章を選択するという方法で解答している。「実はほとんどの文章がこれで解ける」という。語句を並べ替えする問題においては全ての場合の文章を作って、それ全部をスコア付けするという力技だ。長い構文が苦手である理由は局所的な並びを使っているからだが、それも工夫で解けそうだという。

 しかし会話文完成問題には別のアプローチが必要だ。例えば父親が病院に入ったんだ、という文章のあとに適切な答が何なのかが分からない。ここには対話技術研究で一般的な、どういう意図で発話がなされたか自動推定する手法を適用する。ある意見の表明のあとにどんな評価を行なうことが人間にとって自然なのか。例えばネガティブな表明に対してはネガティブな評価で寄り添う方が自然なことだと考えてスコア付けをするのである。そうすることで発話意図の流れが自然か、感情が相手に寄り添っているかという観点からスコア付けをして、正しそうな答えを推定する。意見要旨把握問題も同じような手法で解けるという。

 一方、未知語句推定問題は人間と違う解き方をする。使われ方が似た表現を選ぶという解き方だ。計算機は暗記は得意なので、単語がどのように使われているかを辞書から検索する。そうするとcatとkitは同じような形容詞や動詞を近くに持っていることが分かる。だから両者は似ているのではないかと推測する。これでだいたい解けるという。

 だが、実用文書読解問題や、読解による心情把握は難しいという。単語・文・数文くらいの問題は安定して解けることが分かったが、バラバラに書かれた状況を統合することも難しい。企業のNTTとしては今回の知見を、翻訳や対話エージェントに活かしていきたいと述べた。なお、英語に関してはプレスリリースも出ているのであわせて参照してほしい。

英語を解くには常識が必要
単語の並び方の妥当性からスコア付けをして正解を選ぶ
会話文完成問題の解き方
未知語句探索問題の解き方
読解はまだまだ困難
代々木ゼミナール 辻康介氏

 代ゼミの辻康介氏は「東大を目指すのであればセンターの英語は9割あるいは満点を取らなければいけない。『頑張ったけどもっと頑張ろうね』というのが私の印象」と講評を始めた。センター試験には知識が求められる問題と、読解が必要な問題がある。発音アクセントや語彙、語句整序は知識を問う問題だ。だが本文の文脈から語彙を推測するような問題も「東ロボくん」は知識で解いており、とにかく知識系の問題が得点源になっている。暗記が最大の武器だというわけだ。

 しかし「思考系の問題はあまり解けていない」と評価した。基礎的な読解力を向上するアドバイスとして「一問一問はしっかり読もう」と述べた。どういうことか。英語問題の選択肢の場合、本文と内容は変わらないが選択肢では別の英語で言い換えられているというものがある。これは単純な検索では答えられない。本文の単語がそのまま使われている選択肢はあるが、それはダミーの選択肢であることが多い。例えば本文の字面は同じだけど選択肢の中にnotの一語があったりする。辻氏は「東ロボくんは素直。だけど素直すぎる。意味内容をしっかり考えないといけない」と厳しく指摘した。

 だが暗記が得意であることから、英英辞典を丸ごと覚えてしまえば、単語の定義からアプローチできるのではないかと提案。言い換えられている言葉についても、英英辞典を丸ごと覚えていれば、言い変えられている言葉にも行き着くことができるという。「知識量という武器を使えば読解力を伸ばしていくこともできるのではないか。東ロボくんはそこは苦しまないので」と語った。

国語 消去法ができず、主語が分からない

名古屋大学大学院工学研究科 佐藤理史氏

 国語は名古屋大学大学院工学研究科の佐藤理史氏が解説した。佐藤氏は「他の科目にも目を転じてみると、問われる世界がそれぞれまったく違う」と話を始めた。日常的言語で問われていても本当は数学的科学的なモデルを問う科目もあれば、社会科のように背景モデルがなく事実だけがあり、言葉でしか表現できないようなものを問う科目もある。そして国語は「グラウンディングするものが何もない。作者が言葉だけで作った仮想世界について、色んなことが問われる」科目だという。「大学入試で色んな科目があるというのは意味があることなんだなと思った」。

 国語においては語句を辞書で引くのも難しいという。例えば「不意をつかれて」という言葉をどこできって、あるいはどんな活用形で引けばいいのか分からない。うまく辞書が引けたとしてもまだ問題が残っている。定義文が出てきても、選択肢とどれが一致しているのか単純には分からないからだ。去年の段階でも70%くらい解けたが全部プログラムを書き直したという。だが全体の結果としてはほとんど変わらなかった。

 評論読解は節に着目した。また小説では登場人物の行動心情の理由や説明が問われる。それが難しい。多くの人がそう思うだろうということを推定する必要があるからだ。

 なお、今年は「節」に着目するなどさまざまな工夫をしたにも関わらず、実は昨年のソルバを使っても同じ点数が出てしまったのだそうだ。佐藤氏は最後に「結局、僕らは日本語を分かってないんじゃないか。先は闇でどうしたらいいのか分からない」と語った。

教科別の問われる世界・知識の違い
漢字問題
辞書引きも簡単ではない
読解問題ソルバ
節単位の照合を行なった
小説読解問題ソルバ
代々木ゼミナール 土生昌彦氏

 講評は代ゼミの土生(はぶ)昌彦氏。土生氏は、昨年に比べて点数が伸びたことをまず評価した。特に評論は平均を10点上回った。東ロボくんはいわば「漢字博士」だが「文脈理解ができていない」という。文脈を理解せず、また、決定的な誤りがある選択肢を落とすことが苦手だという。つまり消去法が使えていない。現役受験生の場合は「正しいものの割合が正解とは限らないのが現代文。9割正しいことが書いてあっても、残りに決定的な間違いがあったら落とす。8割正解で残り2割よくわからないことが書いてあってもそっちが正解」だと考えて解くのだという。土生氏もまた「東ロボくんは素直」だと指摘した。

 小説でも同様で、語句の意味を訊く問題は3問中2門正解だが、やはり消去法がネックになっていたという。また、古文の問題においては「若い女性がいとこの男性の密会の様子を遠くから見ている」という状況に関する本文の表現の説明を求める問題にちゃんと正解している一方で、和歌の問題で主語を間違えるという初歩的なミスを犯している。つまり、古文を読解して「別れ話をしている」という状況は分かっていても、どちらが話をしているのかが分かっていないのだ。もしこれが人間なら「高度な判断力をもちながら主語が分かっていない」ということになる。

 土生氏は「選択肢は決定的な誤りがあるかないかで判断する。つまり消去法を身につけてください。前後の流れを見てください。主語を補って考えてみて下さい」と講評を締めくくった。

社会科 「現代日本人としての素養」がないと社会の問題は解けない

静岡大学 情報学研究科 狩野芳伸氏

 最後の科目は社会科。静岡大の狩野芳伸氏が解説した。ちなみに全科目の中で一番偏差値が高いのは社会科だそうだ。狩野氏はまず始めに、フィクションと現実を交えていくつかのロボットを示し、社会科の問題が解けそうなのはどれだと思うかと会場に問うた。「社会科を解くには、他の科目よりも人間的なところが必要とされる」という。受験の暗記は人間の知的能力が前提とされている。教科書と一文字一句同じものが出るわけではないからだ。人間には無意識に異なる言葉同士を接続する能力がある。では機械に足りてなくて人間は誰でもできる能力は何なのか。

 社会科の問題の場合、答は選択肢に書かれている。教科書を検索して、正しいとされている事実が分かれば解けるのではないかと考える人も多いと思うが、まず理解の前に単語を抽出しないといけない。ところがコンピュータにはどこが区切りかさえ分からない。また、教科書には肯定的な表現ばかりで、例えば起こらなかった戦いについては書かれていない。選択肢の中で間違っているものにはウソのキーワードが書かれているわけだが、どれがウソで本当はどれかも分からない。狩野氏らは東ロボくんのソルバを「カタコトの受験生」というイメージで作ったという。つまり日本語能力は今1つ、ということだ。

 日本語は網羅的な良いエンジンがないが、Wikipediaには同義語関係が書かれている。そこで同じ意味のものは同じと見なすようにした。だが、どこまでのデータを使えばいいかは自明ではない。「うそキーワード」については、教科書の探したいところにはなくて、他のところに出てくるのではないかという仮定をおいて対応した。例えば時代が違う言葉は全然違う場所に出てくる。そういう単語はスコアを下げるというやり方だ。

 今回、教科書で知られる山川出版社から用語集の電子データの提供を受け、それをデファクトスタンダードの知識源として用いた。だが実際にはなかなか難しかったという。「1つのイベントがほどよいサイズで書かれてないとうまくいかない」のだそうだ。一方、世界史のためのキーワードのチューニングにおいては役に立ち、判断が難しいものを減らすことで、正答率を上げることができた。昨年はまぐれだったという。結果として日本史への力の注ぎ方が減って、そちらはあまり伸びなかった、と振り返った。

 また紀元前の出来事は年代が曖昧で書かれてない。順番に書かれていることが暗黙の前提で、順番に起きたとされていることがある。それが機械には分からない。このような情報の粒度の違いをうまく吸収できないと難しいという。またキーワードが取れても、それを入れると逆に失敗することもあるという。例えば前振りの文章などに引っ張られてしまうことがあるのだそうだ。このように不要な言葉を「不要」と見なすことが難しい。また動詞の扱いも難しいという。主語述語、代名詞の参照、省略されている言葉の探索なども課題として挙げられた。

 政治経済は点数が良くなかったが、それは「東ロボくんは民主主義が分かってない」からだという。民主主義における常識的なことは教科書には最初から書かれていないのである。また、政治経済にはグラフや図表が頻出することも解けない理由だという。テーマが限定され、現代の話が多くなると、キーワードに依存しているシステムでは解くのは難しい。

 一方、社会科のソルバはYes/No型の質問応答であり「今のシステムでも既にけっこう役に立つのではないか」と狩野氏は述べた。「このプロジェクトは分野によっては直接、社会還元が可能」だという。

暗記を活かすには知的処理が必要
検索キーワードにペナルティ付きランキングを付けて誤選択肢を弾いた
明示されない常識的知識が必要な政治経済は苦手
不要キーワードの除外は困難
動詞表現や主語が省略された問題も苦手
社会還元も可能
代々木ゼミナール 越田大二郎氏

 講評は代ゼミ 越田大二郎氏が行なった。「東ロボくん」は世界史、日本史、政治経済の順で点が高かったことについて「現代の日本人として持っているべき知識の量が違う」のではないかと指摘した。現役受験生の場合、日本史について基本的な部分は中学校までに学習している。一方政治経済になると、現代日本人の常識や価値観が最初から織り込まれて教科書や問題も書かれている。しかし「東ロボくん」はこれが理解できてないという。

 越田氏は「現代の日本人らしい常識がないと社会の問題は解けない。逆にフラットな価値観で世界史で得点を伸ばしていくこともできる」と指摘して、やはり他の講師たちと同様に「東ロボくんは生真面目すぎてせっかち。問題文をよく読めば分かる問題が解けてない。つまり正しいキーワードを読めてない。来年には注意深さと現代日本人としての素養を期待したい」とまとめた。

全体講評 東大合格までの道のりは遠い

代々木ゼミナール 入試情報センター本部長 坂口幸世氏

 各科目の講評のあとは、代々木ゼミナール入試情報センター本部長の坂口幸世氏が「東ロボくんの大学合格可能性」として全体講評を行った。各メディアでも取りあげられているとおり、今回の「東ロボくん」は、私立に限るとほぼ半分近い大学に合格可能生8割以上を出した。しかも私立大学では入試科目が3科目あるいは2科目のところもある。現役受験生であれば上から2つを取るという方法もある。

 結果だけみると、国立私立合わせて合格可能性8割以上と判定された大学は476大学
1,098学部にのぼる。だが、「東ロボくん」が目指しているのは東京大学である。実際の答案を見る限り、東大まではまだまだかなりの距離があるというのが現状だ。坂口氏は「1年でここまで上がったわけですから。そこは人間とは仕組みが違うのでなんとも申し上げられないが」と希望を述べた。

 また「今の入試問題について、知識を詰め込めばできるだろうと一般の世間の人は思っている。だからセンター試験なんかやめちまえみたいな話がでてくるわけですが、そうじゃない」と改めて指摘した。なお新課程によって「東ロボくん」には新たな課題が出てきている。

「東ロボくん」の代ゼミ全国センター模試成績結果
各科目得点状況
成績の位置
合否判定結果
合格可能生8割以上の大学の内訳。「東ロボくん」は文系型。
東大までの道のりはまだ遠い

「東ロボくん」は人工知能の「偉大な失敗例」になれるか

公立はこだて未来大学教授 松原仁氏

 最後に、公立はこだて未来大学教授で人工知能学会会長の松原仁氏が講演した。松原氏は、人工知能の研究の歴史を振り返り、人工知能は「上がって下がって上がって下がって、今また上がっている」と一言でまとめた。要するに何度かブームと楽観的な見方が立ち上がり、ネガティブな見方が強くなり、またしばらくすると新手法が現れて復活して、という流れがあったというわけだ。今Googleそのほかの台頭により、あるいは「ニューラルネットワークのリバイバル」であるディープラーニングにより再び盛り上がっている。

人工知能勃興期
1960年代半ばから2000年まで。暗黒期から再び盛り上がったり下がったりした
2000年以降現在まで。ディープラーニングで再び盛り上がっている

 「東ロボくん」は統合的タスクだ。そして人工知能研究においても、統合と分割がこれまで何度か繰り返している。1970年代は統合、80年代は要素分割、90年代は統合の時代だった。2000年代以降は「統合も分割も大事」というフェーズに入っている。統合のためには、面白いタスクが必要だ。松原氏は例としてロボットによるサッカー「ロボカップ」を挙げた。

 もちろん「東ロボくん」もその1つだ。入試問題は実問題であり、「試験に受かる」というのは一定の上位に入るわけだから社会的な行為だからだ。松原氏は自身が始めた「きまぐれ人工知能プロジェクト 作家ですのよ」もあわせて紹介した。

統合期と分割期を繰り返して来た人工知能研究

 人工知能の研究テーマは、コンピュータでうまく扱えるようになると「それは知能ではない」と言われてしまって外れてきたという歴史がある。だから人工知能の研究テーマは常にうまくいかなかったものが対象になっている。人工知能に抜かれるとそれは大したことはないと思うようなことを「人工知能効果」と呼ぶ言葉までできているという。

 松原氏は、それを受けて、「東ロボくん」にも東大合格の点数をはじき出し、「東大合格は知能の本質とは関係ない」と言われるような「偉大な失敗例」になってもらいたいとエールを送って講演を締めくくった。

人工知能研究は難しいことだけが残る宿命を背負っている
実現したことは知能ではないと言われる「人工知能効果」
「東大合格など知能ではなかった」と言われて欲しいとエールを送った