ニュース
人工知能、機械学習の最前線では何が研究されているのか
~日本マイクロソフトがラウンドテーブルを開催
(2016/2/23 14:59)
日本マイクロソフト株式会社は22日、「人工知能・機械学習の研究開発の最前線に関するラウンドテーブル」と題した説明会を開催した。
米Microsoftの研究機関「Microsoft Research」のトップであるPeter Lee氏(米Microsoft Corporate Vice President, Head of Microsoft Research)の来日に伴って開催されたもので、Lee氏のほか、日本の産学官それぞれの分野における人工知能・機械学習の第一線の研究者として、情報・システム研究機構 統計数理研究所 教授の丸山宏氏、東京大学 大学院新領域創成科学研究科 教授の杉山将氏、Microsoft Research Asia 主席研究員の池内克史氏、NTTコミュニケーション科学基礎研究所 上席特別研究員/機械学習・データ科学センタ代表の上田修功氏、産業技術総合研究所 人工知能研究センター所長の辻井潤一氏らが出席。モデレータとして招かれたサイエンス作家の竹内薫氏を含む、7名によるラウンドテーブルが開かれた。
機械学習は活版印刷と同じように破壊的な技術革命をもたらす
最初に登壇した米Microsoft Corporate Vice President Microsoft Research担当のLee氏は、15世紀にドイツのグーテンベルクによって活版印刷が発明された際、その技術革新により破壊的イノベーションが起こったが、現在、同様に機械学習によって破壊的技術革命がもたらされようとしていると述べた。
Lee氏は、機械学習によって、Microsoftではコンピュータに3つの能力を与えることができたという。
1つ目が人の言葉を認識できる“聴覚”で、毎日3億人利用し会話を行なっているというSkypeに、機械学習によって通話音声を認識し、リアルタイムで翻訳する機能が搭載された。
同機能は現時点では8カ国語のみに対応しているが、この春には日本語にも対応する予定だという。
2つ目が“視覚”で、人間同様に写真に何が写っているのかを判断できるようになったという。今や人間を凌ぐ認識精度を達成しており、2015年10月に開催されたILSVRC(大規模画像認識のコンペティション)では、MSRAのチームが5部門で首位を獲得している。
3つ目が“理解力”で、Windows 10などに搭載されているパーソナルアシスタント「Cortana」では、メールのやりとりから予定を自動で認識し、リマインダを作成するなど、ユーザーの行動を観測することで先行的に行動することを可能としている。
Microsoftでは、「Project Oxford」と称した取り組みを始めており、膨大な機械学習の結果をクラウドとAPIを経由して開発者へ提供している。そのAPIを利用すれば、世界中で人工知能(AI)ベースのアプリが開発可能だという。
Lee氏は、こういった成果はまだ初歩の初歩のもので、何千何万という道のりの中の始まりの1歩に過ぎないが、技術は想像を超える速度で前進しており、世界が大きく変わっていく時に我々は居合わせていると述べた。
深層学習とビッグデータの組み合わせだけが機械学習ではない
東京大学 大学院新領域創成科学研究科 教授の杉山将氏は、機械学習研究の位置付けは、テキストや音声、画像、ロボットといった工学や、医療や生命、物理、化学や社会といった科学の難問を抽象化し、数学とコンピュータを使って解決することだと述べた。
「機械学習というと『深層学習とビッグデータをを組み合わせた物』として捉えられがち」と述べた杉山氏は、少ない情報(データ)からいかに効率的に機械学習を行なうかを研究しているという。
少ないデータからでも高精度の学習ができれば、単純に学習させるコストが低下するだけでなく、稼働を続ければ摩耗してしまうロボットや、医療、生物学など、ビッグデータを取得することが難しい分野で、さらに機械学習の活用が進められるとした。
未来を予測して問題を回避するAI
NTTコミュニケーション科学基礎研究所 上席特別研究員/機械学習・データ科学センタ代表の上田修功氏は、「時空間多次元集合データ解析」を用いることで、事象の発生を予測した上で対応するAIの実現を目指しているという。
例えば、震災などに見舞われた際、都市部では公共交通機関の麻痺などにより、帰宅困難者が大量に発生するが、そういった事象が起きた場合に、群衆を誘導し影響を最小限に抑えられるAIなどが挙げられる。
上田氏は、そのような誘導AIの場合、集団全体を把握するだけでなく、主体的かつリアルタイムに誘導することが必要になるという。
具体的なデモとして、株式会社ドワンゴと共同で行なった「ニコニコ超会議」での誘導デモを紹介した。
デモは、会場図右下のホールでイベントが終了し、左上のステージでイベントが開始された際のもの。スライド右のAIによる誘導では、イベントの進行に伴い、ホールからステージへ集団の移動が始まり、混雑が発生することを予測し、一方通行や通行禁止といった誘導を、実際に混雑が発生する前に行なっている。
比較すると、スライド左の誘導を行なわなかった場合や、中央の混雑が発生してから誘導を開始した場合よりも、効率的な制御が行なえているのが分かる。
AIは時空間予測を用いて、数分前の状況から数分後に起こる事象を予測し、シミュレータ上で誘導を行なった複数の結果から最適なものを提示しており、混雑そのものが発生していない。
上田氏は、これを応用すれば、信号を制御することで交通渋滞を無くすこともできるとして、日本での実現は法律などもありまだ難しいが、中国などでは実証実験も行なっていると述べた。
プログラミングに機械学習を利用する
IoTによって1兆個を超えるセンサーが存在する世界が来ると言われているが、例えば監視カメラであれば、「どこに設置されていてどちらを向いているのか」といったキャリブレーションが必要となり、それらをネットワークに接続し、認証、認可などを経なければ、使用可能な状態とならない。
情報・システム研究機構 統計数理研究所 教授の丸山宏氏は、そういった人の手では膨大な時間がかかってしまうプロセスに、機械学習を応用できるのでは、と考えているという。
丸山氏は、従来のプログラム開発は、ものづくり的考え方に基づいたプロセスで行なわれており、プログラムが動作するためにどういう要件が必要なのかを、プログラムを作成する前に考えているとした。
これに対して、機械学習を用いれば、入力と結果というペアを与えれば、自動的にプログラミングすることが可能になるという。
さらに、強化学習を用いれば、システム作ったあとに、結果が求めるものではなかった場合、自動的にシステムを修正し最適化を行なえる。
丸山氏は、「例えば、顧客からシステムの作成後に『求めているものではなかった』と言われた場合でも、自動で修正できることになる」と述べ、機械学習はAIとしての利用だけでなく、そのほかにも素晴らしいポテンシャルを持った技術であるとして締めた。
計算機としての人工知能とイマジネーションの領域を担う人間という関係
産業技術総合研究所 人工知能研究センター所長の辻井潤一氏は、「人と親和性の高いAI」の開発を行なっている。
辻井氏は、機械学習が効率的に成果を発揮した例として、2016年1月に初めてプロの棋士に勝利したAI「AlphaGo」を挙げた。同AIでは、プロ同士の対戦(棋譜)をデータとして読み込ませただけでなく、それらを基にAIに仮想の対戦相手を作らせて対戦シミュレーションを行なわせることで、与えられたデータからさらにトレーニングデータを作成し、さらなる学習を行なった点がポイントであるという。
このように、囲碁の場合、完全なルールを与えられるため、コンピュータの中でも起こりうる事象全てを捉えられる。
しかし、例えば生物学などの分野では、不明瞭な部分が多く、今まで蓄積されてきたデータベースも、部分的で断片化したものとなる。そのため、シミュレーションも非常に部分的な形でしか行なえず、全容を把握できていない以上、不完全なものとなってしまう。
辻井氏は、これは科学の例に限った話ではなく、現実世界で解くべき問題のほとんどは、こういった構造を持っていると指摘した。
そのため、そういった問題は創造力や構成力を持った自然知能(Natural Intelligence)としての人間と、人工知能としての計算機が組み合わさった集団として解決されていくと考えていると述べた。
人の真似をするロボット
Microsoft Research Asia 主席研究員の池内克史氏は、ロボットという観点から見た人工知能についてを語った。
人間の動きを見て、真似をするロボットを作る場合、ロボットが「どうやって人間の行動を見るか」と、「見た動きからロボットの行なう動作に落とし込む方法」の2点が問題となるという。
現在ではモーションキャプチャなどにより、比較的簡単に“動きを見る”ことが可能となっているが、人間とロボットの体重や足の大きさなどが異なるため、動きを完全にトレースするだけでは、バランスを崩してしまい動作しない。
池内氏は、これは人間も同様で、例えば踊りなら、先生と生徒で、体重、足の大きさなどは異なると指摘し、「真似」というのは完全に模倣をするのではなく、“動きの本質”を抽出し、そこから再度自身に合わせた動きを生成することだと述べた。
人間には基礎となるモデルがあって、それに基づいているから真似が可能なのではないかという考えから、AIに全てを自動で学ばせるのではなく、トップダウンな大枠のフレームを与えることで、学習させる研究を続けているという。
現在では、動きを真似させることは実現しており、次の課題は、ゆったりとした動きや俊敏な動作など、微妙な表現の再現で、例えば、人間同様に速い動きでは細部をごまかすといったAIの開発に挑んでいるとした。
また従来のロボットは単独で行動していたが、クラウドと繋いでいきたいとした。その際には、前述の通り、動作から本質を抽出し記述することは実現しており、そういったシンボリックに圧縮された技と、何をするかをクラウドに置いておくことで、それに基づきロボットの動きが生成されるような構図を描いているという。
まとめとして、「人工知能=機械学習」ではなく、暗黙知や経験値の存在もあり、もっと広い視点で人工知能を捉えるべきとして締めた。
ディスカッションでは、竹内氏が人工知能の発達に併せて我々は何をすべきなのか、という質問を投げかけていた。
Lee氏は、人工知能や機械学習というのは素晴らしい技術だと強調した上で、もしかするとそれら以上に世の中に変化をもたらす物は無いかもしれないと述べた。
活版印刷でも、それによって人間の職が失われるのではないかといった危惧がなされたが、結果として沢山の新しい職を生み出したと述べ、Lee氏は楽観的に見ているという。しかし、短期的には混乱が起こり、会計職や翻訳といった仕事は価値が下落するかもしれないとした。
辻井氏は、イギリスで起きた産業革命では、やはり社会的な混乱が見られた事を挙げ、人工知能や機械学習でも同じように社会に与える衝撃は大きいだろうとして、個々人の対応に任せるのではなく、生涯学習のような公的介入が必要だろうと述べていた。
なお、人工知能が技術的特異点を超え、人間には理解できない存在となって人類の脅威となり得るのかという問題には、池内氏は「(今の)学習するシステムは学習したいと思って学習を行なっているわけではない」として、人が悪用すれば危険な人工知能が生まれる可能性はあるが、それはデータを与えた人間の問題で、創造者たる人間に責任があると述べ、人工知能が自己を認識することが出来るようになるかどうかが転換点であり、それがいつか実現できれば問題になるかもしれないが、現状ではあり得ないとした。