入門:教養としての人工知能
深層学習はなぜうまくいき、足りない部分は何なのか? 原理を研究し応用を進める
~理研AIP 発足記念シンポジウムレポート
2017年3月29日 06:00
今、日本政府は、総務省、経済産業省、文部科学省の3省庁連携で人工知能(AI)の研究開発を進めている。
司令塔となっているのは「人工知能技術戦略会議」。戦略会議の下に「研究連携会議」と「産業連携会議」を設置し、AI技術の研究開発と成果の社会実装を進めている。
さらに研究連携会議の下で、総務省系の情報通信研究機構、文部科学省系の理化学研究所(理研)革新知能統合研究センター、経済産業省系の産業技術総合研究所(産総研)人工知能研究センターがそれぞれ研究を進めている。
その1つ、理化学研究所 革新知能統合研究センター(AIPセンター)は、文部科学省AIPプロジェクトの研究拠点として、2016年度に設置された。新たに開設した日本橋オフィスを中心に、2017度から本格的に活動を開始する。
2017年3月24日には発足記念シンポジウムが開かれ、理研での取り組みのほか、連携センターである情報通信機構と産総研の取り組みも合わせて紹介された。今、国が進めようとしている研究の一部がわかるシンポジウムだったので、レポートしておきたい。
人工知能基盤技術、社会課題の解決、影響の分析などを実施
最初に、理化学研究所 理事長の松本紘氏は「1年をかけてセンターの体制を整備した。AIは広範囲な学問分野。3省3機関が連携して研究を進めていく」と述べ、理研での人工知能の研究体制を紹介した。
今年(2017年)度から10年間のプロジェクトとして、AIPセンターでは下記の3つの研究グループで研究を実施する。
- 汎用基盤技術研究グループ(グループディレクター: 杉山将氏。数理的な基礎研究を主眼とする)
- 目的指向基盤技術研究グループ(グループディレクター: 上田修功氏。再生医療、新素材、ものづくり、防災・減災など実応用を目指す)
- 社会における人工知能研究グループ(グループディレクター: 中川裕志氏。データの収集と流通、社会で活用されるための制度などの調査分析)
具体的には、
- 深層学習を超えるAI基盤技術の開発
- 日本が世界に誇るサイエンス研究のAIによる加速
- 日本が直面している社会課題のAIによる解決支援
- AIの普及が社会に及ぼす影響の分析
- 高度AI研究開発人材・データサイエンティストの育成
などを進める予定となっている。
理研では、来年(2018年)度から文部科学省によるデータプラットフォーム拠点形成事業も推進されることになっている。高品質なデータを利活用しやすい形で集積、新たな価値を生み出すデータ主導型研究を推進する。
文部科学省からは、文部科学副大臣の水落敏栄氏が登壇し、「大学研究機関との緊密な連携」、「産業界との連携」、「グローバルな存在感の発揮」の3点を期待していると挨拶した。
続けて、政府の人工知能技術戦略会議議長で、日本学術振興会 理事長の安西祐一郎氏が挨拶した。
安西氏は「アメリカのIT企業6社で、5兆円くらいの研究費が使われている。一歩進まないと、とても間に合わない。理研のセンターだけではなく、各センターが連携してリードしていただきたい。連携して世界に向けてイノベーションを発信していただきたい」と述べた。
また、「機械学習のポイントは、プログラムした本人が思ってもみなかった出力が出るところ。そこが今までのプログラムと違うところ。ニューラルネットワークは1980年代にはやったが、当時は問題を解くには計算力が足らなかった」と自身のAI研究を少し振り返った。
「自動走行車も、まったくスキルなしにゼロから学習できるわけではない。パターン認識と運動学習だけではうまくいかない。スキルはそれだけではない。深層学習だけではなく、色々な方法が必要。本当に役に立つAIのモデルとは何か、それを日本から発信してもらいたい。今のままだと、できるものはできるが、できないものはできないということになる。応援だと思って聞いてほしい」と会場に呼びかけた。
また、人材獲得問題やデータの蓄積のほか、「スタートアップの支援ができるかどうか」といった課題を指摘した。
「企業のM&Aが多くなっている。優秀なAIベンチャーをどうサポートしていくかが大事」と述べ、「AIPに期待するところは非常に大きい。ほかの省庁とも連携してもらいたい。本当のイノベーションが出てくることを本当に期待している」と挨拶を締めくくった。
数学的に解ける問題の拡大を目指す汎用基盤技術研究グループ
講演では、まず始めに理研AIPセンター センター長の杉山将氏が、「理研AIPセンターの活動方針と汎用基盤技術研究グループの取り組み」と題して全体の紹介を行なった。
2016年4月に設立されたAIPは、理研だけでなくJSTの中にもネットワークラボがあり、そちらではファンディングを行なっている。両者が一体となって研究を実施する体制となっている。
まず基礎研究においては、10年後を見据えて実施する。注目を集めているGoogleの「DeepMind」も少数の研究者の成果であること、深層学習も10年前は冷ややかに見られていたように、基礎研究はいまだ個人勝負であり、日本にも優秀な理論研究者は数は少ないが、いる。彼らを集めて切磋琢磨していくという。
理論研究の方向性は2つ。なぜうまくいくのかわかっていない深層学習の原理の解明と、現在の深層学習では難しい難題解決である。
応用研究はパートナーと連携する。サイエンスと社会的課題をターゲットとする。
再生医療、ものづくり、マテリアル、高齢者ヘルスケア、防災・減災、インフラ点検などの、国内各トップの研究センターやプロジェクトと連携する。
技術が社会に浸透する上での倫理・法的・社会的影響や、技術的特異点の影響の分析も行なう。プライバシー、セキュリティ、公平性など、数理的に解決できる問題にも取り組む。
人材育成にも取り組む。現状が層が薄いAI研究者を育成していき、国内外の産業界とも連携して、エンジニアやデータサイエンティストを育成する。
研究体制は、広範な応用分野があるため、さまざまな大学や企業、ほかのセンターと連携する。それを解決可能な問題に抽象化し、解決、研究する各グループが連携して研究を進める。
拠点は、日本橋駅直結のCOREDO日本橋の上に構えた。計算リソースはNVIDIAの「DGX-1」を24台購入し、横浜に設置。ディープラーニング専用マシンとして活用する。
杉山氏は、センター長と同時に、汎用基盤技術研究グループのグループ長も兼任している。
汎用基盤技術研究グループは「数学的に解ける問題」を拡大し「実世界で求められる問題」に解法を与えることを目指す。両者がクロスする領域が「実用的な人工知能技術」ということになる。
具体的には、今ビッグデータを使った深層学習が性能を出しているが、人間はノイズが多いスモールデータからも学習できる。深層学習がなぜうまくいくのか、また、人間がなぜスモールデータで学習できるのか、その謎を解明する。
たとえば、深層学習では階層を深くすると汎化能力が高まると言われている。だが、なぜうまくいくかはよくわかっていない。階層と素子は離散なので、連続にしか適用できない数学テクニックは使えない。
そこで、横幅が無限に広い仮想ニューラルネットワークを考えることで、数学的なテクニックを解析に使えるようにして取り組むという。
深層学習そのものについても研究を進める。制限つきボルツマンマシンについては、現状のアルゴリズムはあくまで近似計算で、本当は収束するかはわからない。そのため人命がかかるようなところには使えない。そこで、正規化項の部分をまったく不要な学習法を開発することを目指す。
また敵対的生成ネットワークを用いて、画像を自動で生成するような技術が増えつつあるが、こちらについても理論的に何をやっているのか調べ、より性能が高く効率的なアルゴリズムを開発する。
ニューラルネットワークが苦手な問題を、どうやって解いていくかも課題だ。
音声や言語のような、構造が比較的はっきりした系列データには、再起型ニューラルネットワークでうまくモデル化できる。だが、ロボットの運動や流体など、文法がない問題をNNでモデルを作り込むのは非常に難しい。
そこで、固有のダイナミクスや時間スケールを持ったモードごとの時間表現を動的に獲得させて、非線形の動的システムに基底のようなものを持たせてモデル化することを目指す。
今のニューラルネットワークは、主に入力を与えて正解出力を出すような問題に適用されているが、現実には組み合わせ最適化問題が求められることが多い。そこで、これにも挑戦する。解くための計算時間が指数的に爆発するために、解けるかどうかは難しいような問題だ。
サブクラスを考えてやると、効率的に実用的な解を求めることができる。最適価格付け問題のような、普通に解こうとするとNP困難な問題にも適用できる。線形関数なら最適解が簡単に求められるが、非線形だと難しい。今まではまったく解けないと思われていた問題を、実用的な時間で解くことを目指す。
「解ける問題にするために、あらゆる数学的な技術を投入していく」と杉山氏は語った。
学習理論と最適化理論を構築し、最終的に定式化される形にしてできたアルゴリズムを、目的指向基盤技術研究グループに橋渡しする。
国際学会での日本の論文採択率を上げて、存在感を上げるためにも、応用では分野を選んで日本が勝てるところをやっていくという。そして「世界的な競争に勝っていくことを目指したい」と述べた。
医療やものづくり、頑健な社会構築への貢献を目指す目的指向基盤技術研究グループ
革新知能統合研究センター 副センター長の上田修功氏は、「目的指向基盤技術研究グループの取り組み」について講演した。
AIは、ビッグデータをいかに利活用して産業界に発展させられるかが肝だ。理研AIPとしても、汎用技術グループの成果を活かして課題に取り組む。
今のAI応用で多いメディア・知識処理だけでなく、医療、ヘルスケア、ものづくり、防災などの分野に踏み込んでいく。
たとえば、がんについて。がんでは多くの医療データが蓄積されている。個別データは分析されているが、統合されていない。AIPではこれらを連携して研究を進める。具体的には、DNAのヒストン修飾の状態を解析するなど、マルチオミックス解析を進めていく。
さまざまな異種データを融合して解析するのはAIの得意な領域であり、国立がんセンターと連携して、がんの本態解明に挑むという。
認知症に関しても、対話ロボットを用いて認知症のレベルを測ったり、境界領域の人を正常の方にもっていくような認知活動支援を進めていく。
ものづくりについては、名古屋大学価値創造研究センターと連携。高品質な結晶を生成するための結晶成長解析解析を行なう。現在は試行錯誤で行なっている結晶成長に、どういう要因があるのか分析する。
深層学習については、大量の観測データと教師データが正確に与えられる場合の「教師あり学習」では、現状で最強のツールであり、画像、音声認識、自然言語処理では必須の技術だとの見方を示した。
一方、観測データと教師信号の対が不明確なケースや、結果に対して説明が必要なケースなど、対応できない分野も多い。
政府がいうところの「society5.0」のようなスマート社会を目指す上では、AIは人間中心のQoL向上に資するべきであり、「環境知能(Ambient AI)」は、そのための1つのアプローチであると述べた。
アンビエントAIの世界観は、センサーで計測した情報を計算して、制御を通して実世界に働きかけ、またそれを観測するループを回すというものだ。これがレジリエントな社会を作る上では重要だという。
上田氏は、時空間統計解析は非常に重要な領域であり、都市化は全世界的流れだと指摘。2011年に帰宅難民が続出したときのことを振り返り、有事が起こったときの適切なガイダンスが必要だと述べた。
そしてNTT コミュニケーション科学基礎研究所 上田特別研究室での研究として、人の誘導をリアルタイムにアダプティブに行なうという研究を示した。
よくマルチエージェント・シミュレーションで群衆がどう動くかを示す研究はあるが、それは一方的であり、どう防げば良いかを計算するためには、統計解析技術を使った時空間予測や、リアルタイムの計測と動的な誘導が必要だという。
そして「学習型マルチエージェントシミュレータによる集団最適誘導技術」で、実際にスタジアムなどで全体が混雑することなく誘導できるという例を示した。こういう技術を防災・減災にどう役立てるかが重要だ。
災害自体は防げない。だが災害の影響を減らすことはできるし、社会システム復旧にかかる時間を減らすことはできる。
具体的な課題としては、橋梁点検ドローンと、レジリエンス向上をあげた。SIPインフラとも連携し、操縦の自動化だけではなく損傷検出も自動化し、完全自動ドローンでの点検技術を目指す。
人の誘導においては、効率的に人を避難させることで、避難所が避難所として機能するような仕組みを作る。また防災科研とも連携し、衛星情報のAIによる解析を行なう。
社会のレジリエンス向上のために、シミュレーションベースでアダプティブにどう向上させるかを、理研内のスパコングループとも議論をして、ポスト京を想定して研究を進めているところだと述べた。
ほかのセンターとも、密な連携を行なって研究を進めていくという。
人工知能時代のデータの扱い、倫理や法律はどうなる? 社会における人工知能研究
理研AIPセンター 社会における人工知能研究グループ グループディレクターの中川裕志氏は、同グループの取り組みについて紹介した。
ビッグデータをいかにうまく使うかという時代においては、データの流通が非常に重要になる。特に、ビジネス上有益なものはプライバシーデータであり、法律・技術的な問題も絡む。
また、人間側がAIを開発する時に、どういう倫理の指針が必要かといった問題もある。得られたデータをどう活用していくかにおける法律的枠組みも必要になる。
技術が発展すると、社会の仕組み自体も変わってこざるを得ない。そのフィードバックをかけることも必要だ。
また、AIによって起こる問題をAI自体に監視させて高速に解決すような仕組みなども重要だ。そのほか、人間と会話するAIの設計と構築などを8つのチームで研究するという。
ビジネス上、重要な個人のデータは、今は大手企業が管理しているが、データ主体である個人が管理するのが望ましいと中川氏らは考えているという。
今、データはGAFA(Google、Amazon、Facebook、Apple)と呼ばれる大手IT企業を中心に管理されている。そのデータを、データが発生する個人にもっていけないかという動きが、特にヨーロッパを中心に進んでいるという。
必要な技術は、パーソナルデータクラウド、認証、データのポータビリティ、サービスメディエータ、ブロックチェーンによるデータ認証、プライバシー保護、公平性や透明性など。
サービスの仲立ちをするための、匿名化してマッチングするメディエータ(仲介)などは、特にAIが威力を発揮しそうだと考えているという。
また、人間からAIはどう見えるかという視点での議論は多いが、AIから人間はどう見えるかという視点もあり得る。それはシンギュラリティを考える上でも重要だ、とニック・オストロムの「Super Intelligence」などをひいて中川氏は述べた。
安心して使える人工知能の姿を明らかにしていき、人工知能自体をどう信頼してもらえるか、そのための設計方針や倫理を明確にしていくという。
AIが出す指針に対して人間側がどう振る舞うべきか、拒否権をどう持たせればいいのかといったことも研究を進めていく。
今すぐにでも起きそうな問題としては、部下などを操るために人工知能の権威を使うといったケースがあるとした。
また、AIの言うことに従った方が良い状況もあれば、そうではない場合もある。機械の言うとおりにやる方が良い場合としては、AIアプリケーションの1つとして良く挙げられる、車の自動運転がある。
特に問題となるのは、困ったときだけ人間が介入するというパターンで、この場合が実は一番危険だと言われている。保険業界でも、この辺りがリスクだということはすでに認識されているという。
将来は、機械に完全お任せの方がむしろ安全ということになるかもしれないが、そのためには社会の交通システムや法律を根本的に見直す必要がある。
ドローン活用においても航空法の問題などがあり、法律面での解決は重要だ。医療データのAI利活用においても必要な法制度の検討が必要となる。
また、ネットによって個人データも簡単に国境を越えてしまう。だが、国境を超えるとデータを支配する法律が変わるという問題もある。
EUでは、EU域内のデータを使った場合は、世界のどこで売り上げがあっても一定課税をかけるという議論が進んでいるという。
このほか、深層学習においては初期値の設定が膨大だという問題があるが、その最適化や、高速取引による金融市場クラッシュをどう解決するかといった問題も重要だと指摘した。そのほか、履歴データの匿名化などの研究を行なっているという。
連携する産総研とNICTの動向
産業技術総合研究所 人工知能研究センター 副研究センター長の麻生英樹氏は、「産業技術総合研究所人工知能研究センター(AIRC)の現状と展望」について紹介した。
これまでの2年間で拠点形成を進め、人材を集積させてきているという。現在は常勤が92名、客員や兼務を含めると392名の研究員が在籍している。
研究開発テーマは、「実世界に埋め込まれるAI」。実世界で得られるデータを使って解析し、その結果を実世界に返す。それがまた観測データとして帰ってくるというサイクルを回してAI研究を進める。
AIとIoT、AIとロボットなどとの繋がりが大事だと考えているという。また、実世界との繋がりという意味では、人間にとってわかりやすいことも重要だと考えていると述べた。
具体的には、自律移動ロボットによる3次元の地図作成を行なっている。単なる障害物や壁の検出による地図作成に留まらず、移動する人の観測とモデル化による、意味的情報も含めた地図の作成などを行なっている。
関連して、衛星画像データの機械学習解析も行なっている。ものすごい量のビッグデータが宇宙から降りている今、そこから意味を引き出すことが重要になっている。プラットフォーム構築も目指す。
ロボットによる作業に向けた動作の生成や計画も行なっている。特に、事前に動作を生成しておくことができないような状況でも動けるロボットの研究開発を行なっている。
初期状態と最終状態を与えると、自動的にその途中の動作を計画・生成してくれるロボットだ。そのための動作計画技術を研究している。
ロボットに動作を教えるのはコストがかかる。特に柔軟な物体の操作は大変だ。状況依存性が高く事前計画が難しいからだ。
そこで、人間がまずお手本を示してやり、それを汎化するという方法を研究している。麻生氏は例として、ロボットが布をたたむ様子を示した。
故障や異常を早期に検知して保全する研究も行なっている。たとえば、風車に音響・振動センサーを付け、発電用風車の異常をできるだけ早期に検知する。
正常データを集めて学習し、正常だという部分空間を作り、そこから外れたものを異常だとするアプローチで挑んでいる。人間よりも異常検知を早く行なうことができるという。
また、サービス業の応用としては介護現場での取り組みがある。介護の中で発生する申し送りデータを現場でとって、うまく構造化・知識化することで、現場にフィードバックして新しいサービスを作り出す、そういうことをAIを使ってサポートしようとしている。
麻生氏は、これまでのAI応用は、物体の認識にフォーカスが当たっていたが、これからは「モノ」だけでなく「コト」の認識が重要視されるようになるとの見方を示した。
コトの場合は状況依存性が高い。たとえば同じ物体や状況であっても、周囲の状況によって、まったく異なる意味づけになることがある。そこが課題だ。
産総研では、リビングラボを生活支援AIの開発評価フィールドとして、データを取るための仕組みを研究している。模擬環境でデータ取得の方法を研究して、現場で実データを取る。
たとえば、単なる年齢や性別ではなく、生活機能がどのくらい衰えているかといった視点でユーザーをクラスタリングするようなことを目指した技術を研究しているという。
機械学習を使った医療画像・動画の診断支援技術開発も行なっている。
医療機器が発達しているので画像の量は増えている。患者も増えている。だが医師は増えていないので、負荷が増えている。だから見落としを減らすためにもAIが支援する。
また、遺伝性疾患との関連も調べている。複数の要因が組み合わさった場合にどうなるか、その原因解明にAIを応用する。人工知能を使った統合的がん治療システムを開発するという。AIを使った避難誘導支援については、産総研でも進めている。
深層学習を使った日常生活物体の認識や、人の多様な動作を認識する技術も研究している。
日用品学習用データセットは、3次元の日用品データで、たくさんの視点から物体の画像を取ってネットワークに学習させることで、少ない視点からも入力した物体が何か認識できるようになるという。
人の動作認識のための動画データセットも構築している。今は100種類くらいの動作の動画があるという。人工知能が日常的生活シーンを理解できるようになる。国際標準化にも取り組んでいる。
産総研全体として、グローバル研究拠点の整備も実施している。工場を模した工場ロボティクスラボも構築しているという。
クラウド基盤としては、「ABCI」という計算ノード1,500台以上、半精度演算ピーク性能130PFLOPS(ペタフロップス)以上の省電力計算基盤を構築しており、製造業が必要とする機械学習を、アウトソーシングする場にしようとしているという。
麻生氏は、「少しずつ成果が出てきているということを感じていただければ幸い。さらに連携を進めて、社会実装を目指した取り組みを続けていきたい。新たな価値を作るエコシステム基盤を作りたい」と述べた。
情報通信研究機構 ユニバーサルコミュニケーション研究所 研究所長の木俵豊氏は、「ユニバーサルコミュニケーションを実現する人工知能技術」としてNICTの取り組みを紹介した。
キーになるのは質の良いデータであり、それを使える形にして技術を作り、社会に貢献していくものにすることが重要だと述べ、31言語間で翻訳ができる、多言語音声認識アプリの「VoiceTra」などを紹介した。
医療向けハンズフリーアプリや、シナリオではなくダイナミックに答える博学対話ロボットなどの研究を進めている。
社会知解析技術としては、データ駆動知能システム研究センター(DIRECT)で進めており、Web情報分析システム「Wisdom」や、対災害SNS情報分析システム「DISAANA」を紹介した。これらはWeb上で公開されている。
脳情報通信融合研究センター(Ci-Net)では、モデルドリブンからデータドリブンの研究を進めており、脳情報のデコードなどを行なっている(過去記事:脳情報を解読し次世代人工知能の基盤に)。
最後に、サイバーセキュリティ研究所による、セキュリティ関連の取り組みも紹介された。理研AIPと連携し、パーソナルデータの匿名加工化などにも取り組んでいるという。