ニュース

Microsoft、“目で見た”あらゆるものを認識する人工知能技術を開発

～従来の30分の1のリソースで、50倍高速化

（2014/7/15 18:01）

　米Microsoftは13日(現地時間)、米国で開催している「第15回Microsoft Research Faculty Summit」の中で、見たものが何であるかを認識する人工知能技術「プロジェクト・アダム」を披露した。

　同イベントの基調講演で、Microsoftの研究開発機関であるMicrosoft Research 技術・研究担当副社長のHarry Shum氏は、同研究所が考える「次なる大きな潮流」の1つとして、機械学習と人工知能を挙げており、そのプロジェクトがプロジェクト・アダムだ。プロジェクト・アダムの目的は、機械があらゆるものを視覚的に認識することにある。

　この技術の基本は、人間の脳のニューロンや神経網のように、膨大な量のデータを膨大なマシンで処理することで、機械がものごとを学習し、知能を発達させていくというもの。基調講演では、ユーザーによって22,000種類のタグが付けられたWeb上で共有されている1,400万枚の写真を元に、壇上でスマートフォンによって撮影された犬の犬種が何であるかを瞬時に言い当てた。

　もちろん膨大なマシンの利用が前提とは言え、無限に多くのマシンを使うことはできないし、消費電力の観点からマシンの数は少ない方が良い。プロジェクト・アダムは、現行の他の機械学習システムと比べ、30分の1のマシン数で、2倍正確に、50倍高速に見たものを認識できるという。

　その処理能力もさることながら、この能力をクラウド経由でモバイルデバイスからでも利用できるのもポイントで、実際にデモではWindows Phone 8.1のデジタルアシスタント「Cortana」を起動し、「この犬種は?」と音声で質問すると「写真を撮影して下さい」と返され、撮影すると犬種を回答。また、人間を撮影すると「これは犬ではありませんね」と答えて見せた。

　この技術を応用すると、食事を撮影するとその栄養価が表示されたり、肌が荒れている時に写真を撮ると医学的な分析をしてくれたり、野山で草の写真を撮ると、それが食べられるものかどうかを教えてくれるといったことが実現される。