イベントレポート

自然言語をUIにするMicrosoftの新概念

「プラットフォームとしての会話」をアピールするナデラCEO

 MicrosoftはBuild 2016の初日基調講演全体を通して「Conversation as a Platform」という概念を打ち出した。直訳すれば「プラットフォームとしての会話」ということになる。Microsoftがいうには自然言語を新しいUIとして定義しようというチャレンジでもある。そこには新しいかたちのインテリジェンスが介在する。

 自然言語はこれまでのものとは異なるまったく新しいUIであり、ボットは新しいアプリ、そして、デジタルアシスタントはメタアプリであるという。

 そして、自然言語によるインタラクションと言えばすぐに思いつくのがCortanaだ。Cortanaとの自然な会話は、例えば、SkypeのタイムラインをCortanaと作っていく様子で紹介された。

 Cortanaは、その環境で行なわれているあらゆるコミュニケーションを把握しているので、その会話の中で必要に応じてほかのエージェントを呼び出したりすることもできる。例えば、Outlookで交わされたメールのやりとりでホテルについて言及されていれば、会話の中で、ホテルのエージェント(ボット)と接続し、部屋の予約などまで進めていくことができたりもする。これを実現するのが、Cortana Intelligence Suiteだ。背後ではさまざまな別のエージェントが動いていても、それがCortanaとの会話の中に統合されるわけだ。

 なお、Skypeでは、こうした体験のために、Skype botsが今日から提供される。開発者は、Skype bot Platformを使うことで、あらゆる形式のコミュニケーションを使ったボットを開発できるようになる。

 さらにMicrosoftはボットをフレームワークとして提供する。そして、そこに自然な会話というUIを取り入れて、プラットフォームとしての会話を実現する。

 そのために開始されるのがCognitive Servicesだ。そこでは22のAPIが無償で提供される。コンピュータビジョン、エモーション、顔、ビデオ、音声、言語、文字、知識、検索など多岐にわたるカテゴリのAPIが用意され、それが自然な会話のために利用できるという。

 基調講演ではこれらのAPIを使ったHoloLensの応用事例として、開発中のSeeing AIを披露、視覚障碍者のMicrosoft社員の日常をまとめたビデオが紹介された。そこでは、白い杖を持って歩いている途中に、急に飛び出した何かを認識し「あぶない、どうやらスケートボードの若者のようです」と今起きたことを説明したり、レストランに着席して、渡されたメニューをスマホのカメラで認識させようとすると、もう少し右に、上にとメニュー全面がスクリーンに入るように指示し、メニューの中から前菜やメインディッシュなどのカテゴリをピックアップして読み上げるなどの様子が紹介された。

 これらの技術は、北京のMicrosoft Research Asiaがずっと以前から継続的に研究を続けてきたものを組み合わせて、ついにかたちになろうとしているものといえる。Cortana APIもまた、その源はAIであるXiaoiceやりんなにそのオリジナルをもっていることを考えると、MSRAの位置付けは極めて重要な存在だ。

 ナデラCEOは、こうした世界が現実のものになると、医療や教育、サービス産業といった分野1つとっても、いったい何ができるようになるのか想像してみて欲しいと訴求し、頭から3時間近く出ずっぱりで続いた基調講演の幕を閉じた。

Office Outlookと情報を共有して注意を促すコルタナ
いわゆるメッセンジャーアプリが会話のためのキャンバスとなる
Cortanaとの会話の中で、ウェスティンホテルのエージェントが呼び出された様子
視覚障がい者のMicrosoft社員。彼の(近未来の)日常がビデオで紹介された

(山田 祥平)