ニュース

Google新製品の中核を成すパーソナルAI「Google Assistant」

 10月4日(現地時間)に行なわれたGoogleの新スマートフォン「Pixel」発表会では、ハードウェアスペックについてはほとんど触れられず、同社の新しいアシスタント機能「Google Assistant」の説明に焦点が当てられた。それほどGoogle AssistantはPixelにとって中核を成す要素となる。

 Google Assistantは簡単に言うと、より賢くなったGoogleの音声入力検索だ。敢えて新たな名称が与えられているのは、そのバックグラウンドで用いられているAI(人工知能)が格段に強化されており、精度や使い勝手が向上しているため。

Google Assistantは、Googleのナレッジグラフ、自然言語処理、翻訳、音声認識、画像認識などの協力な機械学習の上に成り立つ

 例えば画像認識の精度は2014年の89.6%から93.9%に向上。数値では4%だが、従来は「1台の列車が線路に止まっている」と認識していたものが「青と黄色の電車が線路上を運行している」と認識し、正面を向いた熊と背中を向けた熊のいる写真は「1匹のヒグマが水中を泳いでいる」となっていたものが「2匹のヒグマが岩の上に座っている」と正しく認識できるようになっている。

 翻訳や合成音声も強化され、翻訳はより自然な文章となり、合成音声もより細かい粒度での制御ができるようになったことで声色も好みのものに変更できるなど、より人間のレベルに近付いたとする。

従来までの画像認識の結果(左)と現在の結果(右)
機械翻訳については、特に中英翻訳が強化。左が従来、中央が現在、右が人間による翻訳
英語機械音声の品質も人間のレベルに近付いた

 こういった技術を活用し、「誰々の結婚式の写真を表示」、「自分がダンスしている時の写真」といった指示を与え、適切な写真を表示したり、「バークレイのグリーク劇場で今度催されるイベントを表示」という指示に対して、日付や開催時間とともにイベントを表示させる、お気に入りのアーティストの音楽を再生といったことがGoogle Assistantアプリで完結する。

 チャットを音声入力し、送信もできるが、Google Assistantは画面に表示された内容も常に認識でき、「どこどこで夕食を食べよう」といったチャットをしている最中に、ホームボタンを上にスワイプすると、そのキーワードを元に、適切なレストラン情報を表示。さらに音声で、交通状況を校了した上でのその場所までの到達時間を教えてくれたり、音声でレストランの予約もできる。

Google Assistantで「去年の10月の写真を表示」と指示したところ
最寄りの劇場でのイベントなども検索可能
チャットも音声で入力
レストランの予約も音声でできる

 Google AssistantはスマートフォンではPixelシリーズに初搭載されるが、その動作はクラウド側で行なわれているため、あらゆるデバイスで活用できる。そのAPIはサードパーティにも公開されており、組み込み向け製品用のSDKも提供。このAPIを使うことで、他社の製品も音声による操作や、会話型のインターフェイスを構築できる。

 Google自身もGoogle Assistantを搭載するホームデバイス「Google Home」を米国で11月4日より129ドルで発売する(6カ月のYouTube Red利用権付き)。

Google Home

 Google Homeは、据え置き型のパーソナルアシスタント機器。音声操作に特化しており、「オーケー、Google」に続けて、自然な口語体で話しかけることで内容を理解し、最寄りの店の検索結果や、道路の混雑具合、ユーザーのその日の予定、天気などの情報を音声で読み上げる。

 音楽再生に適したスピーカーも内蔵し、「○○の映画の主題歌を再生」などといった曖昧な指示にも応えられる。Googleのデータベースに適切な回答がない場合は、Wikipediaなどの信頼できる情報源を元に回答する。

 他の機器との連携も可能で、動画の再生を指示すると、Chromecast端末経由でTVで動画を再生したり、Chromecast Audio経由で音楽を再生することも可能。また、各種スマートホーム機器とも連動し、電気を付けたり、電源を切断したり、エアコンの温度調節などもできる。

 部屋が複数ある場合にGoogle Home自体を複数設置することも想定しており、複数のGoogle Homeで同期して同じ音楽を再生可能な一方、ユーザーの音声操作に対しては、最も近い端末だけが反応するよう設計されている。

 なお、上部にはタッチセンサーも内蔵し、音量や再生をタッチでも制御できるほか、一時的に反応させたくない場合用のマイクミュートボタンも備える。

Google Homeがしゃべる時は、上部表面で4色の光がアニメーションする
ハイファイスピーカーを内蔵
下部のキャビネットは違う色のものに変更可能
上部はタッチで音量などを制御可能
背面のマイクミュートボタン
他の機器とも連携可能。画面はChromecastと連動し、写真を表示しているところ