ニュース

GoogleのAI、地理情報のない国のGoogleマップを作成

ストリートビューの画像には様々な地理情報が表示されている。複数の画像から文字を認識することで精度を高める

 Googleは、Googleマップにおける最新技術の活用事例として、機械学習を活用して、地理情報が存在しない国で地図を制作する取り組みと、先進国における駐車場の空きスペースを予測する取り組みについて説明した。

 米Googleマップソフトウェアエンジニアのアンドリュー・ルッキングビル氏は、「機械学習は、Googleマップの制作の上で重要な役割を果たしている。ストリートビューの画像を見ると、地図を制作する上で必要となる情報が数多く含まれている。たとえば、街路名、企業名などが目に入ってくる。

米Googleマップソフトウェアエンジニアのアンドリュー・ルッキングビル氏

 これを機械で判別させるのは難しい。たとえば、文字を読めても、どれが会社名なのかを定義しにくい。また、不鮮明な画像も含まれる。しかし、複数の画像を活用して、文字を正しく認識する再帰型ニューラルネットワーク(RNN)を採用し、深層学習を繰り返すことで精度を高め、最適なアルゴリズムを作り上げ、ストリートビューの画像から、新たな地図を作りあげることができた」とする。

 機械学習を利用した地図の制作では、具体的な事例として、ナイジェリアのラゴスでの実証実験のケースをあげた。

 ストリートビューの画像をもとにして、機械学習により、住所の番号を認識。これを地図の制作に反映。住居に書かれた手書きのような数字など、クルマで通っただけでは識別できないものも認識できた。これにより、地図上に表記できる街路名は2万個、住所では5万個、会社名や店舗名では10万個増やすことができ、多くの人が、より精度の高い、詳細なマップを、使えるようになった。

 ここでは、2014年に公開した、画像内から番地を読みとる技術を活用するとともに、2016年に公開した、ストリートビューの画像から、100万件を超える道路名などの案内標識を抜き出した大規模なトレーニング用データセット「French Street Name Signs(FSNS)」を活用。

 さらに、FSNSを使用して、新たなストリートビューの画像に自動的にラベル付けを行うための深層学習モデルアーキテクチャーを開発し、抽出したテキストを規則に沿ったものに正規化(標準化)したり、無関係の場合には除外の処理を行なったりするという。

 これにより、画像が直接住所を抽出することができるようになったほか、略称で表記されているものも、深層学習によって正しく置き換えることが可能になった。たとえば、ブラジルでは、標識に書かれた「AV」は、「Avenida(Avenue)」の略であり、これを正規化して地図上に表示することができるようになっている。

 ここでは、GoogleのスタッフがAVがAvenidaであることを教え込んだのではなく、機械学習によって、機械が自ら学び、パターンとして認識し、表示したところに意味がある。

ブラジルでは「AV」と書かれた文字を「Avenida」の略語と自ら学習した

 また、企業名や店舗名の正しい認識については、アテンションメカニズムと呼ぶ深層学習により、画像のどの部分が企業名や店舗名を表示しているのかを教え込み、それを繰り返すことで認識精度を高めたという。

 「画像のどの場所に企業名が書かれているのか、どの部分が大切な情報であり、どこが不要な情報であるかということを学習させている。それによって、画像のなかでどれが企業名であるかを高い精度で認識することができた」という。

アテンションメカニズムにより、どれが企業名なのかを判別できるようになった

 ストリートビューの画像から、地理的情報を活用して、精度の高い詳細な地図を制作できる仕組みが広がることで、新興国などにおける地図制作の課題を解決できるようになるというわけだ。

Googleマップの地図情報がより詳細になった
ストリートビュー撮影用の機材。すでにこれを使われていないが、日本国内向けに活用されていたものだ

 もう1つは、多くのドライバーが、毎日直面している駐車場スペースの課題を解決するために開発した「駐車スペース予測のための機械学習アルゴリズム」だ。

 すでに、これを利用したアプリが、2017年から、AndroidおよびiOS向けに提供されており、米国の25都市のほか、欧州、中南米、カナダ、アジアの30都市で利用可能だ(Google Mapsに駐車場の空き具合を示す機能が追加参照)。

2017年からスマホアプリとして提供。米国では25都市で利用できる

 駐車場の需要には流動性がある。時間、曜日、天候、特別イベントなどによっても変動する。サンフランシスコ市内を例にとっても、駐車の空きスペースを見つけやすい場所と見つけにくい場所があったり、1日をとっても、見つけやすい時間帯と見つけにくい時間帯がある。

 過去の駐車データをもとに、どの時間帯が混在しているのかを予測し、ユーザーが、その場所に、何時に到着するかを入力すれば、駐車場の確保が容易か、どれぐらい駐車場の確保が難しいかを予測することができる。

 駐車スペース予測のための機械学習アルゴリズムでは、「現場の声」、「予測のために必要な要素」、「機械学習モデル」の3つに分けて構築を行なったという。

 「現場の声」では、駐車場を探すのに、どれだけの時間がかかったのか、あるいは、どれだけ探すのが大変だったのかといった情報を収集。「予測のために必要な要素」では、目的地に到着した時間と、駐車場に到着した時間を統計処理し、多数の車が、駐車場に到着するまでに長い時間を要していれば、駐車スペースの確保が困難であると予測するという。ここでは、約20の要素をベースにして予測を行なっている。

生涯の106日間を駐車場探しに費やしているというデータも

 「機械学習モデル」では、標準的なロジスティック回帰機械学習モデルを採用。データのノイズに影響を受けにくいように学習を行なっている。

 駐車スペースの予測をする場合には、いくつかの課題が発生する。需要と供給の状況が常に変わることいった要因のほか、スマートメーターからの情報を収集しても、違法に駐車していたり、特別な許可を持っているクルマが駐車している例外的な場合もある。また、駐車場には多層構造をはじめとしてさまざまなレイアウトが存在している。駐車スペースがどれぐらい空いているのか、そして、そのデータが正確なのかどうかということも考慮しなくてはならない。これらの状況も含めて、現場の声、予測のために必要な要素、機械学習モデルによって、駐車場の空き状況を予測している。

駐車スペース予測のための機械学習アルゴリズムは、3つの観点で構築
サンフランシスコ市内の駐車場の状況は時間によって大きく異なる

 駐車に関する課題を解決するためのツールを、機械学習を活用して提供しているGoogleは、交通の利便性を高めるといった点にも挑戦しているというわけだ。