スタンフォード大教授兼Google技術者が無人自律走行自動車実現への道を語る
GTC最終日には締めくくりとして、スタンフォード大学教授としてコンピュータサイエンスと電気工学について教鞭を執り、同大人工知能研究所の所長を務める傍ら、Googleでストリートビューを共同発明したSebastian Thrun氏が基調講演を行なった。
今回のThrun氏のテーマは無人自動車。単に無人なだけじゃなく、コンピュータ制御で自律的に運転を行なう、言うならばロボット自動車だ。
Thrun氏は、「電卓から始まったコンピュータがこの70年間で大きな進化を遂げたのに対し、電気駆動のものも出始めているが、自動車にはそのような抜本的な変革が起こっていない」と切り出した上で、次のように語った。
「アメリカで15歳から24歳の死因でもっとも件数が多いのは自動車事故。それだけでなく、燃料を大量に消費し、大気を汚染。さらに、所有している時間の内、97%は駐車中で使われず、いざ走ると渋滞を引き起こすにも関わらず、92%のハイウェイは効率的に利用されていない」。
米国の若者の死因の第1位は自動車事故 | また、大気汚染や一部の高速道路の慢性的な渋滞などの問題もある |
このように自動車には解決すべき社会的な問題が山積しているが、Thrun氏は自動車の目指すべき進化の方向性の1つとして、無人で自律的に走行する車を挙げた。
米国国防総省は過去20年、目的地まで自動的にたどり着く軍用車両の研究開発を行なってきた。しかし、最終的に100m以上進むことのできる車を作ることはできなかった。そこで、一計を案じた同省は、民間の技術を結集させようと、「Grand Challenge」というレースを催すことにした。
レースの目標は、ロサンゼルスからラスベガスまでの道のり(公道ではない)を、規定のポイントなどを通過しながら、規定時間内に走破すること。1位のチームには賞金100万ドルが与えられる。
第1回は2003年に開催されたが、経験/技術不足から半数が1km以内にコースオフや故障でリタイヤ。そして、いずれのチームも規定距離の5%も進むことができないまま終了した。
翌年、1位賞金が200万ドルに増えた第2回が開催されたのだが、ここにThrun氏が率いるStanford大チームが参加した。同チームが開発した車には、GPS、コンパス、レーザー、カメラ、レーダーなど多くのセンサーを搭載し、これらを6台のコンピュータで制御した。
技術の肝となる、コースや障害物の検知については、レーザーとカメラを併用した適応型視覚システムを数カ月かけて開発した。まず、周囲にレーザーを照射し、その反射にかかる時間から周辺環境までの距離を割り出す。これだけだと25m先までしか把握できないので、レーザーで検知した周辺の地形情報を、カメラから入力した映像に重ね合わせ、そこから道と道以外の部分を区別し、動的に学習していくアルゴリズムを編み出した。これにより200m先までの路面状況を把握できるようになった。
こういった試行錯誤の結果、Thrun氏らのチームは見事に優勝した。ちなみに、この回にはほかに4台が完走に至った。
Grand Challenge 2004の概要 | Thrun氏らのチームが開発した車の内装 | ルーフ上に多数のセンサー類を搭載 |
レーザーでスキャンした周辺地形 | これをカメラから入力した映像に重ね、いくつかの解析や遠近法による調整などから「道」を検出する |
【動画】Thrun氏らの車のレースの様子。まるで人が運転しているようだが、完全なる自律走行 |
この成果を元に、Thrun氏らは、一般公道も法令を遵守しながら、安全に自律走行できる車の開発に乗り出すことになった。その成果は著しく、他の車や、車線、人間の認識などに始まり、レーザーを使った周辺の3次元モデリングの構築、周囲の車を検知しながら、車線変更しての追い越し、交差点の横断/右左折から、今では急ブレーキと急ハンドル操作で、1台分の空間にスピンターンして駐車するという離れ業までできるようになった。
映像を元にした他の車両の検出 | レーザーを使った周辺環境の走査 | それを元にした、3Dモデル |
それぞれ違う速度で走行する車両の間を縫った追い越し | 交差点の対応 | 狭い空間への駐車。こういったことがすでに実験では実現できている |
【動画】無人自律走行車でスピンターンして駐車するデモ |
Thrun氏が紹介した数々の実績の映像に、会場からは感嘆の声が上がったが、これが果たしてGTCとどう関連するのか。それは、これらの技術において、「コンピュータによる視覚解析」(Computer Vision:CV)が重要な基礎となっており、その点においてGPUが大きな威力を発揮する点にある。
GPUはこれまで、モデリングを行ない、それをレンダリング処理して、映像を作る「コンピュータグラフィックス」(CG)に用いられてきた。一方、CVはというと、カメラから入力された映像を元に、モデリングを行なう作業である。つまり、CVはCGの逆変換ということになり、GPUがうってつけのプロセッサとなるとした。
もちろん実際の処理はそんなに単純な逆変換で済むようなものではないのだが、CVでは、膨大な量の画像データを並列処理を行ない、これはまさに今GPUがCPUに対して大きなアドバンテージを誇るとして訴求している作業である。実際、Thrun氏の検証によると、CPUに比べ、GPUは8倍から40倍高速に処理できるという。
そしてThrun氏は本日付けで、CVのオープンライブラリである「OpenCV」がCUDAをサポートしたことを発表した。実際のリリースは2011年秋となるが、OpenCVのCUDAサポートにより、高解像度グラフィックスに対し、リアルタイム処理が可能になるという。
最後にThrun氏は今後の目標として、自動車を今の2倍安全にする、高速道路を2倍効率的にする、車の台数を1/2にする、燃料消費量を1/2にする、そして違法にならない形で車内でメールを打てる量を2倍にするという、「2X Challenge」に取り組んでいきたいと語り、講演を締めくくった。
Computer VisionはComputer Graphicsの逆の操作 | CVにおいてGPUはCPUよりも高速な処理が可能 |
OpenCVがCUDAをサポート | Thrun氏の掲げる2X Challenge |
(2010年 9月 27日)
[Reported by 若杉 紀彦]