森山和道の「ヒトと機械の境界面」

21世紀の高価なオモチャか、世界を変える第一歩か

〜ソフトバンク、ロボット「Pepper」を発表。20万円で販売へ

ソフトバンクのパーソナルロボット「Pepper(ペッパー)」

「Pepper(ペッパー)」登場

 驚いた。6月5日にソフトバンクグループが発表した「Pepper(ペッパー)」のことである。本誌でも既報のとおり、身長120cm、重量28kg、20自由度のロボットをおよそ20万円程度で販売するという。20万円だ。単に開発しただけではなく量産して2015年2月に発売する、しかも一般向けに。おまけにこの低価格。発売と価格が発表されたとき、記者席はざわめき、多数の関係者が集まっていた会場内にどよめきが波立つのを感じた。筆者はソフトバンクのロボット研究開発が本気だったことをようやく理解した。

 記者会見の前日から、ロボットに関する発表を行なうという話は聞きつけていた。会見当日の朝には日本経済新聞やロイターが、同社が子会社化しているALDEBARAN Robotics(アルデバラン・ロボティクス)が開発した案内ロボットを発表すると報じた。だが筆者は、会見ではせいぜいアルデバラン・ロボティクスが2008年から販売している研究用ヒューマノイド「NAO(ナオ)」や、最近になって実物が公開された等身大ロボットの「Romeo(ロメオ)」が登場するくらいだろうと思い込んでいた。

 「NAO」は高さ58cmの小型ロボットで展示会にもよく出展されており、ロボットに興味関心がある人ならばお馴染みのロボットである(発売直後の2009年当時の記事はこちら)。当初は日本円で200万円程度だったが、最近のモデル(NAO next gen)は100万円程度に値下げされており、日本の大学のロボット研究室でもよく使われている。

【動画】アルデバラン・ロボティクスの「NAO Next Gen」(2011年12月に発表されたモデル)

 一方「Romeo」は産学官共同プロジェクトで開発されたロボットで、まだ日本ではお披露目されたことがない。プロジェクト「Romeo」についてはこちらを参照してほしい。

【動画】アルデバラン・ロボティクスのRomeo。プロジェクトは2009年から行なわれていたが、実物は今年お披露目されたばかり

 「Romeo」はまだろくに動くこともできないようだが(2脚の等身大ロボットの全身制御がいかに難しいか、逆によく分かると思う)、これが見られるなら嬉しいな、くらいの気持ちで会見に出かけた。だが舞台上のせり上がりから出て来たのは2年間かけてソフトバンクグループが開発していた新しいロボット、「Pepper」だった。せり上がりから出て来たとき、思わず呆気に取られた。

【動画】Pepper登場シーン。せり上がりから壇上に登場し、孫正義氏から「ハート」をもらう

ソフトバンクとアルデバラン・ロボティクス

 孫正義氏がロボットに興味関心を持っているらしい−−。そんな噂はしばらく前からあった。当時はただの噂で実状を知る余地もなかったが、ソフトバンクは2010年6月に「ソフトバンク 新30年ビジョン」を発表した。孫氏はこの中で「ロボット」や「脳型コンピューター」について語っている。改めてみると「コンピューターに感情をもたせる」という考えも既に述べられており、感情(表情や声)を読むロボットとして発表された「Pepper」は、これに準じたものだったことが分かる。

【動画】ソフトバンク 新30年ビジョン(2010年6月)

 2012年3月末にはソフトバンクグループがフランスのロボットベンチャー、アルデバラン・ロボティクスに1億ドルを出資し、株式の8割を取得して実質的に子会社化したという話が「フィナンシャル・タイムズ」から報じられた。当時の「IEEE Spectrum」による記事には「フィナンシャル・タイムズの記事には一部誤りがあると広報がこたえた」とあるが、しかしながら、その後の各メディアの取材にはどちらの会社も具体的には答えず、公式リリースもなかった。2012年のニュースの後も、アルデバランは以前と見た目上、特に変わらないビジネスを行なっていた。だが密かに2年間、ソフトバンクと「Pepper」を開発していたわけだ。

 ちなみにアルデバランにはその前年の2011年6月に、Intelも1,300万ドルの投資を行なっている(Intel Capitalからの当時の発表資料)。今にして思えば、これがむしろソフトバンクに買収を決断させたのかもしれない。さらに高値になってしまう前に、というわけだ。なおIntelは「21st Century Robot」という電子書籍を無料で公開し、パーソナルロボット「Jimmy」の構想を発表している。5月28日にはCEOのブライアン・クルザニッチ氏がロボットベンチャー会社Trossen
Roboticsが開発した研究バージョンのJimmyと一緒に登場して紹介、ニュースになった。

【動画】インテルとトロッセンロボティクスによる「Jimmy」。マザーボードにIntelのNUCを使っている
アルデバラン・ロボティクスCEOのブルーノ・メゾニエ氏とソフトバンク孫正義氏

 話をアルデバラン・ロボティクスに戻そう。同社が金融系の仕事をしていたブルーノ・メゾニエ(Bruno Maisonnier)CEOによって設立されたのは2005年。その名前が広く知られるようになったのは2007年のことである。ロボットによるサッカー「ロボカップ」という競技がある。その中に、ハードウェア自体は共通のプラットフォームを使うことでソフトウェアの性能を競い合うタイプの競技がある。当時は「4足歩行リーグ」にソニーの犬型ロボット「AIBO」が使われていたのだが、2006年1月にソニーはロボットから完全撤退を発表した。「AIBO」の代わりとなるロボットとして2007年8月に選ばれたのが同社の「NAO」だったのだ(関連記事)。

NAO

 4脚から2足のヒューマノイドになるのも驚きではあったが、何より、当時「NAO」はまだ発売されていなかった。一方、日本には安定して歩行やキックができるロボットキットが既に多数あった。なぜ発売もされていないロボットが選ばれてしまったのかと業界の一部では嘆息もあがった。だがロボカップ委員会はホビーロボットではなく、ソフトウェアによる発展可能性があるプラットフォームとして、NAOを選んだのだ。ソフトバンクがアルデバランをグループ会社としたのも、そこに目をつけたのだろう。ソフトウェアによる進歩と、その受け皿になるハードウェアを作れる会社としてのポテンシャルだ。実際に、最初に発表されたNAOはヨロヨロとした動きだったが、その後に世代を重ね、徐々に動きも改善されていった。最新モデルは第5世代の「NAO Evolution」である。

 ちなみに第4世代目の「NAO Next Gen」は7,999ドルで欧米では一般向けに市販もされている。高いと思うだろうが、これでも実はそれまでの値段の半額になったのだ。今回の「Pepper」の20万円という価格がいかに破壊的なものか分かるだろう。おそらく、アルデバラン自体にとっても破壊的な価格である。これまでのようにはNAOが売れなくなるかもしれない。NAOは現在、70カ国の教育機関や研究機関で5,000台以上が使われているという。

 ただ、NAOはあくまで研究用で、研究者が必要な機能を備えておりさまざまなバリエーションもあるが、Pepperは一般用途である。耐久性は大事にしているだろうがそれ以外は割り切って、精度はそれほど高くない安価な部品を使ったり、機能そのものをばっさり削っている可能性は高い。20万円程度という価格は部品の積み上げからは出てこない価格だろうとは思うが、まるっきり赤字でもないかもしれない、という話もロボット関係者からは聞いている。実のところどうなのかは、市販されはじめれば程なく分かるだろう。

 余談かどうかは、今後のソフトバンクグループのビジネス展開次第なのでまだ分からないのだが、ソフトバンクはもう1つ、ロボット関連で動きを見せている。2013年7月に設立されたアスラテック株式会社である。奈良先端科学技術大学院大学の学生時代にロボット制御用ソフトウェア「V-Sido」を開発、アーティストの倉田光吾郎氏と一緒に4m級の人が乗れるロボット「クラタス」を作り上げた吉崎航氏がチーフロボットクリエーターを務める会社だ。代表取締役は土橋康成氏。土橋氏はSBメディアマーケティングホールディングス株式会社、SBクリエイティブ株式会社、SBヒューマンキャピタルなどの代表取締役を兼務している。

 アスラテックはV-Sidoのようなソフトウェアを活用し広めるほか、ロボット関連のコンサルティング業務を行なうという。吉崎氏は2014年3月にV-Sidoの一部機能をマイコンに実装した「V-Sido CONNECT」という基板の試作品を発表している。製品版の発表も近いと思われる。同社の事業領域が今後どう広がっていくかには注目しておくべきだ。

Pepperと握手するソフトバンク孫正義氏
アルデバラン・ロボティクスCEO ブルーノ・メゾニエ氏
会見にはPepperを製造するフォックスコン会長兼CEOのテリー・ゴウ氏も登壇

Pepperのロボット単体の性能は?

腕とタブレットで表現力豊か

 Pepperの仕様はソフトバンクのサイトに書かれている通りだ。Pepperには両腕と5本の指のある手がついているが、これはほとんど身振り手振り用だと思ったほうがいい。手の把持力は低く、ものを握ることはほとんど不可能だ。しかしながらちゃんと指があり、タッチセンサーもある。力は弱いが、意外と頑丈な、だが安全性を重視したつくりになっている。だから人と握手できるし、それを検知することもできる。ヒューマノイドに握手したがる人は非常に多いのだ。そのへんよく分かっている仕様だと思う。

 頭部はマイクとカメラ、スピーカーである。マイクは頭部上方に4つ付けられている。Pepperの身長は120cmなので、人が上から話しかける状況が多いからだろう。音が来た方向がちゃんと分かるかのようなデモを発表会では行なっていたが、あの部分はシナリオだと思うので、実際に音源分離ができるかどうかは分からない。スピーカーは両耳部分だ。カメラは額と口の部分、つまり顔の上下にそれぞれ付けられている。子供相手をすることも考えて、人の顔の認識性能を上げているのだろう。目の部分には赤外線センサーが内蔵されている。枠の光は顔認識や音声認識結果のステイタスである。音声認識の結果はピポッという音でも示される。

 胸の10.1型タブレットは、現在のモデルでは取り外しできない。だが取り外しできるようにも考えると孫氏が会見で述べていたので、そうなる可能性は高そうだ。

魅力的な顔の造形
首の付け根や肘の内側など関節部分は軟質素材で覆われている
握手ができる手
指も柔らかい
手の甲の部分の造形も効果的
頭部上方にマイクがある

 売りの1つである音声認識の精度はそれほど高くはないが、低過ぎてまったく通じないということもない。デモでは、かなりがやがやした環境下でも「はい/いいえ」やキーとなる単語くらいはちゃんと聞き取って返事してくれていた。アルデバランは、NAO第4世代から発話から重要な単語を拾い出して認識するワードスポッティング方式を使った音声認識技術「Nuance」を実装している。そこからの積み重ねの成果が活かされているのかもしれない。

 ただそれよりもPepperの場合は、認識したあとに会話のイニシアティブをとってしまい、話題を自分でふり続ける。そうやって状況をコントロールすることで、全体として会話が成り立っているかのように演出している面が強い。あるいはもしかすると、認識途中であっても認識終了前に、どうとでも取れる発言を先にしているのかもしれない。一方、人間側が「その話題はもういいよ」と思っているような状況でもなかなかやめず、一方的に話し続けてしまうような状況も生まれてしまう。将来的には「空気を読む」との触れ込みのPepperだが、今はまだまだ無理のようなので、会話のテーマを変えさせるための物理スイッチなどが欲しいなと思った。

【動画】Pepperとのやりとりの一幕

 障害物検知のための超音波センサーなどを内蔵した脚部は3つの車輪で構成されている。車輪部分の機構を見せてもらうことはできなかったが「球のようなもの」とのことだった。段差乗り越え性能は1.5cm。絡まっていないケーブル等やじゅうたんへの段差であれば乗り越えられるが、例えばホットカーペットのコントローラーの類は無理かもしれない。ただし一般家庭においては踏まれては困るものもあり、何でも乗り越えればいいというわけではないので、微妙な高さである。

 Pepperは高さ方向に細長い形をしているので、上半身を振り回しすぎると倒れてしまうかもしれない。だが自律でバランスを取ってくれる機能があるという。限界がどの程度なのか、今回の会見ではよく分からなかった。また家庭内に置くことを考えると、腕の外部との干渉回避、要するに腕がモノにガンとぶつかってしまうことをどのように防ぐかという問題もある。おそらく壁や障害物との距離をある程度取ることで解決しているものと思われるが、あまりに安全方向に振ると日本の狭い家屋の中ではほとんど動けなくなってしまう。そこのあたりをどう解決しているのか、あるいはどう考えているのかも気になるところだ。また、赤外線を使っているとのことなので、窓際など外光があたる部分でのロバスト性も気になる。

 また子供はおおよそ信じられない行動を移動ロボットに対してすることがよくあるが(上に乗ったり、飛び蹴りしたり、体当たりしたり)、それらに対してはほとんど無力のように思われた。やんちゃなキャラクター付けのPepperではあるが、彼自身に対してはお行儀の良い行動が求められそうだ。

腰部
脚部には超音波センサーやジャイロなどを内蔵

クラウドAI

「空気を読んで学んで成長する」という

 Pepper最大の特徴であろう感情エンジンと集合知を持つという「クラウドAI」については、今のところ孫氏が講演で述べたことが全てで、それ以上の情報がない。具体的にどんなアーキテクチャの何なのか、どんな処理をするのか、何をどう保管するのか全く分からない。感情技術関連の研究・開発に特化する会社として「cocoro SB」という会社を設立、ユーザーの表情や声の認識結果をクラウドに送って共有するというが、具体的にどんな情報をどんな形式で送るのかも分からない。

 今回発表されたものの中でもっとも秘密のベールに包まれている部分だが、ユーザーにとっても最も大事な部分なので、ある程度の今後の情報開示に期待したい。

NAOqiとアプリケーション

タブレットと身振りを組み合わせたアプリケーションも

 PepperのOSはLinuxで、独自のミドルウェアとして「NAOqi-OS」が組み込まれている。NAOqiは「ナオキ」あるいは「ナオキー」と読むようだ。アプリケーションは、ユーザーが自由に作れるようにSDKも今年度内に配布される予定だ。開発者向けサイトも既に公開されている。言語はPythonまたはC++だが、プログラミングができない人であっても、簡単なアクションであればGUIベースのソフトウェアを使って作ることができる。

 NAOでも用いられている「Choregraphe」というソフトウェアがある。デモ会場では「人を認識する」というブロックに「認識した人に近づく」、「片腕を上げて握手をする」、そして「両腕を上げる」というブロック(オブジェクト)を連続して繋げ、握手してわーっと喜ぶという動作を実際にささっと作ってみせてくれた。もちろん技術者であれば、それぞれのブロックを展開してソースコードを見て直接書くこともできる。ロボットの腕などを直接動かして覚えさせるダイレクトティーチングも可能だ。

 開発されたアプリを共有する仕組みなども用意される予定だ。一般向けの「NAOStore」のようなものを考えているのだろう。ここがPepperの可能性の肝となることは誰の目にも明らかである。プラットフォームを安価にして大量に配布し、大勢の人にアプリケーションを開発してもらうモデルだ。CGM(消費者生成メディア)、ユーザー・ジェネレイテッドコンテンツ(UGC)といった流れに乗って、まったく想定外の面白いアプリケーションが出てくるかもしれない。出てこないかもしれない。分からない。

ロボットを直接動かして記録するダイレクトティーチングも可能
NAOqi-とChoregrapheを使ってGUIベースで動作をプログラムできる

使われ方はどうなるか

Pepper全身

 さてPepperはどのように使われるのだろうか。Pepperのモデルや狙いは、ソニーがAIBOや、そのあと研究開発されていたQRIOでやろうとしていたことと、おそらくよく似ている。少なくともマーケットとしては同じだ。

 だが違う点もある。1つ目は時代だ。今は家庭でも高速で常時接続のネット利用や無線LANが当たり前となり、スマートフォンも普及した。動画共有サイトのような消費者生成メディア(CGM)も誕生した。ネット接続されたスマートフォンでの音声認識利用も当たり前になっている。確かにネット環境は変わった。

 ただ一方で、ネットを通じてロボットが提供できるコンテンツには、それほどの変化がない。三菱重工が9年前の2005年に売り出した「wakamaru」というロボットの記事を改めて読んでもらえると分かるが、やれること自体は、この時代からほとんど変わっていない。ついでながら比較すると価格や処理性能は違うが、物理的サイズや重量などはPepperとよく似ていることが分かる。

 ネットに繋いで天気予報や占いをさせて音声で出力させても、最初の数回くらいは面白いかもしれないが、それ以上の価値はない。スマートフォンで十分なことをロボットでやっても仕方ないのである。例え、常時接続のネット環境を利用して新たなシナリオが知らない間にダウンロードされていても同じことだ。ここに革命が起こってほしいとみんな思っている。これまでロボットに縁がなかった人たちが想定外の使い方をすることで新たな用途が生まれる、かもしれない。

クラウド・インターネット連携機能。ニュースや天気予報、株価情報などを伝えてくれるという
パーティプロモーターとしての役割
ベビーシッター機能

 もう1つ、AIBO等と大きく違うのは、Pepperの大きさである。これにはプラス面とマイナス面の両面がある。AIBOくらいの大きさであれば、記念に買って飽きてしまったとしても、それほど邪魔にはならない。だがPepperは大きい。そこらへんを適当に動かしておくというわけにもいかないし、いらなくなったからといって廃棄するのも手間がかかりそうだ。みんなが言っているように維持費の問題も気になる。

ソフトバンクショップでロボット店員として働く

 だが、プラス面も大きい。何しろ目立つ。これだけ大きければ動く看板としても使える。大容量バッテリのおかげで、12時間も連続駆動できるのならば、ほとんどほったらかしでも問題ないはずだ。存在感も抜群である。ただ、店頭あるいは店内の看板として用いるなら動かない人形でも問題ないわけで、そこにどれだけ価値を見出せるかどうか。Pepperに対して、役に立たないという理由で否定的な見解を述べる人たちの気持ちはよく分かる。確かに役に立ちそうにはない。物理的にはお茶さえ運んできてくれないわけだから。Pepperが持って来れるのは情報だけだ。

 筆者は人に情報を提供する「コンシュルジュ・ロボット」のようなものには否定的な意見を持っていた。何度も言うがスマートフォンやタブレットで済むことをロボットでやる意味はないと思っていたからだ。今も思っている。だが今回のPepperの実物が動き回っている風景を見て、妙な説得力と魅力を感じてしまった。イベント会場等でPepperのようなロボットが数十台うろうろしながら、例えば数十カ国語で各国の人たちの相手をする−−。そんな状況が、これまでにないほど安価かつ簡単に実現できてしまうのは、ほかにはない魅力があると思う。

 「SFじゃない」というのがPepperの売り文句だが、現在の目線では非日常的な風景を(取りあえず見た目だけでも)実現できてしまうのである。Pepperというロボットにどれだけの価値を載せられるかで、体験の価値自体も変わる。価値には「機能価値」と「感性価値」があるが、どちらの機能も重要だし、両者のバランスもまた重要だ。

デモンストレーションの様子
「SFじゃない」

 物理的なロボットを見ていると、いろいろな想像が湧いてくる。今回発表されたPepperは外見は1種類だけだったが、カラーバリエーションなどは展開されるのだろうか。あるいは服などでカスタマイズをしようとする人は必ず出てくると思う。子供がいる家庭ではシールや落書きだらけになることは容易に想像出来る。ネットでは早速、マンガ「ドラゴンボール」に登場するキャラ、フリーザ風に塗られた画像が出回っていたが、そういう流れは実はソフトバンクとしてはシメシメといったところなのではなかろうか、と思う。

 中身のキャラクターについてはどうだろう。今回のデモで登場したPepperは、かなりファニーなキャラクターで、軽口もお得意の小生意気なおしゃべり屋さんである。これは今回のデモを手がけた吉本興行の子会社「株式会社よしもとロボット研究所」の演出によるものなのだろう。これを取り入れたソフトバンクもすごいと思う。

【動画】全ての自由度を使って滑らかな動きを披露した、くねくねウェーブ

 Pepperは、お馴染み「白戸家」の面々を前にしたデモの途中では、演技のオーディションを行なうと称して違うキャラを演じるといったこともやってみせた。おそらくホームパーティなどでの使用を想定した何気ないデモだったが、キャラクター設定の入れ替えは、大きな可能性をもたらしえると思う。例えば逆に、ものすごく真面目な知的なキャラクターにもなれるはずだし、例えばIBMの「ワトソン」のような高度な質疑応答システムに接続できたらどうだろう? ソフトバンクの「クラウドAI」の質次第だが、ここには本当に大きな可能性がある。

 一方、懸念される課題もいくつもある。例えば安全性。物理的な安全性は言うに及ばずだ。今回の発表では事故発生時の責任範囲や安全性に関する保険などの整備についての考え方等は述べられなかった。集合知を形成するためクラウドAIに送るというデータの安全性も課題だろう。プライバシー部分と送る部分との区別はどうつけるのかも良く分からない。プライバシーを気にする人たちは多い。

ソフトバンク「白戸家」の面々とPepper
演技のオーディションを行なうデモの一場面
記念撮影には「お父さん」も登場
【ロボットラップ】

あくまで第一歩

愛嬌をふりまくPepper

 Pepperは結構大きなロボットだ。大きいだけに家庭では邪魔になる。だから今は「いらない」、そう思っている人の中にも、実物を目の前にすると「これが20万円!?」という気分になる人は間違いなくいると思う。商品としての可能性は意外とあるのではないか。少なくともちょっと面白い製品であることは間違いない。

 「情報技術で人を幸せにしたい」と語る孫氏は、今回のロボット発表は、あくまで「第一歩」だと語った。目標は人の感情を数値化して理解し、自らの意志で自律的に動くロボットだという。目指すところは、「愛」を理解し、自分を犠牲にしても愛のために自らの意志で動くロボットだとも語った。

 ロボットにしろ感情認識にしろAIにしろ、今の技術はまだまだ未熟で、目標への道のりは遥かに遠そうに思える。孫氏も「先の長い挑戦だ」と語った。だが、ソフトバンクは一歩を踏み出した。驚きの一歩だ。踏み出してしまわないと何も動き始めない。そう考えたのだろう。

 孫氏は「歴史的転換点」になるかもしれないと言った。本当に歴史的転換点だったと振り返ることになるのか。そうだった、と未来に振り返りたい。

「ロボラップ」を披露するなどユニークなデモンストレーションだった
ブルーノ・メゾニエ氏は「ロボットは心が通い合う究極のインターフェース」だと述べた
「情報革命で人々を幸せに」