山田祥平のRe:config.sys

反転コマンド行ってQ

 新しく登場するデバイスというのは、なぜ、こうも、それ単体で世界観を完結させようとしてしまうのか。自律型であるためには協調も必要だ。社会の中で自然なかたちで人間と共存するために、できることはたくさんある。

表裏一体の簡単と乱暴

 Googleが終了にしたプロジェクトの1つにNexus Qがある(「【特別編】Nexus Qが示す次世代の共有」参照)。もう、5年前になる。その流れはたぶんChromecastに繋がっている。今、必要なのはあの考え方なんじゃないか。つまり、Androidデバイスとして、初めてマルチユーザーを想定していた点だ。

 Qが優れていた点の1つは特定のアカウントをセットする必要がないところだった。ユーザーはスマートフォンを通してQに一時的な権限を与え、Qはその権限を使ってインターネットからコンテンツを取得して再生する。

 委譲はあくまでも一時的なものなので、他者が自分のプライバシーを侵すことを心配しなくていい。Chromecastで家族や仲間が入れ替わり立ち替わり、次の再生動画をキューに追加していくことができるのは、こうした機能があるからだ。

 AmazonのAlexaなど、家庭内のデバイスがユーザーの音声によるコマンドを聴いて、なんらかのアクションを起こす音声アシスタントの仕組みが流行りつつあるが、そこには家庭内という半分パブリックで、半分プライベートな空間におけるマルチユーザーの想定が甘すぎるように思う。

 限定された空間であるとはいえ、そこにいる誰でもが使えるデバイスに、さまざま権限を与えてしまえるというのは危険だ。Amazonのdashにしたって同じ印象を持っている。簡単と乱暴は表裏一体だ。

 今日の天気を尋ねて答えてくれるくらいなら、誰の権限だってかまわないだろう。でも、とっておきのコンテンツはどうだろう。今日の予定はどうか。届いたばかりのSNSメッセージやメールメッセージはどうなのか。それらを家族のいるかもしれない空間で読み上げてくれることをヨシとしてしまっていいのか。子どもが勝手にAmazonに高額な商品を注文できてしまってもいいのかどうか。

 AIとエンドユーザーの間を取り持つデジタルアシスタントは、長い間パーソナルデジタルアシスタントとしてとらえられてきた。デジタルアシスタントが稼働するデバイスは、常に、エンドユーザー1人だけの管理下にあったわけで、だからこその「パーソナル」だった。

 ところが、昨今のトレンドは、家庭という空間において、そこにいるであろう個人を曖昧なものとして扱おうとしている。その空間に発生する音声を常時ウォッチし、なんらかのコマンドを認識すれば、その言うことを聞くという流れだ。その音声が誰によって発せられたのかは問わない。なぜなら、そのデバイスそのものが1つのアカウントを委譲されているからだ。

 特定の声だけを認識するとか、誰の声でも認識するが、その声ごとに異なる権限でアクションを起こすといったことは技術的には可能だ。

 実際、AndroidのGoogle Nowも、iOSのSiriも最初にトレーニングして声を記憶させる。だから、声に応じて利用するアカウントを変更するなり、本人だけが持っているはずの認証済みデバイス、例えば必ず近くにあるはずのスマートフォンにルーティングして、そちらに仕事をさせることだってできるはず。

 よく分からないものはルートに戻すというのは、安易な方法とは思えない。インターネットのDNSだってそれで成り立っている。スマートフォンはパーソナルなデバイスとして保証されているからそれでいい。

 こうしたデバイス協調が、これからの課題なのではないだろうか。家族アカウントのようなものを取得して、それを使って仕事をさせるという手もあるが、それではパーソナルな情報に関するアクセスができなくなってしまう。

 このあたりのことを解決できない限り、20年ほど前に、一家に1台のデバイスとしてPCが各家庭に入ってきてインターネットに繋がったころと似たようなことが起こってしまうだろう。家族で1つのメールアドレスを共有していた家庭は少なくないと思う。

 だが、今はそういう時代ではない。パーソナルな情報を扱うデバイスは、物理的にもパーソナルな存在でなければならないし、それができないなら、パーソナルを保証する何かを実装すべきだ。

AIとそのエージェントは異なる「私」を認識できるか

 近頃のトレンドワードになって盛り上がっているAIについても同様の問題が潜在している。やはり大事なのは、そのAIとエンドユーザーの間に介在するエージェントだ。そのエージェントにどのような権限を委譲するかで、得られるものも変わってくる。

 「ここだけの話」とか「きみだから正直に言うのだけど」といったことが、ちゃんと通じるエージェントが必要だ。例え、万民に愛想を振りまく社交ロボットであっても、対峙する相手によって異なる反応をするようでなければならないし、そのためには権限の委譲と互いの信頼関係が必要だ。そのあたりの概念を放置する限り、AIに未来はないだろう。

 その一方で、相手がAIやエージェントだったとしても、それに対して権限を委譲してしまうかどうかも人間側の判断が問われる。

 メールやメッセージなどの、きわめてセンシティブな情報にアクセスさせるか、そして、そのために、サービスパスワードを教えてしまうのか。でも、何もかも開けっぴろげにしなければ有用な情報は得られないし、自分に代わって働いてもくれない。

 気になるのは、1台のデバイスとしてのエージェントに、家族がそれぞれの権限を委譲することをよしとするかどうかだ。生理的には気持ちが悪い。

 例えば、WindowsはマルチユーザーOSとして、複数のユーザーアカウントを設定できるが、全員が管理者権限を持っていれば他人の情報にもアクセスできるし、できないにしても、1台のデバイスに家族それぞれの個人情報を置くことを嫌がる家族もいるだろう。

 それは当たり前の感情だ。例え管理者であっても他ユーザーの情報にはアクセスできないことをOSそのものが保証しない限り、なんらかの不信感はつきまとう。

 つまり、デバイスは所有者と使用者を確実に区別できるような仕組みを取り入れなければならないはずだ。スーパーユーザーの存在は、かえってうっとおしく感じられる。ウイルスと同様に管理者の存在も脅威だ。その権限でできることはシステム方面のことだけであるべきだ。

 つまり、今、Webで提供されている各サービスが、ユーザーごとの個人情報にアクセスできない、そしてしないことを保証するのと同様なことが、家庭で使われるようなデバイスでも保証されなければ、一般家庭における人間とキカイの共存は難しい。

 そういう意味では、誰が決めたか、スマートフォンと人間の距離感というのは絶妙にできているようにも感じる。