ニュース
Microsoft Researchの方向性と日本人研究者の取り組み
~着るモーションキャプチャカメラや外部脳など
(2013/11/13 06:00)
Microsoftの研究所部門であるMicrosoft Reseachの研究所の1つ、「Microsoft Research Asia」(MSRA)が15周年を迎えた。その記念に開催されたプレスイベントの様子は、先日お伝えした通りだ。
イベントの後、Microsoft ReseachのトップであるPeter Lee氏(Corporate Vice President, Head of Microsoft Research)から話を聞くことができた。また、MSRAに所属する日本人研究者の話をうかがう機会もあったので、併せて紹介することにしよう。
「今、MSRはトランジスタを作ろうとしている」
--Microsotは、デバイス&サービスカンパニーとしてのリスタートをきったわけですが、それによってMicrosoft Reseachの役割というのは変わっていくのでしょうか。
Lee それは難しい質問ですが、イエスでもあり、ノーでもありますね。
まず、ノーです。つまり、MSRの使命は変わりません。これは、どんなに会社が変わっても変わりません。それどころか、研究の重要性は今以上に高まるでしょう。
そしてイエスです。研究者が持っている関心事は、デバイスに関連したものが少なくありません。イベントの展示スペースでもご覧になっていただいた通りです。彼らが生み出す新しいコンセプトは、携帯電話、センサー、タッチスクリーン、Kinectなどのデバイスに応用され、それらをクラウドを使ったサービスと連携させて、将来的にも重要なものになっていくでしょう。
今後は、研究者の数も増やしていくつもりです。とりあえず、デバイスハードウェアのカテゴリとしては、シリコン、新しいセンサーなどのデバイス、大規模な計算機を使ったクラウドコンピューティングなどがありますが、どの研究者がどんなデバイスに取り組んでいるか、どんな研究をしているかといった構成比は今すぐには分からない状況です。なぜなら、私は、研究者に対して、これをしなさいということは言わないからです。世界を見なさい、何が大事なことなのか、何が新しいのかを見極めなさいと、それしか言わないんです。ですから彼らはとにかく自由です。
エンジニアは大きな野望を持っています。社会の問題にも取り組みますし、もちろん、Microsoftが成功するための役に立ちたいとも思っています。彼らの前には幾多の問題が立ちはだかりますが、彼らはその問題に対応するだけのやる気を持っています。例えば、クラウドに対してソフトウェアの問題点が見つかったとしても、彼らなら、きっと解決することができるはずなのです。
--Microsoftは、今回のWindows 8.1リリースにあたり、前バージョンから1年以内のラピッドリリースを強調しています。こうしたスピード感はMSRの仕事に影響を与えないでしょうか。
Lee もちろんラピッドリリースの影響はとても大きいですね。今まで2~3年の間隔だったWindowsのリリースが、今後、1年ごとになるかもしれません。それに伴って、リサーチに求められるスピードも速くなっていくでしょう。
でも、私は、将来を見据え、情報技術の将来をどうあるべきかをいつも考えています。そして、それを研究者に期待するのです。
--それでも、こうした状況の変化は、研究者に研究を急がせることにはなりませんか。
Lee その通りです。ただ、私は彼らに対して常に先を見るようにいっています。
例えば、MSRには、スピーチプロセスに一生懸命だった2人の研究者がいました。その後、大学と協業をしたのですが、それまでのスピーチ処理とは違う方向で考えることを成功させ、別の技術を考える方向に至りました。2008年のことですが、誰も実践的ではないと思っていた方法論を確立し、先を見据えて考えた結果、2010年には、それまでのスピーチ処理よりDeep Learningの方がいいということがわかり、今は、業界全体がそちらの方向に進むようになりました。
PowerMapもそうです。あの構想は、何年も前に始めたものです。世界中の全ての望遠鏡データを取り込もうというもので、全部のデータを1つのシステムで見よういうものでした。これもすごく先を見て始めた研究です。
Kinectもそうです。スタートは実に1996年まで遡ります。当時、たくさんのノイズの中で2人の人間が会話するときに、なぜ、会話が成立するのかを考えることが研究の発端でした。それが実って、XboxのKinectは、TVが大きな音で鳴っていて、とてもうるさくても話をすると処理してくれるようになったのです。
このように、ずっと先の未来を見つめて研究を進めることが、さまざまな実りとなっていくのです。
--MSRの役割は研究なのでしょうか、それとも発明なのでしょうか。
Lee 研究と発明は違うものですよね。研究は問題を解決すること、そして、理解を深めることです。それに対して発明はいろんなアイディアを合成し、新しい形を創り出すものです。研究も発明も両方大事なものですね。MSRはいいバランスで両方をサポートしてきました。これからも同様です。両方必要で、助け合っていくものじゃないでしょうか。
例えば、スピーチ・トゥ・スピーチによる翻訳システムは、どう理解させるか、どう翻訳するか、どうしゃべるかという研究があり、発明はそれらを組み合わせるというわけです。
ある意味では開発とも違うものでしょうね。発明は驚きと創造を提供します。開発はアイディアを洗練し、多くの人に便利だと思ってもらえるものを創り出します。ちょっと違いますよね。
実際には、MSRが研究、発明して、Microsoft本体が開発をするという役割分担かもしれません。もちろん協業するということもあります。MSRに研究者がいて、Microsoft本体にプロダクトチームがいて助け合うことで、魔法のようなことが起こるわけです。
Kinectはまさにその好例です。Kinectは、Alex Kipmanという人物が生み出したプロジェクトです。彼は当時、研究所に対してある問題の解決を要求していました。骨格をリアルタイムでとらえることができないかという要求をしていたのです。でも、研究者はその要求を断り続けていました。でも、彼はあきらめずに、研究所に要求を続け、最終的に説得して、Kinectのセンサーができあがったのです。そして魔法が現実のものになりました。
--トップの立場として今後のMSRがこう変わる、ここは変わらないという点について教えてください。
Lee 見なければならない新製品はたくさんあります。怠らないで継続的に続けなければならないこともたくさんあります。MSRにとっては変化はより早く起こるので、これをきちんとやっていくのは大変です。
古い組織では、それぞれの部署が、仕事の仕方、スタイルを持っていました。でも、今は、「One Microsoft」の時代です。全てのプロダクトや戦略について、MSRがすぐにそれに関われる組織になったのです。かつてのように、製品部門が間に立って、壁になるということもありません。プロジェクトがキックオフする初日から迅速に関わりができるようになりました。これは非常にエキサイティングなことではないでしょうか。でも、研究者に対してそれを徹底することはしますが、最初に申し上げたように、やはり長期的な展望は忘れてはならないと思います。
--5年後のMSRはどうなっていればいいと思われますか。
Lee 実践的にはMSRがMicrosoftをよりスマートな会社にして成長することに貢献することを最優先します。
その一方で、5年後というとMSRは22年目を迎えます。これまでの世界を見渡したときに、たった22年しか経っていない研究所はとても若いといえます。優れた研究所は、25年は経たないと出てこない。ベル研究所もそうでした。IBM研究所もそうでした。おそらく、今、MSRは、まさにトランジスタを作ろうとしている段階にあるんじゃないでしょうか。そして、5年後には、それが実るはずです。
日本人研究者インタビュー
MSRAはインターンを含めて数多くの日本人研究者を擁する。日本語という言語が、MSRAの研究過程において考慮されるということでもあり、われわれ日本人が未来をつかみ取るためにも心強い限りだ。ここでは、現地で話をきくことができた3人の日本人研究者を紹介しよう。
HCIを究める矢谷浩司氏
矢谷浩司氏の専門はHCI(Human Computer Interaction)で、コンピュータとヒトの関わりの研究を続けている。現在は、プレゼンテーションツールのUXを研究しているという。
この日は、「HyperSlides」と呼ばれるデモを見せていただいた。一般的なプレゼンテーションスライドが線形につながっているのに対して、スライド上の上下左右の位置をタップ、クリックした時に、飛び先が変わるというものだ。現時点では、これをちょっとしたスクリプトで実現しているが、将来的にはGUIで指定できるようになるという。
連続でに並んだスライドは、一般的に順に再生されるだけだが、それにいろんな飛び先を作ることで、1つのプレゼンテーションをいろんなタイプのものとして運用できる。今後は、作成過程でのサジェスチョンのような機能も取り組んでいきたいそうだ。
また、もう1つ併行して進めている研究として、「SidePoint」がある。こちらは、文書の作成中などに、関連情報を見つけるための方法論を提案するものだ。情報の質とそれを見つけるまでにかかる時間は一般的にトレードオフの関係にある。さらに、情報の検索には、2つのニーズがあり、1つは、知りたいことを調べることだが、もう1つ、隠れたニーズとして、自分では知りたいと思っていないが、知ったときに有益になる情報もあるという。この研究は、それを提示しようするものだ。
これは、現代版の「直子の代筆」的だという印象を持った。ユーザーがキーワードを入れるだけで、短い文章で文書のサイドに関連情報が提示され、それによって、本人が気づいていなかったニーズを満たす。そこでは、同じような情報が列挙されるのではなく、情報の種類をばらすことで、検索結果を多様化することも考慮されているという。
新しいモーションキャプチャの方法論をめざす白鳥貴亮氏
白鳥貴亮氏はディズニー研究所やCMU(カーネギー・メロン大学)を経て、MSRAに入所した人物だ。企業としてみればMSRは相当特殊な所だとしながら、研究者が勝手気ままに研究できる点で、自分の興味のあることがやりやすいところであるという。既存の有名なアプリや会社を倒せるようなものができるかもしれないという期待と、世界を変えられるかもしれないという予感にやりがいを感じるという。
現在、白鳥氏が研究しているのは、モーションキャプチャだ。これまでのモーションキャプチャは、カメラが外にあって、動くものを映していた。これは設備も大変なら、用意のためのキャリブレーションも大変だ。そこでそれを逆にしてみた。カメラを体につけて外側を映してみたのだ。
カメラの数は全部で20個、その映像から3次元空間を計算する。そして、アウトドアでのモーションキャプチャが可能になった。
ディズニー出身ということもあり、アニメーションに関する研究は彼の専門でもある。モーションを説得力あるものにするために、Kinectでも使われている技術を応用し、密度の高い3次元情報を入手することに成功したという。
内部脳と外部脳の効率をイコールにしようとする福本雅朗氏
福本雅朗氏は横須賀にある某携帯電話会社出身で、Accelerated Humanを研究している。すなわち、ネットワーク上の情報や処理能力を外部脳として、あたかも自分自身の知識や思考のように内部脳のように使いながら生活できることが、21世紀の新人類を実現する為に必要となると考え、そのための、超高速インタフェース技術を考えて行こうとしているのだ。
福本氏は50歳になる直前に転職しMSRAにやってきた。1回きりの人生、やりたいことをやりたかったという。これまでの経歴の中で、やれること、やれないことが分かってきてはいるが、もう一暴れしたかった福本氏。大学に行くことも考えたが、教育者になるよりは研究者でいたいと考え、MSRAを選んだという。
福本氏が北京を選んだのはなぜか。そこが、秋葉原を斜め上に超えているからだという。それは、北京には中関村があるからだ。いわば、北京の秋葉原ともうべきこの街には試作に使えるいろんなものがあるという。ビルの全フロアが小間で埋まり、秋葉原ですらないような専門店、部品ショップがたくさんある。福本氏は、大阪の日本橋や東京の秋葉原まで1時間以内に行ける環境にずっといたこともあり、部品屋に行ってすぐに現物合わせでモノが作れることを重要視してきた。現物合わせスタイルは、日本の物作りの原点であり、秋月、若松、共立らがなくなったら、日本のGDPが下がるだろうとまで言い切る。
そんな福本氏が今、熱中しているのが、ウェアラブルの世界だ。デバイスは使うために数秒かかる。ポケットの中などから取りだしている限り、今より進化させるのはもう無理だと福本氏。でも、インターフェイスはあまり小さくすることはできない。腕時計型電卓が使いものにならなかったことを考えれば、使いやすい大きさというものがあることが分かる。ただし、常時装用のためのものは、がんばれば身につけられるというものではダメだという。だから、ウェアラブルと言われているうちはダメなんだそうだ。
朝から晩まで情報とコンタクトすることをアクセラレートし、これまで10秒かかったことを1秒で済ませるようにする。そうすれば時間が浮いて他のことができる。最終的には、内部脳と外部脳の効率をイコールにすることを目論み、人間に対するターボボタンのようなものを考えたいという。