山田祥平のRe:config.sys

文系、理系、どっちの味方だコンピュータ




 人手では不可能なほど大量のデータを短時間でなめ尽くすコンピュータの処理能力は、学問の属する領域をも曖昧なものにしてしまった。自然言語の研究はそんな分野の1つでもあるという。今回は、そのコンピュータの力業について考えてみることにしよう。

●自然言語処理って何だ

 仕事で海外を訪れる機会は少なくないが、やはり現地では言葉に悩まされることが多い。英語だって怪しいものだが、アルファベットが読めて書けるだけまだマシだ。辞書などで調べるのが簡単だからだ。これがフランス語だったり、イタリア語だったりするととたんに不自由になるし、親和的であるはずの漢字を使う中国語も、簡体字はややこしいし、繁体字はなさけないことに漢字忘れが甚だしくて書き取れない。ハングルになるともうお手上げだ。それに、ロシア語も……と、行ったことがある国だけあげてもこの始末だ。

 各国の言葉を覚えると、訪問したときにもっと楽しく、時間を有意義に使えるのはわかっているのだが、なかなかそういうやる気が出てこない。

 ならば、一切の言葉を覚えないで、すべてスマートフォンの機能で、クラウドを使ってコミュニケーションのヘルプにできないかとチャレンジしようとしているのだが、日本のようにいつでもどこでも高速インターネットが使えるわけでもなく、トイレがどこかを聞くために30秒以上かかるなど、なさけない体験が続いている。

 各社、いろんな試みをしているようだが、まるで通訳を連れ歩いているような感じで異国を歩き回れるようになるまでは、もうちょっと時間がかかりそうではある。でも、そんなに長い時間はかからないだろうとたかをくくっているのだが、実際にはどうなのか。

 さて、先日、中国・北京にあるMicrosoftのコンピュータサイエンス研究所、Microsoft Reseach Asia(MSRA)を訪ねてきた。この研究所は、全世界に7カ所ある研究所の1つで、規模的には本拠地であるレドモンドに次ぐものだ。

 ここで自然言語処理のエキスパートに会ってきた。工学博士である辻井潤一氏は計算言語学の分野で日本の第一人者であり、東京大学教授、マンチェスター大学教授を早期退職し、昨年、MSRAに研究者として就任した。

 さあ、この「計算言語学」というジャンルがもうわからない。自然言語学とも異なるアプローチをする学問のようだ。辻井氏に、計算言語学は理系なのか文系なのかという愚かしい疑問をぶつけてみたところ、笑いながら丁寧に説明をしてもらえた。

 コンピュータ的アプローチによる自然言語学は、かつては純粋な言語学に近い位置にあった学問なのだという。その構造を解明できれば計算機プログラムになり、プログラムを作って計算機で動かすと、言葉の働きを理解する助けになる。だから、文系と理系が助け合って支えてきた時期が長かったのだそうだ。

 ところが、80年代の終わり頃に流れが変わる。コンピュータの処理能力が向上し、大量のデータを簡単に扱えるようになったため、特に人間が理論を作り、それをプログラムにしなくても、データの解析でルールを導き出せる可能性が出てきたからだ。そのアプローチは、かつてのIBMが提案し、IBMの中でもさまざまな論議を呼んだそうだが、最終的にIBMの中では、データ処理による学問として位置づけられるようになったという。

 コンピュータと言語といえば、すぐに思いつくのが機械翻訳だが、MSRAの自然言語グループでも、この分野の研究は多岐にわたって行なわれている。

 辻井氏によると、翻訳は、それをまじめに理解しようとしてやっていると、問題は複雑になるばかりなんだそうだ。たとえば「Heavy Rain」という言葉を、忠実に訳すと「重い雨」になるわけだが、文脈中に普通に出てくる場合は「激しい雨」とすればいい。これを「土砂降り」としたほうがいいんじゃないか、とかなんとかやっているとキリがなくなってしまうわけだ。

 ただ、これからの言語処理は、もう1回、変革のときを迎えるかもしれないと辻井氏はいう。人間は言葉を使うその背景に知識があって、その知識があるおかげで言葉をうまく使える。だが、その知識も計算機で作れる可能性が出てきたのだ。つまり、膨大なデータで知識を作るわけだが、それをMicrosoftやGoogleはやっている。人間にかなり近い何かを計算機の中に作り、それを操作することができれば、言葉を意味のレベルまで持ち上げて、違う言葉を使って同じ意味の言葉を探し出せるかもしれないという。統計的に言葉を分析するだけはなく、知識も膨大な量を扱えるようになったからこそのアプローチだ。これによって意味を中核においたような言葉の処理が行なえるにようになりつつある。

 画像にしてもデータマイニングにしても、人間が何らかの位置づけを与えている。その位置づけを何かにマッピングすることができるのではないかというのが辻井氏の考え方だ。もちろんそのためには、ものすごい量の計算機とデータが必要になる。今の大学の現場では、そのスケールでの作業を可能にする環境を用意するのは難しいが、MicrosoftやGoogleはそれを持っているという。辻井氏が大学を早期退職してまでMSRAにやってきた理由は、この部分が大きいのだそうだ。

●マイニングによる翻訳知識の抽出

 辻井氏がいうように、ビッグデータを扱うことで、言語を処理する方法論が変われば、翻訳の世界は大きな変化が訪れるかもしれない。

 MSRAの日本人研究者の1人である荒瀬由紀氏は、大阪大学で情報科学の博士号を取得、インターンとしてレドモンドでMSRを体験、その終了後、すぐに北京に研究者として就任した人物だ。自然言語処理グループの中で、膨大な翻訳知識をクリーニングして品質の高いものだけを抽出するデータマイニングの研究を続けている。

 彼女の研究は、すでに中国語-英語の間でサービスとして提供されていて、中国のBingではなくてはならない機能になっている。ベースになっているのはEngKooと呼ばれる中国人のための英語ラーニングシステムだ。

 冒頭に書いたように中国語のノン・ネイティブには、言葉を調べようにも漢字を書けない。英語のノン・ネイティブには単語のスペルがわからない。ならば、スピーチテクノロジを使って、適当な発音を綴れば、それで正しいスペルを提案するなど、発音から検索できるようにする仕組みも用意されている。ただ、実際に使ってみると、漢字表記をきちんと発音できなければ役に立たない。でも、かなりいいかげんなスペルでも正しい英語の綴りを提案してくれる。

●翻訳の世界を変えるのはカネなのか

 意味を掴みたい外国語が、電子化されているものであれば、それはなんとかなる。コピーした結果をどこかの翻訳サイトに貼り付けて、結果がいぶかしければ、他のサイトでも試してみればいい。でも、異国での生活が、すべて電子化されているわけではない。街角の案内やサイネージ、新聞や雑誌などの印刷媒体、そして、目の前の人の口から発せられる言葉。さまざまなシチュエーションに、さまざまなスタイルの「コトバ」があふれている。

 その「コトバ」を、機械に処理させるにはどうすればいいのか。言語処理とは異なるところで、入出力のためのインターフェイスが重要な役割を担うことになるだろう。そこは1つ、Kinectを完成させたMSRAのお家芸ともいえるナチュラル・ユーザー・インターフェイスのチームで、アッと驚くものを作ってほしい。看板をカメラで撮影して、それをOCR処理したり、リアルタイムでAR的処理の中で翻訳するようなアプリもたくさんあって、いろいろ試してみたが、本当の実用までにはちょっと遠いように思っている。ぜひ、彼らの仕事に期待したい。

 荒瀬氏のシステムは、日本語-英語間対応も間近いそうだ。できればぜひ、日本語-中国語にも対応してほしい。そして、そのときには、書けない読めないしゃべれないという三重苦を背負った他言語知識ゼロのユーザーのことも考慮したものにしてほしいと切に願う。そういう層が言葉を覚える手助けになる方法も必ずあるはずだ。

 いずれにしても、MicrosoftやGoogleが本気を出せば翻訳の世界さえ大きく変わってしまうということを聞いて、ちょっとしたショックを受けた。彼らには、半端ではなく大規模なデータを扱うだけの能力と財力があり、実際にきちんとヒト、カネ、モノをつぎ込んでいるからだ。MSRAでは、よほどのことがない限り、研究者が要求した研究予算が却下されることはないともいう。日本の研究者も負けないで欲しいという言葉がむなしく響いてしまうのは、ちょっと悲しい。