山田祥平のRe:config.sys

ほしい→キボンヌ




 Googleが日本語入力システムを公開した。ベータ版ではあるが、十分に安定して使えるようだ。試しに使ってみて、その辞書の語彙に驚く。そこには、インターネットの今がギッシリと詰まっているからだ。

●確定履歴はプライバシー

 愛用の万年筆を人に貸すのはよくないと教えられた。万年筆のペン先はやわらかいので、人に使わせると、すぐにクセがついてしまい、自分が使いづらくなってしまうからだというのだ。今の世の中、万年筆を日常的に使っている人は少ないと思うが、その代わりとして思いつくのが、さまざまなデバイスで稼働している日本語入力システムだ。

 携帯電話では予測変換はおなじみだし、Wiindows上のIMEでも、ATOKなどの連想変換、省入力、推測変換などは使いようによってはとても便利だ。たとえば、電車の中で立ったままメールを書いているときなどは、これらの機能のお世話になることが多い。片手でPCを支え、もう片方の手で、ポツポツと雨だれ入力をするため、両手でタッチタイプをするときと違って入力の効率はガタ落ちになる。でも、予測変換を利用すれば、ある程度はスピードアップが図れる。

 Google日本語入力には、サジェスト機能が用意され、予測変換に近いことができる。数文字入力すれば自動的に候補が表示されるし、タブキーを使って強制的に予測させることもできる。その候補を見て笑ってしまうのは、どこかで見たような単語、フレーズが満載されていることだ。人々が安易にこの候補を採用するようになれば、世の中の文章は、どんどん画一化がすすむかもしれない。「だ、である」で文章を書こうと思っていても、候補が「です、ます」になっていたら、ついそれを選んでしまうのが人情だ。「だいじょ」くらいまで入れて「大丈夫だよ」と出れば、「大丈夫です」と書くつもりだった気持ちがグラつき、つい、そちらを選んでしまう。もしかしたら「ほしい」が「キボンヌ」と変換されることだってあるかもしれない。

 この辞書は、力業で作られたものだという印象を受ける。つまり、インターネットに蓄積された文章をかき集め、巧みなアルゴリズムで分析し、膨大なコンピュータリソースをつぎ込み、計算で作り上げた辞書だ。そんなプロセスで作られた辞書は、確かに便利かもしれないが、いろいろな問題を人に突きつけることになるだろう。

●その話はガイシュツですが

 予測変換が的確に機能するための重要な材料は、変換と確定の履歴だ。過去において、そのユーザーが入力し、変換して確定した結果がうまく反映されれば、その候補はより優れたものになるだろう。だから、IMEは万年筆と同様に、人に使わせると、IMEがおかしな学習をしてしまい、変換候補にノイズが混じるようになる。これは、ペン先に人のクセがつくのと同じだ。それに、過去にどんな文章を書いたかのプライバシーのことも考えなければならない。

 Google IMEのサジェスト機能は、それを初めて使うユーザーにとっても、まっさらなイメージはない。すでに誰かが、しかも、不特定多数の誰かが使いまくった手垢で汚れた印象を受ける。そして、それがインターネットだ。インターネットの先住者たちの叡智の集大成でもある。

 そして、その辞書を使うと、自分ではこんな文章は絶対に書かないと思う文章を、つい書いてしまうのだ。もちろん、Google IMEの候補を無視しながら、丹念に変換していけばいいのだが、そうそう人間は強くない。このままいけば、「いんてる」と書いただけで、インターネットからインテル関連の文章を探し出してきて、何気なく候補に挙げるようになるかもしれない。検索ボックスにキーワードを入れて、検索ボタンをクリックする行為は、インターネットの時代、ごく当たり前に行われていることだが、それと類似の行為が、変換キーを叩くたびに行なわれるようになったらどうだろう。ちょっと怖い話だ。

 たぶん、Googleは、そんなことはしないと思う。でも、その気になれば、いつでもできるんだという警鐘に近いようなものを個人的には感じる。

●バイオリンの音はこのサンプリング音源で決まり

 試みとしては、すごくおもしろいし、まさにGoogleらしいプロジェクトだともいえる。でも、そこには、軒先の洗濯物まで克明に記録してしまったGoogle Earthと同じようなにおいを感じてしまうのだ。デフォルト辞書の語彙、変換の確定履歴だけではなく、Gmailに溜めこまれた膨大な量のメールメッセージ、あるいは、そのユーザーが訪問したブラウザの履歴、そして、そこに置かれた文章に使われていたフレーズなどなど、サジェスト機能を賢くするためのデータはたくさんある。

 いやなら機能をオフにすればいいといわれれば、それまでだ。でも、文章を書くという行為に対して、そこまでのこだわりを持っている層がどのくらいいるのか。

 そういえば、最近になって、Google翻訳がアップデートされて、入力した文章をリアルタイムで他国語に翻訳するようになっている。これもまた、IMEの一種といえば一種だ。他国語を直接書けないからこうしたサービスを利用するのであって、完成した訳文を読んで、それが優れた訳なのかどうかを判断するのはなかなか難しい。でも、他国語のメールを書くときなどは、つい、便利で使ってしまう。逆に他国語で書かれた文章を翻訳させたときに、元の文章が持っていたニュアンスがきちんと反映されているかどうかを判断するのも簡単なことではない。

 こうした便利が統合化されて、キーボードを叩いて文章を入力するという行為の大部分を計算とデータが支配するようになれば、それが文化に与える影響は少なからずあるだろう。もちろん、それも文化ではないかという論調もある。言葉の誤用も、その一部は既成事実化され正しいとされる風潮もあるくらいだ。でも、言葉の乱れは文化かもしれないが、言葉の画一化はどうなんだろう。ある種の意図がそこに介在すれば危険なことになる。

 その先に待っているのはいったい何なのか。今の時点では、漠然としていて整理がつかないのだが、10年先、20年先のことを考えると、何かとんでもない状況につながるようにも思う。たかがIMEだがPCを使うために欠かせないユーティリティでもある。道理がわかっている大人が使うのはともかく、初めてコンピュータを使う世代には、ちょっと使ってほしくないようにも感じている。

 言葉をつむぐことが、量子化という処理に置き換えられる日がくるのだろうか。すべての音楽がサンプリングを多用したヒップ・ホップになってはつまらないとは思わないか。すべての歌声がボーカロイドでいいのか。かくして、妄想はどんどん高まっていくのだ。久しぶりにコンピュータって、そしてインターネットってすごいけれど怖いと思った。