山田祥平のRe:config.sys

フツーATOKだからGoogleの参入は大歓迎


 Googleが日本語入力システムを公開した翌週、予定通り、ジャストシステムが日本語入力システムATOKの最新版を発表した。まるで、Googleは、ATOKの新版が発表されることを知っていたかのようなタイミングだ。

●脅威どころか大歓迎

 ジャストシステムはGoogle IMEを、どのようにとらえているのだろう。発表会で、これを聞かずには帰れない。その参入に脅威を感じているのか、あるいは、話にならないという判断で話題にするのもおこがましいくらいに感じているのか。四半世紀前、ATOKの前身にあたるJS-WORD上のKTISから同社の日本語入力システムを使って文章を綴ってきたぼくとしては興味津々だ。

 質疑応答の場で、ジャストシステムコンシューマ事業部企画課の佐藤洋行氏は、同社としてGoogleの参入を歓迎する旨の回答を提示した。日本語入力システムはユーザーの意志で選択できるのだということが広く知らしめられることは実に喜ばしいことだとしている。

 かつて、日本語入力の両横綱といえばATOKとVJEだった。WXといった選択肢もあった。だが、いつのまにか、ATOKの相手はWindowsに付属するMS-IMEか、Microsoft Officeに付属するOffice IMEくらいになってしまった。PCを購入したユーザーは、特に意識することなく、このどちらかを使い続けるケースが多い。新たに好みのIMEを購入するどころか、デフォルトの設定を変更したりもしないのだ。携帯電話の賢い推測変換に比べて、なぜPCの日本語入力は、こんなに気が利かないんだろうと疑問を感じながらも、素直にそのまま使い続ける。

 先週発表されたGoogleのIMEは大きな話題となり、同社のクラウド戦略、そして、OS、ブラウザなどのプロジェクト群とともに、さまざまな場所で語られた。もちろん、ATOK危機一髪的な論調も数多く目にした。そして、日本語入力システムというソフトウェアの存在感が一気に浮上した。ジャストシステムが歓迎するのはその点だ。これまで無料かそうでないかの違い程度で、文脈でしか語られなかった日本語入力システムが、辞書の語彙や推測変換の偏りといった部分にまで言及され、PCで日本語を入力するという行為のために、IMEは、どう貢献しているのかが、広く話題になったのだ。そのことは、これからのATOKにとって脅威どころか、大歓迎だというのがジャストシステムの見解だ。

●キーワードは距離感

 新しいATOKに搭載された新機能はいくつかあるが、ぼく自身が感じた今回のキーワードは「距離感」だ。具体的には、文脈の中で適切な変換候補を示すために、すでに入力された文脈で確定された変換結果を参照しながら候補を出していく。以前に確定された語と、現在変換しようとしている読みとの距離を考慮しながら、最適であると思われる候補を提示する。同じ「ほうそう」でも、ギフト、ショップとくれば「包装」だし、地デジ、ドラマ、番組とくれば「放送」となる。だったら、裁判所、法廷とくれば「法曹」かと思いきや、なぜか「放送」になる。それに「地デジ」という言葉も知らないようだ。もう少しチューンナップが欲しいところだ。

 新しいATOKにインプリメントされた「距離感」は、正しいとされる日本語との距離感をできるだけ縮めようとする振る舞いにも見て取れる。新たな機能としての「重ね言葉の指摘」もその1つだ。例えば「腹痛が痛い」、「彼にすべてを一任する」といった表現を指摘する。ただし、ベータの時点では、この機能はOFFになっていて、ユーザーが自分の意志で校正支援機能の1つとしてONにしなければならない。

 Googleの変換は多くの人が使っている表現は、例え間違っているとしても、それはそれで求められているものだというポリシーに則っているように感じるが、ATOKの変換結果はそうではない。できるだけ正しい日本語の文章になるようにナビゲートされていく。「がいしゅつ」の候補の中に「既出」は含まれるが、きちんと「きしゅつ」の誤りだと指摘する。そして、ユーザーは、そうだったのかと学習するのだ。かつては、学習といえば、辞書がユーザーの決定を覚えることをいったが、今は、ユーザーが辞書で学習する時代になった。これは、手書きの時代に国語辞書を傍らに置き、表現に迷うたびに参照していたのに似ている。ある意味では遠い時代への回帰でもある。

●ユーザーの意志として、今、入力したい日本語

 ぼくは日本語の入力において、比較的細切れ入力をする方だと思う。ATOKは、文として成立するくらいの意味のあるフレーズを入れた方が正確な変換をする傾向があるようだが、変換結果が間違っていたときの訂正手順を煩雑に感じ、つい、頻繁に変換と確定を繰り返す。何年か前にATOKが確定済みの文脈を考慮するようになったことで、ぼくのような入力方法でもATOKの能力の恩恵を得られるようになったのだが、問題は、その履歴をどこまで覚えておいてくれるかなのだが、残念ながら、それを実感として感じるシーンには遭遇してこなかった。

 普通、PCを使って日本語を入力する際に、1つの文脈にしばられることは、そんなに多くはない。それに、日本語入力システムは1つでも、それが使われるアプリケーションは多彩だ。例えば、こうしたコラムを書いている最中に、飲み会の誘いのメールがくれば、くだけた文章で返事をするかもしれないし、Twitterで軽薄なつぶやきをした後で得意先に提出する企画書作成の続きに取りかかるユーザーもいる。

 それでも、ATOKは、アプリケーションへのフォーカスやインスタンスをそれなりに認識しているようだ。

 例えば、エディタのウィンドウを2つ開き、ウィンドウ間をいったりきたりして、片方のウィンドウに「テレビ」「ラジオ」「ドラマ」と入れ、もう片方のウィンドウで「ギフト」「ショップ」「商品」といった単語を入れる。そして最後に「ほうそう」を変換させると、1つ目のウィンドウでは「放送」になるし、もう1つのウィンドウでは「包装」になる。

 この機能が究極に達すれば、編集のために開いたファイルの内容を瞬時に解析し、その文脈に従った変換ができるようにもなるのだろう。新規に作成したファイルでは変換精度はよくないが、書き進めるにしたがって精度が高まっていく。現在のプロセッサパワーをもってすれば、たかが数百KB程度のテキストデータの解析くらい、ユーザーに重さを感じさせることもなく、たやすくできてしまうのではないだろうか。実際、現在のATOKに添付されているAI辞書トレーナーでは、クリップボードやファイルから入力されたテキストデータを解析し、辞書に反映する機能が提供されている。WindowsにおけるIMEが、ユーザーのキー入力を超えて既存の文字列を取得する権限をプログラムとして得ていいのかどうかという論議もあるが、行の隔たり、インスタンスの隔たり、アプリの隔たり、ファイルの隔たりを距離としてとらえ、それを変換に活用するIMEはおもしろそうだ。つまるところは、さっきの続きが書きやすいIMEである。

 こうして、ブラウザウィンドウ内のフォームに文章を入力するときには、そのページ内の既存の文章が解析されて、その文脈にふさわしい変換結果が得られる。ATOKでは、変換キーとしてスペースキーを使うのが一般的だが、Tabキーによって、推測変換、連想変換、変換履歴等が候補として表示される。そうなると、まるで、Google IMEのサジェスト機能のような結果も得られるようになるだろう。その場でダイナミックに文脈を解析できれば、Google IMEのサジェスト機能よりフィットするかもしれない。

 メールを書く場合も同じだ。受け取ったメールに返事を書く場合、元のメッセージを引用することは多いが、引用された文章を解析できれば、新たに書かれる文章の変換結果の精度が高まるはずだ。

 インターネットという広大な空間を、あらいざらい解析して、今の日本語を乱れも含めて定義したのがGoogleなら、ATOKが目指しているのは、やはり、パーソナライズとコンテキストではないか。今、書きたい文章は、どんな文章なのかを推測し、ユーザーの意志を尊重しながら的確な候補を提示していく。そんなATOKを、次の四半世紀も使い続けていきたいと思う。ただ、それをつきつめて行けば、今のGoogle IMEの方向性にも似ていきそうな怖さもある。