第284回
情報を見通すデジタル世界のゴーグル
~検索ツール活用のススメ



 昨年10月のこと。Google創設者である技術部門担当社長のセルゲイ・ブリン氏と製品部門担当社長のラリー・ペイジ氏の2人が揃って記者会見を行なった日があった。株式公開で億万長者となった2人だが、まだまだ現場で製品やサービスに深く関わる2人でもある。

 おそらく'99年だったと思うが、ある展示会で、不思議な名前に「Googleって何?」と小さな、本当に小さなブースに立つ人物に話しかけたのが、Googleに初めて関わった時だったが、そのときに話を聞いたのはラリー・ペイジ氏。

 「ゴーグル(Goggle)をもじったものだよ。どうかな?」

 当時もまじめな好青年という印象を持っていたが、その後のネットバブルでも株式公開による資金調達・事業拡大に向かわず、きちんと利益を確保できる体裁を整えてからIPOに踏み切ったあたり、他のベンチャー起業家とは考え方や志向がかなり異なる。

 記者会見は日本での研究開発センター設立、それに書籍検索の「Google Print」やデスクトップ検索の「Google Desktop」などさまざまな分野にGoogleの検索機能を拡大している事についての発表だった。そして、そのGoogle Desktopは、日本での研究開発センターでの成果を受けて日本語化。現在はまだβ版ながら、日本語による検索にも対応するようになっている。

●日々埋もれ行く情報の山

Googleデスクトップのトップページ。インストールされたエージェントがWebブラウザに送り出しているので、オフライン時にももちろん利用可能。タスクバーやフローティングバーから検索することも可能

 Google Desktopとは、1台のPC内で扱うさまざまな情報を収集し、そこから検索で必要な情報を取り出すための小さなツールだ。Google Desktopが発表されて以来、“デスクトップ検索”という“新しい分野”についてさまざまな記事が乱れ飛んだ。しかし、PCで扱う複数種類の情報をまとめて検索し、情報として役立てようという試みは、これまでも何度か行なわれてきた。決して全く新しい分野ではない。

 たとえば、ジャストシステムの「インターネットブーメラン」などいくつかの製品が存在し、この連載でも紹介した事があった。文書や電子メールなど、山のように日々通過していく大量の情報は、そのほとんどが頭の中から忘れ去られていく。おそらく、そのほとんどは忘れ去っても良いものかもしれない。しかし、ごくたまに必要になったとき、それが見つからずにイライラする、というのはありがちな話である。

 しかし残念なことに、これらの個人向け検索ツールは大きなビジネスにはならず、市場から姿を消してしまっている。

 以前に紹介した日本の製品だけでなく、似たような製品はなかなか花開かない。2002年11月のCOMDEX/Fallで発表されていたCREOの「Six Degrees」(メール内容を検索、分析する“メールマイニングソフト”と謳われていた)は、当時、米国ではそれなりに注目された製品で、個人的にも英語版ながらユニークな機能に興味を惹かれていた。しかしその後、Six Degreesは別会社(Ralston Technology Group)に製品の権利が売却されている。そのRalston Technology Groupは、バージョンアップ後に「Clarity 2.0」という名前で製品を販売中だが、機能面でのアップデートはほとんどなく、日本語版の予定はないようだ。

 もうひとつ、Outlook内で管理するさまざまな情報とテキストファイルの検索ツール「Lookout」という製品もある。現在でもダウンロードは可能で開発も続けてはいるようだが、実はMicrosoftに買収され、製品としての販売は中止。サポート無しの無償ソフトウェアとしてダウンロードが可能になっている(ただし日本語の正しいサーチは行なえずバージョンアップもない)。

 いずれも有用性が認められるからこそ存続しているが、かといってビジネスとしての魅力が大きなものでもないという事か。

 世界でもっとも多く使われているメールクライアントは、意外にもOutlook(Expressではない)との調査結果を見たことがあるが、Microsoftはこれまで、Outlookにまともな全文検索機能を付けたことがない。LonghornがOSレベルでデータベース機能(WinFS)を持つことで改善される見込みだったが、WinFSは最初のLonghornに搭載されないことが決まっている。Outlookの次期バージョンが、きちんと情報を掘り起こす機能を備えるかどうかは不透明になってきた。

 このように、個人がコンピュータを日常的に使う中で積み上がっていく情報から、必要な情報を掘り起こすためのツールがビジネスにならないのは、“ニーズがない”からなのだろうか? それとも“ニーズはあるが不完全な実装だから”なのだろうか?

 Google Desktopに限らず、Yahoo!やMicrosoft、そしてAppleが取り組んでいるデスクトップサーチという技術は、検索範囲をメールからPIM情報全体、さらにはPC内のあらゆるファイル、Webページに拡げたものだが、果たしてそこにニーズはあるのか?

 個人的にはあると信じたい。今、こうしているうちにもPCを用いて扱う情報の量は増大している。日々、次々とPCの中に取り込まれ、忘れ去られ、HDD上にあるbitの塵として、有益かも、無益かも分からない情報が埋もれている事だけは間違いないのだ。

 冒頭で紹介したラリー・ペイジ氏は「ビジネスモデルの前に、我々はまず幅広くユーザーに使ってもらい、そこからのフィードバックで製品を改善しながらビジネスモデルを考えるようにしている」と話していた。

 過去、何度かの例を見る限り、サーチ技術単体には、ユーザーに強い購買意欲を湧かせるだけのビジネス的な可能性は少ないのかもしれない。しかし、“まずは便利に使ってもらう。使ってもらわなければ、ユーザーが何を求めているのかもわからない”というペイジ氏の思想からならば、あるいはデスクトップ検索だけでなく、ちょっと気の利いた、しかしビジネスとしては成功しにくいツールが、我々の手元に届くようになるかもしれない。

●日本語版登場までに機能アップされたGoogle Desktop

 さて読者の皆さんはGoogle Desktopを導入しいるだろうか? まだ試していないならば、一度はその機能に触れておくといい。昨年の発表から先日の日本語版発表までの間に、Google Desktopは機能アップを果たしている。もし英語版を評価した、あるいは以前の記事を読んだだけで使っていないのならば、再評価することを勧める。この手のツールの中では、随一と思われる完成度の高さだ。

 もちろんβ版だけに不具合がある事も考えられるが、現時点ではWindows環境を破壊するような振る舞いは確認されていない。元々、同社は長く長くβテストを行なう事で知られている。昨年の4月1日に発表された「GMail」でさえ、いまだにβテストが続けられ、機能アップを繰り返しながら今年の4月1日には2GBまでメールボックス容量が拡張された。Googleは以前から、機能がある程度固まるまではフィールドテストを行ないながら、繰り返しバージョンアップをしていくと話しており、一般的なソフトウェアのβ版ほどには神経質にならずとも良さそうだ。

 現時点で検索可能なアイテムは、メール(Outlook、Netscape Mail/Thunderbird、Outlook Express)、Webページのアクセス履歴とキャッシュ(Internet Explorer、Netscape/Firefox/Mozilla)、MSオフィス文書(Word、Excel、PowerPoint)、PDF、音楽(WMA、MP3などのタグ)、画像(Exif情報など)、ビデオ(WMV、MPGなどのタグ)、それにAOLインスタントメッセンジャーのチャット履歴。初期のβと比較すると、対応メーラー、Webブラウザが強化され、PDF検索が加わっている。

メールの検索結果はメーラーを起動せずにWebブラウザ上で確認できる。もちろんメーラー上のメッセージアイテムを呼び出すことも可能だ Google Desktopのオプション設定。今年になってからPDF検索に対応しており、グッと実用性が増した GoogleはGoogle Desktop用プラグインのSDKを配布、プログラミング手法も公開されており、すでにユーザーの手によるプラグインが多数存在する

 また現バージョンのGoogle Desktopにはプラグイン機能もあり、別の異なる種類のアイテムを検索するモジュールを追加することも可能。プラグインのインターフェイスは公開されており、ユーザーが開発した追加検索モジュールが提供されている。たとえば、ZIPファイル内ファイル名、IRCチャットの履歴、RSS形式で提供される情報、あるいはC++のプログラムソースといった検索プラグインがダウンロード可能だ。

 普通にGoogleで検索を行なうと、Google Desktopで検索した結果、目的の情報に近いと思われるものがちょっとだけ上の方に表示されるなど、本来のGoogleサーチとの連携もなされる。またWebページに関しては過去のアクセス履歴も残されており、“数日前のページ内容を見る”といった事も可能だ。

検索するとメールやWebページの履歴、文書ファイルなどの結果を一度に表示。特定のアイテムに絞り込む事も可能。Webページ履歴の検索結果にはサムネイルも表示される 同じWebサイトの過去の情報もキャッシュを用いて履歴で表示可能。ここでは3月16日のPC Watchを表示させてみた

 また、インターネットに繋がっていないモバイル環境で、「朝見たあのニュース、残ってるかな?」などオフラインで情報を探したい場合にも便利だ。こうしたWebページのスナップショットは、Webブラウザのキャッシュではなく、Google Desktop自身がインデックスと一緒に保管する。

 なお、検索インデックスの作成はインストール直後、CPUが空いている時間帯にスグに始まる。インデックス作成時間は環境によって異なるが、数時間から10数時間かかる場合もあるようだ。フォアグラウンドの処理にはほとんど影響しないが、ひとつ注意点がある。

 HyperThreading対応プロセッサで、HTをONにしていると、フォアグラウンドで処理を行なおうとしてもプロセッサに空きがあると判断し、インデックス作成が中断されず、操作レスポンスが悪くなる。

 一度インデックスを作成してしまえば、あとはWebページ、メールやファイルを開いたときにインデックスが作成されるため、長時間のインデックス作成は行なわれない。インストールは就寝前に行い、一晩そのまま寝かしておけば大抵の場合は問題ないだろう。

●増え続ける情報をどう処理するか

 コンピュータの能力と記憶容量は猛烈に向上してきた。Windows 95が登場した頃、ノートPCに使われていたHDDは1~2GBほどしかなかった事を憶えている人も多いと思う。しかし今や、個人向けのWebホスティングでさえ3GBの容量を持ち、無料Webメールサービスが2GBにまで増量してきている。ローカルのHDDならば最低でも20GB、多ければ80GB程度の情報を記録しておける。デスクトップPCなら……、いや今後もどんどん増え続けていく。

 ひとりひとりが検索ツールを活用する事で、より多くの新しいアイディアが検索ツールに盛り込まれる。より多くのユーザーが使うことで、製品の選択肢も拡がる。Mac OS Xユーザーなら、そう遠くない未来に登場する次期Mac OS Xの「Spotlight」を期待できるが、Windowsの場合はOSに統合される日は遠い。

 ひとまずここで、山のようなbitの羅列から、必要な情報を取り出す事を真剣に考え直してみてはいかがだろう? みんなが欲しいと思えば、より良い実装の製品が登場し、既存のツールも改善されるものだ。

□関連記事
【2002年7月18日】【本田】持ち歩きデータの検索活用と悩み
http://pc.watch.impress.co.jp/docs/2002/0718/mobile162.htm

バックナンバー

(2005年4月6日)

[Text by 本田雅一]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2005 Impress Corporation, an Impress Group company. All rights reserved.