山田祥平のRe:config.sys

一芸に秀でたAI

 AIが身近な存在になりつつある。これからは、コンピューターを使うあらゆるシーンで、AIの在不在が大きな意味を持つようになるのだろう。時間をかけてもっと考え続けなければならないことなのだが、めまぐるしく変わる状況に、なかなか頭が追いつかない。

やりとりしたメールは自分の経験の履歴

 いろんな生成AIがあって、それぞれがそれぞれの特徴を持っている。内容もそうだし、人との関わり方もそうだし、知識の範囲もそうだ。

 1990年代の終わり頃に初めてGoogle検索を体験したとき、これは世界が変わると驚いた。まだ正式サービスになっていない時期だったはずで、米カリフォルニア・サンノゼのホテルで開催されたIntelのイベントがあって、そのデモショーケースのようなエリアにブースが出ていた。残念ながら当時の写真などが出てこない。ということはきっとフィルムで写真を撮っていたからなんだろう。

 そう思ってはみたものの、過去のメールをあさってみたら、1999年の2月に、IntelがPentium IIIプロセッサのプレス向けプレビューイベントをサンノゼで開催していた。個人的にそのイベントを取材した。Googleとの遭遇はこのときだったはずだ。あのブースで説明してくれた若者はLarry PageとかSergey Brinとかだったのだろうか。今から考えると興奮ものだ。

 かすかな記憶を頼りに、過去のコトをいつどのように体験したのかを特定するには、昔のメールをあさるのが手っ取り早い。個人的に、届いたメールはすべてとっておく主義で、迷惑メールから新製品発売のプレスリリース、広告のメールマガジンまで、とにかく削除することなくメールボックスに置いたままにしていた。

 先日、ついにメールボックスの容量が100GBの制限に達したために、新製品などを告知するニュース関連や、メールマガジンなどについて、2020年以前のものについてはローカルストレージの別ファイルにクラウドから移動した。これでもうスマホやモバイルパソコンからの検索はできなくなってしまった。カネで解決できる問題ではあるだけに悩ましい。

 それでも個人的なやりとりをしている相手の顔が見えるメールについては全部クラウドの受信トレイに残してある。Outlookの表示を信じれば、このコラムを書いている時点で12万4,851通ある。受信トレイの最古のメールは1995年のもので差出人はすでに故人だ。逆に送信したメールは6万3,603通と受信メールの半分くらいだ。

 世の中一般のことについてはGoogle検索でキーワードを入れれば、たいていのことは分かる。その確からしさは分からないが、キーワードを追加して追い込んでいけば、なんとかなるし、なんとかしてきた。

 だが、自分自身のことについては残念ながらGoogle検索はあまり役にたたない。何も教えてはくれない。

GoogleのNotebookLMが気になる

 AIの知識は、そのモデルが学習のために読み込んだデータで決まる。メールであれば、過去のメールをすべて読み込み、代理所有者として自分の知識を持ってくれているAIがいればどんなにいいかと思う。回答の根拠となるデータを、限定的なものにすることで、生成される情報からノイズを排除したいのだ。

 MicrosoftのCopilotも、契約によっては企業内のメールや社外秘ドキュメントを対象にした学習ができて質問等に答えられるようにするものもある。

 個人的に現時点で魅力を感じるのは、こうした知識の範囲が著しく狭いAIだ。

 個人的に気になっているのはGoogleのNotebookLMだ。パーソナライズ・リサーチ・アシスタントを称するAIで、Gemini 1.5Proがベースとなっている。少なくとも現時点では無料で使える。

 使い方は簡単だ。最初にノートブックを作る。これはいわばフォルダだ。その中に知識のソースにしたいデータを追加していく。Googleドライブに置いたドキュメント、ローカルのPDF、テキストファイル、ローカル環境でコピーされたテキスト、WebページのURLをソースとしてノートブックにほうりこんでおくことができる。要するに何でもとりあえずつっこんでおけば丸暗記してくれて、いつでも質問に答えられるAIとして機能する。

 「ユーザーの個人データがNotebookLMのトレーニングに使用されることはありません。人間のレビュアーは、トラブルシューティング、不正使用への対応、フィードバックに基づく改善を行なうために、クエリ、アップロード、モデルの回答を確認することがあります。人間のレビュアーに見られたくない情報は送信しないでください」

 とある。今のAIが抱える問題はここにある。メールのデータも投げ込めればいいが、内密のメール、守秘義務のある事柄についてのメールなどが含まれる場合はそれが難しい。自分はまあいいやと思っても、相手側にしてみればとんでもない話だろう。だからこそローカルで使えるAIが欲しくなるわけだ。

 特定のデータだけを情報源とした知識をもとに生成して欲しいことは意外に多い。たとえば、USB Power Deliveryの仕様は、世の中が何を言おうと、USB-IFが公開しているドキュメントだけがよりどころとなる。だから、ほかの情報源は一切無視して、Universal Serial Bus Power Delivery Specification Revision 3.2のPDFだけを論拠にして、要約や質問などに応えてくれればうれしい。英語と格闘しなくても、日本語で質問すれば日本語で回答してくれる。もっともそれなりにウソをつくので注意は必要だ。

 読み込んでもらうデータごとにノートブックを作り、六法全書とか電気通信事業法とか、コンピュータの歴史本とかを読み込ませれば、きっと頼もしい存在として役立ってくれるだろう。性能はまだまだだと思うが、順調に成長していって欲しいと思う。

ドキュメントとの対話

 アドビがAcrobat AI Assistantを発表、AcrobatにAdobe Fireflyの機能を導入し、複数ドキュメントの対話型AI体験チャットをサポートするという。その日本語版開発も表明されている。最初は知識のもととなるデータをPDFにしなければならないのは無駄なような気もしていたのだが、考えようによってはこれはインタラクティブなドキュメントじゃないかと思ったら腑に落ちた。

 人間がAIアシスタントを介してPDFと対話ができるのだ。これはドキュメントが持つ新たな付加価値だ。頭からシーケンシャルに読んでいくのが当たり前の小説のようなコンテンツ、必要な部分を探し出してアトランダムなつまみ食いをする辞書のようなコンテンツなど、過去に人間が生成した従来型のコンテンツを知識としたAIは、少なくとも今の仕事や暮らしにストレートに貢献してくれるだろう。

 ドキュメント。それは社内規定かもしれない、就業規則かもしれない、分厚い社史かもしれない。あるいは料理本、趣味で読む作家の全集かもしれない。それを把握したAIがあらゆる質問に答えてくれるとしたらと、想像するだけでワクワクする。ドキュメントそのものがAIの力でインタラクティブになり、人間と対話するチカラを持つといってもいい。

 そういえば、初めてコンピュータを使ったときも、このくらいワクワクな気持ちだったかもしれないと、今にして思う。