山田祥平のRe:config.sys

30年分のメールを集めたらローカルAI処理には絶望的な量だと言われて途方に暮れながら2025年が終わる

 2025年も終わりが近づいている。そしてそれは21世紀の最初の四半世紀が終わろうとしているということでもある。激動の四半世紀だったとも思うが、なんだかアッというまに過ぎたようにも感じている。今、解決できないことも、きっと未来には解決できるようになる。だから、とにかく捨てないで何でも手元に置いておこうと思ってデジタルとつきあってきた。

75万通の「デジタル地層」

 2025年もいよいよ年の瀬、改めて手元の環境を見渡すと、そこには約30年分の「人生」が堆積していることが分かった。メール環境をホスティングしているMicrosoft Exchange Onlineには、インターネットメールをメインに使うようになった1995年頃から現在(2025年12月)にいたる約75万通のメールが無秩序に放り込んである。

 その中に自分が書いた送信済みアイテムも約 6万5,000通ある。ざっくり全部で100GB、はみ出た分は別のファイルにアーカイブしている。まるで整理をしていない。きっと将来役に立つときがくると思って削除しないでおいてあるだけだ。今だって役立っている。検索すれば過去のことがたいてい分かるからだ。

 これらのメールは「自分の思考のログ」であり、「文体」の源泉となるデータでもある。仕事や遊びのスタイルの履歴でもある。受信トレイには自分がTo:やCc:に入っているメール約13万通が保存されているようだ。これは直接的なコミュニケーションの履歴と考えられる。単なるデータではない。自分が誰と会い、何を考え、どう合意形成をしてきたかという「コンテキスト」のすべてだ。そして、将来、何をするであろうかという予測を可能とする学習材料でもある。

 そのほか、毎日届くプレスリリースや各種の発表会等イベントの招待状、そして迷惑メールなどが約50万通。それを置いておいて何の役に立つのだろうと思いながらも、バルクで届く情報や、今は不要かもしれないが保存してあるデータまでもろもろだ。

 2004年にはGmailのサービスがスタートしたので、Exchangeに届いたメールのすべてをそちらに転送するようにした。結果、Gmailの受信トレイには、2004年以降、未整理のまま積み上がったメールがある。通数を調べたら約75万通だった。GmailにはGmailの検索しやすさがあるので、この転送は検索とバックアップを兼ねている。

 昨今の生成AIを使えば「データを全部AIに食わせて学習させ、自動で返信させればラクになる」などと言われることがある。技術的にも、ぼくの口調や文体を真似た「クローン」を作り、それに作業させることは簡単かもしれない。でも、それはそれ。気持ちとしては断固として拒否したい。それはなぜか。

コミュニケーションの拒絶

 ぼく自身は自分のクローンはいらないと思っている。欲しいのは「アンプ」だ。それはAIの時代の前から思っていたことで、パーソナルコンピュータ的なものに担わせたいと思ってきた役割だった。

 コンピューターやAIは自分とコラボレーションするパートナーなのだ。「まるで自分のように勝手に返信してくれるAI」に何もかも任せることができればそれはラクだろうけれど、それは、対話すべき相手と向き合う時間の放棄であり、コミュニケーションの拒否につながる。もっとも相手も人間とは限らないわけで、そこのところは永遠のテーマとなる。

 いずれにしても、30年分のメールの記録は内容をほとんど忘れ去っているかもしれないけれど、自分自身の記憶であり、アンプを動かすためのパワーとなる電源というか、そのアンプで楽しむ膨大なレコード・コレクションであるとも言える。

 そして自分は、その前で新しいメールを書こうとしている。そのための道具がPCだ。つまり、ぼくがパートナーとしてのPCに求めるのは、勝手にピアノを弾く自動演奏機能ではなく、ぼく自身の言動や行動を検知し「あ、この相手とは5年前にこんなセッションをした」とコンテキストから過去の履歴を引き出し耳元でささやくなど、今の活動に深みを持たせて増幅してくれる「アンプ」としての役割だ。つまり、創造性をブーストする共生関係こそが、目指すべき形じゃないかと思う。

クラウドの「脳」と、NPUの「自律神経」

 世間ではAI PCのNPUがスペックとして話題になることがあるようだが、たかだか40TOPSで75万通のメールを学習させたらどのくらいの負荷になるんだろうか。継続的に届く新規メールも学習し整理し続けるというのは重労働で、GoogleやMicrosoftのような圧倒的な計算資源を持つクラウドという「巨大な脳」に任せるべき規模だ。

 それが望みなら、データをネットの海に放流するしかない。Geminiにたずねてみたら、40TOPSで100GB分のメールを学習させるというのは「ティースプーン1本で東京湾の埋め立て工事をするようなもの」とのことだった。TOPSは整数演算の理論値であり、訓練(学習)に必要なメモリ帯域やデータ前処理のボトルネックは別問題だとも。計算ではいつかは終わるだろうけれど、頼んだ本人が生きているうちには絶対に終わらないらしい。

 つまり、パーソナルコンピュータのNPUは、あくまでも完成したAIを動かすためのものであり、AIを作るためのものではない。そこに決定的な違いがある。

 それではNPUは無意味というと決してそうじゃない。NPUはかつてのGPUとは違う。低電力で動き続ける「エコカー」だからだ。

 クラウドは「遠い」ところにある。だからこそ、手元のNPUが「自律神経」として24時間365日働き、クラウドからの情報を瞬時に翻訳して人間の思考のレイテンシを埋めるわけだ。「クラウドで記憶、記録し、エッジ(NPU)で直感する」。これが2026年のハイブリッド・ワークスタイルだと言える。

メールの「ハガキ化」とセキュリティのアリバイ

 「クラウドにメールを読ませると、情報が漏れるのでは?」という懸念もある。できないからやっていないが、できたとしても大手を振ってクラウドサービスのAIにすべてのメールを学習させているとは言いにくいのはそれが理由だ。漏れるはずがなくても、ぼくにメールをくれる相手はいい気分はしないだろう。75万通のメールのうち、自分で書いたものは約9%に過ぎないのだ。

 そもそもNDA(秘密保持契約)に関わるような機密を平文のメールで送ること自体が時代遅れになりつつある。メールは誰でも読める「ハガキ」だと再定義すべきなのかもしれない。

 機密はセキュアなチャットへ移行し、メールには、AIに学習されてもいいコンテンツだけを流すということが新しい当たり前にならないか。その機密選別こそが人間の仕事だと言える。

 そもそも、我々は「AIには情報を渡さない」と言いつつ、Googleの検索ボックスには、業務上の悩みから個人的な欲望までのすべてを平気で入力してきた。20年以上、当たり前のようにそうしてきた。検索ボックスに文字列を入力した時点で、情報はプラットフォーマーに渡っている。「チャットはダメで検索はOK」というのはまるでアリバイ工作だ。検索体験もAIの介入で大きく変わってきている今、学習にはユーザーから得た情報を使わないという保証を信じる以外に何か方法はあるんだろうか。

 当面は、オンデバイスで野望を叶えるのは無理そうだというのが2025年末の結論だ。これを何とか解決する手立てを提案されるのを期待したい。ぼくらはすでにデジタルな巨人に依存しまくっているのだ。できないはずがない。2026年中には無理かもしれないけれど…。

 今年もご愛読ありがとうございました。来年もよろしくお願いいたします。