山田祥平のRe:config.sys
読み書きAI
2026年2月21日 06:02
GoogleのAIアシスタント、Geminiの基盤モデルが3.1へと進化した。先週、高度な推論機能で困難な課題に対応するGemini 3 Deep Thinkの大幅アップデートが話題になったが、そのブレイクスルーを根本で支えている最新のコアがGemini 3.1 Proだ。これが日常的なタスク向けにも解放され、利用できるようになっている。
人間の能力を増幅するコンピュータ
コンピュータと人間の対話は、マンマシンインターフェイスと呼ばれることがある。マンとマシンがコミュニケーションするというからだ。そのために、僕らはキーボードやマウスなどのインターフェイスを使ったさまざまなUIやUXのもとで、コンピュータにいろんなことを頼んできた。
ただ、頼む側の人間に分析能力がなければExcelを使っても数値の羅列から傾向などを読み取ることはできない。数表をグラフ化するにしても、どんなグラフを作れば直感的に状況が理解できるのかが分からなかったりもする。
インフォグラフィックスなどの視覚化は、膨大な量のデータや複雑な概念を一目で理解できるようにするが、それができるのは、コンピュータの使い方を知っているだけではだめで、アプリの使い方を知っていてもやっぱりだめで、数字を読み解き、それを視覚化する特有のスキルを持っていなければ有用なインフォグラフィックスは作れない。
また、文章を書く能力に乏しいユーザーは、Wordを使ったところで、人になんらかの情報を正確に伝える文章を書くことはできない。
読み書きソロバンとはよく言ったもので、文章を読み、文章を書き、計算ができることはあらゆる作業のための基本中の基本で、社会人になるためには必須の能力として求められる。
これらに加えて、昨今はちょっとしたイラストが描けるとか、人に何かを伝えるためのプレゼンテーションに長けているといった能力があると歓迎される。これらは専門家がいなければ実現できなかった能力だったからだ。
生成AIは、これらの能力に乏しくても、あるいは能力があってもやることが多過ぎて時間がない人間を助けてくれる。
ネットワークから遮断されたコンピュータにできることとは
AIアシスタントの登場は、コンピュータに何かを頼む際のハードルをずいぶん低くした。Excelの使い方が分からなくても、作文能力が低くても、絵が絶望的に下手だったとしても、とにかくAIに頼めばそれなりの結果を得ることができる。それでよいかどうかを判断できれば十分だ。
役に立つAIを使えれば、コンピュータの付加価値は格段に向上する。コストとの兼ね合いもあるが、サブスクリプションであれば、今回のGeminiのバージョンアップのように、性能がどんどん上がっていくAIを完全にキャッチアップしながら使っていくことができる。
インターネットでWebが使えるようになって、コンピュータはネットワークにつながっていることが新しい当たり前となった。そして、ブラウザを使えば、まるで打ち出の小槌のようにさまざまな情報を取り出せることも当たり前になった。コンピュータは通信機として、遠くにある別のコンピュータと対話し、情報を取り寄せてくれるのだ。もはやスタンドアロンでコンピュータを使うことはほとんどないんじゃないだろうか。
でも、ネットワークから遮断された環境下で、なんらかの相談に乗ってもらうために生成AIの力が欲しいこともある。ローカルAIはそのための有効な手段となるだろう。とりあえずはハイブリッドで使われるようになって、そのうちセキュリティ担保のためにデータが外部に送信されないAIが必要だということで、PCにローカルAIが実装されて使われるようになる。
でも、現在のクラウドAI並みの処理性能が欲しければ、いったいどんな高スペックのPCが必要になるのか……。そしてそんな高性能ノートを常に携行することなどできるんだろうか。あるいはその意味があるんだろうか。
発展途上のAIに無理難題を要求しよう
Googleが提供しているGeminiには、現時点で3つのモードがある。高速モードはすばやく回答が欲しい場合に使い、思考モードは複雑な問題を解決したいときに使う。また、Proモードでは3.1 Proによる高度な数学とコード生成までがカバーされる。
WindowsやMacからGeminiを使うには、ブラウザでサイトを開けばいい。必要に応じてアプリとしてインストールしてもいい。個人的には、期待した回答が返らなかった場合のやり直しが面倒なので、思考モードをメインに使ってきたが、しばらくはProモードで新しいGeminiを試してみようと思う。回答に時間はかかるが、なんだか昔のコンピュータのようで懐かしさすら感じる。昔のPCはとにかく遅かった。
個人的には40年ほど前からPCでの通信を楽しんできた。当時のパソコン通信サービスはホストコンピュータに多くのユーザーが電話回線で接続し、そのホストコンピュータ上のアプリを使った。はじめたころはPCは計算機ではなく通信機だったんだということが実感できた。
そのうちパソコン通信サービスで見知らぬ第三者とのチャット機能がアプリとして提供されるようになり、ログインしているほかのユーザーと文字で対話できるようになった。これは実におもしろく、毎晩かなりの時間を費やしていたことを思い出す。
AIとの対話では、なんとなくあの当時のムードを思い出す。ただし、当時は相手が人間だった。それが今、相手はコンピュータになっている。コンピュータ上で稼働する生成AIだ。願わくば、当時のグループチャットのように、複数のAIが相手をしてくれればいいのにとさえ思う。
今の生成AIは、いろんな意味でまだまだ発展途上だと思う。できることは増えてはいるが、Gemini 3が3.1になったくらいではほとんど感動しない。相変わらず、1時間超の音声ファイルは認識できない。ハルシネーションで架空の会議を作ってしまったりもする。
試しにファイルを2分割するように頼んだがGeminiはそれもできない。仕方がないので、Adobe Auditionを使って自分で分割したが、いっしょに2つのファイルを渡したらうまく認識できず、前半と後半を別々に処理させてようやく長丁場の文字起こしができた。使うにはまだまだノウハウが必要なのだ。それがなくならなければならないと思う。もちろん、それでも、自分で文字起こしするよりはずっと短時間で処理は終了するし、文字データになってしまえば、要約などはかなり満足できる結果が得られる。
画像や動画の生成はできるが有料のプランでも回数に制限があったりもする。いわば融通の利かないAIは、まだまだプロンプトエンジニアリングに長けたユーザーでなければ期待した処理結果が得られない。
今回のバージョンアップでは、複雑な推論と論理的思考、長文脈の理解力の向上、そして指示の忠実な実行などが実現されたようだが、さまざまな返答に対話による微調整が必要な点はGemini 3とそれほど変わってはいない。間違いを指摘したときの謝り方がうまくなったような気はするけれど。
今はとにかく、対話の機会をできるだけたくさん作り、あれもこれもやらせてみる体験を積極的にするのでいいと思う。PCでもスマホでもできる。少なくとも5年前のPCだって、最新のPCだって、今のクラウドAIサービスにおけるチャットについての性能差はないに等しい。当面はそれでいいと思う。そうしているうちに、自分がPCに望むものが見えてくるはずだ。大事なことはそこに書いてある。












![[Amazon限定ブランド]CCL い・ろ・は・すラベルレス 2LPET ×8本 ミネラルウォーター 無味 製品画像:2位](https://m.media-amazon.com/images/I/41h0MHfvhkL._SL160_.jpg)







