特集
コルタナの悲願、ついに「言葉でWindowsを操作」する時代へ!ビルド23493に実装されたWindows Copilotを試す
2023年7月3日 06:06
2023年6月29日、Windows Insider ProgramのDevチャネルにて、Windows 11のプレビュー版となる「ビルド23493」の提供が開始された。さまざまな新機能が提供されるが、最大の注目はAIアシスタント「Windows Copilot」が搭載されたことだ。実際にインストールして試してみた。
Windows Copilotとは、ChatGPTなどで有名な大規模言語モデル(LLM)を利用したAIアシスタントのことだ。手っ取り早く操作感について知りたい方は以下の目次から「(4) 言葉でWindowsを操作してみる」に飛んでほしい。
Windowsを言葉で操れるようになるのか?
「Dir」や「Copy」などのコマンドで操作するCUIのMS-DOSから始まり、マウスで操作するGUIのWindowsへと変化したPCのインターフェイスが、もしかすると大きく変わるかもしれない。
Microsoftは、2023年6月29日、かねてから予告していたWindows向けのAIアシスタント「Windows Copilot」のプレビューを公開した。
公開と言っても、本格導入はまだ先で、おそらく今年秋のメジャーアップデート以降となると予想されるが、現状Windows Insider ProgramのDevチャネルで配布されているビルド23493で実際に体験可能だ。
Windows Copilotは、AIアシスタント機能なので、たとえば「ダークモードに切り替え」のように、普段使っている言葉を利用して、Windowsを操作することができる。
SF映画やアニメなどでは、アンドロイドやマザーコンピューターに「惑星〇〇に向かって」などと話しかけるだけで、宇宙船を操作したりするが、これと同じように、言葉を使ってWindowsを操作できると考えると分かりやすいだろう(まあ、今のところキーボードで入力する必要はあるが……)。
同じような発想は、先日廃止が発表された「コルタナ」でも目指されていた。ただ、Copilotではバックグラウンドの仕組みが大規模言語モデルとなったことで、あらかじめ決められたコマンドの言葉ではなく、人によって表現や単語の選択が異なるような自然な会話文でも、Windowsを操作できるのが違いとなる。
コルタナの悲願再び、と言うと少し意地が悪いが、MicrosoftがPCのインターフェイスを劇的に変革させようとしている新たな試みの1つと言えそうだ。
Windows Copilotを利用するには
※一度、Devチャネルに登録すると、プレビュービルドの受信を停止するためにはOSのクリーンインストールが必要になる。検証の際は、検証用の仮想マシンなどを新たに用意することを強く推奨する。
Windows Copilotに対応したWindows 11 ビルド23493は、前述したように、Windows Insider ProgramのDevチャネルで配布されている。
このため、今すぐ試してみたい場合は、Windows 11の「設定」の「Windows Update」にある「Windows Insider Program」からプログラムに参加しよう。
そして、チャネルで「Devチャネル」を選択し、Windows Update経由で更新。「Windows 11 Insider Preview 23493.1000(ni_prerelease)」をインストールする。
ただし、現状はOSのアップデートだけでは、まだWindows Copilotは有効にならない。Windows Copilotの利用には、「ビルド23493の適用」と「ビルド115以降のEdgeの利用」という2つの条件が必要となるため、Edgeをアップデートする必要がある。
通常は、Edgeを起動すれば、自動的に最新版にアップデートされるので、「Microsoft Edgeについて」の画面でバージョンを確認しつつ、アップデートすればいい。
その後、再起動すると、タスクバーの中央に「Copilot」ボタン(Officeと同じデザイン)が表示されるので、ボタンをクリックするか、Windows+Cのショートカットキーから、画面右端にチャットウィンドウを表示することができる。
なお、Windows+Cは、従来、チャットアプリに割り当てられていたが、こちらもTeamsへの統合が発表されており、今後は、Copilot用のショートカットとして使われることになる。Windowsの迷走は今に始まったことではないが、Copilotは大丈夫だと思いたいところだ。
また、筆者が試した限りでは、テスト中に1度だけだが、グリーンスクリーンで強制再起動がかかる経験をした。Devチャネルなので当然と言えば当然だが、安定性は低いので、メインマシンでの利用はおすすめしない。検証用のPCを用意し、自己責任の上で利用してほしい。
Windowsと一体化するためにEdgeとの結びつきは弱くなった
実際の使用感は、悪くない印象が、個人的にはいくつか気になる点もあった。
Windows Copilotボタンをクリックすると、デスクトップの右側にEdgeで見慣れたBingチャットと同じ画面が表示される。
「なんでも聞いてください」と表示されるので、試しに「日本のおすすめの観光地を3つ教えて」と入力すると、Bing検索が実行され、函館や中尊寺などが紹介される。使ってみた限り、Web検索を伴う質問で利用されるモデルは現状のBingチャットそのもののようだ。
では、EdgeのBingチャットはどうなってしまったのか? と疑問に思って、Edgeを起動し、右上の「b」ボタンをクリックすると、表示中のWindows Copilotの画面が閉じた。
タスクバーのWindows Copilotボタン、Windows+C、Edgeの「b」ボタンと、どれでも同じWindows Copilot画面が表示される。
ちなみに、Windows Copilotの右上にある「…」から設定を開くと、「Let Copilot use content from Microsoft Edge」という設定が表示される。これをオンにすると、Edgeの開いているタブの情報をWindows Copilotで利用できる。
たとえば、Edgeで本サイトの記事を表示した状態で、Windows Copilotを起動し、「記事を要約して」と入力すると、Edgeのタブの記事を読み込んで要約してくれる。
従来、Edgeと一体化していたBingチャットでは、上部の「分析情報」からEdgeで表示中のコンテンツのポイントなどを自動的に表示したり、関連する情報を自動的に表示したりすることができたが、こうした機能が現状のプレビューでは姿を消している。
標準でEdgeとの連携をオフにしているのは、OSとの一体化によって、ブラウザの選択肢を狭めることを防ぐ目的だろう。
OSとの一体化のために、ブラウザとの結びつきを弱くせざるを得なかったあたりは、いわゆる独占禁止法対策としての葛藤が感じられる。
言葉でWindowsを操作してみる
では、いよいよWindowsを操作してみよう。と言っても、現状サポートされている機能はごくわずかで、公式では以下の3つの機能が紹介されている(カッコ内は筆者が利用できた日本語訳の命令)。
- “Change to dark mode.” (ダークモードにして)
- “Turn on do not disturb.” (通知を止めて)
- “Take a screenshot”(キャプチャして)
たとえば、「ダークモードにして」と入力してみよう。すると、以下のような処理が発生する。
- 「ダークモードにして」
(適切なアクションを検索しています ※3秒前後) - 「Turn on dark mode」設定用カード表示
- 「はい」クリック
- ダークモードに切り替え
同じことをマウスで操作すると、以下のようになる。
- 「スタートボタン」をクリック
- 「設定」をクリックして起動
- 「個人用設定」をクリック
- 「色」を選択
- モードで「ダーク」を選択
ステップ数で比べると、わずか1ステップ少ないだけだが、最後の「はい」をクリックは単なる確認なので、実際のステップ数はさらに少ない。しかも、実際にやってみると、「設定」で項目を探す必要がないうえ、画面をいくつも切り替える必要もないので、確かに楽に感じる。
Windowsの「設定」に精通し、どこにどの設定があるのかを正確に把握しているのであれば、もしかすると従来操作でも苦労しないかもしれないが、普通はそうではない。
実際には、「ダークモードにするのってどうやるんだっけ?」とWeb検索をして、複数表示された候補のWebページから、最新の情報が掲載されている情報を見つけ出し、その手順を見ながら「設定」画面に目を凝らし、時に項目を間違え、画面を前後に何度も遷移させながら、操作することになる。
Windows Copilotの場合、こうした「下調べ」と「設定操作の試行錯誤」が、自動的に実行される。筆者もたまに不慣れなLinuxやMacを触ると、こうした状況に陥るので、Windowsに慣れてない人にとっては、画期的とも言える手軽さだ。
ちなみに、ダークモードや通知停止は、最後の確認操作が必要だが、「キャプチャして」は、自動的にSnipping Toolが起動するので、まさに言語でアプリを起動している感覚を得られる。
なお、前述したように、質問を入力してから回答が表示されるまでの間に3~4秒ほどの待ち時間が発生する。これは、クラウド上の言語モデルに問い合わせを発行している時間だ。慣れると、少し長く感じられるが、現状は我慢するしかない。
もちろん、PCがオフライン、つまりインターネットに接続されていないと、Windows Copilotは機能しない。
将来的にPCのマシンラーニング性能が進化し、軽量の言語モデルがローカルで動くようになれば、こうした状況も変わる可能性がある。
どうやってWindowsの機能を動かしているのか?
このように、なかなか興味深いWindows Copilotだが、個人的に気になったのは、チャット画面からどうやってWindowsの機能を呼び出しているのかだ。
というわけで、「ダークモードにして」と聞いて表示されたWindows Copilotの回答の「はい」のリンクを取得してみたところ、以下のようになっていた。
https://edgeservices.bing.com/edgesvc/chat?udsframed=1&form=SHORUN&clientscopes=chat,noheader,channelbeta,wincopilot,&shellsig=xxxxxxxxxxxxxxxxxxxxxxxxxxx&setlang=ja&lightschemeovr=1#sjevt|Discover.Chat.SydneyActionCardConfirm
「https://edgeservices.bing.com/edgesvc/chat」のリンクが、Windows CopilotのモデルにアクセスするためのURLになっており、そこに実際にコマンドを実行するクライアントの情報やコマンドなどを与えることで、設定画面の各機能に関連付けされた項目を実行しているようだ。
個人的には不正なリンクや偽サイトなどで、勝手にWindowsの設定を変更してしまうようなリンクが悪用されることがないのか、という点を懸念しているのだが、現状の情報だけでは判断が難しい。抜け道なく、保護されるのだろうか?
「ショートカットキーの方が速い」はその通りだが目的が違う
以上、Windows Copilotを試してみた。
マウスに変わる新しいUIになるかどうかは、まだ判断できないが、少なくともWebや設定画面を探し回らなくて済むのは便利だ。
もちろん、スクリーンショットなどは、「Windows+Shift+S」だったり、新たに追加された「PrintScreen」での起動の方が圧倒的に速い。
しかし、これとWindows Copilotがターゲットとしているユーザーは、明確に異なる。前述したように、「Webで調べる」という地点からスタートする初心者ユーザーにとっては、Windows Copilotほど心強い機能はない。
Windowsに慣れたユーザーにとっても、もう友人や知人に「〇〇ってどうすればいいの?」と聞かれて、手順を丁寧に説明する必要がなくなるので、それはそれで時短と効率化につながりそうだ。