特集

即分かる！Copilot+ PCでできることまとめ。そもそも何が便利？生成AIはどう使う？商用利用OK？素朴な疑問も解決

清水理史

2024年6月24日 06:24

コクリエイターなどのAI機能が使えるCopilot+ PC。写真は「Lenovo Yoga Slim 7x Gen 9」

　Microsoftが提唱する「Copilot+ PC」に準拠したPCが各メーカーから登場した。最大の特徴は、CPU内蔵のNPUを活用した各種AI機能が使える点となる。実機(Lenovo Yoga Slim 7x Gen 9)を利用して、Copilot+ PCならではの機能を試してみた。

記事目次

　(1) NPUを活用したAI機能を搭載するCopilot+ PC
　(2) コクリエイター
　(3) リコール
　(4) Windows Studio エフェクト
　(5) イメージクリエーター/リスタイル
　(6) ライブキャプション
　(7) 自動スーパー解像度(Auto SR)
　(8) Copilot+ PCはタッチ+縦解像度＋メモリにこだわるべき

NPUを活用したAI機能を搭載するCopilot+ PC

　Microsoftから発表されたCopilot+ PCは、CPUに内蔵されたNPUを活用して、クラウドではなくローカルでAI機能を快適に利用できるようにしたPCとなる。現状は、QualcommのSnapdragon X Elite/Plusを搭載したPCのみとなるが、将来的に対応が拡大されることが予想される。

　AI関連の機能は、これまでGPUを利用するのが一般的だったが、NPUはAI機能の中でも推論に特化した構成となっており、小規模かつ低消費電力でAI関連の処理ができるのが特徴となる。

　Microsoftは、WindowsのAI関連の開発環境をWindows Copilot Runtimeとして提供しており、その中にローカルNPUを活用できるライブラリ(Windows Copilot Library)が存在する。これらの組み合わせによって、Windows上でAIを活用したさまざまな機能が実現されていることになる。

Windows Copilot RuntimeとしてAI関連機能が提供される

　具体的な機能として、以下の6つが提供されている。

コクリエイター
リコール
Windows Studio エフェクト
イメージクリエーター/リスタイル
ライブキャプション
自動スーパー解像度(Auto SR)

　今回、Copilot+ PCとして「Lenovo Yoga Slim 7x Gen 9」を拝借できたので、実機を使ってこれらの機能を紹介する。なお、実機で検証しきれなかった一部の機能については、Microsoftのサイトの情報を基に構成していることをお断りしておく。

Copilot+ PCでできること

コクリエイター

　コクリエイター(Cocreator)は、Windows標準アプリである「ペイント」に搭載される生成AI機能となる。

コクリエイター

　コクリエイターは昨年、Windows 11 23H2の新機能として紹介された。Insider向けにDall-Eを使った画像生成機能というかたちでテストが実施されていたが、同じ名前のままCopilot+ PC向けの機能として登場した。

　コクリエイターの最大の特徴は、入力して手書きのラフスケッチを利用できる点だ。通常、画像生成AIでは、プロンプトを利用して画像を生成するが、コクリエイターではプロンプト＋画像という2つの入力を組み合わせることができる。

　描きたい絵を言葉(プロンプト)で説明するのは慣れていないと非常に難しいが、ラフスケッチを併用することで、AIに対して欲しい絵を簡単に指示できるのがメリットだ。

コクリエイターの仕組み

　実際に試してみると、雑な絵でもそれなりに似た画像を生成できるので、プロンプトのみの画像生成よりも、自分の頭の中にあるイメージに近い画像を生成できる印象がある。

　ただし、思い通りの絵にするのはなかなか難しい。画面上の「創造性」スライダーを調整することでAIの加入度を調整できるのだが、創造性を低くすると元絵に忠実になる一方で、完成する絵のクオリティも低くなる(下手さも忠実に再現する)、逆に創造性を高くすると細部のクオリティは上がるが元絵の構図などが無視されがちになる。

創造性50。構図を保つが細部のクオリティが低い

創造性100。元絵の構図などが無視されがちになる

　このほか、「水彩画風」などスタイルを選択して画像を生成したりできる。非常におもしろい機能だが、雑な絵でもプロンプトでも、細部まで指示した通りに描く機能ではないので、あくまでも「ざっくり」としたイメージから似た画像を生成する機能と考えるといいだろう。

水彩画風

ドット絵風

　なお、コクリエイターは、Microsoftが独自に微調整したオープンソースモデルがローカルで実行されているため、ほぼリアルタイムで反映してくれる点がすばらしい。スピーディで、制限なく何度でも生成できるのはとても快適だ。試行錯誤しながらの画像生成に適していると言えるだろう。

　ただし、ローカル動作であっても、PCがオンラインで、かつMicrosoftアカウントにサインインしていないと利用できない(こちらを参照)。「生成時にリクエストが有害でないか」などを検証し、フィルタリングしているためだ。

創造性のスライダーを調整すると、NPUの負荷が一瞬あがり、ローカルで処理していることが分かる

　また、生成物の著作権についても注意が必要だ。生成物を使用する責任はユーザーにあるため、生成結果が第三者の著作権を侵害しないように注意しなければならない(商用利用は明記なし。詳細は後述)。このほか、生成された画像にはAIによって生成されたことを示す資格情報(C2PAの電子透かし。詳細は後述)も追加される。

利用時の注意点

リコール

　リコールは、PC上で表示されたコンテンツを記憶し、後から検索できる機能だ。定期的にデスクトップのスクリーンショットを取得し、この情報を基に検索することで、「あれ何だっけ？」「あれどこだっけ？」という漠然とした情報を検索できる。

　たとえば、「青いグラフ」などという漠然とした言葉で検索した場合に、過去に表示したExcelのグラフやWebページで観たグラフなどの候補を表示できる。

　現状、この機能はプレビュー段階で利用できないが、筆者が個人的に購入した同一機種(Lenovo Yoga Slim 7x Gen 9)が届く予定なので、今回は概要のみ紹介し、詳細は後日追記したい。

【6月24日訂正】初出時にInsider Programの特定のチャネルで利用できるとしていましたが、日本マイクロソフトより、現状日本ではどのチャネルでも提供していないとの訂正が入り、該当箇所を修正いたしました。

　仕組みとしては以下のようになる。利用条件を満たした環境では、PCのデスクトップ画面を画像として保存するスクリーンショットが5秒おきに取得され、この情報がNPUによって処理され、画像そのものと検索用のインデックスが保存される。

リコールの仕組み

　なお、登場当初はセキュリティが問題視されたが、その対策も盛り込まれている。具体的には、保存されるスクリーンショットや検索インデックスが暗号化され、Windows Helloの顔認証などによって認証された場合のみ、データがジャストインタイムで復号化される。

Windows Studio エフェクト

　Windows Studio エフェクトは、Web会議などで多用するカメラとサウンドの各種効果を適用できる機能となる。

Windows Studio エフェクト

　従来の一部機種でも利用可能だったが、Copilot+ PCでは、NPUを活用した高度な効果が追加されており、これらをラグなく適用できるのが特徴となっている。

　中でも、画面上のコンテンツを読んでいるときでもカメラ目線を維持する「テレプロンプター」、画面内で人物が動いてもブレなく追従するレベルで弱いぼかしを適用する「人物背景用ぼかし」の2つの機能は、Copilot+ PC(40TOPS以上のNPU)ならではの機能となっている。

　同様のカメラ効果は、TeamsやZoomなどのWeb会議アプリなどでも利用可能だが、Windows Studio エフェクトの特徴は、効果を共通に適用できることだ。

　Windows Studio エフェクトの効果は、カメラやマイクのハードウェアレベルで適用されるようになっており、内部的にはカメラが、物理的なカメラの機能とWindows Studio エフェクトのAI効果で構成される複合的なカメラとして扱われる。

　これにより、Windows Studio エフェクトで設定した背景ぼかしや自動フレーミングなどの効果が、TeamsでもZoomでも、Meetでも、Webexでも適用される。

　つまり、Windows Studio エフェクトで、背景ぼかしや明るさなどを調整しておけば、どのWeb会議アプリで呼び出されても、いつも同じ効果で対応できることになる。

　実際に使ってみたところ、ラグがないのが印象的だ。肌をきれいにするような効果を適用した状態で動いても、よほど激しくない限りは、画面内で効果が外れてしまうようなことがない。いつでも快適に使えるという意味では、Copilot+ PCで最も実用的な機能と言えそうだ。

Zoomの画面。Zoom側ではカメラ効果をすべてオフにしているが、Windows Studio エフェクトのおかげで効果が適用されている

イメージクリエーター/リスタイル

　イメージクリエーターは、フォトアプリに搭載されている画像生成機能となる。

　既存のWindowsでもCopilot経由で、クラウド上で提供されているデザイナーのイメージクリエーターを利用することができたが、Copilot+ PCではローカルで動作するモデル(Microsoftが微調整した独自のオープンソースAIモデル)が利用されている。これにより、コクリエイター同様、ブーストを気にせず画像生成や編集が可能になる。

　具体的には、テキストから画像を生成する「イメージクリエーター」と、既存の画像(写真)をプロンプトや選択したスタイルで変換する「リスタイル」を利用できる。

フォトアプリに搭載されているイメージクリエーターとリスタイル

　Microsoftのドキュメントによると、イメージクリエーターではText-to-Imageモデル、リスタイルではSketch-to-Imageモデルを使い分けているようで、さらに注意点としてプロンプトを英語に翻訳してから実行することも述べられている(詳細はこちら)。このため、生成時は英語を利用したほうが精度が高い。

　イメージクリエーターについては、Web上などで提供されている画像生成AIと同様にプロンプトによって画像を生成するが、高速かつ無料という特徴を生かして、ガンガン生成できるイメージだ。プロンプトを入力すると複数の候補が短時間で生成され、プロンプトを書き換えたり追加したりすると、候補がスレッド表示のようにスクロールしながら、次々に画像が生成されていく。

　ただし、プロンプトがなかなか難しい。現状は英語に最適化されており、日本語は翻訳されてから生成されるようになっている影響が大きいが、日本語で入力すると(特に人物を含むプロンプト)、ゆがんだ画像やくずれた画像が結構な確率で出現する。基本的には英語で入力することをおすすめする。

日本語のプロンプトだとゆがんだ画像などが出現しやすい

英語だとプロンプトの指示を正しく受け取る

　なお、この機能もコクリエイターと同様に、コンテンツフィルタ(有害な生成などを防ぐAIの安全な使用を確保するための機能)を利用するためにクラウドサービスにアクセスする必要がある。また、コンテンツ資格情報が付与される。

ネット上で公開されているプロンプトなどをそのまま入力すると、フィルタによって生成が拒否されることもある

生成された画像にはコンテンツ資格情報が付与される

　使用条件については、ローカルで生成されるサービスとなるため、既存の「DesignerのImage Creatorの使用条件」が適用されるわけではないが、使用時にMicrosoftアカウントでサインインする必要があるため、Microsoftのオンラインサービスとしての使用条件など、既存の使用条件に準じて利用するのが妥当と言えそうだ。

　簡単に言えば、基本的にMicrosoftではどの使用条件でも生成されたコンテンツに対して「所有権を主張しない」という表現にとどまっている。

　このため、使用の用途は限定されず(以前記載されていた『非商用利用』表記も現在はない)、ユーザーの責任において利用することになる。似た画像など存在しないか、第三者の権利を侵害していないかを検証して利用する必要があるだろう。

Microsoftの方針は、「Microsoftは所有権は主張しない」「ユーザーの責任においてコンテンツを利用する」というもの

　そもそも現状のCopilot+ PCは個人向けという位置づけで法人利用は想定されていない。搭載されるWindowsのエディションもHomeとなっている。もちろん、Proにアップグレードし、法人向けアカウントでサインインすることも可能だが、現状のペイントやフォトアプリなどの機能は個人向けのMicrosoftアカウントでのみ利用可能となっている点に注意が必要だ。

ライブキャプション

　ライブキャプションは、PCの音声出力をリアルタイムに翻訳し、画面上に表示する機能となる。現状もアクセシビリティ機能として搭載されているが、Copilot+ PCではNPUを使用した高速な翻訳と表示が可能になっている。

　残念ながら、現状は英語のみの表示にしか対応していないため、利用シーンは限られてしまうが、たとえば日本語で作成したプロモーション動画などでも、PCでの再生時に自動的に英語字幕を表示することが可能になる。

　YouTubeなど、アプリケーションやサービスでも同様の機能を利用できるが、Windows Studio エフェクト同様に、この機能もアプリを問わず利用できるのがメリットとなる。

　シンプルに、ライブキャプションをオンにした状態で、動画や音声を再生すれば自動的に字幕が表示される。日本語表示への対応が待ち望まれる機能だ。

ライブキャプション。PCの音声出力を自動翻訳して英語字幕で表示する。NPUを使った翻訳字幕表示は、現状、英語のみ対応

自動スーパー解像度(Auto SR)

　最後の自動スーパー解像度(Auto SR)は、ゲーム向けの機能で、フレームレート優先の低解像度設定でゲームをプレイした場合でも、NPUによって自動的に保管することで高い品質(解像度)を得られるようにする機能となる。

標準でオンになっている自動スーパー解像度

　詳細は、引用先のMicrosoftのサイトを参照してほしいが、1440pネイティブの場合と、720pでAuto SRを有効化した場合の比較を見ると、高いフレームレートを維持しつつ、高精細な画像も実現できていることが分かる。

　とはいえ、現状のCopilot+ PCはArmベースとなるため、ゲーム目的でPCを購入するユーザーは少ないと考えられる。今後、登場予定の他ベンダーチップを搭載したCopilot+ PC向けの機能と言えそうだ。

Microsoftのサイトで公開されている自動スーパー解像度の効果例

7days to Dieで検証。720p以上に設定すると、自動スーパー解像度によってNPUが稼働していることを確認できた

Copilot+ PCはタッチ+縦解像度＋メモリにこだわるべき

　以上、Copilot+ PCでできることを解説した。

　NPUによって、従来のPCではできないことが実現できるようになる画期的なPCと言えるだろう。もちろん、すべての機能が実用的とは言わないが、Windows Studio エフェクトなどは、ビジネスシーンで地味に便利な機能となっている。

　また、Copilot+ PCには今後の目玉として、NPUに最適化された小規模言語モデルの「Phi-Silica」の登場も控えている。これが搭載されれば、さらにできることが広がるはずだ。

　なお、実際にCopilot+ PCを購入する際は、2つのポイントに注目することをおすすめする。

　1つは、コクリエイターでラフを描くときに便利なタッチ対応だ。マウスでも不可能ではないが、元絵の品質が低いと、生成される画像の品質も低くなるので、タッチで描けるほうが圧倒的に便利だ。

　もう1つはメモリだ。今回のCopilot+ PCのラインナップでは16GBが一般的だが、個人的には32GB搭載モデルをおすすめしたい。理由は、複数のAIモデルを快適に動作させるためだ。NPU向けのAIモデルは8bit/4bit量子化によって小型軽量に調整されているが、それでもメモリを多く消費する。

　現状でも、コクリエイターやWindows Studio エフェクトなどで12GB前後のメモリを消費する。

Copilot+ PCにはメモリが必要

　今後、Phi-Silicaのような言語モデルが登場すれば、4bit量子化でも3GB前後のメモリを常に消費することになる。複数のAIモデルを活用し、さらにアプリも使うとなれば、メモリには余裕があるほうが好ましい。

　そういった意味では、今回試用した「Lenovo Yoga Slim 7x Gen 9」は理想的なPCと言える。タッチ対応、メモリ32GB搭載で、実売価格が24万円と抑えられている。

　Armということで当初は互換性が気になったのだが、WebやOfficeを使う分には問題ない上、ゲームもエミュレーションで動作させることができた(Easy Anti-Cheatは無効化)。IMEなどシステムと密接に連携するソフトウェア以外は、互換性に敏感にならなくてもよさそうだ。

　Copilot+ PCの購入を検討しているのであれば、候補の1つと考えるといいだろう。

スリムでリーズナブルなのにタッチ対応で、メモリ32GB搭載の「Lenovo Yoga Slim 7x Gen 9」