特集
Googleの対話型AI「Gemini」は何ができるのか?無料版と有料版、そしてMicrosoft Copilotと機能を比較
2024年2月15日 06:34
2022年11月に、ChatGPTの正式サービスが始まって以来、世の中は「生成AI」の話題で持ちきりになった。そうした中で、Googleは従来Bardの名称で提供してきた対話型AIのブランド名を「Gemini」に変更。その上位版となる「Gemini Advanced」も明らかになった。
本記事ではGeminiにブランド名が変更された背景や、Geminiと競合製品(ChatGPT/Copilot)との違いについて説明していきたい。
生成AIとは従来のML/DLベースのAIモデルがより大規模になったもの
生成AI(Generative AI)とは、基本的には2010年代の半ばからIT業界が取り組んできた、マシンラーニング(MLまたは機械学習)/ディープラーニング(DLまたは深層学習)ベースのAIが発展したものになる。それを説明するために、そもそもML/DLなAIとはどういうものかを振り返っておきたい。
ML/DLベースのAIは、モデルとかファンデーションモデルと呼ばれるAIのブラックボックスが作られる。画像認識のAIであれば、作成したモデルに必要なデータ(具体的には写真など)を読み込ませて、猫の写真を猫、犬の写真を犬と教えていく(あるいはモデルが自分で学習する)。そうしたデータを読み込ませてモデル鍛えることをAIの世界では「学習」(英語ではTraining)と呼んでいる。
そして学習したモデルを使って、今度はそのモデルに猫の写真を見せて、猫だと判別してもらう。そうしたプロセスを、AIでは「推論」(英語ではInference)と呼んでおり、基本的にはこの学習と推論という2つのフェーズでAIを構築していく仕組みになっている。
生成AIもその基本的な仕組みは同じだが、モデルが従来のML/DLベースのAIとは比較にならないほど大規模になっていることが特徴だ。
たとえば、生成AIの代表例であるLLM(大規模言語モデル)ではニューラルネットワークのパラメータが数千億から数千兆まで達すると言われている。つまり、従来のML/DLベースのAIよりもモデルの大きさが大規模になっていることが生成AIの特徴だと言える。
パラメータが増えると、学習にかかる時間は増える。基本的にML/DLベースのAI学習は、GPUのような並列処理が得意なプロセッサを利用して行なうが、生成AIに対応したモデルが増えれば増えるほど、GPUなどのAI処理を専用に行なうAIプロセッサへの需要が青天井になっているのが現状だ。
なお、推論は主にCPUで行なわれているが、最近はLLMの推論にGPUを使う例も増え始めている。
Google「Gemini」が好反応。BardやDuet AIも今後はGeminiブランドに
生成AIが現在のように大きな話題を呼ぶようになったのは、OpenAIがChatGPTを2022年11月にリリースしてからになる。
この生成AIのトレンドにいち早く乗ったのはMicrosoftだ。OpenAIがGPT(Generative Pre-trained Transformer)というLLMを活用したChatGPTのサービスを開始すると、MicrosoftはOpenAIのソフトウェア資産を活用した生成AIのサービスを続々とリリースし始めた。
実は、MicrosoftはChatGPTが話題になる前から、OpenAIに投資しており、2019年に10億ドル、2023年の1月にも数十億ドルの投資を行なうことを発表している。MicrosoftはOpenAIのソフトウェア資産を活用したサービスの提供を行ない、OpenAIはMicrosoftのクラウドサービスであるAzureのコンピューティングリソース(GPUなど)を活用するという契約も明らかにされている。
Microsoftはそれを活用して、GPT-4カスタム版をベースとし、後に「Copilot」(発表時はBingChat)となる話型AIツールを投入。Copilot Pro/Copilot for Microsoft 365(発表時Microsoft 365 Copilot)といった生成AIを活用した生産性向上ツールの投入も明らかにした。
こうした早い展開により、「生成AI=OpenAI=Microsoft」という構図が出来上がっていったというのが2023年の動向になる。
それに対してGoogleは、大規模言語モデルとして「PaLM 2」(パームツー)、そしてChatGPT/Copilotに対抗するような対話型AIとして「Bard」を投入したが、率直に言ってChatGPTやCopilotほどは知名度が上がらず苦戦していた。
このままでは、Googleが検索の覇者となり、Microsoftが敗者になった2000年代とは逆の状況が発生するのではと見られていた。
そこで、2023年の12月にGoogleが新しい生成AIモデル「Gemini」(英語ではジェムナイ、日本語だとジェミニ)を発表した。
GeminiはOpenAIの最新版のGPT-4を上回る性能を持つとGoogleがアピールしており、マルチモーダルと呼ばれる人間だけができていた複数要素を利用しての推論などが今後可能になる見通しだ。
GPT-4よりも高い基本性能を持つことを、Googleが数字をもって説明したため、それこそ世界中のメディアで「Gemini」の名前が取り上げられ、GPTの有力な対抗馬として注目されるようになっていった。
技術的にGeminiがGPT4より上かどうかは、どの角度から見るかによっても変わってくるので、そうした細かな議論は置いておくが、マーケティング的にいいイメージを持ってもらうことに成功した言えるだろう。
そして先日「Gemini」が発表。これまでBardやDuet AIと呼ばれてきた生産性向上ツール(DocsやSpreadsheetなど)向けの生成AI機能も、今後はまとめてGeminiになるということだ。
ここでGoogleが狙っていることは明白で、よいイメージを持たれることに成功した「Gemini」の名前を対話型AIや生産性向上ツールのAIなどの名称に利用することで、ユーザーの認知度を上げ、OpenAIのChatGPTやMicrosoft Copilotと競争していきたいということだろう。
Gemini AdvancedはGemini Ultraと2TBストレージがセットに
現在生成AIベースの対話型AIは、OpenAIのChatGPT、GoogleのGemini、MicrosoftのCopilotが並んでいる状況だが、それぞれ無料版(無印)と有料版(Plus、Advanced、Proとそれぞれ付いている)があり、価格や機能の違いをまとめると以下のようになる。
ChatGPT | ChatGPT Plus | Gemini | Gemini Advanced | Copilot | Copilot Pro | |
---|---|---|---|---|---|---|
モデル | GPT-3.5 | GPT-4/DALL·E | Gemini Pro | Gemini Ultra | GPT-4ベースカスタム | GPT-4ベースカスタム |
アカウント | ChatGPT | ChatGPT | Microsoft | Microsoft | ||
ストレージ | 非公開 | 非公開 | 15GB | 2TB | 5GB | 1TB |
日本語 | 対応 | 対応 | 対応 | - | 対応 | 対応 |
生産性向上アプリケーション | - | - | Google Docsなど (クラウドのみ) | Google Docsなど (クラウドのみ) | Microsoft 365 Apps (クラウドのみ) | Microsoft 365 Apps (ローカル/クラウド) |
価格 (月額/1ユーザー) | 無料 | 20ドル(約3,000円) | 無料 | 2,900円 | 無料 | 4,690円 (1,490円+3,200円) |
いわゆる生成AIのできることに大きな違いはない。プロンプトにやってほしいことを入力するという形で、何かを調べたり、画像を生成したり、データを分析したりという基本機能はほぼ同等だ。また、プラグインを利用してほかのサービスと接続して何かができるようになるという点もどのサービスでも利用可能だ。
今回発表されたBard改めGeminiには、2つのグレードがある。Gemini(無印)と上位版となるGemini Advancedがそれだ。2つの大きな違いは、採用されているモデルの差だ。ややこしいが「生成AIモデルとしてのGemini」には3つのグレードがある。それが上からGemini Ultra、Gemini Pro、Gemini Nanoになる。
このうちGemini Nanoは、スマートフォンなどでデバイス上のプロセッサ(CPU/GPU/NPUなど)で処理を行なうためのモデルで、すでにPixel 8 Proなどで採用されている。先日Samsungが発表したGalaxy S24シリーズ(Galaxy S24/S24+/S24 Ultra)にも採用されていることが、Samsung、Googleから明らかにされている。
クラウド経由で提供されるGeminiとGemini Advancedには、それぞれGemini ProとGemini Ultraが「生成AIモデルのGemini」として採用されている。両者の基本的な違いは何かと言うと、モデルの規模だ。Gemini Ultraのほうがより大規模であり、より高品質な生成AIを提供できるということだ。
GoogleがGPT-4を上回ると説明しているのは、Gemini Ultraからになるので、より高い利便性で使いたいと考えるのならGemini Advancedを選ぶべきだろう。
なお、無印のGeminiはこれまで通り無償で利用できる。しかし、Gemini Advancedのほうは有料で、「Google One AI Premiumプラン」と呼ばれるほかのGoogleのサービスとセットで提供されるサブスクリプション契約の一部として利用できる。日本では1ユーザーあたり月額2,900円(税別)だ。
ただし、現時点ではGemini Advancedと後述するGoogle Docs関連の機能は、日本でも英語版でのみの提供となっており、早期の日本語版提供に期待したいところだ(無料版のGeminiは日本語に対応しているので、時間の問題だと考えられるが……)。
今回発表されたBard改めGeminiの強みは、大容量のストレージとその月額料金の安さだ。上位版となるGemini Proは、月額料金が2,900円/月という有料プランの中でもっとも安価で使え、かつ2TBのストレージを利用できる。
Gemini Advancedの場合、すでに提供されてきたGoogle One Premiumプラン(月額1,300円、2TB)に1,600円を追加することでGemini Advancedを使えるので、ChatGPT Plusの月額20ドル(日本円で約3,000円)と比較して、安価な価格設定と言える。
重要なのは、こうした生成AIを活用するには、自分のデータをクラウドストレージに上げておく必要があることだ。というのも、たとえば過去の自分が作成したスライドを全部参照して新しいスライドを作ってほしいということを、Gemini AdvancedやCopilot Proにお願いすることを考えてみよう。
その時にGemini AdvancedやCopilot Proに過去の資料を参照してもらうには、何らかの形でGoogleストレージやOneDriveにデータが上がっている必要がある。
余談になるが、筆者の周りでもCopilot Proが思ったより使えなかったという人と使えるという人と意見が真っ二つなのだが、使えないという人によくよく話を聞いてみると、クラウドストレージにデータを上げていないというユーザーがほとんどだった。
その意味では、Gemini AdvancedやCopilot Proを本格的に使いこなしたいと思うのであれば、データをクラウドストレージにアップロードすることは前準備として検討しておきたいところだし、クラウドストレージの容量が多いGemini Advancedはその点で優位性があると言える。
Copilot ProはローカルのOfficeアプリで生成AIを利用できるのが特徴
Google One AI Premium | Microsoft 365 Personal+Copilot Pro | |
---|---|---|
クラウドストレージ | 2TB | 1TB |
対話型AIツール | Gemini Advanced | Copilot |
対話型AIモデル | Gemini Ultra | OpenAI GPT-4カスタム |
電子メール | Gmail | Outlook |
オフィスアプリケーション | クラウドのみ | Microsoft 365 Apps (ローカル/クラウド) |
生産性向上ツール向け生成AI | Gemini in Gmail/Docs/Sheetなど (旧Duet AI) | Copilot Pro |
価格 (月額/1ユーザー) | 2,900円 | 4,690円 (1,490円+3,200円) |
MicrosoftのCopilot Proとの比較では、やはり料金の安さが光る。Copilot Pro(月額3,200円)を利用するには、別途Microsoft 365 Personal(月額1,490円)ないしはMicrosoft 365 Family(月額2,100円)が必要になり、Microsoft 365 Personalと組み合わせた場合は月額4,690円、Microsoft 365 Familyと組み合わせた場合には月額5,300円となり、GoogleのGoogle One AI Premiumプランに比べるとやや高額な設定になってしまう。
しかも、クラウドストレージの容量はGoogle One AI Premiumプランが2TBであるのに対して、Microsoftの両プランは1TBになっていることも見逃せない。
しかし、Microsoft 365+Copilot Proには、日本でほとんどのビジネスパーソンが利用しているMicrosoft Officeアプリ(Microsoft 365 Apps)で生成AIが利用できるようになるというメリットがある。
たとえば、Wordの文章を、Wordのアプリケーション上から要約するなどの機能をそのまま利用できる。この点はビジネスパーソンにとっては大きなメリットと言え、その価格差に見合うものだと言えるだろう。
なお、Copilot Proはオンプレミス版のOfficeとは組み合わせて利用することはできない、あくまでMicrosoft 365とだけ組み合わせられる。
これに対してGemini Advancedでは、クラウドベースのオフィスツールであるGoogle Docs(ドキュメント/スプレッドシート/スライド/フォームなど)向けに生成AIを利用できるが、Google DocsはWebブラウザからのみ利用可能で、PC上でローカルに実行できるアプリは提供されていないのはマイナスポイントだと言える(それと同時に現時点ではGoogle Docsの生成AI機能は日本語未対応)。
その意味では、日本語対応とMicrosoft Officeでの利用が優先ならCopilot Pro、ストレージ容量が優先ならGemini Advancedというのが現時点での選択ということになるのではないだろうか。