ニュース
Google新AIの「Gemini Pro」、Google Cloud開発者と大企業に無償プレビュー開始
2023年12月14日 00:00
Googleの子会社でCSP(クラウドサービスプロバイダー)のGoogle Cloudは、12月13日(日本時間12月14日)に報道発表を行ない、開発者や大企業などをターゲットにした「Gemini Pro」について、生成AIを含むAI開発ツールになる「Google AI Studio」、生成AIのマネージドサービスな開発ツールとなる「Vertex AI」から、Gemini ProをAPIの形で利用できるようになると発表した。来年(2024年)に予定されている一般提供開始(GA)までは無償で利用でき、GA後も従来に比べて低価格で利用できる。
また、Google Workspaceに生成AIの機能をもたらす「Duet AI」にも、Gemini適用のプレビュー提供が2024年初頭から行なわれることも明らかにされ、生産性を向上させるGoogle Workspace+Duet AIが、Geminiによりさらに便利になっていくことになる。
Microsoftに先を越された感があるGoogle、Geminiで逆襲
Googleが先週発表したGeminiは一種の社会現象になるほど、各所で話題になった。Geminiは、新しい生成AIのAIモデルだ(基盤モデルやファウンデーションモデルとも呼ばれるが、ここではAIモデルに統一する)。GoogleにとってGeminiは、生成AI=OpenAI+Microsoftという図式を覆すための武器だ。
AIモデルはデジタル的な人間の脳の入れものだと考えると分かりやすい、そのモデルを“学習”させて使えるAIに進化させていくことが、開発の現場では行なわれている。その時に、どんなモデルをプログラマーが最初に用意するかで、AIの精度、正確性、性能などが変わってくるため、AIアプリケーション開発企業にとっては大きな関心事になっている。
たとえば、OpenAIが開発して、Microsoftが同社のCopilotなどに採用して話題になった「GPT」はその代表例と言える。GPTなどのLLM(大規模言語モデル)と呼ばれるモデルは、言葉を理解してそれを文字にしたりなどの機能を実現するAIモデルになっており、従来のAIよりもパラメータ(脳の容量が増えたようなものだと理解すればよい)が巨大になり、人間と同じように話したり、言葉を翻訳したり、人間の質問に自然に応答したリができるようになっている。
こうしたGPTをいち早く採用したOpenAI自身の「ChatGPT」、Microsoftの「Copilot(当初はBing Chat)」などが注目を集めて、生成AIは社会現象のようになっている。
しかし、AIモデルの選択肢はOpenAIが開発したGPT一択ということではなく、実際には複数のモデルがオープンソースで提供されており、それらを利用することで、ChatGPTやMicrosoft Copilotに負けない、あるいはそれを上回る生成AIを構築することが可能になる。
Gemini ProがAI Studio、Vertex AIという2つのGoogle Cloudの生成AI開発ツールにおいて、無償でプレビュー利用可能に
そうした状況の中で、先週Googleが発表したのがGeminiだ。Geminiは簡単に言えば、「GPT」や「Llama 2」、「Titan」などのAIモデルの最新版で、Googleがフルスクラッチから開発したものになる。
Geminiの特徴は、現在の生成AIのトレンドであるマルチモーダル(いわゆるベクターデータとなる動画や静止画、音楽などに関しても人間に近く判別したりできること)を最初から取り入れていることにあり、Google自身のベンチマークによれば、GPT-4やGPT-4vなどのOpenAIが提供するAIモデルよりも高いパフォーマンスを最初から発揮するという点にある。
これにより、将来Geminiを利用してAIアプリケーションを構築すると、より人間に近い判断や、会話などができる生成AIが実現できると期待されている。
このGeminiの3つのグレード(Ultra、Pro、Nano)が用意されているが、このうちUltraは発表時で特定の大企業などに対してプレビュー提供しているほか、Nanoはエッジデバイス(スマートフォンやPCなどのこと)向けに、「Pixel 8 Pro」に既に提供が開始されている。今回の発表は、発表がなかったなかった「Pro」が、Google Cloudの顧客などにプレビュー提供が開始されたことだ。
Gemini Proを提供するのは、2つのAIアプリケーションの開発ツールとなる。1つはGoogle AI Studioで、もう1つがVertex AIだ。
前者はWebベースの開発ツールで、ユーザー自身が自分でGoogleのハードウェアインスタンスなどを設定して学習させ、アプリケーションを構築する。後者もWebベースの開発ツールだがマネージドサービスと呼ばれる、ハードウェアなどのインフラはGoogleが自動で設定し、必要な分のハードウェアが自動で割り当てられ、AIモデルの学習やアプリケーションの実行などが行なわれる。
また、開発者や大企業などが自分のデータを利用して学習するといったチューニングも可能で、生成AI開発のさまざまなニーズに応えられるとGoogle Cloudは説明している。
GoogleはこのAI Studio/Vertex AIに対して、APIの形でGemini Proのプレビュー提供を行なう。現時点では32Kウィンドウテキストが有効で、テキストの処理は入力と出力に対応している。また、マルチモーダルの機能を実現するためのGemini Pro Visionが今回発表され、それを活用することでテキストだけでなくイメージの入力にも対応する。
Gemini Proは既に38の言語をサポートしており、180カ国で提供される計画だ。また、開発者向けにはPython、Android(Kotlin)、Node.js、Swift、JavaScriptなどをサポートした開発キット(SDK)も提供される。
Gemini Proの価格だが、現時点ではプレビュー提供であるため無償で利用できる。AI Studioを利用する開発者は1分間に60リクエストという制限内で利用できる(Googleによればほとんどのアプリの開発ではこれで十分だとのこと)。
来年(2024年)初頭に予定されている、一般提供開始以後は有料になるが、入力は1千文字あたり0.00025ドル、1イメージあたり0.0025ドル、出力は1千文字あたり0.0005ドルという価格だと明らかにされている。
Duet AIにも来年初頭から一般提供開始でGeminiの適用が開始
GeminiのAIモデルは今後、Google Cloudが提供するさまざまなサービスに実装し、それに伴って新しいサービスの提供を開始する。
Google Workspace(Googleのクラウドベースの生産性向上ツール、Microsoft 365のようなサービス)向けにGoogleは、Duet AIという生成AIベースのサービスがあり、米国などではユーザーあたり月額30ドルで既にサービス提供を開始している。そのDuet AIにも、Geminiの適用を2024年初頭から一般提供開始する。
Google Workspaceには、Gmail(電子メール)やMeet(電話会議)、Docs(ワープロ)、Spreadsheet(表計算)などさまざまな機能が用意されているが、Geminiを適用したDuet AIを活用すると、表計算の機能を利用して情報の分析、ワープロで文章を書く時に文章の構成や翻訳など、Geminiを適用されたDuet AIがこれまでよりも高精度で行なえるようになる。同じようにMeetの要約や翻訳といった機能がより高度になっていくとGoogle Cloudでは説明している。
このほかにも、Vertex AIで、より高度な検索を構築するための「Vertex AI Search」や会話型AIを作成するための「Vertex AI Conversation」に関しても、Geminiのプレビュー適用が来年初頭から開始される。Geminiに対応することで、これらの検索や会話型AIでマルチモーダルな処理が可能になるなどのメリットを開発者にもたらすことになる。