ニュース

OpenAI、コスト効率がもっとも高いLLM「GPT-4o mini」

 OpenAIは18日(米国時間)、もっともコスト効率が高いと謳う小型モデル「GPT-4o mini」を発表した。価格は入力トークン100万個あたり15セント、出力トークン100万個あたり60セントとなっており、以前のフロンティアモデルと比較して一桁安く、GPT-3.5 Turboと比較しても60%安価。手頃な価格となったことでAIアプリケーションの範囲が大幅に拡大すると期待している。

 GPT-4o miniは低コストと低レイテンシで、複数モデルの呼び出しを連鎖または並列化したり、大量のコンテキストをモデルに渡したり、高速でリアルタイムのテキスト応答を通じて顧客と対話したりするアプリケーションに好適としている。

 現在のAPIではテキストとビジョンをサポートしているが、将来的にはビデオ、オーディオの入出力もサポート。128Kトークンのコンテキストウィンドウを備え、リクエストごとに最大16Kの出力トークンに対応。また、2023年10月までの知識があるという。GPT-4oと共通の改善版トークナイザーにより、英語以外のテキスト処理におけるコスト効率が改善されたという。

 性能面では、テキストインテリジェンスと推論ベンチマークのMMLUで82%のスコアを獲得したほか、数学的推論のMGSMは87%、コーディングパフォーマンスのHumanEvalは87.2%、マルチモーダル推論評価であるMMMUでは59.4%のスコアを記録。いずれも競合の「Gemini Flash」や「Claude Haiku」を上回るとしている。

ベンチマーク比較