ニュース

推論性能をさらに高めた「OpenAI o3-pro」。o3の料金引き下げも

専門家によるOpenAI o3-proの評価結果

 OpenAIは、OpenAI o3をベースとした推論AIモデル「OpenAI o3-pro」を発表した。より長い思考プロセスにより、同社のモデルの中で最も信頼性の高い回答を提示できるとしている。ChatGPTのPro/TeamユーザーおよびAPIを通じて利用できる。

 同社の説明では、専門家による評価において、科学的分析やプログラミングなど各項目でo3よりも高い評価を獲得。AIME 2024やGPQA Diamond、Codeforceといったベンチマークにおいては、pass@1(1回の実行で正解)、4/4 reliability(4回の実行で連続して正解)の2つの評価方法で、o1-proやo3(medium)より優れたスコアを達成したとしている。

各種ベンチマークの結果(pass@1)
各種ベンチマークの結果(4/4 reliability)

 なお、現時点ではo3-proでのチャット機能は利用不可となっているほか、画像生成やCanvasもサポートしていない。あわせて、o3の利用料金が80%引き下げられている。