ニュース

OpenAI、より高度な推論能力でAGIに近づいた「o3」。小型モデルは1月下旬に公開

浅井淳志

2024年12月23日 16:12

　OpenAIは20日(米国時間)、最新のAIモデル「OpenAI o3」および小型モデル「OpenAI o3-mini」を発表した。いずれも研究者向けに安全性テストへの早期アクセスの募集を開始し、応募期間は2025年1月10日まで。OpenAI o3-miniは2025年1月末までの一般公開を予定している。

　「OpenAI o1」シリーズの後継となり、より高度な推論能力を備えたモデルとなる。特にAGI(汎用人工知能)の進歩を測るベンチマークで人間の平均スコアを上回る結果を記録している。なお、名称を「o2」にしなかったのは、通信事業者のTelefonicaが展開する携帯キャリア「O2」と被るためだという。

　OpenAI o3は、コーディングや数学などの分野で非常に高いベンチマーク結果を記録している。競技プログラミングのCodeforcesベンチマークではOpenAIの社員を超える2,727を記録したほか、2024年のAIME(アメリカ数学選抜試験)では96.7%の正答率、GPQA Diamondでは博士号レベルの70%を上回る87.7%の正答率を発揮している。

o1 previewやo1との性能比較(コーディング)

o1 previewやo1との性能比較(数学)

　また、AGIの進歩を測るベンチマーク「ARC-AGI」では、人間の平均を上回る最高87.5%のスコアを記録している。最高32%のOpenAI o1と比べて、これまで人間には簡単だがAIには難しかった変換ルールを推測する問題なども答えられるようになり、性能向上を謳っている。

ARC-AGIでのベンチマーク結果

これまでAIには難しかった問題も解答できるように

Today, we shared evals for an early version of the next model in our o-model reasoning series: OpenAI o3pic.twitter.com/e4dQWdLbAD
— OpenAI (@OpenAI)December 20, 2024

先読み！IT×ビジネス講座 ChatGPT 対話型AIが生み出す未来