ニュース

OpenAI、より高度な推論能力でAGIに近づいた「o3」。小型モデルは1月下旬に公開

 OpenAIは20日(米国時間)、最新のAIモデル「OpenAI o3」および小型モデル「OpenAI o3-mini」を発表した。いずれも研究者向けに安全性テストへの早期アクセスの募集を開始し、応募期間は2025年1月10日まで。OpenAI o3-miniは2025年1月末までの一般公開を予定している。

 「OpenAI o1」シリーズの後継となり、より高度な推論能力を備えたモデルとなる。特にAGI(汎用人工知能)の進歩を測るベンチマークで人間の平均スコアを上回る結果を記録している。なお、名称を「o2」にしなかったのは、通信事業者のTelefonicaが展開する携帯キャリア「O2」と被るためだという。

 OpenAI o3は、コーディングや数学などの分野で非常に高いベンチマーク結果を記録している。競技プログラミングのCodeforcesベンチマークではOpenAIの社員を超える2,727を記録したほか、2024年のAIME(アメリカ数学選抜試験)では96.7%の正答率、GPQA Diamondでは博士号レベルの70%を上回る87.7%の正答率を発揮している。

o1 previewやo1との性能比較(コーディング)
o1 previewやo1との性能比較(数学)

 また、AGIの進歩を測るベンチマーク「ARC-AGI」では、人間の平均を上回る最高87.5%のスコアを記録している。最高32%のOpenAI o1と比べて、これまで人間には簡単だがAIには難しかった変換ルールを推測する問題なども答えられるようになり、性能向上を謳っている。

ARC-AGIでのベンチマーク結果
これまでAIには難しかった問題も解答できるように