ニュース

OpenAI「GPT-5.2」開始。専門業務で人間と同等、エラー率は半減

 OpenAIは12月11日、専門的な知識業務などの性能を大幅に向上させた新型AIモデル「GPT-5.2」を提供開始した。ChatGPT Plus/Pro/Go/Business/Enterpriseプラン向けには順次展開を開始しており、API経由での利用も可能となっている。

 GPT-5.2は、専門的な知識業務やコーディング、数学/科学、画像認識など幅広い領域で性能を改善した新型AIモデル。プレゼンやスプレッドシートの作成などを含む、知識業務タスクの能力を測るGDPvalでは、新モデル「GPT-5.2 Thinking」がタスクの70.7%において、業界トップクラスの専門家と同等以上の成果物を、11倍以上の速度で生成したとしている。

GDPvalの結果
プロジェクト報告書を作成させた例。左がGPT-5.1 Thinking、右がGPT-5.2 Thinking

 画像認識では、GPT-5.2 Thinkingのチャート推論などにおけるエラー率を約半分にまで抑制。ダッシュボード、ビジュアルレポート、技術図面や製品スクリーンショットなどを、より正確に解釈できるようになった。また、長文コンテキストの推論性能も向上しており、契約書や研究論文など数十万トークン規模のドキュメントでも一貫性と精度を保って処理できる。

 コーディング性能も改善しており、GPT-5.2 ThinkingがSWE-Bench Proベンチマークで55.6%のスコアを達成。従来のモデルと比べ、フロントエンド開発や特に3D要素を含むような複雑なUI作業などに関して、性能が上がった。

マザーボードの部品を特定させた例。左がGPT-5.1、右がGPT-5.2
SWE-Bench Proの結果

 そのほか、科学/数学分野や汎用的な推論能力も、従来モデルから大幅に強化された。ハルシネーションの発生率も低減している。

 モデルラインナップは、Instant、Thinking、Proの3種類で展開される。なお、GPT-5.2の提供開始にともない、前世代のGPT-5.1はレガシーモデルへ移行し、有料ユーザー向けに今後3カ月間提供が続けられる。