ニュース

難しい科学問題もOK。答える前に考える時間を取ったLLM「OpenAI o1」

 OpenAIは12日(米国時間)、より複雑なタスクを処理でき、従来より科学、コーディング、数学においてより難しい問題を解決できる大規模言語モデル(LLM)「OpenAI o1」シリーズのプレビューを開始した。ChatGPT Plusサブスクリプションで既に利用可能となっているほか、「GitHub Copilot」にも統合された。

 OpenAI o1では人間と同じように、問題に反応する前にじっくり考える時間を取るようにトレーニングした。これにより、思考プロセスを洗練し、さまざまな戦略を試し、間違いを認識することができるようになったという。

 これにより、物理学、化学、生物学といった難しいベンチマークタスクにおいて、博士課程の学生と同等の性能を発揮したという。また、国際数学オリンピック(IMO)の予選試験を解かせたところ、GPT-4oの正答率はわずか13%だったが、今回の推論モデルでは83%に達した。コーディング能力を計測するCodeforceコンテストでも89%に達した。

 現在初期モデルであるため、Webの情報閲覧や、ファイル/画像のアップロードといったChatGPTの機能は備わっていないが、一般的なケースでは近い将来、GPT-4oより優れる結果を示すようになるだろうとしている。

 ChatGPT Plusに加入している場合、「o1-preview」と「o1-mini」の2つが選べるようになっている。o1-previewは高度な推論が可能。一方o1-miniはより高速で、コーディングタスクについてo1-previewと同等の性能を示す。