ニュース

Anthropic、GPT-4以上の性能を謳う新AIモデル「Claude 3」

 Anthropicは4日、新型AIモデル「Claude 3」ファミリーを発表した。トークン当たりのコストと性能に応じて、Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opusの3種類を用意する。SonnetとOpusはClaude APIですでに利用でき、Haikuは近日中に利用可能となる予定。

 3モデルともに、分析や予測、ニュアンスのあるコンテンツの作成、コード生成に加え、日本語やスペイン語、フランス語といった英語以外での会話の能力が向上。加えて、写真やグラフといったビジュアル情報についても高い処理能力を持つとしている。リリース時点でのコンテキストウィンドウは20万トークンとなるが、100万トークン以上の入力も受け付けられるという。

 一方で、プロンプトを細かく理解できるようになり、無害なプロンプトを有害なものだと誤認識する頻度が大幅に減少。出力する回答の精度も高めており、さらに、回答の根拠となる参照資料を提示する引用機能もまもなく実装される。バイアスへの対処についても継続的に行なっており、従来モデルよりも減らしているという。

 そのほか、今後数カ月中にもアップデートを提供するとしており、一部の企業や大規模展開に向けてTool Use(関数呼び出し)や対話型コーディング(REPL)、より高度なエージェント機能なども実装予定。

Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opusの3種類を用意

 下位のHaikuは、最も高速でコストパフォーマンスが高いモデルとなっており、arXivに掲載されている1万トークン以内の研究論文であれば、チャートやグラフとともに3秒以内で読み取れるという。

 中位のSonnetは、従来のモデルであるClaude 2や2.1と比べて2倍高速となり、より高い知能レベルを実現。知識の検索やセールスの自動化といったすばやい応答が求められるタスクに優れた性能を発揮するという。

 上位のOpusは、Claude 2や2.1と同程度の速度で、はるかに高い知能レベルを実現。学部レベルの専門知識(MMLU)、大学院レベルの専門的な推論(GPQA)、基礎的な数学(GSM8K)など、ほとんどの評価ベンチマークにおいて、GPT-4をはじめとした競合の同様のモデルを上回る性能を発揮できるとする。

上位のOpusは、競合のGPT-4やGemin 1.0などを上回る性能を発揮できるという