ニュース

PCを操作できるAIが登場。進化したClaude 3.5 Sonnetに新機能

computer useのデモの様子

 Anthropicは23日、AIモデル「Claude 3.5 Sonnect」のアップグレード、および新モデルとなる「Claude 3.5 Haiku」を発表した。加えて、ClaudeがPCを操作できるようになる新機能「computer use」もパブリックベータとして提供開始した。

 シリーズの中位モデルとなるClaude 3.5 Sonnetは、Anthropicが以前から提供してきたAIモデルだが、今回はアップグレードが施されたかたち。特にコーディングの性能が改善しており、SWE-bench Verifiedでは性能が33.4%から49%へと向上。OpenAI o1-previewなどを含む公開モデルと比べても高いスコアを記録したとしている。

 下位モデルとなるClaude 3.5 Haikuは、次世代バージョンとして新たに投入されるもので、従来のClaude 3 Haikuと同等のコストと速度を維持しつつ性能を向上。前世代の上位モデルであるClaude 3 Opusを凌ぐ性能を実現したとする。こちらも特にコーディングに強く、SWE-bench VerifiedのスコアではGPT-4oなどを上回る40.6%を達成したという。

アップグレード版Claude 3.5 SonnetとClaude 3.5 Haikuのベンチマーク結果

 また、上述のClaude 3.5 Sonnet向けに、computer useと呼ばれる機能がパブリックベータとして追加された。人間がPCを使うときと同じように、Claudeがカーソルを動かしたり、ボタンをクリックしたり、文字を入力したりして、PCを操作できるようにするものとなる。

 たとえば「私のPCとオンライン上のデータを使って、このフォームに記入して」と指示すると、Claudeがこれを解釈。スプレッドシートをチェックする、カーソルを操作してWebブラウザを起動する、フォームのページまで移動する、データに基づいてフォームに記入するといったかたちで操作に変換し、実際に人間のようにPCを操り、指示を完了する。

 現時点では能力が不完全であり、スクロールやドラッグ、ズームといった操作が課題になっているというが、今後数カ月のうちに性能は急速に向上すると見込んでいるという。なお、本機能はスパムやデマ、詐欺などに悪用される可能性もあるため、安全に展開するための取り組みも行なっていると説明している。

Claude | computer use for automating operations