ニュース
OpenAI、Webブラウザでの作業をAIが肩代わりする「Operator」
2025年1月28日 06:13
OpenAIは、独自ブラウザを使用してユーザーのタスクをAIが肩代わりして実行できる「Operator」のリサーチプレビュー版を公開した。まずは米国のProユーザー向けに展開する。
Operatorは、独自ブラウザでWebアクセスしてユーザーに代わってタスクを実行できるエージェント。フォームへの記入/食料品の注文/ミームの作成など、さまざまな反復的なタスクを説明/指示するだけでAI処理できる。使われているモデルは「CUA」という新規モデルで、GPT-4oと組み合わせてGUIを操作するようにトレーニングされている。
安全性やプライバシーへの配慮として、ログイン情報などをユーザーに委ねる「テイクオーバーモード」、モデルのトレーニングからデータを除外する「オプトアウト」などを実装。また、プロンプトインジェクションの検出やモニターモデルによる監視などにより有害なリクエストを拒否。再三の警告に応じないユーザーはブロックすることも明記されている。
安全対策を講じたうえで設計されているものの、完璧な状態ではないため現時点では研究プレビューであるとしている。今後はフィードバックやテストを介して改善に取り組み、APIも近日中に公開。将来的にPlus、Team、Enterpriseユーザーにも拡大し、機能をChatGPTに統合する予定。
A research preview of Operator, an agent that can use its own browser to perform tasks for you.pic.twitter.com/wkBBDIlVqj
— OpenAI (@OpenAI)January 23, 2025