ニュース

OpenAI、Webブラウザでの作業をAIが肩代わりする「Operator」

 OpenAIは、独自ブラウザを使用してユーザーのタスクをAIが肩代わりして実行できる「Operator」のリサーチプレビュー版を公開した。まずは米国のProユーザー向けに展開する。

 Operatorは、独自ブラウザでWebアクセスしてユーザーに代わってタスクを実行できるエージェント。フォームへの記入/食料品の注文/ミームの作成など、さまざまな反復的なタスクを説明/指示するだけでAI処理できる。使われているモデルは「CUA」という新規モデルで、GPT-4oと組み合わせてGUIを操作するようにトレーニングされている。

 安全性やプライバシーへの配慮として、ログイン情報などをユーザーに委ねる「テイクオーバーモード」、モデルのトレーニングからデータを除外する「オプトアウト」などを実装。また、プロンプトインジェクションの検出やモニターモデルによる監視などにより有害なリクエストを拒否。再三の警告に応じないユーザーはブロックすることも明記されている。

 安全対策を講じたうえで設計されているものの、完璧な状態ではないため現時点では研究プレビューであるとしている。今後はフィードバックやテストを介して改善に取り組み、APIも近日中に公開。将来的にPlus、Team、Enterpriseユーザーにも拡大し、機能をChatGPTに統合する予定。