ニュース

データ分析から資料作成までまとめてやってくれる「ChatGPT agent」

ChatGPT agent

 OpenAIは7月17日、複雑なタスクをまとめて実行してくれるAIエージェント機能「ChatGPT agent」を発表した。プロンプトの入力画面からエージェントモードを有効にすると利用できる。

 ChatGPT Proプランでは17日から、PlusおよびTeamプランでは数日以内に、EnterpriseおよびEducationプランでは数週間以内に順次利用可能となる。利用上限はProプランが月間400メッセージ、それ以外が月間40メッセージまでで、クレジットベースで追加もできる。

 ChatGPT agentは、競合他社を分析してスライドを作る、4人分の朝食を考えて材料を購入するなど、複雑なタスクを一貫して処理できるAIエージェント機能。高度な知能や会話能力を持つChatGPTに加え、Webサイトを直接操作できるOperator、情報を分析/統合するDeep researchといった、既存の機能を統合したものとなる。

 仮想のコンピュータの中で、推論とアクションを柔軟に切り替えながら、ユーザーの指示に基づいて多様なタスクをまとめて処理する。ChatGPTの作業の様子は可視化され、指示の調整や中断などいつでもユーザーは介入できる。

Webサイトを直接操作することもできる
データ分析も可能
Gmailなど外部サービスとの接続にも対応

 機能としては、GUIを通じてWebサイトとインタラクションできるビジュアルブラウザ、Webクエリに向けた推論ベースのシンプルなテキストベースブラウザ、ターミナル、APIへのアクセスを用意。加えて、GmailやGitHubをはじめとした外部サービスと接続できるChatGPT connectors、Webサイトにログインしてより高度なタスクを処理可能にするテイクオーバーモード、タスクのスケジューリングなどにも対応している。

 一方で、AIモデルがWebサイトを直接操作したり、機密性の高い情報にアクセスしたりするため、プロンプトインジェクション攻撃に対する対策やプライバシー保護の機能も実装した。

 同社の説明によれば、「Humanity's Last Exam」において41.6%のスコア、FrontierMathでは27.4%を達成するなど、各種ベンチマークにおいても優れたスコアを獲得したという。