ニュース

Amazon、人の代わりにWebブラウザ上で操作を行なうAI「Nova Act」

 Amazonは4月1日、新たなAIモデル「Nova Act」を発表した。ユーザーの指示に応じてWebブラウザ上で操作を行なうAIエージェントの構築に使えるもので、現在SDKの研究プレビュー版が公開されており、開発者はSDKを使ってエージェントを構築できる。

 Nova Actは、Webブラウザ内でアクションを行なうことを目的にトレーニングされたAIモデル。たとえば社内システムで不在申請を提出する、カレンダーを不在に設定する、外出中のメールを送信するといった操作をAIエージェントで実現可能にする。

 開発者向けに提供するNova Act SDKでは、検索、チェックアウト、質問への回答など、複雑なワークフローを細かなコマンドを分解できる仕組みを採用。より詳細な指示を追加したり、APIを呼び出したりといった動作も組み込むことができるという。

 開発に際しては、より信頼性が高く役立つエージェントが構築できるよう、日付の選択やドロップダウン、ポップアップの操作といった機能において、社内評価で90%以上のスコアの達成を目指したという。ベンチマーク結果では、Claude 3.7 SonnetやOpenAI CUAと比べても優れた性能を発揮できたと説明している。

Introducing Amazon Nova Act
Amazon Nova Act | Running on a Schedule
Amazon Nova Act | Unseen Environments