ニュース

GitHub Copilotでの作業データをAI向けに収集開始へ。オプトアウトは可能

 GitHubは3月25日、GitHub Copilotのインタラクションデータの利用ポリシーを更新すると発表。4月24日以降、Copilot Free、Copilot Pro、Copilot Pro+などのプランでの作業内容がデータ収集の対象となり、入力や出力、コードスニペットといったデータがAIモデルのトレーニングに使用されるという。

 GitHub Copilotは、統合開発環境(IDE)向けのAIエージェント。コーディングなどの作業を支援する。

 これまでは、公開データや手作業で作成されたコードサンプルのみがAI向けの学習データとして利用されていた。しかし、Microsoft従業員とCopilotとのインタラクションデータを組み込んだところ、複数の言語で能力の向上が見られるなど成果があったという。これを受け、より多様なユースケースに対応できるようモデルを改善するため、一般ユーザーの実際のデータを利用することにした。

 収集されるデータには、ユーザーが承認または変更した出力、GitHub Copilotに送信された入力、カーソル周辺のコードコンテキストなどが含まれる。一方で、Copilot Business/Enterpriseプランユーザーのデータは使用されない。

 データの利用を防ぎたい場合は、設定の「プライバシー」からオプトアウトできる。GitHubは、さらにモデルを改善し、バグを未然に防ぐ能力などを高めるため、ユーザーに協力を呼びかけている。