ニュース

AMD、AIの前処理も推論も1チップで行なえる第2世代「Versal」

 AMDは9日、組み込み向けSoC「Versal」シリーズの第2世代として、AI処理向けの「Versal AI Edge Series Gen 2」と汎用処理向けの「Versal Prime Series Gen 2」を発表した。これらはAIエンジンの有無以外は基本的に同様のものであり、本項ではVersal AI Edge Series Gen 2を中心に紹介する。

 AMDは、組み込み型システムにおいて、これまでに「Zynq」などのソリューションを提供してきたが、AIにより注力するために第2世代のVersalアダプティブSoCを投入した。同SoCでは、高温下での機能維持、電力供給の制限、フォームファクター上の制約など、組み込み型システム特有の課題への対応を目指している。

 Versal AI Edge Series Gen 2は、プログラマブルロジック、ベクタープロセッサ、高性能CPUを組み合わせることで、AI処理におけるPreprocessing(前処理)、AI Inference(AI推論)、Postprocessing(後処理)の3工程をシングルチップで処理できるという特徴を持つ。

 このような設計により、従来のマルチチップベースのアプローチが抱える電力消費の肥大、給電やボードエリアの問題、外部メモリの必要性、通信の遅延やセキュリティリスクの増加、設計段階の長期化、そしてライフスパンに関する懸念などの多くの問題を解決できるという。

 第2世代のVersalアダプティブSoCは前世代と比較して、AI推論に関して3倍のTOPs/Wattを実現しているほか、スカラー型の演算性能は最大10倍で、プログラマブルロジックにおいても前世代からさまざまな機能拡張や強化がなされている。

 これにより、前世代と比べて4倍の画像処理性能や2倍の動画処理性能を発揮している。

前世代との比較

 第2世代のVersalアダプティブSoCは、前処理段階でプログラマブルロジックを用いることで標準的なSoCsと比べて高性能を発揮する。プログラマブルロジックは、プロセッサベースの処理とは異なり、低遅延で高速な処理ができるだけでなく、決定論的な処理が可能となる。

 また、プログラマブルロジックは任意のセンサーに対応可能であり、回路ごとの処理量や消費電力も削減でき、システム全体の効率化を実現する。

前処理について

 AI推論においても、次世代のAIエンジン「AIE-ML v2」を搭載することで、処理量の増加や消費電力の削減を実現し、システム全体の効率化を促進している。

 同エンジンは、より高い精度を要求するデータタイプにも対応し、より高性能なTOPs/Wattをサポートすることで、AI推論だけでなく、リアルタイムの信号処理や動画処理などにも力を発揮する。

AI推論について

 後処理に関する性能については、APUに8コアのArm Cortex-A78AE、RPUに10コアのArm Cortex-R52を搭載することで、DMIPsベースで約228kという高性能を実現している。また、安全面では、APUがlock-step modeで100kを達成している。

後処理について

 Versal AI Edge Series Gen 2は、その安全性やプログラマブルロジックによる柔軟さが評価され、スバルの次世代のEyeSightシステムに採用されるという。

 第2世代のVersalアダプティブSoCは、アーリーアクセスドキュメントの提供を開始しており、シリコンサンプルは2025年上期に、評価キットは2025年中頃、量産シリコンは2025年下期に提供を予定している。