ニュース

AIアプリケーションでGPUを効率的に使う機能、ソフトバンクとAMDが共同検証

 ソフトバンクは、AIアプリケーションのモデル規模などに応じてGPUを最適に割り当てる機能を開発し、AMDとの共同検証を開始した。

 本機能は、計算資源の管理やAIアプリケーションの最適な配分を行なうオーケストレータを拡張して開発した機能。AMD製GPUのInstinctが持つGPUパーティショニング機能を活用し、AIアプリケーションのモデル規模や同時実行可能数などに応じてGPUを分割して最適に割り当てることで、効率的な動作を実現する。

 大規模言語モデル(LLM)などでは、AIモデルのパラメータ数や同時実行数によって必要な計算資源が大きく異なることから、計算資源を一律に割り当てるとGPUリソースを効率的に利用できない。今回の機能を活用することで計算資源を柔軟に制御できるようになるため、こういった課題を解決できるとしている。