ニュース
Microsoft、自社設計の半導体をセキュリティチップとネットワークDPUに拡大
2024年11月19日 22:30
Microsoftは11月19日(米国時間)から、米国イリノイ州シカゴ市において同社の年次イベント「Microsoft Ignite」を開催する。それに先だって報道発表が行なわれ、Igniteで発表される内容が明らかにされ、カスタムセキュリティチップとなる「Azure Integrated HSM」、ネットワークカード向けDPU(Data Processing Unit)となる「Azure Boost DPU」が発表された。
昨年(2023年)のIgniteにおいて、Microsoftはパブリック・クラウドサービス事業である「Azure」向けに、Armアーキテクチャのデータセンター向けCPU「Cobalt」と、AIアクセラレータとなる「Maia」を発表したが、今回の製品も、半導体メーカーが提供していないような自社のニーズを埋めるものとなる。
カスタムシリコンをセキュリティチップやDPUに拡大するMicrosoft
近年、Microsoftはカスタムチップやカスタム半導体などと呼ばれる、自社の半導体設計部門が設計した半導体をAzureに導入することに熱心だ。昨年の11月に行なわれたIgniteでは、ArmアーキテクチャCPUであるCobaltブランドの最初の製品となる「Microsoft Cobalt 100」、AIアクセラレータMaiaブランドの最初の製品となる「Microsoft Maia 100」を発表。既にAzureのデータセンターで演算に利用されている。
今年はCPU、GPUに加えて、データセンター内のセキュリティ機能を強化するためのセキュリティチップとなるAzure Integrated HSM、そしてネットワークの負荷を減らすためのDPUとなるAzure Boost DPUが発表された。
Azure Integrated HSMは、PCにおけるTPMのように、暗号化や署名などに利用するハードウェアキーを内蔵したもので、ソフトウェアベースのキーに比較して“盗む”のが困難になる。これにより、データセンター上で動作するアプリケーションが、性能や遅延などを犠牲にすることがなく、より安全にデータ処理を行なうことを可能にする。Azure Integrated HSMは来年にAzureのハードウェアにインストールされ、機密性が高いアプリケーションや一般的なワークロードに活用できるようになる。
Azure Boost DPUは、ストレージなどがネットワークで接続されているデータセンター環境において、データアクセス時に発生するCPU処理をオフロードすることで、システム全体の性能を引き上げられるだけでなく、消費電力を抑えることも可能なネットワークアクセラレータ。Microsoftによれば、クラウドストレージのアクセス時に、従来型のネットワークカードに比べて性能が4倍になるのに、消費電力は3分の1になるという。
NVIDIAのGB200向けの冷却システムに熱交換器になる液冷サイドキックラックを導入、GB200数万基のスパコンも導入
Microsoftは、最近クラウドサービスプロバイダー(CSP)が繰り広げている生成AI向けのスーパーコンピュータ建造競争で、同社が優位に立てるような新しい取り組みをIgniteで発表した。
既に各所で指摘されているように、現在生成AI界隈では学習に利用するGPUが足りておらず、自社のデータセンターで足りない分はCSPにどんどん注文が入っていっている状況で、CSPでGPUを使える枠が空くと、右から左へと埋まっていっているような状況になっている。このため、CSP各社は競ってGPUを採用したスーパーコンピュータを建造して、サービス開始しているような状況だ。
Microsoftも同様に、NVIDIAのH100やH200などの現行製品を利用したスーパーコンピュータの導入を急いでいるほか、足りない分を埋める意味もあって、AMDのInstinct MI300Xシリーズの導入を明らかにするなど、GPUソリューションの充実を目指している。
そうした中でMicrosoftが発表したのは「liquid cooling ‘sidekick’ rack」(液冷サイドキックラック)の導入。簡単に言えば、NVIDIAのGPUをたくさん並べたラックの横に、ラックサイズの巨大な熱交換器を置いて、液冷の液が運んでくる熱を高効率に放熱できるようにするものだ。そうした液冷サイドキックラックとMetaと共同開発した「disaggregated power rack design」(分離されたパワーラックデザイン)による高効率な電源により、高効率にGPUベースのスーパーコンピュータを構築できるとMicrosoftは説明している。
また、MicrosoftはAzure向けの新しいインスタンス(Azure的な言い方だとVM)として「Azure ND GB200 v6」を今後導入する計画であることを明らかにした。NVIDIAのGB200を72機搭載しているNVIDIA GB200 NVL 72ラックを、Quantum InfiniBandで接続したソリューションで、数万基のBlackwell GPUを1つのGPUとして利用することが可能になる。