イベントレポート

TDP 300W超続出。次に来るデータセンターのCPU冷却技術は?

 米AMDは2022年11月10日(現地時間)に「第4世代EPYC」、Intelは1月10日に「第4世代Xeonスケーラブル・プロセッサ」(以下第4世代Xeon SP)をそれぞれ発表して出荷開始した。両社のCPUともに消費電力が上がり続け、それに合わせて発生する熱をどのように排熱するのかが、データセンターにおける新しい課題として浮上しつつある。

 そうした課題に対して、意外なベンダーがCESで新しいソリューションの展示を行なった。それがフランスの自動車向けティアワン部品メーカーのヴァレオ(Valeo)だ。ヴァレオはZutaCore(ズータコア)というスタートアップと共同で、自動車向けの冷却技術をデータセンターのCPUを冷却することに利用するデモをCESの同社ブースで行ない注目を集めた。

AMDの第4世代EPYC、Intelの第4世代Xeon SPではいずれもTDP 300W越えに

AMDの第4世代EPYC

 AMDの第4世代EPYC、Intelの第4世代Xeon SPが相次いで発表され、出荷開始された。それぞれの製品に関しては以下の記事に詳しいのでそちらをご参照いただきたい。

 チップレットの使い方やマイクロアーキテクチャに関しては両社それぞれの特徴があるので、それらに関して知りたい方は上記の記事をご参照いただくとして、ここでは両社ともにOEMメーカー、CSP(クラウドサービスプロバイダー、AWSやMicrosoft Azureなどのパブリッククラウド事業者のこと)、そしてエンドユーザーにとって悩ましい課題について指摘したい。それが「どちらも上位モデルはTDPが300W越え」という課題だ。

Intelの第4世代Xeon SP

 例えば、第4世代EPYCの最上位モデルとなるEPYC 9654はベースとなるTDPが360Wで、cTDPを利用することを決断してさらに性能を上げることを決めると、CPU 1つだけで400Wに達することになる。もちろん、TDPというのはある時点の電力量ではなく、その電力を消費した時に発生する熱量を正しく排熱するように熱設計を行なってくださいという指標に過ぎないのだが、それでも400WというTDPが発する熱量は非常に大きく、それを空冷で設計するのはもはや限界に達しつつある。

 OEMメーカーによっては第4世代EPYCのサーバーで、下位モデルCPUでは空冷でOKだが、上位モデルCPUでは水冷が必須というところにしているメーカーもあり、メーカーの苦悩の後が伺える状況だ。

 Intelの第4世代Xeon SPも状況はそんなに変わらない。最上位モデルのXeon Platinum 8490Hではやはり350WのTDPが設定されており、両社ともにベースTDPで350~360Wのレンジになっており、cTDPやターボモード時にはもっと電力を消費するということを考えると、本当に両社のCPUの性能を発揮させるには、熱設計をしっかりやることが重要だという状況になっている。

 このため、OEMメーカーも、CSPも、新しい取り組みを行なっている。選択肢はいろいろあるのだが、メジャーな選択肢としては水冷がある。水冷は既に多くのメーカーが取り組んでいるのだが、最大の課題は循環水のメンテナンスで、それを怠ると性能が低下したりということが発生する。次に注目されているのは液冷で、水の代わりに何らかの液を利用することでメンテナンスフリーにしたりすることも可能になる。

 そしてその先に注目されているのが液浸で、要するに熱伝導率の良い油にシステムごと漬けてしまい、冷却を行なうという力業だが、最も効果がある方法になる。Intelは第4世代Xeon SPに向けて液浸で利用する開発キットなどを用意するなど液浸ソリューションに取り組んでおり、日本でもCSPであるKDDIがパートナー企業と一緒に開発を進めている。

フランスのヴァレオが、データセンター向けに自動車由来の冷却技術を採用した液冷ソリューションを提供

ヴァレオが展示したデータセンター向け冷却ソリューションのデモ

 このように、今データセンターの冷却技術は文字通り「ホット」な話題なのだが、そこにCESで意外な企業が参戦した。それがフランスのティアワン自動車部品メーカー「ヴァレオ」だ。

 自動車のサプライチェーンに詳しくない人にとっては「ティアワン(Tier1)」とか「ティアツー(Tier2)」などの言葉は聞き慣れない言葉かもしれないが、自動車産業は高度に階層化されており、自動車メーカーに部品を供給するメーカーは、自動車メーカーに近い方から見て「ティアワン」(第1階層)、「ティアツー」(第2階層)、「ティアスリー」(第3階層)……という形で呼ばれている。

 直接自動車メーカーにエンジンやモーター、ECUなど完成部品組み立てて納入する部品メーカーがティアワンで、そのティアワンにECUの部品(例えば半導体や基板など)を納入するのがティアツーとなる。弊誌でおなじみのAMD、Intel、NVIDIA、Qualcommのような半導体メーカーはティアツーで、日本のデンソーやアイシン、ドイツのボッシュやZFなどがティアワンというのが自動車産業のサプライチェーンの仕組みだ。

 ヴァレオはフランスの部品メーカーで、そうしたサプライチェーンの中でティアワンの部品メーカー。例えば、ヴァレオは日本の自動車メーカーである「ホンダ フィット」のADAS用のカメラモジュールを組み立ててホンダに納品している。そしてそのADASカメラモジュールの部品はIntel傘下のMobileyeが作っている。そうした形で自動車産業と半導体産業は今や密接につながってきている。

ZutaCoreが開発したヒートシンク部。CPUの熱を液体に熱伝導する、写真撮影はできなかったが、第4世代EPYC、第4世代Xeon SP用のヒートシンクも展示されていた

 そうしたヴァレオがCESで発表して、同社ブースに展示したのが自動車の冷却技術を利用したサーバー機器用の液冷装置だ。米国のスタートアップ企業であるZutaCoreと共同で開発したソリューションで、ZutaCoreがCPUの熱を液に熱伝導するヒートシンク部分を開発し、3Mが提供している「Novec 7000」という高機能性液体に伝導する。このNovec 7000は低毒性で、引火性がなく、仮にシステムボードなどにかかってもすぐに乾くため、システムボードが壊れたりを避けることができるという。

ヴァレオの自動車由来のデータセンター向け液冷システムのデモ
Novec 7000を循環する液体に利用している。このように動作しているシステムにかけても問題がない

 このNovec 7000をラック内のサーバーすべてに循環させて、ヴァレオが開発したデータセンター用の冷却装置に熱伝導する。このヴァレオの冷却装置はもともと車載バッテリなどを冷やすために開発された技術が利用されており、4つあるポンプのうち3つでラジエーターに液体を循環させ冷却する。

 ヴァレオによれば、空冷で冷却する場合に比較して消費電力を5分の1にすることが可能だとしている。現在データセンターではそうした空冷ファンの消費電力(データセンター全体の5%を占めていると言われている)も大きな課題になっているので、それが5分の1にできることは大きな効果があると言えるだろう。

ラックの下部に装着されていた冷却装置
冷却装置の中身はこのようになっており、自動車のラジエータに似た装置が利用されている
液体を循環させるポンプ、4つあり通常は3つで動作し、1つはフェイルセーフに利用される
説明

 展示されていたのは、第3世代EPYCや第3世代Xeon SP向けの200W台のTDPを処理するヒートシンクになっていたが、第4世代EPYCや第4世代Xeon SP用の300W超TDPにも対応したヒートシンクを開発中で、今後そうした新しい世代のCPUにも対応できるとZutaCoreの関係者は説明した。

 今後多くのデータセンターやCSPなどで第4世代EPYCや第4世代Xeon SPへの移行が進むと考えられるが、その時に増え続ける消費電力を、空冷に変わって確実に冷やすソリューションが求められることになる。水冷や液浸などに加えて、こうした自動車由来の液冷が検討されるようになってもおかしくなく、今後の動向は要注目だ。