福田昭のセミコン業界最前線

4年ぶりのリアルイベントとなった高性能プロセッサの祭典「Hot Chips」

開催地は従来と同じスタンフォード大学、ただし会場は変更に

 高性能プロセッサの最新技術を披露する国際学会「Hot Chips」が4年ぶりに、リアルイベントとして開催される。開催時期は2023年8月27日~29日(米国太平洋時間)、開催形態はリアルイベント(In-Person)とオンライン(Virtual)のハイブリッド開催である。オンラインの参加枠を残したのは、何らかの事情で渡米が困難な研究者に配慮したため。

 開催場所は米国カリフォルニア州パロアルトのスタンフォード大学である。会場は「Dinkelspiel Auditorium」を予定する。コロナ禍前は同じスタンフォード大学でも「Memorial Auditorium」を会場としていた。

 会場の変更により、収容人数が大幅に減少した。旧会場の「Memorial Auditorium」はかなり大きなホールで、公式の収容人数は1,705名と多い。新会場の「Dinkelspiel Auditorium」は公式の収容人数が710名と半分以下になった。

 サンフランシスコとサンノゼ地区を結ぶ鉄道「カルトレイン(Caltrain)」の最寄り駅である「パロアルト(Palo Alto)」からは、新会場の「Dinkelspiel Auditorium」までバス(無料)と徒歩で25分近くかかる。旧会場に比べると少し遠くなった。

「Hot Chips 2023」の会場となる「Dinkelspiel Auditorium」の外観。スタンフォード大学の案内webサイトから抜粋したもの
「パロアルト(Palo Alto)」駅から「Dinkelspiel Auditorium」までの経路をGoogleの経路探索によって得た結果

初日はチュートリアル、中日と最終日はカンファレンス

 現地開催の基本的なスケジュールはコロナ禍前と変わらない。初日(27日)がチュートリアル(技術講座)、中日(28日)と最終日(29日)はカンファレンス(技術講演)とキーノート講演である。

Hot Chipsの基本的なスケジュールと開催情報。Hot Chipsの公式Webサイトから筆者がまとめた。ポスター発表の日付は筆者の推定によるもの。表記の時間はすべて米国太平洋時間なので留意されたい

 カンファレンスは口頭講演である一般講演とキーノート講演のほか、ポスター発表を予定する。公式Webサイトにはポスター発表の時間帯が明示されていない。ただしポスター発表に関する短い講演(ライトニングトーク)の時間帯が最終日の始めにある。このことから、ポスター発表は最終日と推定した。

発展途上国の学生向けに参加料5ドルの特別登録枠を用意

 今年(2023年)のHot Chips(Hot Chips 2023あるいはHot Chips 35)は、参加登録料金がリアルとバーチャルでかなり違う。リアルの参加料は高く、バーチャルの参加料は安い。

 リアルの参加者には講演の聴講以外にも、ランチ(3日間すべて)やレセプション(ドリンクと食事が用意される)などのサービスが受けられる。また参加者同士の交流が可能だ。

Hot Chips 35の参加登録料金(リアル参加、500名限定)。8月11日までは早期割引料金が適用される。Hot Chipsの公式Webサイトから抜粋したもの

 バーチャルの参加料で注目すべきは、発展途上国の学生向けに破格の低料金を設定したことだ。わずか5ドルで参加できる。メキシコ、カリブ海諸島、中南米、アジア(日本、韓国、中国、台湾、シンガポールを除く)、太平洋諸島が対象となる。

Hot Chips 35のバーチャル参加登録料金。8月11日までは早期割引料金が適用される。Hot Chipsの公式Webサイトから抜粋したもの

チュートリアルでは「機械学習(推論)」と「チップレット」の技術講座を開催

 8月27日に予定するチュートリアルは、午前と午後に分かれる。午前と午後で異なる2つのテーマに関する技術講座を開催する。Hot Chipsのチュートリアルは伝統的に、時機を得たテーマを扱う。今回のテーマもタイムリーだ。

8月27日に開催されるチュートリアルの講演一覧。公式Webサイトから筆者が作成した

 午前のテーマは、「ML-Inference(機械学習(推論)」である。合計で5件の講演を予定する。

 始めは機械学習における「推論」の概要、次がMicrosoftの深層学習用オープンソフトウェア「DeepSpeed」の解説、3番目がエッジにおける機械学習(推論)の説明である。休憩を挟んで4つ目は、機械学習フレームワーク(ライブラリ)「Pytorch(パイトーチ)」のバージョンアップ版である「Pytorch 2.0」の解説である。最後はスパース性を活用した推論エンジンのハードウェアを説明する。

 昼食休憩を挟んで午後のチュートリアルが始まる。午後のテーマは「Chiplets/UCI(チップレット/UCI)」である。4件の講演を予定する。

 最初の講演ではチップレット(ミニダイ)間の接続規格UCIe(Universal Chiplet Interconnect Express)の概要と採用事例を説明する。次の講演ではUCIeのプロトコルを解説する。それから休憩を挟んで、3番目の講演では電気的な仕様とフォームファクタ、互換性検証を説明する。最後の講演は、ソフトウェアと管理のしやすさ、セキュリティを扱う。

カンファレンス初日午前:SamsungとSK Hynixがプロセシングインメモリを発表

 翌日の8月28日はカンファレンスの初日となる。4つの講演セッションと1件のキーノート講演を予定する。午前のプログラムを紹介していこう。

 始めはキーノート講演である。GoogleのJeff Dean氏とAmin Vahdat氏が、「Exciting Directions for ML Models and the Implications for Computing Hardware(コンピューティングハードウェアにおける機械学習モデルと実装のエキサイティングな方向性)」と題して機械学習モデルとその実装を展望する。

 続いて技術講演セッションとなる。テーマは「Processing in Memory(PIM)(プロセシングインメモリ(PIM))」である。始めはSK Hynixが同社のドメイン特化メモリにおけるコンピューティング機能を説明する。

 続いてSamsungがプロセシング機能を内蔵するHBM(High Bandwidth Memory)とCXLメモリの近傍にプロセシング機能を置いたサブシステムによるLLM(大規模言語モデル)搭載のAIクラスタシステムを発表する。

 休憩を挟んで2番目の技術講演セッションが始まる。テーマは「CPU」である。始めはArmが同社の高性能コンピューティングおよび機械学習向けCPUコア「Neoverse V2」の概要を述べる。

 続いてAMDが「Zen4」コアによるサーバー向けCPU「EPYC 9004」を説明する(参考記事)。それから技術開発ベンチャーのVentanaがRISC-Vアーキテクチャのデータセンター向けCPU「Veyron V1」を発表する。

カンファレンス初日(8月22日)の講演一覧(前半部分)。公式Webサイトから筆者が作成した

カンファレンス初日午後:大規模システムで不可欠となる「Root of Trust」

 昼食休憩の後は、3番目の技術講演セッションとなる。テーマは「Platform(プラットフォーム)」である。

 最初は、Intelがサーバー向けプロセッサ「Xeon」の将来を展望する。次に検証済みのカスタマイズが可能なCPUプラットフォーム「Neoverse N2」をArmが解説する(参考記事)。それから次世代CPU「Meteor Lake」の電力管理アーキテクチャをIntelが説明する。最後はMicrosoftがオープンソースのRoT(Route of Trust)プロジェクト「Caliptra」を解説する。

 4番目の技術講演セッションは、再び「CPU」がテーマとなる。始めはIntelが、次世代の低消費高性能サーバー向けにXeonの高効率コア(E-Core)を発表する。続いてAMDが、モバイルプロセッサ「Ryzen 7040」シリーズを概説する(参考記事)。それから技術開発ベンチャーのSiFiveが、同社が開発した最新のベクトルプロセッサの概要を述べる。

カンファレンス初日(8月28日)の講演一覧(後半部分)。公式Webサイトから筆者が作成した

カンファレンス2日目午前:Googleの機械学習用スーパーコンピュータ

 カンファレンス2日目かつ最終日の8月29日は、前日と同様に4つの講演セッションと1件のキーノート講演で構成する。

 最初はポスター発表(10件)の発表者による短い口頭紹介で始まる。1件当たりの紹介時間は2分と短い。それから、キーノート講演となる。NVIDIAのBill Dally氏が「Hardware for Deep Learning(深層学習向けハードウェア)」と題して講演する。

 続いて技術講演セッションが始まる。最初のテーマは「ML-Training(機械学習(学習))」である。まずGoogleが、再構成可能な光インターコネクトおよび埋め込みサポートを備える機械学習用スーパーコンピュータを発表する。続いて技術開発ベンチャーのCerebrasが、同社が開発した開発したウェハスケールクラスタの詳細を述べる(参考記事)。

 休憩を挟んで次の技術講演セッションとなる。テーマは「Interconnect(相互接続)」である。最初にNVIDIAが、リソースを置き換え可能なネットワーク処理ASICを発表する。次に技術開発ベンチャーのLightelligenceが、光インターコネクトの低遅延コンピューティングエンジン「Hummingbird」を説明する。それからIntelが、メッシュ間を光によって直接結合するファブリックを発表する。

カンファレンス第2日(8月29日)の講演一覧(前半部分)。公式Webサイトから筆者が作

カンファレンス2日目午後:チップレット構成の次世代FPGA

 昼食休憩を挟んで午後の技術講演セッションが始まる。最初のテーマは「ML-Inference(機械学習(推論))」である。

 始めにIBMがニューラル推論マシン「NorthPole」を解説する。続いて技術開発ベンチャーのMoffet AIが「ビジョンモデルと大規模言語モデルに向けた深層スパース推論SoC(System on a Chip)「Moffett Antoum」」を発表する。

 それからQualcommがテンソルプロセッサ「Hexagon」を説明する(参考記事)。最後に技術開発ベンチャーのNumentaが最新のCPUに実装するGPT(Generative Pretrained Transformer)推論機能を論じる。

カンファレンス第2日(8月29日)の講演一覧(後半部分)。公式Webサイトから筆者が作成した

 それから休憩を挟んで最後の技術講演セッションとなる。テーマは「FPGA and Cooling(FPGAと冷却)」である。始めにAMDが、チップレット構成の次世代FPGAを解説する。次にIntelが、64Gサンプル/秒のAD/DA変換器と58Gbpsのトランシーバーを内蔵する超高速FPGA「Agilex-9」を発表する。それから技術開発ベンチャーのFabric8Labsが、データセンター向けの高性能冷却プレート技術を説明する。

 残念ながら筆者は、バーチャル参加となる。現地レポートとはならないものの、聴講レポートを執筆する予定だ。ご期待されたい。