後藤弘茂のWeekly海外ニュース

AMDがGPUに新しいコヒーレントインターコネクトを導入

（2016/1/15 12:21）

AMDの路線変更で必要となる新インターコネクト技術

　AMDは同社の企業戦略を転換しつつある。一言で言えば、APU(Accelerated Processing Unit)重視路線から、再びディスクリートGPUも重視する路線に巻き戻している。AMDはPC市場から、より広い市場へと広げる企業戦略を2012年に発表した。その時にAMDがコア技術としてフォーカスしたのは、APUとSoC(System on a Chip)だった。

　しかし、現在、AMDはディスクリートGPUをコア技術として重視しているように見える。それを象徴するのは、2015年9月に行なった組織変更で「Radeon Technologies Group(RTG)」を編成したことだ。AMDの中の旧ATI Technologies部分であるRTGは、ディスクリートGPUビジネスを担当する。

　AMDのディスクリートGPU重視路線は、GPUアーキテクチャにも大きな影響を与えつつある。既に明瞭なように、AMDはGPUコアを巨大化させつつあるが、2016年の「Polaris Architecture」以降は、内部コントロールなどのアーキテクチャも拡張する。さらに、まだ発表されていないが、今後はGPUのインターコネクト技術も新しくなる。

AMDの2016年のGPUアーキテクチャPolaris

　インターコネクトでは、AMDはGPUに新しいコヒーレントファブリックを導入しようとしている。新インターコネクトは、CPUとGPU、GPU同士、あるいはほかのデバイスを接続する。超広帯域かつ低レイテンシのインターコネクトで、メモリコヒーレンシプロトコルをサポートする。

　AMDは、PCI ExpressやCrossFireを越えた新インターコネクトを導入することで、複数チップのGPUをスケーラブルに扱えるようにする予定だ。これはNVIDIAの「NVLink」インターコネクトと競合する技術となる。

増大し続けるコンピューティング性能への要求

AMD Senior Vice President and Chief Architect Raja Koduri氏

　RTGを率いるRaja Koduri(ラジャ・コドゥリ)氏(Senior Vice President and Chief Architect, Radeon Technologies Group, AMD)は、こうしたディスクリートGPU構想の背景にあるコンピュータ産業の状況を次のように説明する。

　「よく、ディスクリートGPUは消えてゆくと言われる。およそ、3年置きに、“消えるディスクリートGPU”議論が蒸し返される(笑)。Intelが最初にチップセットにGPUを統合した時もそう言った。しかし、GPUはそうした議論のサイクルを何回経ても消えることはなかった。なぜなら、ディスクリートGPUのコンピュート性能は高く、ユーザーは高いコンピュート性能を求め続けているからだ」。

　もっとも、コンピューティングデバイスの市場でも、通常のクライアントでは、性能への要求が止まっているように見える。エントリーレベルのPCやスマートフォンでは、コンピュート性能はあまり重視されない。Koduri氏は、市場は二極化していると説明する。

　「コンピュートのユーザーは2種類に大別できる。携帯機器や一部のPCのユーザーは、コンピュートに一定の性能しか求めない。例えば、スマートフォンを買う場合に、多くのユーザーが重視するのはフラッシュメモリの容量などであり、CPUやGPUの性能は一定レベルで良いと考えている。コンピュートが固定された市場だ。しかし、サーバーやワークステーション、高性能PCの市場では、どれだけのコンピュート性能が必要であるかは、ユーザーによって異なる。こうした市場はスケーラビリティが重要となる。我々はディスクリートGPUをスケーラビリティ市場向けにフォーカスして行く。固定されたコンピュートの市場ではない。そして、スケーラブルコンピュートの市場では、性能への要求が尽きることがない。多分、私が死ぬ時も、まだ性能要求が増大し続けているだろう(笑)。グラフィックスやデータのコンピュートへの人間の要求は終わることがないからだ」。

現在のAMDが柱とする市場。ゲーム、没入感のVRや、データセンターなど、いずれもGPUが重要となる市場だ

スケーラビリティのために必要な新インターコネクト

　現在、GPUはデータセンターに浸透できる絶好の機会に遭遇している。並列コンピューティングが有効な深層学習の流行によって、GPUを通常のデータセンターに導入しようという機運が高まっている。しかし現状、こうした潮流ではNVIDIAの方が活発に活動しており、AMDの影が薄い。AMDはRTGの編成とともに、性能要求が膨れ上がっているデータセンターまで重要ターゲットとする。Koduri氏は、この分野は性能要求が非常に強いことを強調する。

　「データセンターやワークステーション、あるいはVRなどの市場では、現在よりはるかに高い性能が求められている。Radeon R9 Fury(Fiji)が10個、あるいはそれ以上で達成できるような性能だ。そうした市場のユーザーは、既にGPUに処理させたいワークロードを抱えている。単に現在のGPUの性能が足りていないだけだ。そうしたユーザーにとって必要なことは、GPU性能のスケーラビリティだ。スケーラビリティでは、どうやって複数GPUを連携させて問題を解決するかが重要となる。我々は、GPUを安定してスケーラブルにする方法を真剣に考えている」。

　ディスクリートGPUによるGPUコンピュートにフォーカスしているAMDにとって、マルチGPUを連携させて、単一のリソースのように扱うことができるスケーラビリティが重要となって来た。AMDは、同社のGPUコンピューティングイニシアチブ「Boltzmann Initiative」で、ソフトウェアベースのマルチGPUのフレームワークを提供する。仮想共有メモリで、物理的に分離されたメモリ上のデータ内容を同期させ、あたかも同じメモリを共有しているように扱うことができるようにする。これは「Caffe」のような深層学習フレームワークと連携する。しかしその先は、もっと踏み込んだ、ハードウェアベースのマルチGPUソリューションを考えている。

　「当社が現在提供しているマルチGPU技術『CrossFire』は、これまでのアプリケーションに対してはOKだ。しかし今後は、より優れたものが必要となるだろう。マルチGPUにスケーラビリティが求められるようになるからだ。そのために、PCI Expressより優れていて、スケーラブルなインターコネクトが必要なことは確実だ。しかし、我々はオープンなインターコネクトが望ましいと考えており、独自規格のプロプラエタリなインターコネクトは求めていない。インターコネクトに、複数のGPUを接続するだけでなく、FPGAなど、他社のGPU以外のデバイスも接続したいからだ」。

メモリコヒーレントなインターコネクト技術

　PCI ExpressやCrossFireに代わる、新しいGPUインターコネクトを求めるAMD。そのインターコネクトは、複数のGPU同士を接続し、ホストCPUとGPUも接続し、さらにFPGAなど、そのほかのアクセラレータも接続する。PCI Expressによる伝送帯域とレイテンシのボトルネックを解消するものとなる。新インターコネクトは、オンパッケージの場合、100GB/secの帯域となると言われている。そして、AMDは新インターコネクトを、何らかのオープンな規格としようとしているようだ。

　ここで出てくる疑問は、新インターコネクトがメモリコヒーレンシもサポートするかどうかという点だ。新インターコネクトによって、ディスクリートCPUとディスクリートGPUの間でメモリコヒーレンシが保たれるとすれば、現在のマルチソケットCPUと同様のメモリ共有がCPUとGPUの間で実現できることになる。そのためには、キャッシュライン粒度でハードウェア的にメモリコヒーレンシを保つ必要があり、そのためのインターコネクトのアーキテクチャが必要だ。

　「全くその通り。それ(CPUとGPUのメモリコヒーレンシ)こそ、我々がインターコネクトに必要としているものだ。詳細は言うことができないが、コヒーレンシは確実に考慮している」とKoduri氏は断言する。

　ちなみに、NVIDIAも2世代目のNVLinkで、コヒーレンシをサポートする予定だ。また、AMDはNVLinkをプロプラエタリ技術と見なしているが、NVIDIAはパートナーにIBMを得ている。ただし、NVLinkでNVIDIA GPUと接続できるCPUはIBM Powerだが、AMDは自社のx86 CPUに接続できる。この点では、AMDに利点がある。

NVIDIAのNVLinkアーキテクチャ

CPUダイとGPUダイのパッケージ統合が可能に

　AMDのコヒーレントファブリックは、AMDにとって新しい可能性を開く。CPU、GPU、APUの他に、CPUとGPUそれぞれのダイを統合したパッケージを可能にするからだ。例えば、同じパッケージ基板上で、CPUとGPUをコヒーレントファブリックで、広帯域かつメモリコヒーレントに統合した製品のような、これまでとは異なるレベルの統合が可能になる。

　AMDは、Fiji以降、パッケージ技術にも重点を置いている。HBM(High Bandwidth Memory)によるメモリのシリコンインタポーザ上での統合を行なったためだ。今後は、こうしたマルチダイ統合が進む可能性がある。Koduri氏は、今後は、パッケージ技術が重要であると語る。

　「我々は、GPUの開発に際して4つの『P』を重視している。パフォーマンス、パワー(電力)、プライス、パッケージの4つのPで始まる要素だ。このうち最後のパッケージが重要になって来ている。CPUでもGPUでも、パッケージを小型にする必要がある。この点で興味深いのはHBMだ。HBMの利点は、広帯域や電力効率だけではなく、素晴らしい省パッケージ技術でもある点だ。HBMの技術では、個別のチップを、単一の小さなパッケージに統合することができる。そうしたパッケージ技術は、新しい可能性を開く。APUでもディスクリートGPUでも、それぞれを小さなフォームファクタに収めることが可能になる。また、それらを一緒にすることも可能だ」。

HBMを使ったAMDのFiji

　HBMでは、シリコン貫通ビア(TSV:Through Silicon Via)技術を使ったシリコンインタポーザによって、複数のダイを、広帯域かつ低電力に統合する。また、シリコンインタポーザを使わずにHBMのような統合を可能にする技術の開発も行なわれている。AMDは、こうした技術を使って、例えば、ディスクリートCPUとディスクリートGPUを統合した製品を作ることができる。

　その場合、CPUダイとGPUダイの間は、新しいコヒーレントファブリックによって接続され、メモリコヒーレンシが維持されることになる。言い換えれば、シングルダイのAPUのように扱うことができる、CPUとGPUの統合製品が可能となる。

　APUと異なる利点は、GPUの広帯域メモリと最高性能を維持できることだ。また、AMDにとっては、大型APUのような特殊な製品ダイを開発する必要がなくなり、開発と製造コストを抑えることが可能になる。

　ディスクリートGPUをより重視する路線へと変わったAMD。同社の今年(2016年)以降のGPUは、大きな転換期を迎えることになりそうだ。

（後藤弘茂 (Hiroshige Goto)E-mail）