ニュース

Intel Arcのレイトレーシングの実装が明らかに。上位の「A770」はRTX 3060をやや上回る性能

Intel Arc GPUにおけるレイトレーシングの実装

 Intelは9月1日(現地時間)、Intel Arc GPUにおけるレイトレーシングの実装、およびレイトレーシング対応ゲームプレイ時の性能を明らかにした。

 Arcにおけるレイトレーシングハードウェアは「Ray Tracing Unit(s):RTU」として実装される。RTUには2本のレイ(光線)トラバーサルパイプラインを搭載しており、1サイクルあたり12回のボックスインターセクション(光線とオブジェクトの交差判定)と1回のトライアングルインターセプションが可能。また、バウンディングボリューム(BVH)キャッシュも備えている。

 ちなみにAMDのRDNA 2における「Ray Accelerator」(RA)では、レイトラバーサルを行なうとは謳っておらず、1クロックあたり4回のボックスインターセクションと1回のトライアングルインターセプションが可能で、BVHワークセットについてはInfinity Cacheに保管するとしている。Intel ArcのRTUではボックスインターセクション数が上なだけでなく、レイトラバーサルも行なえる点で一歩先に進んだ実装になっていると見られる。

 Intel ArcではこのRTUの実装に留まらず、同社が「Asynchronous Ray Tracing(非同期レイトレーシング)」と呼ぶ技術を可能にする「Thread Sorting Unit(TSU)」も備えている。TSUではレイの分岐を処理し、似ているヒットシェーダーにまとめて実行することで、シンプルなシーンでも複雑なシーンでもXeコアの利用率を最大限に引き上げるという。

Asynchronous Ray Tracingのフロー
Thread Sorting Unitの役割

 なおRTUもTSUも、1つのXeコアにつき1基ずつ内蔵されている。ダイが最も大規模な「ACM-G10」ではXeコアは32基とされているので、RTUもTSUも同じ32基ずつと考えるのが妥当だろう。

 同社が公開したArc A770とGeForce RTX 3060のゲーム内におけるレイトレーシング有効時の性能比較(ベータドライバを利用)によれば、タイトルによるものの、ほぼ同等かそれ以上の性能を実現できていることが分かる(1080p解像度においての場合)。また1440p解像度では、アップスケーリング技術のXeSSを有効にすることで現実的な性能を達成できるとしている。

GeForce RTX 3060との性能比較
1440p解像度環境下ではXeSSで現実的な性能を実現する