ニュース

Intelの次期内蔵GPUは1TFLOPSの性能で3Dゲームにも対応

Gen11 GPUのデモ。左がGen11で、右が従来の内蔵GPU。Gen11の方はスムーズに再生できていたが、従来の内蔵GPUではスムーズに再生できていなかった

 米Intelは11日(現地時間)、Intelの共同創始者ロバート・ノイス氏のかつての私邸において記者会見を行ない、同社が開発している次世代CPUなどに採用される各種技術を公開した。

 同社上席副社長兼Intelアーキテクチャ/グラフィックスソリューション事業本部長兼エッジコンピューティングソリューション主任アーキテクトのラジャ・コドリ氏は、Intelが開発してきた新世代の内蔵GPU「Gen11」は、最大で1TFLOPSを超える性能を持っており、PCゲーミングも十分プレイできる性能を持っているとアピール。

 また、同氏がリーダーシップを取って開発してきて2020年にリリースする予定の単体GPU(dGPU)は、開発コードネーム「Xe」(エックスイー)で、PC向けの内蔵GPU(iGPU)に使えるようなローエンドから、データセンターで深層学習の学習にも使えるようなハイエンドまで利用できるようなスケーラブルなアーキテクチャであることが明らかになった。

Gen11は64EUを備え1TFLOPSを超える性能

Intel上席副社長兼Intelアーキテクチャ/グラフィックスソリューション事業本部長兼エッジコンピューティングソリューション主任アーキテクトのラジャ・コドリ氏

 Intelの内蔵GPU(Intel HD GraphicsやIntel Iris Graphicsのブランド名で呼ばれている)は、CPU世代毎に分類されているが、第6世代Core(Skylake)から、第7世代Core(Kaby Lake)、第8世代Core(Coffee Lake、Kaby Lake-R、Whiskey Lake-Rなど)、第9世代Core(Coffee Lake-SRなど)まで、内蔵されているGPUは「Gen9」という世代のものだ。

 今回発表されたGen11はそれに次ぐ内蔵GPUの新デザインとなる。Gen9の次がGen11なのは、Gen10はCannon Lakeで採用されていた中間バージョンだからだ。Cannon LakeはGPUが無効になった状態でしか出荷されていないため、Gen10はなかったことになっている。

Gen11の内蔵GPUを導入

 Gen11では、EUと呼ばれる実行エンジンは68ユニットで、Gen9の標準仕様(GT2)の24ユニットの倍以上という設計になっている。これは10nmで製造される恩恵を受けていることもあり、大きな性能のジャンプになる。

 コドリ氏によれば「Gen11の性能は1TFLOPSを超える」と説明されており、Intelとしては内蔵GPUの性能を大きく引き上げることで、内蔵GPUでもそれなりに重いゲームでもプレイできるようにしたい考えだ。デモではUnreal Engine 4ベースの鉄拳7が動作しており、従来の内蔵GPUではやや重たく感じる表示が、Gen11のGPUでは安定してプレイできる様子が見て取れた。

 また、コドリ氏は同社が開発してきた単体型GPUのコードネームが「Xe」(エックスイー)であることを明らかにし、SoCに内蔵されるような統合型GPUから、データセンターのサーバーで深層学習の学習などにも活用できるようなハイエンド・サーバー向けまでスケーラブルな設計になっていることを明らかにした。

単体型GPUのコードネームはXe

Gen11では新しいレンダリングの手法なども導入され効率が前世代よりも大きく改善

Gen11の内蔵GPUのブロック図

 Intelフェロー兼Intelアーキテクチャ・グラフィックスソリューション事業本部グラフィックスアーキテクチャ・ビジュアル・パラレルコンピューティング事業部部長のデビッド・ブライス氏は「Gen11の設計思想は高効率で高性能、さらに先進の3D/メディア/ディスプレイの機能をサポートし、これまでよりもよりよいゲーミング体験を、多くのPCユーザーに提供するという点にある」と述る。

 性能を引き上げることでゲーミングPCにも使えるような性能を内蔵GPUでも提供し、さらにこれまで単体GPUに比べて遅れを取っていた感のあるメディア関連の機能やディスプレイ機能などを改善する。

Intelフェロー兼Intelアーキテクチャ・グラフィックスソリューション事業本部グラフィックスアーキテクチャ・ビジュアル・パラレルコンピューティング事業部部長のデビッド・ブライス氏
Gen11の設計思想
3Dパイプライン
Coarse Pixel Shadingのデモ。シェーディング時の負荷を減らす仕組み

 Gen11の内蔵GPUは、タイルベースのレンダリングの仕組みを持っており、メモリ帯域の削減や電力効率が改善される。さらにL3キャッシュは3MBに強化されるなど、メモリ階層に関しても大きく改善されている。

 また、Coarse Pixel Shadingというピクセルシェーダーの手法に対応しており、アプリケーション側がこれをサポートするとシェーディング時の負荷を減らすことが可能になり、レンダリング性能を向上させることができる。

推論に対応
コンピュートエンジンの構造

 メディア周りも強化されており新しいHEVCハードウェアエンコーダを内蔵することで、QSVで動画をエンコードするときのクオリティが30%向上。そのほかにも、HDRトーンマッピングに対応し、サポートできるディスプレイの数も増えている。VESAのAdaptive Syncにも対応する。

メディア周りの強化点
ディスプレイ関連の強化点
Adaptive Syncのデモ

CPU、GPU、FPGA、各種アクセラレータなどを1つのプロセッサのように扱えるOne API

 また、コドリ氏はOne APIと呼ばれる新しい構想を明らかにした。このOne APIは新しいISA(Instruction Set Architecture)を作るようなもので、ヘテロジニアスなプロセッサに対してプログラムを行なうさいに、1つのプログラミングインターフェイスで、CPU、GPU、FPGA、各種アクセラレータなど、種類が異なるプロセッサを1つのプロセッサであるように扱う仕組みとなる。

One APIを発表
One APIの仕組み

 「One APIでは、極端なことを言えば他社の製品、たとえばNVIDIAのGPUやArmのCPUなども含めてサポート可能になる」(コドリ氏)とのことで、自社製品だけでなく他社製品を含めてプログラマに対して統合した開発ツールキットとして提供することで、プロセッサのISAの違いを意識しなくても、複数のプロセッサを使って演算できる仕組みを目指す。

 今回は構想が明らかになっただけで、具体的にどのような仕組みになるのかは語られなかったが、2019年に一般公開される予定になっている。