元半導体設計屋 筑秋 景のシリコン解体新書

Intel Arrow Lakeはゲーマーにも好適

 前回、コードネームArrow LakeことCore Ultraデスクトッププロセッサー(シリーズ2)の技術的な詳細について説明した。今回は、その技術的な進化をパフォーマンスと電力特性の観点から説明する。

 Arrow Lakeの開発目標は、エネルギー効率を大幅に改善することだった。ただ、エンスージアストであっても、すべての時間をゲームに費やすことはない。現実の生活ではブラウザを使用していたり、オフィスソフトを使ったり、電話会議などを使用している。これらの日常や生活の中のアプリにおいて、Arrow Lakeは前世代のRaptor Lakeと比較して消費電力を半分に抑えている。

 これらの電力削減を達成しながらも、シングルスレッドとマルチスレッドの両方でパフォーマンスが向上している。シングルスレッド(1T)のパフォーマンスは、Raptor Lake Refreshと比較して約8%向上しているという。シングルスレッドのパフォーマンスにおいては、1%の向上でも難しい。Arrow Lakeは、新しいCPUコアを採用することで、コアあたりの電力効率を大幅に向上させつつ、パフォーマンスを向上させることができたようだ。

 マルチスレッド(nT)のパフォーマンスも、新しい電圧と周波数特性により向上した。Raptor Lake世代では、熱的または電気的限界に到達した場合に、クロック周波数が制限され、CPU消費電力を制限するクランプ状態に入ることになる。

 一方、Arrow Lakeは電力効率の改善により、Raptor Lakeでクランプ状態に入る状況でも、クランプ状態には入らずに実行が続けられる。それにより、高速に処理を進めることができ、Raptor Lake Refreshから20%近く向上させている。競合するRyzen 9 9950Xよりも10〜15%高速だという。実際、Arrow Lakeは24スレッドのパフォーマンスで、32スレッドのRaptor LakeやAMD Zen 5を凌駕している。

 また、コンピュートスケーラビリティを追求したArrow Lakeでは、低消費電力レベルでの性能も注目に値する。上記スライドでCinebench 2024での比較が確認できる。Arrow Lake は125Wの消費電力で、Raptor Lakeの250Wと同じスコアになる。つまり、電力は半分で、パフォーマンスは同じになっている。Arrow Lakeは250Wから65Wまで幅広く電力値をスケーリングできる。

 エネルギー効率に関してまとめると、Arrow Lakeはエンスージアストセグメントでシングルスレッドとマルチスレッドで高いパフォーマンスを実現し、通常の利活用シーンでは、電力消費が約50%削減されたことになる。また、ゲーミングプレイ時の電力削減とチップ温度の低下も期待できる。

ゲームのパフォーマンス

 ゲーミング性能については、現在流通している他のフラグシップゲーミングCPUと同等以上の性能を提供するという。また、Raptor Lakeから動作周波数を少し抑え、より効率的なコアを採用したことで、ゲーミング中の動的電力が大幅に削減されている。つまり、絶対性能より、ワット当たりの性能を追求した形だ。

 Inteによると、30近くのゲームタイトルで、Arrow LakeとRaptor Lakeを比較すると、ほとんどの場合、性能差はプラスマイナス3%以内だという。シリコンダイ構成はRaptor Lakeはモノリシックで、Arrow Lakeはタイル構造である。この違いがこのグラフの結果を反映しているという。

 グラフの左端のにある奮わない結果は、モノリシックとタイル構造の違いからくるデータの流れ方によるレイテンシが要因だという。一方でスコアが高くなっている右端にあるタイトルは、タイル構造の利点が生きた結果だという。

 ゲームの性能は、熱性能、電気的性能、コア性能の影響を敏感に受ける。このことから、きめ細かい物理的な構造の変更とバランス調整によって性能が上積みされる。Arrow LakeとRaptor Lakeには、それぞれ物理構造が起因となる長所と短所があるが、ゲーミングパフォーマンスは基本的には同じとなる。しかし、Arrow Lakeでは、その性能を低い消費電力で実現している。

 たとえば、Age of Mythologyでは、システムで136Wも電力が減少している。この減少分は、より電力を必要とするであろう将来登場するゲームに対するヘッドルームとなる。これがArrow Lakeを設計する際に目指した目的の1つだ。

 いくつかのゲームで消費電力を見てみると、かなり大幅な削減が見られる。Raptor Lakeと比較すると、CPUとマザーボードを変更するだけで、50〜80Wの範囲で削減しているといえる。「ゴッド・オブ・ウォー ラグナロク」、「ウォーハンマー:スペースマリーン2」、「Age of Mythology」などでは、システムレベルで125W以上減少している。

 これらの劇的な電力効率の向上のプラスアルファの効果として、平均してArrow Lakeでは、同じ条件下でRaptor Lake Refreshよりも約13℃低温で動作し、ピーク時には15℃から17℃の範囲での減少も確認されている。

 Intelの資料によると、Core Ultra 9 285KとAMDの同等製品でゲーム性能はほぼ同じだという。どちらの製品にもプラス面とマイナス面がある。結果を平均すると、これら2つのCPUは、全体的なゲームパフォーマンスでいい勝負をしている。電力に関しても、同じような特性が確認されたという。

 ラストレベルのキャッシュがパッケージ内でスタックされたRyzen 9 7950X3Dとの比較では、30以上のゲーム1080pのテストでは約5〜7%優位になっている。

 ちなみに、ここまでのスライドで見てきたすべてのゲームパフォーマンスは、デフォルト持続電力である250Wの設定を用いている。Intelは長時間持続可能な電力制限をPL1と呼んでいるが、PL1を175Wや125Wという控えめな低電力値にしても、ゲームのパフォーマンスは同等だという。

 これは簡単に言うと、電力を半分にカットしても、ゲーミングは性能が同じにできるということで、トップエンドのハードウェアを非常に小さなシステムに収めた省スペースゲーミングPCを好むゲーマーの層には、Arrow Lakeのゲーミングパフォーマンスは満足のいくものとなるだろう。

 RedditやX(旧Twitter)などで、新CPUに対してCore-i9 14900Kのようなゲーミングパフォーマンスを提供してほしいという多くのリクエスト(チャット)があったという。消費電力が低く、動作温度が低い、より効率的なシステムが欲しいということだったようだ。それはまさにCore Ultra 7 265Kの20コア、良好な動作温度、高効率な消費電力、オーバークロック用のアンロックという組み合わせで可能になったと言える。

 AIの新しい用途として、ゲームが期待されている。ゲームでのAI処理について、NPUを活用し、GPUからリソースを解放することで、GPUが本来の目的である、より高いフレームレートを生成できるようになる。

 具体例として、Cephableのユースケースを要約すると、AIモデルをNPUにオフロードすることで、CPUで利用率10%、統合グラフィックスで利用率30%必要だった処理が、NPUではわずか5%の利用率で処理できるという。

クリエイターとAI

 Arrow Lakeは、レイトレースレンダラー、ビデオコーデック処理、マルチアプリワークフローといったクリエイター向けの改善も盛りこまれている。3Dアーティストやビデオグラファーに恩恵がありそうだが、マルチスレッド最適化されてないワークロードでは、AMD製品と互角の勝負となるだろう。

 この1年間で、AIによるコンテンツ作成や商業的ユースケースが爆発的に増えた。Adobe、Black Magic Design、Topaz Lab、Materialise Magicsなどの企業はすべて、AIアクセラレーション機能を自社製品にかなりのペースで追加している。また、オフィスアプリケーションでのAI支援や、より洗練されたセキュリティモデルもAI機能が強化されている。2023年から2024年にかけて、Intelが市場投入したAI PCで実装されたAI機能の数は10倍に増えたという。

 そして、2025年はAIの活用が広がる年になると予想される。Intelはこれらのソフトウェアベンダーと、ロードマップを共有しながら、何を実現、何が必要かを協議している。

 ソフトウェアベンダーとのミーティングから、NPUだけではAIソフトウェアのリーダーシップを取ることはできないことをIntelは約18カ月前から知っていたという。AI用処理エンジンとして最も有望視されているのはGPUだということだ。そして、AI処理において2025年においてもCPUがまだ重要な役割を果たすだろう。

 Geekbench AIは画像セグメンテーション、複数のタイプのオブジェクト、画像またはパターンの認識、アップスケーリング、テキスト翻訳、分類、スタイル転送などをテストすることができる。この結果を見てみると、前世代と比べてEコアのスループットが倍増したため、CPUでの16bit浮動小数点演算で大きな性能向上が得られている。そして、CPUでのFP16がほぼ2倍であることが分かる。

 GPUも、DP4a命令と前世代よりも高速なコアにより、大きな性能向上を実現している。Raptor LakeにはNPUがないため、データはArrow Lakeのみの参考値となる。

 Procyon AI Computer Visionもオブジェクト検出、超解像、画像識別モデルを複数のテストを行なう。このテストでは、エンジンとデータ型の整合性を幅広く把握できるため、ハードウェアやソフトウェアスタックの整合性も全体的に把握できる。これはGeekbenchとは異なるモデルセットで、エンジンごとにどのモデルが実行されたのかが分かる。

 たとえば、Geekbenchのスライドでは、特定のモデルセットでは、8TOPS GPUの方が13TOPS NPUよりも高速であることが確認できる。一方、Procyonのモデルセットでは、NPUが高速で、CPUはInt8に対してGPUと同等であることが明確に分かる。モデルの複雑さや、エンジンが出力する内容によっては、パフォーマンスのばらつきが非常に大きくなるため、複数のワークロードや複数のモデルを使用して、AI性能を検証する必要が出てくる。

 これらの結果から、Arrow LakeのAIパフォーマンスはRaptor Lakeのほぼ2倍と言えるようだ。そして、新しいNPUは、CPUやGPUからタスクをオフロードすることで、システムの性能を向上させるだろう。