後藤弘茂のWeekly海外ニュース

DirectX 9世代GPU「XP8」を99ドルでバーゲンするTrident


●TridentのXP8はRADEON 9700の半分のトランジスタ数

Trident Le Trong Nguyen氏

 Trident Microsystemsは、来年、DirectX 9世代GPU「XP8」をデスクトップ向けに100ドル以下のボード価格で出そうとしている。その時点で、DirectX 8世代GPU「XP4」を50ドル以下のボード価格と、統合チップセットに持ってくる。新アーキテクチャをいち早く、より低い価格帯に持ってくることで、下から攻め上げる戦略だ。

 XP8は、デスクトップ版とモバイル版があり、モバイルではディスクリート(単体チップ)のほか、MCMパッケージで64MBのDRAMをパッケージに納めたXP8m64がある。出荷時期は「DirectX 9ゲームが出てくるのは2003年のクリスマス。その商戦時期には間に合わせる」(Trident Microsystems, Assistant Vice President, Graphics Marketing Le Trong Nguyen氏)というので、2003年前半にシリコン、中盤に発表、秋口に出荷のパターンだと予想される。

 前回のコラムで、Tridentが0.13μmプロセス技術で先行することを書いた。しかし、Nguyen氏は「プロセス技術が、Tridentの大きなアドバンテージだとは思わない。NVIDIAだってすぐに0.13μmを使う。ファウンダリの準備ができれば誰でも使える。アドバンテージはほぼない」という。

 では、Tridentのアドバンテージは何か。それは、GPUのトランジスタ数を徹底して少なく抑えることにあるという。DirectX 8世代のXP4は3,000万トランジスタと、他社のDirectX 8世代GPUの半分。そして、DirectX 9世代のXP8もまた「5,500万トランジスタ程度。他社のDirectX 9世代の約半分に抑える」(Le Trong Nguyen氏)という。トランジスタ数が少ないから、低コスト化が可能になり、低価格戦略が取れるというわけだ。

 現在から来年前半にかけてのGPUのトランジスタ数はおよそ3階層に分かれる。一番上がDirectX 9世代のハイエンドモデルで、1億トランジスタ以上。例えば、ATI Technologiesの「RADEON 9700(R300)」は約1億1,000万、NVIDIAの「NV30」は約1億2,000万だ。次のDirectX 8世代GPUが5,500万~6,500万程度に集中しており、丁度ハイエンドからメインストリームへ降りてきたところだ。次のレイヤがバリュー市場のDirectX7世代GPUで、これは2,500万~3,500万トランジスタあたりに集中している。このクラスは、統合チップセットへも入り始めたところだ。

GPUトランジスタ数ロードマップ(再掲)

 このトランジスタ数の階層の中で、Tridentはそれぞれのアーキテクチャ世代を半分のトランジスタ数で実現する。つまり、ひとつ前の世代のトランジスタ数で次の世代の機能を入れ込むことでもある。つまり、XP4はDirectX 8世代の機能をDirectX7世代のトランジスタ数で実現、XP8はDirectX 9世代の機能をDirectX 8世代のトランジスタ数で実現するわけだ。

 利点は、少ないトランジスタ数による、低コストと低消費電力ということになる。デスクトップでは低価格ボードで攻め、モバイルでは高機能で攻めるという図式だ。


●2本目以降のパイプラインのトランジスタ数を削る

 しかし、他のGPUベンダーは、いずれもアーキテクチャによって、ほぼトランジスタ数は決まってしまっている。アーキテクチャ世代が同じなら、どのメーカーも同程度のトランジスタ数を必要としている。なのに、なぜTridentだけが半分のトランジスタ数にできたのだろう。Nguyen氏によると、それは設計思想の違いだという。

 「Tridentも、NVIDIAなどの他社も、1パイプの時の構成はほとんど同じだ。1グラフィックスピクセルパイプには100から120のステージがある。現在は、その中にVertex ShaderやPixel Shaderも含み、1パイプで約1,500万トランジスタが必要となる。これは、同じ機能を実装しようとするなら、どのメーカーも条件は同じで、同程度のトランジスタが必要となる。TridentもNVIDIAも変わらない」

 「変わるのはここからだ。ピクセルパイプを2本に増やそうとする場合、他社は非常に単純に同じパイプを2本並べている。だから、2ピクセルを処理するには、2倍のトランジスタ数が必要になる。4ピクセルなら、パイプを4本並べる。4パイプだとトータルでは1,500万×4本で6,000万トランジスタになる」

 「Tridentが他社と違うのは、この2本目以降のパイプの構成方法だ。Tridentでは、2本目のパイプのトランジスタ数を、1本目の半分の750万にすることができる。3番目と4番目のピクセルパイプのトランジスタ数は、さらに減らすことができる。その結果、4本のパイプでも合計3,000万トランジスタに納めることができた」

 つまり、GPUのトランジスタ数は、パイプ本数にほぼ比例し、そのパイプ構成のアプローチによって変わってくるというわけだ。

 実際、パイプ本数とトランジスタ数には、かなり強い相関関係がある。2パイプのGPUは3,000万クラスで、4パイプは6,000万クラス、8パイプは1億2,000万クラスで、計算上合う。この理由のひとつは、ピクセルパイプ部分がGPUの中で最もトランジスタを食っているからだと思われる。また、ピクセルパイプを増やすとメモリインターフェイスやジオメトリ側も比例して強化(=トランジスタ数を増加)しなければならない。ちなみに、Nguyen氏がパイプと言っているのはジオメトリ側も含めて言っている。

●鍵は数学アルゴリズム

 では、Tridentはどうやって2本目以降のパイプのトランジスタ数を減らすことができたのか。再びNguyen氏に語ってもらおう。

 「数学アルゴリズムによってだ。グラフィックスは全て数学だ。アルゴリズムをうまく考えれば、複数のピクセルで計算を共有することができる。つまり、複数のピクセルそれぞれに対して、個別に計算を行なう必要がなくなる。結果として、複数ピクセルの処理の場合は、論理回路の量が少なくて済む。4ピクセルに4倍の回路は必要ない。その分、トランジスタ数を節約することができる。残念ながら、これ以上具体的な話はできないが、計算を共有できる数学アルゴリズムの開発力、これがTridentの強みだ」

 Tridentの説明からすると、複数ピクセルに対して処理を行なう場合、論理回路を各パイプにそれぞれ設けるのではなく、パイプラインをまたがる論理回路で複数ピクセルを同時に処理(例えばSIMD型)して節約をすると見られる。おそらく、Tridentはモバイル向けGPUに集中していたため、こうしたトランジスタ数削減のためのアルゴリズム開発を徹底していたと思われる。

 「他社がこうしたアプローチを取らないのは、単純にパイプを増やす方が設計が容易だからだろう。当社の方法だと、数学アルゴリズムを考案しなければならない。そのために、当社は数学に優れた人材を雇い、15年も経験を積み上げてきた」とNguyen氏は言う。

●DirectX 9世代ではやや異なるアプローチか

Tridentロードマップ(再掲)
 しかし、Tridentの言うとおりだとしても、他社がこのアプローチを取らない理由もよくわかる。まず、パフォーマンスチューニングでは、おそらくパイプを独立させた方がやりやすい。下手に複雑なパイプを作ると、ボトルネックが予測しにくくなり、性能を上げにくいだろう。また、大手GPUベンダーは、同アーキテクチャでパイプ本数の異なるラインナップを作ろうとしている。そうすると、パイプ本数を比較的容易に増減できるベースアーキテクチャの方がいい。

 また、Trident方式は、プロセッサ化するDirectX 9以降にも有効かどうかはわからない。Nguyen氏は「DirectX 9世代でも、同様に数学アルゴリズムのアドバンテージは活きる。DirectX 9の最大の違いは、ピクセル処理が浮動小数点演算になることだ。整数演算で有効なアルゴリズムで、浮動小数点演算のユニットもシンプルにできると考えている」という。しかし、これまでのような3Dアルゴリズムのハードワイヤド実装とは異なり、GPUがプロセッサ化して行くと、話はそう単純ではなくなるはずだ。

 実際のところ、DirectX 9世代のXP8のトランジスタ数が少ない理由は、XP4とはやや異なるものも含まれると思われる。例えば、現在唯一のDirectX 9世代GPUであるRADEON 9700は、8パイプと256bit幅メモリインターフェイスを持っている。しかし、XP8のパイプ本数とメモリインターフェイス幅はその半分だと想像される。Nguyen氏は、XP8について、次のように説明している。

 「DirectX 9でも、他社のような256bitメモリインターフェイスは必要ないと思う。コスト的に見合わない。128bitメモリで、十分に効率よくできると考えている」「(ピクセルパイプ本数については)いい例を挙げよう。クルマに車輪を多くつけたら速くなるだろうか。そうではない。我々はそうしたアプローチは採らない。むしろ、コアを軽く速く作る。小さく効率を良くして、クロックレートを上げる。Tridentの鍵は、100ドル以下の低コストのソリューションでもっとも効率的なアーキテクチャを作ることにある」

●“数学”がパフォーマンス、“物理”がチップサイズ、“歩留まり”が利益

 XP8のメモリインターフェイスが128bitで、レンダリングパイプが4パイプだとすると、対抗するのはDirectX 9世代GPUでもメインストリーム向けのNVIDIAの「NV31」やATIの「RV350」になる。このクラスのDirectX 9世代GPUのトランジスタ数は7,000~8,000万だと見られている。XP8のトランジスタ数が本当に5,500万だとすると、他社の半分にはなっていない。

 もちろん、ここでのトランジスタ数は全て予測なので、実際には大きく異なる可能性もある。いずれにせよ、Tridentは、XP8のトランジスタ数を他社の競合製品よりは少なく抑えることができるそうだ。そして、トランジスタ数が少なければ、原理的に、消費電力とコストの低減が容易になる。その意味では、Tridentが、デスクトップで低価格、モバイルで高機能/消費電力を強調する戦略を取っているのは理にかなっている。

 また、Tridentのトランジスタ数を削減するというアプローチは、GPUの現状では重要な意味を持っている。というのは、DirectX 9時代に向かってGPUがどんどん肥大化しているからだ。GPUのトランジスタ数はムーアの法則を上回る勢いで増えており、その分、コストと消費電力が重荷になりつつある。だからこそ、Tridentも市場に付け入る隙を見いだしたというわけだろう。

 というわけで、Tridentは現在、プロセス技術とトランジスタ削減の2つのアドバンテージを持っている。「当社のビジネスの構成要素は3つある。“数学”は我々のパフォーマンスを最大にする、“物理”はチップサイズをより小さくする、そして“歩留まり”は利益を最大にする。この3つが揃うことが重要だ」とNguyen氏は言う。

 Tridentが本当にデスクトップ市場に返り咲くかどうかが、ひとつの注目のポイントだ。

□関連記事
【9月25日】【海外】Uの0.13μm化で先行するTridentがデスクトップも狙う
http://pc.watch.impress.co.jp/docs/2002/0925/kaigai01.htm
【8月13日】【海外】上から下まで一気に増殖するDirectX 9世代VPU
http://pc.watch.impress.co.jp/docs/2002/0813/kaigai01.htm

バックナンバー

(2002年9月27日)

[Reported by 後藤 弘茂]

【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp
個別にご回答することはいたしかねます。

Copyright (c) 2002 Impress Corporation All rights reserved.