多和田新也のニューアイテム診断室

GT200ベースのミッドレンジGPU「GeForce GT 240」



 NVIDIAは11月17日、99ドル以下のセグメントを埋めるミッドレンジGPU「GeForce GT 240」を発表。GT200ベースの低価格製品として、GeForce GT 220/210に続くモデルとなる。NVIDIAのデスクトップ製品としては初めてGDDR5をサポートした点でも注目される本製品のパフォーマンスを見ていきたい。

●GT200ベースだがGeForce GTX 200シリーズとは異なる仕様も
【写真1】GeForce GT 240 GPU。コードネームである「GT215」の文字が印刷されている

 最初にGeForce GT 240の特徴を整理しておきたい。GeForce GT 240はGT200をベースとしたミッドレンジGPUとして、GeForce GT 220/210に続いて登場する製品となる。本コラムではGeForce GT 220/210を取り上げていないので、このGT200ベースのミッドレンジ以下製品の全般的な特徴も合わせて紹介していきたい。なお、Streaming Processorと呼ばれた各演算ユニットは、NVIDIAがCUDA Coreと名称を改めているので、本コラムもCUDA Coreの表現へ変更する。

 表1は、GeForce GT 240の主な仕様をまとめたもので、セグメントが近いGeForce 9600 GTの仕様も参考までに併記している。コアのコードネームはGT215(写真1)。40nmプロセスで製造される。

【表1】GeForce GT 240の仕様

GeForce GT 240GeForce 9600 GT
コアクロック550MHz650MHz600MHz
CUDA Core数96基64基
CUDA Coreクロック1,340MHz1,625MHz1,500MHz
テクスチャユニット数32基32基
メモリ容量1GB/512MB
GDDR5/DDR3
512MB GDDR3
メモリクロック3,400MHz(GDDR5)
2,000MHz(DDR3)
1,800MHz
メモリインターフェイス128bit256bit
ROPユニット数8基16基
ボード消費電力(アイドル)9W
ボード消費電力(ピーク)70W96W59W

 CUDA Coreは96基とGeForce 9600 GTより多い。ただし、テクスチャユニットは同数、ROPは半減しており、メモリインターフェイスも128bitとなる。ROPおよびメモリインターフェイスについては、GeForce 9600 GTはミッドレンジ製品としては贅沢な仕様であったわけで、GeForce GT 240ではミッドレンジ製品らしい仕様へ戻ったことになる。

 GeForce GT 240はGT200ベースと書いたが、CUDA Core数とテクスチャユニットからその構成は推測できる。GT200のアーキテクチャでは、8基のCUDA CoreをまとめたSM(Streaming Multiprocessors)を3ユニットと、8基のテクスチャユニットをひとまとめにして、1つのクラスタを形成。GeForce GTX 285/280などのフルスペックは10クラスタを持つ。

 GeForce GT 240は、これを4クラスタ持った構成と推測できる。SMは8CUDA Core×3SM×4クラスタで96基、テクスチャユニットは8ユニット×4クラスタで32基と、これで計算は合う。GeForce 9600 GTとテクスチャユニットが同数となっているのは、G92世代が2SMと8テクスチャユニットで1つのクラスタを形成していたためである。

 ただ、同じGT200を採用したGeForce GTX 200シリーズとは機能面の違いが多々ある。GeForce GTX 280が初めて登場した際、CUDA周りのGT200の特徴としてレジスタが倍になった点や倍精度浮動小数点演算をサポートした点などが話題となった。こうしたCUDAの機能や性能をチェックするCUDA-Zというアプリケーションを実行すると、GeForce GT 240は画面1のような結果になる。参考までにGeForce 9600 GTの結果を画面2に紹介している。

 画面1からも分かるとおり、GeForce GT 240のCompute Capabilityは「1.2」となっている点に注意を要する。Compute CapabilityとはCUDAにおけるハードウェアの機能を示すもので、ざっくり言うとG80世代が1.0、G92世代が1.1、GT200世代が1.2/1.3となる。GeForce GTX 200シリーズはCompute Capability 1.3に準拠している。

【画面1】GeForce GT 240におけるCUDA-Zの結果。Compute Capabilityが1.2で、レジスタも16,384個となっている【画面2】こちらはGeForce 9600 GTで実行した場合、Compute Capabilityは1.1となる

 GeForce GT 240のCompute Capability 1.2は、SMあたりのレジスタ数が16,384個、シェアードメモリ上で32bitワード・グローバルメモリ上で64bitワードのアトミック演算が可能といった機能が特徴となる。

 しかしながら、倍精度浮動小数点演算はCompute Capability 1.3の機能であり、GeForce GT 240はこれをサポートしないことになる。GT200の倍精度浮動小数点演算は、専用のファンクションユニットを搭載するアーキテクチャとなっている。GeForce GT 240のコアはこれが無効化されているか、トランジスタ数を削減するなどの理由からそもそもGPU内に実装していない可能性も高いと思われる。

 一方で、GeForce GTX 200シリーズより高機能化した部分もある。まず、これはGeForce GT 220/210が登場した折にも話題となったが、GeForce GTX 200シリーズはDirectX 10対応どまりであったのに対し、GeForce GT 240はDirectX 10.1をサポートする。

 そして、NVIDIAのデスクトップ向けGPUとしては初めてGDDR5をサポートした。ミッドレンジ製品らしくビデオメモリは容量や種別のバリエーションが設けられてはいるが、GDDR5の帯域幅の広さは大きなポイントになる。というのも、GeForce 9600 GTでは256bitだったメモリインターフェイスが、GeForce GT 240では128bitに削減された。

 GeForce 9600 GTの1,800MHz/256bitインターフェイスの場合、メモリ帯域幅は57.6GB/secとなる。GeForce GT 240のGDDR5/3,400MHz/128bitインターフェイスでは54.4GB/sec、DDR3/2,000MHz/128bitでは32GB/secとなり、GDDR5ならばメモリインターフェイスの削減分をかなり補うことができることが分かる。

 さて、GeForce GT 240は、GeForce GT 220/210と同じく、PureVideo HD周りも機能強化されている。アクセラレーション可能な動画形式が拡充され、従来のMPEG-2、H.264、VC-1に加え、DivXやXvidなどのMPEG-4 Part 2に準じた動画のアクセラレーションに対応。さらに、フルHD動画のデュアルストリームアクセラレーションをサポート。ピクチャー・イン・ピクチャーに限らず、2つの独立したフルHD動画のアクセラレーションが可能になっている。

【画面3】HDMIから出力するためのHD Audioドライバが組み込まれる

 PureVideo HDエンジンとは別の機能になるが、HDMI出力時のサウンドをGPUのみで出力する機能が実装された。従来のGeForceシリーズでHDMI出力を行なう場合、ビデオカード上のS/PDIF入力にケーブルを接続する必要があったのだが、GeForce GT 240(GT220/210も同様)では、HD Audio機能を内蔵している(画面3)。DACなどは備えないので、あくまでHDMI出力専用のサウンド機能となる。とはいえ、これまで単体でHDMIのサウンドを利用できるのはRadeonシリーズ独自のメリットだったわけで、ようやくGeForceもこれに追いついたことになる。

【お詫びと訂正】初出時に、PC側のサウンド機能から入力すると記述していましたが、ご指摘をいただいて追試したところ、GPU単体でHDMIサウンドを出力できることを確認しました。お詫びして訂正させていただきます。

 今回テストを行なうのは、GIGABYTEから借用した「GV-N240D5-512I」である(写真2)。新GPU登場直後でありながら、オリジナルクーラーを用いた製品だ。NVIDIAのリファレンスデザインはブロアタイプのファンを用いた写真3のようなもの。

 ちなみに本製品はGDDR5を512MB搭載したモデルとなるが、GIGABYTEでは1GBのDDR3を搭載する「GV-N240D3-1GI」というモデルもリリースされる予定だ。DDR3を搭載するというだけでなくオーバークロックモデルにもなっている。ミッドレンジ製品らしく、登場直後からオリジナルクーラー搭載製品やオーバークロックモデルといった特徴ある製品展開をしており、他社からもバリエーションに富んだ製品がリリースされそうである。

 さて、GV-N240D5-512Iの外観に話を戻すが、ボードを見ても電源端子やSLI端子などは搭載していないことが分かる(写真4)。ボードのピーク消費電力は70Wとなっており、PCI Expressスロットから供給可能な75Wを下回っていることから、電源端子が排除されているが、逆に、NVIDIAが製品スペックを電源端子を排除できるギリギリのラインに設定した、と見るべきかも知れない。

 ブラケット部はHDMI、ミニD-Sub15ピン、DVI-Iの構成(写真5)。GeForce 9600 GTのリファレンスデザインはDVIのみでD-Subを持っていなかった。GeForce GT 240はやや下のセグメントを意識した製品であることが垣間見える構成といえる。

【写真2】GIGABYTEの「GV-N240D5-512I」。512MBのGDDR5を搭載する製品【写真3】GeForce GT 240のリファレンスデザイン
【写真4】電源端子やSLI端子は備えていない【写真5】ブラケット部はHDMI、D-Sub15ピン、DVI-Iの順に並ぶ。HDMI出力は音声も出力できるようになっている

 Windows上からは、本製品が定格クロックで動作していることを確認できる(画面4)。メモリは先述のとおりGDDR5で、Samsungの「K4G10325FE-HC05」を搭載(写真6)。

【画面4】GV-N240D5-512Iは定格クロックで動作していることを確認できる【写真6】SAMSUNGのGDDR5「K4G10325FE-HC05」を搭載。0.5ns品。1Gbitのチップで、これを4枚搭載して512MBとなっている

●ミッドレンジGPU3製品を比較

 それではベンチマーク結果を紹介したい。テスト環境は表2に示したとおり、ここではミッドレンジ製品のGeForce 9600 GTとRadeon HD 4670を比較対象とした(写真7、8)。GeForce 9800 GTは電源端子を持つ96W版のものである。

 GeForce両製品のドライバは、GeForce GT 240のレビュー用にNVIDIAから提供を受けたGeForce/ION Driver 195.50を使用。Radeon HD 4670は公開ドライバの最新版であるCatalyst 9.10を使用している。

【写真7】GeForce 9600 GTを搭載する、InnoVISIONの「Inno3D Geforce 9600 GT【写真8】Radeon HD 4670を搭載する、GIGABYTEの「GV-R467D3-512I

【表1】GeForce GT 240の仕様
ビデオカードGeForce GT 240(512MB GDDR5)
GeForce 9600 GT(512MB GDDR3)
Radeon HD 4670(512MB GDDR3)
グラフィックドライバGeForce/ION Driver 195.50βCatalyst 9.10
CPUCore i7-860(TurboBoost無効)
マザーボードASUSTeK P7P55D EVO(Intel P55)
メモリDDR3-1333 2GB×2(9-9-9-24)
ストレージSeagete Barracuda 7200.12(ST3500418AS)
電源Seasonic SS-700HM
OSWindows 7 Ultimate x64

 まずは、「3DMark Vatange」(グラフ1、2)である。これを見ると、まずはGeForce GT 240のグラフィックススコアが非常に良好な結果を出していることが分かる。

 ただし、Feature Testを見ると、Pixel ShaderやPerlin Noiseのように典型的なCUDA Core/SPの処理能力に依存するようなテストを除いては、GeForce 9600 GTに対してそれほどアドバンテージを持っていない。それどころか、バーテックスシェーダの処理負荷が高めになるGPU PerticlesではGeForce 9600 GTに劣る結果となった。

【グラフ1】3DMark Vantage Build 1.0.1(Graphics Score)
【グラフ2】3DMark Vantage Build 1.0.1(Feature Test)

 「3DMark06」(グラフ3、4)の結果は、GeForce 9600 GTが良い結果を出しており、高負荷時には、GeForce GT 240がRadeon HD 4670を下回るスコアにまで落ち込んでいる。Feature Testを見ても、やはりPixel Shader周りの性能はGeForce GT 240が良好である一方、バーテックスシェーダ処理になると相対的に低いスコアに落ち込む。

 ここでは、Feature Testから受ける印象以上に、SM2.0やHDR/SM3.0テストのスコアが低いと感じられる面もある。GeForce 9600 GTに比べ、コアクロックが低いことによるテクスチャ処理性能や、GDDR5を使っているとはいえ狭いメモリ帯域幅となっているといった点も影響が大きいと見られる。

【グラフ3】3DMark06 Build 1.1.0
【グラフ4】3DMark06 Build 1.1.0(Feature Test)

 「BattleForge」(グラフ5)は、Radeon HD 4670が良好な結果を出している。本題であるGeForce GT 240はGeForce 9600 GTよりも低いフレームレートで、とくにフィルタ類を適用した際に差が開く結果となっている。ROPの性能低下、メモリ帯域幅の縮小が影響したのだろう。

【グラフ5】BattleForge

 「BIOHAZZARD 5 ベンチマーク」(グラフ6)と「COMPANY of HEROES Tales of Valor」(グラフ7)の結果は、多少異なる点はあるがBattleForgeとは逆の傾向が出ている。BIOHAZZARD 5はGeForce GT 240がGeForce 9600 GTを上回る結果を出しているうえ、フィルタを適用すると、その優位性が高まる。

 COMPANY of HEROESは、BIOHAZZARD 5以上にGeForce GT 240の優位性が目立つ結果となっているが、フィルタ適用による性能差はあまり大きくない。いずれもシェーダへの負荷が大きいアプリケーションであり、CUDA Core数に勝るGeForce GT 240の良さが出ている。

【グラフ6】BIOHAZZARD 5 ベンチマーク
【グラフ7】COMPANY of HEROES Tales of Valor(Patch v2.601)

 「Crysis Warhead」(グラフ8)は、GeForce GT 240とGeForce 9600 GTのフレームレートは似たような結果となった。とはいえ、ここでは最高クオリティ設定でテストを行なっているわけだが、このクオリティでのプレイは少々厳しい結果であり、快適に利用するにはクオリティを下げる必要があるだろう。

【グラフ8】Crysis Warhead (Patch v1.1)

 「Enemy Territory: Quake Wars」(グラフ9)はBattleForgeに近い結果である。GeForce 9600 GTが良好なフレームレートを出しており、高負荷時にはRadeon HD 4670がGeForce GT 240を上回る。平均60fpsを1つのしきい値とした場合、SXGAのフィルタ適用時にGeForce GT 240はこれを割り込んでしまうあたり、現実的にもダメージが大きい印象だ。

【グラフ9】Enemy Territory: Quake Wars (Patch v1.5)

 「Far Cry 2」(グラフ10)はGeForce 9600 GTが抜きん出た結果となった。シェーダ負荷の高いアプリケーションではあるが、リアリティを向上させるためにポストプロセスも多いことから、GeForce GT 240ではROP周りの性能で伸び悩んだ可能性が高いと考えている。いずれにしても最高クオリティ設定の本テストで平均フレームレートが30fps台であり、現実的に楽しむには、もう少しクオリティを下げるなり、解像度を落とすなりする必要はありそうである。

【グラフ10】Far Cry 2 (Patch v1.03)

 「Left 4 Dead」(グラフ11)、「ストリートファイターIVベンチマーク」(グラフ12)は負荷が低めのアプリケーションで、スコア傾向も類似しており、状況としてはBattleForgeやET:Quake Warsに近い傾向の結果が出ている。ストリートファイターIVのほうが、Radeon HD 4670に対するアドバンテージが大きいものの、GeForce 9600 GTの性格の違いは、シェーダに負荷が偏っていないほかのアプリケーションと同じような傾向で安定している。

【グラフ11】Left 4 Dead
【グラフ12】ストリートファイターIV ベンチマーク

 「Tom Clancy's H.A.W.X」(グラフ13)もわりとシェーダ負荷の高いアプリケーションであるが、結果はGeForce GT 240とGeForce 9600 GTが似たようなスコアに落ち着いた。Radeon HD 4670のフィルタ非適用時のスコアが良いのもピクセルシェーダの性能の良さが生んだものだろう。

 ちなみに、GeForce GT 240はDirectX 10.1設定によるものであり、これによる多少のアドバンテージが得られている。また、GeForce GT 240がフィルタ適用時にフレームレートを大きく落とす傾向が見られるのは、ほかの多くのアプリケーションと同様である。

【グラフ13】Tom Clancy's H.A.W.X

 「Unreal Tournament 3」(グラフ14)、「World in Conflict」(グラフ15)は負荷の多少はあるものの、フィルタ適用時にROPとメモリ帯域幅への要求が高めになるアプリケーションだ。ROPが少ないGeForce GT 240は、こうしたアプリケーションでは、どうしてもGeForce 9600 GTに対して不利になる傾向が見られる。

【グラフ14】Unreal Tournament 3 (Patch v2.0)
【グラフ15】World in Conflict(Patch v1.011)

 さて、最後は消費電力の測定結果である(グラフ16)。アイドル時、ピーク時の総合的な印象では、Radeon HD 4670のバランスの良さを感じられる結果といえる。

 GeForce 9600 GTは初期の標準モデルということもあって、GeForce GT 240のほうがよく抑制されている。ただ、ピーク時はそれほど大きな差がついておらず、最大でも約1割弱の消費電力抑制を期待できるといったところだろうか。

 一方でアイドル時の消費電力は非常によく抑制されている。G92はクロックや電圧を下げる省電力機能を持っておらず、この点はGT200ベースのアーキテクチャであるGeForce GT 240のアドバンテージといえる。

【グラフ16】消費電力

●消費電力は魅力、価格がこなれたころが狙い目

 ベンチマーク結果を見てくると、性能的にはTDP 96WのGeForce 9600 GTに対して、低い結果が出るアプリケーションがやや多めという傾向になった。ピーク時の消費電力は公称電力ほど違いが見られないが、アドバンテージがある。Radeon HD 4670に対しては性能面で優位性があるが、こちらはピーク時の消費電力面で不利がある。つまり、従来の同クラスの従来製品に対して一長一短ある格好だ。

 ただ、価格は少しネックである。NVIDIAが提示する参考価格は99ドル。今回テストしたGIGABYTE製品は14,000円になる見込みという。参考価格からすると、他社製品には1万円前後の価格は期待できるだろう。比較対象の両製品がともに1万円未満で購入できることを考えると割高感は感じるが,価格がこなれてこれば競争力はあると思う。

 しかしながら、アイドル時の消費電力やPureVideo HDのアップデートなど、G92世代にはないポテンシャルはある。GeForce 9600 GTよりも3D性能は低くなったが、それとは違ったバランスを持った製品として、これまでとは違った性格を持つ製品が登場したといえる。