多和田新也のニューアイテム診断室

Radeon HD 2600/2400シリーズの3Dと動画性能を検証




 5月14日に発表されたRadeon HDシリーズ。最上位モデルのRadeon HD 2900 XTについてはすでに本連載でも紹介済みだが、ミッドレンジ~バリューモデルについて出荷が先送りにされていたこともあって遅れていた。ようやく先月末から秋葉原などのパーツショップでも販売が開始されており、すでに入手されている読者もおられるだろう。ここでは、そのラインナップのなかから「Radeon HD 2600 XT」と「Radeon HD 2400 Pro」の性能についてチェックしていきたい。

●電源端子なしに注目したいRadeon HD 2600 XT

 すでに発表から2カ月近く経過していることもあり、Radeon HD 2600/2400シリーズに関する情報も周知のことと思うので、ここでは簡単に特徴のみまとめておきたい。主なスペックは表1の通りで、SP数はそれぞれ120基、40基と、Radeon HD 2900 XTの320基から大幅に削減されている一方、Radeon HD 2900 XTでは742MHzとなるコアクロックは、極端に落とされていない。

【表1】Radeon HD 2600/2400シリーズの主な仕様
  Radeon HD 2600 XT Radeon HD 2600 Pro Radeon HD 2400 XT Radeon HD 2400 Pro
コアクロック 800MHz 600MHz 700MHz 525MHz
ストリーミングプロセッサ数 120基 40基
メモリクロック 2.2GHz(GDDR4)/1.6GHz(GDDR3)/800MHz(DDR2) 1.6GHz(GDDR3)/800MHz(DDR2)
メモリ容量 256MB 256MB
メモリインターフェイス 128bit 64bit
テクスチャユニット 8基 4基
レンダーバックエンド 4基 4基

 メモリはベンダーのために選択肢が多く用意されている。表1に示したのは、あくまでATIが提示したクロックや種別であり、ここからオーバークロック版などの派生形が生まれる可能性は高い。

 メモリクロックは、Radeon HD 2600シリーズのGDDR4使用時が2.2GHz(1,100MHz DDR)と、非常に高い。一方、メモリインターフェイスは従来通り128bit以下に制限されており、メモリ帯域幅のビハインドは大きい。

 そのほか、テクスチャユニット数、レンダーバックエンド(NVIDIAがいうところのROP)も削減されており、動作クロックは落とさずに、ほかの部分でパフォーマンスを抑制した方向性のスペックといえる。

 ちなみに、Radeon HDシリーズ発表後に情報が錯綜したUniversal Video Decoder(UVD)であるが、これはRadeon HD 2600/2400シリーズにのみ実装されることが、後に改めてアナウンスされている。MPEG-4 AVCだけでなく、VC-1のビットストリーム処理も可能な点が、NVIDIAのGeForce 8600/8500/8400シリーズに実装されているPureVideo Gen2とは異なる点で、このパフォーマンスも後ほどチェックしてみたい。

 さて、今回テストに使用するのは、Sapphire TechnologyのRadeon HD 2600 XT搭載製品「HD 2600 XT 256MB GDDR3 PCI-e DUAL DVI-I/TVO」と、Radeon HD 2400 Pro搭載製品「HD 2400 PRO 256MB 64-BIT DDR2 PCI-E VGA/TVO/DVI-I」である(写真1~4)。

 前者はミッドレンジの上位モデルという位置付けの製品だが、基板は最近の同セグメントの製品ではコンパクトに収まっている。また、電源端子を備えていないのも特徴的。ボードの消費電力が公称45Wとなっており、低電力さにも期待できる仕様といえるだろう。このほかNative CrossFire端子も備えているあたりも特徴的な点だ(写真5)。

 後者はさらにコンパクトで、見た目はいたって普通のビデオカードといった印象。アルミ製のヒートシンクのみでファンレスある点が特徴であるが、それほど特筆することもないシンプルな製品である。利用されているDDR2メモリはHynixの「HY5PS121621CFP-25」で、400MHz動作が可能な定格動作クロックに準じた製品である。512Mbitチップなので、これを4枚利用して256MBとなる。

【写真1】Radeon HD 2600 XTを搭載する、Sapphire Technologyの「HD 2600 XT 256MB GDDR3 PCI-e DUAL DVI-I/TVO」 【写真2】Radeon HD 2400 Proを搭載する、Sapphire Technologyの「HD 2400 PRO 256MB 64-BIT DDR2 PCI-E VGA/TVO/DVI-I」 【写真3】Radeon HD 2600 XT搭載製品のブラケット部。DVI×2とビデオ出力の構成。DVIはもちろんHDCPに対応している
【写真4】Radeon HD 2400 XT搭載製品のブラケット部。こちらはD-Sub15ピンを備えるほか、DVIとビデオ出力を持つ。DVI端子はHDCPに対応する 【写真5】Radeon HD 2600 XTは同シリーズのミッドレンジ上位モデルとなるが、このクラスの製品では久しぶりに外部電源供給なしで動作する 【写真6】Radeon HD 2600 XTはNative CrossFire端子も備えている。Radeon HD 2400 Proのほうは備えていない

 各製品の動作クロックは、画面1、2の通り。注意したいのは画面1のRadeon HD 2600 XTのメモリクロックで、1.4GHz(700MHz DDR)と定格よりも若干低いクロックで動作している。

【画面1】テストに使用するRadeon HD 2600 XT搭載製品は、コアクロック800MHz、メモリクロック700MHz(データレート:1.4GHz)であることが分かる 【画面2】同じくRadeon HD 2400 Pro搭載製品は、コアクロック525MHz、メモリクロック400MHz(同800MHz)で、定格通りの動作クロックとなっている

●βドライバで性能改善が見られるRadeon

 それでは、パフォーマンスの検証に移りたい。環境は表2の通り。今回からビデオカード関連のベンチマーク環境を、Windows Vista Ultimateに移行したほか、メモリ容量を1GB×2枚へアップしている。

【表2】テスト環境
  AMD ATI Radeon 2600 XT
ATI Radeon 2400 Pro
NVIDIA GeForce 8600 GTS
NVIDIA GeForce 8400 GT
VGA Driver Driver Package:8.38.3-070613a-048646C-ATI
Beta Driver Package:8.38.9.1-070613a-048912E-ATI
ForceWare 158.24
マザーボード Intel D975XBX2 (Intel 975X)
CPU Core 2 Duo E6700
メモリ PC2-6400 DDR SDRAM 1GB×2 (5-5-5-18)
HDD Seagete Barracuda 7200.10 (ST3250620AS)
OS Windows Vista Ultimate

 また、ビデオカードのテスト環境のCPUは、最近は主にCore 2 Extreme X6800を使用しているが、今回はCore 2 Duo E6700を選択した。ミッドレンジ以下のビデオカード製品を対象としたテストであるため、Core 2 Duo E6700でもCPUがボトルネックになる可能性は低く、むしろUVDのテストにおいてはCPU性能が高すぎると差が分かりにくくなる恐れがあるため選択したものである。

 このほか、ベンチマークソフトも見直しを行ない、DirectX 10ベンチマークの追加、3DMark03の削除、DirectX 9ベンチマークの簡略化を行なった。ただし、DirectX 10ベンチマークとして現時点で貴重な存在であるロストプラネットに関しては、Radeon環境でエラーが発生して起動しなかった。DirectX SDKの更新やドライバを変更しても状況に変化はなく、動作しなかったRadeon 2製品が今回の主題であるため、本稿では結果を掲載していない。

 Radeon HDシリーズ用のドライバは、原稿執筆時にはCATALYST 7.6(Package Version:8.38.3-070613a-048646C-ATI)がAMDのWebサイトにアップされていた。しかし、CATALYST 7.7に向けて開発中のベータドライバ(Package Version:8.38.9.1-070613a-048912E-ATI)も入手しており、ここでは、この両方でテストを行なっている。新バージョンに変更することによる、パフォーマンスの変化にも注目したい。

 比較対象にはGeForce 8600 GTS、GeForce 8400 GSを用意(写真7、8)。両製品の動作クロックは画面3、4の通りで、いずれもほぼ定格での動作となっている。

【写真7】GeForce 8600 GTSを搭載する「XFX GeForce 8600GTS 256MB DDR3」 【写真8】GeForce 8400 GSを搭載する「XFX GF 8400 GS 256MB DDR2」
【画面3】GeForce 8600 GTS搭載製品の動作クロック。コア675MHz、メモリ1,008MHz(2016MHz)と、メモリが若干高いものの、ほぼ定格通りといえるクロックで動作している 【画面4】GeForce 8400 GS搭載製品の動作クロック。コア450MHz、メモリ400MHz(800MHz)と、こちらは定格通りに動作している

 まず3DMark06(グラフ1~4)、3DMark05(グラフ5)の結果である。GeForce 8400 GSについては、3DMark06のUXGA条件で一部テストが完走しなかったため数値を割愛している。

 全体的に見ると、結果はミッドレンジ、バリューレンジで完全に二極化している。GeForceとRadeonの比較では、OverallとSM2.0テスト、3DMark05でGeForce勢が優位に立っているが、SM3.0テストの特に高負荷条件でRadeon勢の健闘も見逃せない結果になっている。差の大小はあるが、傾向としては以前にテストしたRadeon HD 2900 XTとGeForce 8800 GTXに非常によく似たものとなっており、アーキテクチャ上の特性と見ていいだろう。

 Feature Testの結果は、ちょっと判断が難しいポイントが見られる。まず、ピクセルシェーダのテストでRadeon HD 2600 XTが突出したスコアを出したのは、SP数の絶対数で押し切った感を受ける。Radeon HD 2400 Proも、GeForce 8400 GSと比較して悪くないスコアを出している。バーテックスシェーダのシンプルテストも同様の理由による好結果だろう。

 ただ、バーテックスシェーダのテストでも負荷が高まるコンプレックステストでは、シンプルテストの3分の1以下と、大幅なスコア低下が起きてしまっているのだ。統合型シェーダになったGeForce 8シリーズやRadeon HD 2900 XTでは、従来の独立型シェーダGPUに比べて、このテストで圧倒的な強さを見せていたわけだが、独立型シェーダでバーテックスシェーダユニット数が少なかったときに、そのユニット数の少なさがボトルネックになっていたときの状態に似ている。つまり、120基/40基あるSPが有効に使われていないように思われる。

 しかし、このあたりは今後のドライバの改善で変化が見られるのではないだろうか。そう考える根拠は、リリース済みドライバとβドライバでのスコア差にもある。

 このFeature Testでは、バーテックスシェーダテストを除いては、ピクセルシェーダの能力が強く問われるわけだが、バーテックスシェーダの2テスト以外はパフォーマンスに大きな変化ないか、むしろ悪化する傾向すら見て取れる。顕著なのがPerlin Noiseのテストで、このテストではメモリ帯域幅のほかピクセルシェーダの演算能力が影響する。

 統合型シェーダでは、バーテックスシェーダよりのチューンを行なえば、当然、それだけピクセルシェーダに割り当てられるSP数が減り、その処理性能も落ちることになる。後のゲーム関連のテストでも、βドライバのパフォーマンスの良さは目立っており、こうしたFeature Testの結果が特異に感じられるほどだ。

 そのため、このドライバではバーテックスシェーダ処理の改善に重きを置いているように見えるのである。つまり、現在のドライバのパフォーマンス上の問題点はバーテックスシェーダの処理にあるとAMDは考え、CATALYST 7.7に向けてこの点を中心に改善を行なっているのではないかと想像される。

【グラフ1】3DMark06 Build 1.1.0
【グラフ2】3DMark06 Build 1.1.0(SM2.0)
【グラフ3】3DMark06 Build 1.1.0(HDR/SM3.0)
【グラフ4】3DMark06 Build 1.1.0(Feature Tests)
【グラフ5】3DMark05 Build 1.3.0

 続いては実際のゲームを利用したベンチマークテストである。テストは、「Call of Juarez DirectX 10 Benchmark」(グラフ6)、「Splinter Cell Chaos Theory」(グラフ7)、「Call of Duty 2」(グラフ8)、「F.E.A.R.」(グラフ9)だ。

 Call of Juarezに関してはRadeon勢の圧倒的なパフォーマンスが目立つが、ほかはほぼGeForce勢が優勢という結果に収まった。また、Call of Juarez、Splinter Cell、F.E.A.R.で、βドライバのパフォーマンス向上がはっきり見て取れる点には注目すべきだろう。

 統合型シェーダでは、そのSPをどう割り当てるかなどをドライバ側でどこまでコントロールするかによってパフォーマンスが変化する。ドライバによるアプリケーションごとの最適化が、独立型シェーダGPUよりも顕著になってくる可能性は高い。

 効果のあったアプリケーションでは大きいところで1割ほどスコアを伸ばしており、ドライバ1つでパフォーマンスが大きく変化することが分かる。逆にこのβドライバではCall of Duty 2に対してはほとんど手が加わっていないことも興味深く、ユーザーも、これまで以上にドライバのバージョンをこまめにチェックしたほうがよさそうである。

 もっとも、Radeon HD 2600 XTはXGA以下であれば現実的に利用できるゲームタイトルも多そうだが、Radeon HD 2400 Proに関してはGeForce 8400 GSに辛い印象を受ける。今日に至っても、バリューセグメントにおいては3Dゲームに対するパフォーマンスに期待を抱けない結果になっている。

【グラフ6】Call of Juarez DirectX 10 Benchmark
【グラフ7】Splinter Cell Chaos Theory Patch 1.05(HDR有効)
【グラフ8】Call of Duty 2 Patch v1.3
【グラフ9】F.E.A.R. Patch 1.08(SoftShadows無効)

●VC-1への効果が認められるがやや動作が不安定なUVD

 次にUVDの性能を見るため、HD DVDタイトル再生中のCPU使用率をチェックしてみたい。再生したのは、MPEG-4 AVCで収録された「映像詩 里山 命めぐる水辺」のチャプタ2、VC-1で収録された「ワイルド・スピード X3 TOKYO DRIFT」のチャプタ18である。数値は、各チャプタ開始時からCPU使用率を1秒ごとにスキャンし、3分間(つまりサンプル数は180個)の平均値を出すことにした。

 結果はグラフ10である。ここではMPEG-4 AVC/VC-1のビットストリーム処理をハードウェア処理できない場合の例として、GeForce 8800 GTXもテストに追加した。

 なお、このテストではRadeon HD 2600 XTのハードウェアアクセラレーションありの場合に、正しく再生できていなかった点を特記しておきたい。ハードウェアアクセラレーションを有効にして再生した場合、コマ落ちが激しく、VC-1ソースの場合は画面描画の乱れも非常に激しかった。逆にハードウェアアクセラレーションを無効にした場合は問題なく表示された。

 2種類のドライバともに現象が同じであったため、ドライバの問題なのかハードウェアの問題なのか判断に苦しむ。さらに、テスト結果ではハードウェアアクセラレーション有効時にCPU使用率が下がっているものの、これはUVDが働いた上で出力に問題があったものなのか、コマ落ちしている間にデコード処理が端折られてしまったためなのかも判断できなかった。

 ただ、正しく再生できたRadeon HD 2400 Proに近い傾向も見られるので、デコードはフルフレームでなされたものの、出力に問題があったのではないかと想像はしている。よって、参考値ということにはしたいが、Radeon HD 2600 XTの結果も掲載した次第である。

 このような事情により、結果はRadeon HD 2400 Proを中心に見ていくことにしたいが、ここには2つ大きなポイントがある。1つはRadeon勢のドライバによる傾向の違いだ。まず、Radeon HD 2400 ProのCATALYST 7.6時にMPEG-4 AVCでほとんどハードウェアアクセラレーションが行なわれていないと判断できる。

 一方のβドライバではMPEG-4 AVCもVC-1もきっちりハードウェアアクセラレーションが行なわれているが、現在のドライバよりもCPU使用率が増してしまっている。ただしこれは、ハードウェアアクセラレーションを無効にした状態でもRadeon 2製品に共通して見られる傾向であり、動画再生支援に関わる話というよりは、むしろドライバ全体の傾向として受け取っておいたほうが妥当に感じられる。

 もう1つのポイントはGeForce 8600/8500との違いである。MPEG-4 AVCソースでハードウェアアクセラレーションを有効にした場合はGeForce 8600/8500のCPU使用率が低く抑えられており、この点ではGeForce勢がアドバンテージを持っている結果となった。

 しかし、VC-1ソースでハードウェアアクセラレーションを有効にした場合は、Radeon勢のCPU使用率の方が低くなる。Radeon HD 2600/2400のUVDは、GeForce 8600/8500のVP2に対して、VC-1のビットストリーム処理とエントロピートランスフォームにも対応する点をアドバンテージとしてアピールしているが、それが証明された結果といえるだろう。

 GeForce 8800 GTXは、MPEG-4 AVC/VC-1ともハードウェアアクセラレーションの適用範囲が限定されており、適用範囲が同一となるVC-1ではGeForce 8600/8500と同程度のCPU使用率となるが、MPEG-4 AVCではCPU使用率が高い状態になった。これは理に適った結果といえる。

【グラフ10】HD DVD再生時のCPU使用率(Power DVD Ultra使用)

 最後に消費電力のテストである(グラフ11)。Radeon HD 2600 XT/2400 Proともにアイドル時の消費電力はかなり抑制されている。ただし、負荷が高まった時には、Radeon HD 2600 XTは、GeForce 8600 GTSを上回る消費電力となってしまった。もっとも、これは外部の電源端子を持つGeForce 8600 GTSが意外に抑制されていると見るべきかも知れない。

 一方のRadeon HD 2400 Proは負荷が高まった状態でもGeForce 8400 GS以上に省電力動作が実現されている。このクラスでは、パフォーマンス以上に消費電力や熱に対する重要度が高まるわけで、好印象を受ける結果だ。

【グラフ11】各ビデオカード使用時の消費電力

●ドライバの熟成がキーになるRadeon HD 2600/2400シリーズ

 以上の通りRadeon HD 2600 XT、Radeon HD 2400 Proの結果を見てきた。まず、Radeon HD 2600 XTについて触れていくと、GeForce 8600 GTSとの比較でパフォーマンス、高負荷時の消費電力ともに全般に劣る結果となった。このセグメントの製品の場合は、3Dゲームをプレイしようと考えるユーザーが検討するだろうし、この2点で劣る結果となったのは残念だ。コスト面ではGeForce 8600 GTSが数千円ほど高価である点や、追加電源を接続する必要があるなどの不利もあるが、性能/電力という2点のファクターを覆すほどの不利という印象は受けない。

 一方、Radeon HD 2400 Proもパフォーマンス面ではGeForce 8400 GSに劣る結果といえるが、価格は同等、消費電力ではRadeon HD 2400 Proに分がある格好だ。βドライバにおけるUVDの性能も安定しており、こちらはローエンド製品として魅力的な結果といえるだろう。

 ただ、Radeon HD 2400 Proの現在のドライバにおけるMPEG-4 AVC再生時のCPU使用率や、Radeon HD 2600 XTにおけるUVD利用時のHD DVD再生異常、βドライバでパフォーマンスの伸びを見せた点など、少なくとも現在の公式ドライバでは製品として完成されているとは言い難い印象を受けたのも確かだ。

 βドライバではパフォーマンスとRadeon HD 2400 ProのUVDの問題は解消されており、正式に次のバージョンがリリースされるまでには、さらなる修正が加えられるのだろう。Radeon HD 2600/2400シリーズが製品としての完成度を高め、持つ能力を最大限に発揮できるかどうかは、今後のドライバリリースにかかっている。

□関連記事
【6月14日】AMD、Radeon HD 2600/2400をカードメーカーに出荷開始
http://pc.watch.impress.co.jp/docs/2007/0614/amd.htm
【5月14日】AMD、「R600」ことDirectX 10対応GPU「Radeon HD 2000」シリーズ
http://pc.watch.impress.co.jp/docs/2007/0514/amd1.htm
【5月14日】【多和田】AMDのDirectX 10対応GPU「Radeon HD 2900 XT」
http://pc.watch.impress.co.jp/docs/2007/0514/tawada104.htm

バックナンバー

(2007年7月10日)

[Text by 多和田新也]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2007 Impress Corporation, an Impress Group company. All rights reserved.