●フルスクラッチで開発されたTM8000 [Q] TM8000の現在の開発状況を教えて欲しい。 [D'Souza氏] 我々は、最初の動作チップをCOMDEXで見せた。顧客は、今年の頭から評価のためのサンプルを受け取っている。すでに我々は顧客からのフィードバックを受け取っており、パフォーマンスについては、評価は高い。 [Ditzel氏] 我々は報道関係者に初めて公式にフィーチャを明らかにしたところだ。製品の導入時期までには、もっと詳細を明らかにする。顧客が当社のCPUを搭載した製品を出荷する時期は、第3四半期をターゲットとしている。 [Q] TM8000は「Crusoe」ブランドを引き継ぐのか。 [Ditzel氏] 強調しておきたいのは、TM8000は「Crusoe」とは呼ばないことだ。CrusoeはTM5000シリーズのための名前で、TM8000シリーズはCrusoeとは異なる新ブランド名になる。2つのCPUを容易に区別できるようにするためだ。実際に、この2つのCPUの内容は大きく異なる。 [Q] TM8000はフルスクラッチで(全く新しく)設計したのか。 [D'Souza氏] そうだ。我々は、新しいマーケットに合わせて、この新CPUをフルスクラッチで開発した。ブランドニューアーキテクチャであり、Crusoeを拡張したCPUではない。 [Ditzel氏] そこが我々の競争相手と違うところだ。例えば、Centrino(Pentium M)はPentium IIIにSSE2命令を加えるといった多少の変更を加えただけだ。ベースは古いPentium IIIに変わりはない。それに対して、ASTROはゼロからエネルギー効率のいいCPUを目指して開発された。 新しい設計といっても、TM8000には過去5年の我々の学習の成果が生かされている。 [Q] Crusoeでは、ユーザーは性能面への不満が多かった。TM8000ではその点は解消できると考えているのか。 [Ditzel氏] 理解して欲しいのは、Crusoeがわれわれの最初の製品であり、業界で最初のソフトウェアベースのCPUだったことだ。Crusoeを出した時、人々に“これは素晴らしい。でも、まだ改良の余地がある”と言われた。我々もそれを理解し、そこから学び、そして、性能だけでなく、多くの部分を改良した。TM8000は我々にとって第2世代のアーキテクチャであり、完成度は高い。特に、日本の素晴らしい顧客のおかげで、多くのことを学ぶことができた。
●スケーラビリティの高いTM8000アーキテクチャ [Q] TM5000シリーズは0.18μmと0.13μmの2世代があった。TM8000シリーズも0.13μmから始まり複数の世代に渡ると考えるのが自然だが。 [D'Souza氏] もちろんTM8000も複数の世代に渡るが、TM5000と違う点がある。それは、TM8000がスケーラビリティを考慮して設計されたことだ。TM8000では、今後数年に渡って性能を向上させ続けることができる余裕が、最初からアーキテクチャに織り込まれている。我々はTM8000から、拡張してゆく展望をすでに持っている。 これは、ちょうど我々の競争相手がやっているのと同じことだ。彼らはPentium Proからスタートして、同じアーキテクチャをPentium IIIやCentrinoまで拡張した。同じことが、今回は我々にもできる。TM8000は、この新コアファミリの単なる出発点に過ぎない。だから、我々は将来に対しても非常に楽観的だ。 [Q] Crusoeの時はソフトで性能や機能を拡張したが、CPUアーキテクチャ自体は世代(TM5600→TM5800)でほぼ変わらなかった。しかし、TM8000ではCPUハードウェアも、拡張できるように最初から設計したということか。 [Ditzel氏] ハードウェアとソフトウェアの両面で改良していく。非常に拡張性が高いアーキテクチャだ。 [Q] TM8000のCMSは何が拡張されたのか。 [Ditzel氏] TM8000でベンチマークを取り始めたのだが、非常にエキサイティングだ。同じシリコンなのに、ソフトウェア(CMS)を変えるだけで、どんどん性能が上がっている。ソフトウェアチームが、CMSの最適化の方法を次々に見つけるからだ。TM8000では、8命令同時発行であるため、ソフトウェアが命令を並列化するのが容易だ。命令発行数(命令スロット)が限られるため並列化できないといった、従来の制約がない。それだけ、ソフトウェア側での最適化の余裕がある。だから、製品を出荷してからも、長年CMSの改良でパフォーマンスを向上させ続けることができると信じている。 ●並列性が高いTM8000は電力効率も高い [Q] TM8000の最大の特徴は命令レベルの並列性の高さだ。TM5000では最大4命令/サイクルだったのが、TM8000では最大8命令/サイクルだ。しかし、これは最大値に過ぎない。平均値または典型値はどの程度になるのか。VLIW型アーキテクチャでは、平均値で5命令/サイクルが限界と言われているが。 [D'Souza氏] これは難しい質問だ。というのは、命令/サイクルは、ソフトウェアによって大きく異なるため、典型値を出すのは難しいからだ。今は答えることができない。もちろん、これまでより多くの並列性を実現できる機会があるのは確かだ。 並列性が高いということは、エネルギー効率の高いコンピューティングができることでもある。より多くの命令を同時に発行できるため、単位時間当たりに多くの処理ができる。つまり、TM5000シリーズと比べて、CPUの処理量/消費電力が高くなる。 [Q] TM8000の消費電力はどうなのか。 [Ditzel氏] 消費電力について、もっとも的確な表現は「TM8000はTM5000よりもっと広いダイナミックレンジを持っている」という言い方だろう。同じタスクを実行させるなら、TM8000の方がTM5000より電力効率が高い。例えば、DVDムービー再生やMP3オーディオ再生ならTM8000の方が消費電力が低い。これは、CPUのがより多くの命令を並列に処理できるために、より低い周波数、低い電圧で動作させることができるからだ。 だが、その逆に、やや高い周波数で、やや高い電圧で動作させれば、TM8000は非常に高いパフォーマンスを発揮できる。消費電力のレベルはやや上がるが、それでも一定の枠に留めることができるだろう。ノートPCでは消費電力はクリティカルだが、デスクトップPCでは、消費電力はノートPCほど問題とならない。つまり、TM8000はそうした市場にも適合できるということだ。静音デスクトップにも、TM8000は最適だろう。 ●浮動小数点演算とSIMD演算の性能強化にフォーカス
[Ditzel氏] そういうことだ。特に、並列性の高さはマルチメディア処理では意味が大きい。もちろん、eメールを使う時にも効果はあるだろうが、eメールはそんなに電力を食わない。しかし、DVD再生は食う。そこで、我々はTM8000の並列性の向上の焦点を、もっとも重要なところに置いた。TM8000は、TM5000よりずっと強力な浮動小数点演算ユニットとマルチメディア命令サポートを備える。 [Q] それは、SIMD命令をハードウェアでサポートし、SIMD演算ユニットを備えるという意味か。 [Ditzel氏] そうだ。まだ正確なディテールを教えることはできないが、多くのSIMD命令を実装する。また、SIMDの並列性は、同時発行できる8命令の中には数えていない。つまり、TM8000はSIMDを含めると、8よりも多い数のオペレーションを並列実行できる。 [Q] SIMD演算ユニット自体も複数備えるのか。 [Ditzel氏] 8命令のうち少なくとも2以上(more than one)はSIMD命令だ。だから、マルチメディアパフォーマンスは非常にいい(注:英語のmore than oneでは1を含まないので2以上になる)。 [Q] 消費電力では、トランジスタからの漏れ電流(リーケッジ)も問題だ。特に90nmから先のプロセスではこれは巨大な問題になる。この問題は「LongRun」(Transmetaの省電力アーキテクチャ)では解決ができない。 [D'Souza氏] それは理解しているし、いくつかの対策を考えている。だが、漏れ電流を減らす最大のポイントはトランジスタ数自体を減らすことだ。ソフトウェアベースのTransmetaのアプローチは、CPUのトランジスタ数を減らすことができる。
[Ditzel氏] ソフトウェアには漏れ電流がないから(笑)。
□関連記事 (2003年3月10日) [Reported by 後藤 弘茂]
【PC Watchホームページ】
|
|