[an error occurred while processing the directive]

パット・ゲルシンガー氏基調講演レポート
「Peta FLOPsからミリワットまでカバーするIA」

基調講演を行なうIntel上級副社長でデジタルエンタープライズ事業部担当のPatrick P.ゲルシンガー氏。以前レーシック手術でメガネが不要になったとのことだったが、また復活したようである

4月2日(現地時間) 開催

会場:上海国際コンベンションセンター



 IDF初日、最初の基調講演は、太鼓の演奏で始まった。昨年(2007年)のIDF北京でも最初に踊りが披露されたが、同じような演出である。Intelが中国になじんでいることを示したいのか、あるいは、こういうスタイルが中国では普通なのかはよくわからない。

 オープニングの挨拶のあと、デジタル・エンタープライズグループ担当のパット・ゲルシンガー(Pat Gelsinger)氏が登場。同氏は、デスクトップやサーバー向けCPUなどを担当している。

 基調講演のタイトルは、「From Peta FLOPs to Milli Watts」(Peta FLOPsからミリワットまで)。IntelのIAプロセッサが、スーパーコンピュータからMIDまで利用できることから付けられたタイトルだ。

 ゲルシンガー氏は、「ムーアの法則」やアンディ・グローブ元Intel CEOが言った「ソフトウェアスパイラル」(ハードウェアが進歩していくことで、ソフトウェアもそれにつれて向上していく)、Ethernet発明者である「メカトーフの法則」(システムの価値は、接続されるデバイス数の2乗に比例する)、「Reedの法則」(インターネットでは参加者がグループを作って議論するところに意味があり、その数は多いほうがいい。ネットワーク内で作ることができるグループの数は参加者をnとすると2のn乗-n-1個ある)などを引き合いに出し、IAプロセッサの価値とは、これらの法則の関数になっているとした。つまり、世の中に大量に普及しており、定期的に性能が向上していくIAプロセッサの価値は非常に高いと述べたのだ。

 そして、現在では、このIAプロセッサは、Atomプロセッサのようにミリワット(mW)で動作するものから、スーパーコンピュータに使われるものでは非常に幅広い範囲をカバーしており、これは、自由に伸び縮みする孫悟空の如意棒のようなものだと説明した。

 同氏は、80386の開発に携わり、いわば、現在のIAプロセッサの基本を作った人物の1人といえる。IAには強い思い入れがあるように見受けられた。

 この広い範囲を今回は、アナンド・チャンドラシーカ氏がミリワットの部分を、ダディ・パルムッター氏がその上の部分を、そして、ゲルシンガー氏が一番上のPeta FLOPsの部分を担当すると説明した。

太鼓の演奏で始まった基調講演。余談だが、泊まっているホテルの部屋の真上が基調講演会場で、昨晩遅くまでリハーサルの太鼓の音が聞こえて寝るどころではなかった 幅広い範囲をカバーするIntelアーキテクチャは、孫悟空の如意棒のようなものと中国文化を使ってアピール。ちなみに京劇の孫悟空は、三蔵法師と出会う前の暴れ者の頃の話なのだとか ステージにも如意棒を持ち込み、登場するゲストに手渡していた

●IntelアーキテクチャがHPCを進歩させる

 ハイエンドのIntelプロセッサがカバーする分野を、同氏は「High Performance Computing(HPC)」と呼び、「飽くことなく向上する性能」と表現した。これを利用する主要なアプリケーションには、「天気予報」、「石油探索」、「設計シミュレーション」、「遺伝子研究」、「金融分析」、「医療画像処理」などがあるとした。

 いまやIAを使ったマシンの性能は、Peta FLOPs(10の15乗 FLOPs)に近づきつつある。Peta FLOPsの性能があれば、リアルタイムの医療画像処理が可能になる。さらに、その後10年ぐらいでその上のExa FLOPs(10の18乗)になると予測。Exa FLOPsになると遺伝子研究にリアルタイム性が導入できるようになり、テーラーメイド医療(遺伝子などを検査して一人一人に最適な治療方法を選択する医療技術)が可能になるとした。

 さらに10年後はZeta FLOPs(10の21乗)に到達、天気予報の精度を向上させることが可能になるという。このHPC分野に対してIntelは、さまざまなサポートを提供することにより、さまざまな分野の研究にブレークスルーをもたらすことができるとした。その後、中国での取り組みとして石油会社のSINOPECを紹介した。

 そして具体的な製品の紹介に入った。まずは、Itanium系の「Tukwila(タックウイラ)」とXeonとなる6コアの「Dunnington(ダニングトン)」を紹介した。Tukwilaは、30MBのキャッシュを搭載、さらにQuickPathを持つ。このため、Nehalem世代のIAプロセッサとの類似性が高くなる。クロックは2GHz程度で、メインフレーム同等のRAS(Reliability、Availability、Serviceability)を持つという。

 Dunningtonは、3コアのダイを2つ統合し6コアとするもの。45nmのHigh-k採用プロセスで製造される。今年後半には登場し、Caneland(ケインランド)プラットフォームに対応する。このDunningtonが最後のCoreマイクロアーキテクチャとなり、次にはNehalemベースのものへと移行する予定だ。

 企業内での利用分野(エンタープライズ分野)では、仮想化が主要な問題であるとし、これからは、仮想化の利用方法も変わってくると予測した。これまでの仮想化は、主にテストや開発、そしてサーバー統合が大きな目的だった。しかし、今後は、Fault Tolerance(耐障害性)やダイナミックデータセンター(構成や資源配分が柔軟に行なえるデータセンター)、Availability&Continuity(有用性と連続性)などが加わるという。これを同氏は、「Virtualization 2.0」と表現した。

 このためには、安定性と信頼性、性能向上、新しい利用方法を可能にするといった技術革新が必要だとし、Intelはこれに答える準備があるとした。

 もう1つの問題は、消費電力である。Intelの製品は、SPECの性能と消費電力のベンチマークであるSPECpowerでも高性能なことが示されており、現在SPECpowerのランク第1位であるInspurを紹介した。

すぐにでも到達しそうなPeta FLOPsでは、リアルタイムの医療画像処理が可能になり、さらに10年で1Exa FLOPsを達成し、遺伝子研究が加速、その後さらに10年で1Zeta Flopsに到達し、天気予報の精度を上げることになるという 新しい仮想化の応用分野を「Virtualization 2.0」と定義。システムの信頼性を向上させるような使い方が可能になるという

●チックタックモデルによるCPUの進歩

 仮想化の性能向上や低消費電力化は、2008年第4四半期に登場するNehalemでさらに改善されるとした。

 Nehalemは、Coreマイクロアーキテクチャの後継となる新しいマイクロアーキテクチャを採用。メモリコントローラを内蔵し、QuickPathでCPUやI/Oハブとの接続を行なう。また、SSE4.2と呼ばれる新しい命令が追加される。これは、文字列検索などを高速化する命令で、128bitのXMMレジスタを2バイト文字8文字分とし、2つのXMMレジスタで文字列の一致や、指定文字の有無などを検査するもの。これにより、8×8文字の組合せを一度に検査でき、金融分野のデータ処理で命令数を75%削減でき、性能を3倍程度向上できるとした。さらにNehalemの次になるWestmereでは、AES暗号化処理を最大3倍程度向上させる命令を追加する。

 また、次世代となるSunday Bridgeでは、256bitのベクトル演算命令や、データの並べ替え命令、3オペランド命令を追加する予定だ。これにより、浮動小数点演算のピーク性能で2倍程度高速化が行なえるという。3オペランド命令とは、演算に必要な2つのパラメータと結果の格納先を指定する命令形式。

 現在のIAの命令は結果を片方のパラメータに上書きすることを暗黙に指定する2オペランド方式である。3オペランド方式では、演算結果とパラメータが分離されるため、コンパイラ処理が簡単になるなどの利点がある。

 デモでは、256個のNehalemを動作させ、シミュレーションなどが高速化されることを示した。ステージには、Supermicroのラックマウントマシンが設置されていたが、32ノードのマシンには、8コアのNehalemが搭載されており、256コア、論理CPU数では512個(NehalemはSMTで各コアが2スレッドを同時実行できるため)を動作させていた。

 最後にゲルシンガー氏は、さまざまなものを視覚化するビジュアルコンピューティングについて触れた。コンピュータの性能向上は、ビジュアルコンピューティングを変えることになるという。単純なグラフィックス表示から写真のようなグラフィックスやHDビデオの処理、モデルベースのコンピューティングなどが可能になる。

 さらにIntelは、ここにIAによる汎用的なプログラミングモデルをもたらす。これが既発表の「Larrabee(ララビー)」である。これは、ビジュアルコンピューティングの重要な要素となるプロセッサだが、グラフィックス用として考えられている。

 実際には、DirectXやOpenGLが提供されるが、内部的には、IAのコードが走るグラフィックスプロセッサとなる。ただし、グラフィックス用に最適化された命令が追加され、ベクトル演算機能などもメインCPU系とは違ったものになるという。同氏は、これまでさまざまな新しいシリコンの開発をしてきたが、この製品ほどISVが熱心になった製品はないという。

 最後にゲルシンガー氏は、Intelアーキテクチャは、あらゆる段階において利用することができ、一生を通じての利用が可能なアーキテクチャであるとした。これを利用することで、開発者の皆さんは、孫悟空のように活躍することができるだろうとしてスピーチを締めくくった。

いまやIntelの開発パターンとなった「チック、タック」モデル。アーキテクチャの革新とプロセスの進化を交互に行なう。今年後半は、アーキテクチャ革新となり、Nehalemが登場、2009年はこれを32nmに展開する年で、2010年にはまた新しいアーキテクチャとなるSandy Bridge(サンディブリッジ)が登場する Nehalemは、4コアのダイを2つパッケージに封入した8コア製品が用意される。メモリコントローラを内蔵してQuickPathを使って外部デバイスと接続する Nehalemのウェハ。ロジックとキャッシュ部分で色が違って見え、キャッシュ部分が大きな面積を占めているのがわかる

32個のNehalem(256コア、512スレッド)を実装したラックマウントマシン Nehalemのワークステーション。2台で自動車設計のシミュレーションをデモ Nehalemによる自動車設計(空力)のシミュレーション。左側には、32スレッド分のCPU負荷率のメーターが並ぶ。かつてスーパーコンピュータが必要だった処理をデスクトップマシンで行なうことが可能になり、設計時により多くのシミュレーションを行うことができるようになるため、設計精度を高めることが可能になる

Penlynから始まる命令セットの追加は、Sandy Bridgeでは、ベクトル処理幅を256bitにし、3オペランド命令を採用することになるという Larrabeeは、グラフィックス処理にIA命令セットを持ち込む。ただし、新規のベクトル演算機構が入り、そのための命令などが追加される

□Intelのホームページ(英文)
http://www.intel.com/
□IDFのホームページ(英文)
http://www.intel.com/idf/
□関連記事
【2007年4月18日】【IDF】パトリック・ゲルシンガー氏基調講演
http://pc.watch.impress.co.jp/docs/2007/0418/idf03.htm

(2008年4月3日)

[Reported by 塩田紳二 / Shinji Shioda]

【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp
お問い合わせに対して、個別にご回答はいたしません。

Copyright (c)2008 Impress Watch Corporation, an Impress Group company. All rights reserved.