[an error occurred while processing the directive]

NVISION08レポート

Emerging Companies Summit編その2
Elementalの超高速H.264エンコーダは9月登場ほか

Emerging Companies Summitの参加企業。約60社がNVIDIAの技術を活用した自社製品をアピールする

会期:8月25日~27日(現地時間)

会場:米国カリフォルニア州サンノゼダウンタウン



 さまざまなジャンルの開発者、ゲーマー、一般ユーザーなど、多様な人に向けたイベントが寄り合った形で展開されているNVISION。「Emerging Companies Summit」も、NVISIONで開催されている1つのイベントで、NVIDIAのビジュアルコンピューティング技術を利用して起業したり、活動を広げようとしているメーカーが参加するもの。

 ゲーム、ライフスタイル、CUDA/HPC、プロフェッショナルビジュアルコンピューティングの4つのトラックが並行して開催されており、終日、各メーカー製品をデモンストレーションする場が設けられている。このレポートでは、CUDA/HPCトラックの初日に登場したメーカーの一部をお伝えしたい。

●Badaboom Media Converterは9月発売

Elemental Technologiesの社長兼CEOのSamuel S. Blackman氏

 本誌でも何度かメーカー名、製品名が登場している、Elemental Technologiesの「Badaboom Media Converter」。GeForce 8以降のGPUを利用してH.264エンコードを非常に高速に行なうことができる動画エンコーダとして注目している人も多いかと思う。同イベントに参加したメーカーのなかでも、GPUコンピューティングを利用したソフトウェアを提供するところとしては知名度は高いほうである。そうした事情もあってか、同社はデモよりも、会社自体の紹介やビジョンなどを中心にスピーチを行なった。

 デモを行なった同社CEO、Sam Blackman氏はこのソフトウェアを開発した経緯を紹介。デスクトップPC、ラップトップPC、携帯電話、ポータブルプレイヤーなどで、さまざまなデバイスで動画を楽しむことができるようになっているが、各デバイスで液晶解像度などが異なるため、デバイスに合わせた動画コンテンツを、それぞれに作成しなければならない。それは個人ユーザーだけでなく、マルチプラットフォームに対応した動画配信サイトも同様の悩みを抱えることになる。

 しかし、CPUベースのPCでは動画エンコードが遅いし、エンコードに特化したハードウェアは非常に高価であることが問題だとし、このGPUによる動画エンコードの開発につながったとしている。GPUはどんなPCでも必要なものだから、コスト効率も良い点をアピールしている。

 同社はGPU動画エンコードとして、2つのソリューションを提供する予定だ。いずれも既報のものだが、1つはコンシューマユーザー向けのBadaboom Media Encoder、もう1つはプロフェッショナルビデオクリエイター向けのAdobe Priemereプラグイン「RapiHD Accelerator for Adobe Premiere Pro」である。

 前者については、すでにNVIDIAが提供しているGeForceパワーパックでベータ版が提供されているが、9月には正式に発売される予定になった。実は、本来は8月末に発売の予定だったのだが、ベータ版公開後に得られたユーザーからのフィードバックを反映してリリースするために少し延期されたという事情がある。

 Badaboom Media Converterは、30ドルの通常版と、100ドルのプロ版の2つが発売される。Pro版は高解像度に対応しているのと、解像度をユーザーがカスタマイズできるのが大きな違いだ。エンコードエンジン自体に違いはない。今回のイベントでは、iPodビデオの作成のほか、Apple TV用のHD動画のエンコードを実施。720p動画の作成を60fps近い速度で変換するデモが披露された。

 一方のAdobe Premiere用RapiHDについては、ダウンロード販売のほか、NVIDIAのQuadroにバンドルしての販売形態も検討されている。価格は未定で、販売時期は今年第4四半期が見込まれている。

 このほか、Blackman氏は、IPTVやインターネット動画サーバーへの展開についても言及。こうしたジャンルは10億ドルという巨大な市場になっており、RaidHDのサーバープラットフォーム版を投入して参入していくようだ。例えば、動画共有サイトではユーザーからアップロードされた動画を、必要に応じてエンコードしているわけだが、それをTeslaの1U版などを利用して安価に高速にエンコードしようというものだ。

 さらに、先述のマルチプラットフォームなWebサイトにおいては、現在、対象のプラットフォーム向けに別々の動画コンテンツを作成し、保管しているという。Blackman氏はこれをオフラインエンコードと呼んでいたが、GPUエンコーディングが普及すればベースとなる1つのコンテンツを用意して、利用者が視聴するさいに、そのデバイスに合わせてリアルタイムエンコードして配信することも可能になるかも知れないという未来を語った。


エンジンの仕組み。デコードとエンコードにおける離散コサイン変換、動き検索といった、MPEGエンコード/デコードの中核処理にGPUを使用している Badaboom Media Converterの2つのラインナップ。Pro版はHD対応が大きな特徴で、解像度指定などを行なってのエンコードも可能になる Badaboom Media Encoderの「Advancedモード」では、解像度やアスペクト比など、細かい指定が可能になった
720p動画のエンコードデモ。50fps以上の速度でエンコード処理を終えた RapiHD Accelerator for Adobe Premiere Proのデモ。エンコード中のCPU使用率が30%程度に抑えられていることをアピール。CPUはAMDのクアッドコアCPUとのこと RapiHDエンジンでさまざまなデバイスに適応できることを示したプレゼン。IPTV、インターネット動画サイトへの適用が次のステップとなる

●フェイストラッキングにもCUDAを活用

Seeing Machines CEOのNick Cerneaz氏

 Seeing Machinesのセッションでは、同社が展開しているフェイストラッキングAPI「faceAPI」の紹介が行なわれた。といっても、このセッションは、すでにフェイストラッキングにGPU処理を取り入れているという話ではなく、現在、GPU利用に向けて取り組んでいるというものであった。

 同社は2000年ごろからフェイストラッキング関連のアプリケーションを開発し、現在はfaceAPIという、APIをライセンス提供している。その機能は、単なる顔の検出に留まらず、3次元の移動を検出したり、顔のなかでも唇やまぶたなどのパーツの認識、さらには検出した顔情報から3Dモデルを作り出すこともできる状態になっている。もちろん、これはすべてリアルタイムに処理が行なわれ、通常のWebカメラや赤外線で得た情報を元に解析する。

同社のフェイストラッキングAPI「faceAPI」のデモ。Webカメラから入力した映像から顔とそのパーツを認識している さらに顔の動きも3次元で認識。写真は検出したX軸、Y軸、Z軸をグラフ化して表示したもの
自動車産業への活用例。赤外線センサーを使って顔やまぶたの動きを検出。居眠りなどを検知して警告を発する faceAPIのロードマップ。次期バージョンでGPU対応を行なう予定で、将来的にはトラッキングした情報から性別や年齢などを判別する機能も実現したいとしている

 このAPIの例として示されたのは、NVISION08のフォーカス範囲でもあるゲームと自動車への活用だ。ゲームでは、顔の動きによってキャラクターの視点を操作したり、視点のズーミングを行なう動きを示した。自動車関連の技術としては、車にドライバーの表情を取得する赤外線センサーを取り付け、まぶたの動きや頭の動きなどから居眠りや集中力の欠落を判断。音声による警告を発するという例が示されている。

 といっても、同社が目指すフェイストラッキング技術は現状の機能に留まらず、将来的には解析した画像から、その人の個性や性別、年齢、感情などを、リアルタイムに判断できるようになりたいとしている。

 そのために活用を検討されているのがGPUである。CPU処理からGPU処理にすることで10倍程度の性能向上が見込めるとのことで、現在、その最適化に向けてNVIDIAのサポートを受けつつ作業中で、まだデモをできる段階ではないそうだ。だが、次期バージョンとなるFaceAPI V4で、3Dモデリング機能の強化とともに実現したいとしている。

 まったくの別件ではあるが、フェイストラッキングにおけるCUDAの活用については、「Journal of Signal Processing Systems」で紹介されている論文にも高い効果が示されている。今後、GPUによるフェイストラッキング技術が進化すれば、想像もつかないようなアプリケーションが生み出されるかも知れない。

【動画】faceAPIのデモ動画。顔だけでなく、まぶたや唇などもはっきりとトラッキングできていることが分かる(wmv形式) 【動画】faceAPIのゲームへの応答。顔の動きを利用したUIの一種で、視点やズーミングなどを行なっている(wmv形式)

●布表現におけるCUDAの活用効果

OptiTexのEri Rubin氏

 アパレル関連のデザインツールを開発するOptiTexのセッションでは、同社のソフトウェアの機能にCUDAを適用した実例を紹介。その具体的なパフォーマンスも示された。

 OptiTexは布のパターンデザインを用いたデザインキットでは有名なソフトウェアメーカーで、著名なCADツールへのプラグインやEコマースサイトへの導入なども含めて展開し、世界でもトップ5のシェアを持つという。同社が得意とする布地のEコマースは非常にリターンの大きい業界である一方、ユーザーからの「イメージと違う」という反響も大きいことを問題点として提示。このクオリティ強化に取り組んでいる。

 同社のソリューションは、2Dの布地パターンから、3Dモデルを作り上げるのが面白いところで、作り上げられた3Dモデルの布を非常にリアルに表現できる。歩いたときの服やスカートの揺らめく様が演算によって再現されており、ちょうど昨日お伝えしたNurien Softwareのスカートのデモに近い。PhysXにも布シミュレーションのAPIが含まれるように、典型的な物理表現の1つであり、CUDAによって高い効果が得られるプログラムである。

同社のツールは、2Dの布地パターンから3Dモデルを作り上げることができる 利用デモ。2Dの布地パターンを用意し、人間の3Dモデルへ配置していく
すると自動的に服を着た人間の3Dモデルが作成される この3Dモデルをアニメーションにすると、布の動きなどがリアルに表現される。この表現の演算にCUDAを活用する

 今回のセッションでは、こうした同社のアプリケーションにCUDAを実装した場合のパフォーマンス変化についても、具体的な測定結果が示された。頂点の数や、粒度の細かさを上げても、性能が頭打ちすることなく伸び続けるのが印象的な結果だ。また、CPUでは粒度を高めることでPentium DよりもCore 2 Duoのほうが性能が悪くなることもあるとしており、そうしたボトルネックが発生せずに性能が得られる点もGPUを利用したときのアドバンテージとしている。

同社のソフトウェアにおける、CUDAとCPUの比較。CUDAの場合、グラフィック表現の要求を高めても、ボトルネックが発生していないために、どんどん性能を高めていくのが特徴

□NVISION08のホームページ(英文)
http://www.nvision2008.com/

(2008年8月28日)

[Reported by 多和田新也]

【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp
お問い合わせに対して、個別にご回答はいたしません。

Copyright (c)2008 Impress Watch Corporation, an Impress Group company. All rights reserved.