たいていの大手家電メーカーにとって“圧倒的な高音質”化は、あまり優先順位の高い仕事ではない。'80年代の技術であるCDがいまだに主流であり、CD以降もMD、iPodと続く道のりは、多くの大衆にとって“音質”が製品を選ぶ上で大きな要素ではないことを示している。製品を企画、販売する側にとって、音質は“そこそこ整ったものであればいい”ものだ。 “多くのユーザーは良い音なんてわからない”という、大きな誤解があることや、オーディオ業界が音質のみを追求しすぎ、利便性にもっと目を向けられなかったことなど、現状に至った色々と原因はあるだろう。しかし良い音を感じる能力は、言われるほどに個人による違いはない。要は良い音を知っているか、それとも知らないか。それだけの差でしかないことが多い。
と、それはともかく、音質がさほど重要視されていなかったのは、ゲームを中心としたエンターテイメントマシンであるPLAYSTATION 3でも同じである。PS3のプロジェクト全体からすれば、“SACD再生をサポートする”なんてことも、実は忘れ去られるほどの小さな存在だった。 「あぁ、そういえばSACDも再生できるようになるんだよな」と、ゲームやBD再生といったPS3の中心機能にばかり注意がいく社内環境の中で、SACDの開発チームは陽の当たらない道を歩んでいたのである。 ところが、その忘れ去られたSACDプロジェクトは、意外にも大きな成果を出した。HDMIから出力されるSACDの音が、高級SACDプレーヤーでの再生にも勝る品質になってしまったのである。 ●“実時間の6倍”から作り直したSACD再生機能 現在も欧州を中心に高音質タイトルがリリースされているSACDだが、音楽市場全体からすれば小さい市場だ。CDとSACDの同時両対応が可能なハイブリッドディスク技術もありながら、いまだにマイナーな存在ではある。そもそもPS3でサポートしようと思ったのはなぜなのだろうか? 【お詫びと訂正】初出時、全世界800タイトル以上のコンテンツがリリースとしておりましたが、誤りでした。お詫びして訂正いたします。 ソニー・コンピュータエンターテインメント(SCE) 設計生産本部副本部長の伊藤雅康氏は「ソニーがAVの会社ということもあり、実はPSXの時点から再生させようというアイディアはありました。しかしPSXではソフトウェアデコードはとてもできない。しかし、今回は能力的に可能であることが、あらかじめ予想できていましたから、早い段階から取り組んでいました」と話す。 しかし、実際には今年に入った段階でも、SACDデコーダは実時間の6倍をかけなければ、サラウンドのDSD記録の音声をPCMに変換できていなかった。 SACDを含め、オーディオCODECやプレーヤーソフトウェアの開発を担当していたソフトウェアプラットフォーム開発部2課のマネジメントを行なっていた縣秀征課長は「このままではとても完成しない」と判断。ソニー本社でVAIOシリーズ向けソフトウェアをともに開発していた石塚健作氏がPS3のソフトウェア開発でSCEに出向してきた直後に「SACD再生CODECを完成させてくれ」と、開発を託した。
ところが、SACD、DVD、BDの再生プレーヤーのソフトウェアアーキテクチャを設計した同課チーフの村田乾氏ともども、オーディオ用のコードを書くのは、まったく初めてのことだった。
“たかだか音楽再生”と思うかもしれないが、実はSACD再生は汎用プロセッサにとって、非常に負荷の大きな処理なのだという。「SACDはDSDデータを圧縮した、DSTというデータで保存されています。ところが、DSTは圧縮率を高めるため、1/75秒ごとに複数の異なる圧縮方式が採用可能で、パラメータももちろん可変。まずはパケットがどのように圧縮しているかを判別し、圧縮方式の切り替え時に適切な処理を行なわなければなりません。この組み合わせが膨大で、処理負荷も高いため、Cellをもってしても最初は遅く、実時間の6倍もデコード時間がかかったんです(村田氏)」 石塚氏はSACDの仕様を何度も読み返しながら、最初の2カ月でリアルタイム処理にまで高速化を行なった。そして勘所を押さえた上で、その遅いソースコードを捨ててしまったのである。スクラッチから書き直すためだ。 ●ソニー社内のオーディオノウハウをかき集め 勘所をつかんだ石塚氏は、完全にゼロからソースコードを書き直し、トータル3週間ほどで高速なSACD CODECを書いた。DSTデータの伸長処理にCellが7個持つSPEを3個、DSDからPCMデータへの変換に2個。合計5個ものSPEを使うことでデコード可能になったのである。
「私はSCEに来るまで、Cellのプログラムを組んだことがありませんでした。それまではVAIO向けにPentium上でプログラムしていたんです。Pentiumは、どこをどうすれば、どれぐらい速くなるかがあらかじめ読めますし、パフォーマンスが上がる幅も予想できます。ところがCellは試行錯誤を繰り返していると、予想外にものすごく高速化したり、逆に予想外に遅くなったりする。この動きがパズルのようで、プログラムを書いていて面白くてしかたがなかった。処理シーケンスをちょっと変えるだけでパフォーマンスが上がるので、まだまだ余力はあります」と石塚氏。 すでに十分なパフォーマンスを持つようになったSACDコーデックだが「ここから先は“チャレンジ”であって、必要な性能は出せました。が、これからもチャレンジしたいですね。まだまだ出来ることがありますから(石塚氏)」 もっとも、高速化が達成できたら、即、音が良かったのかというと、これから先が長かった。何しろDSDというデータ形式(2.7MHzで1bitの信号を並べ、波形を表現する手法)をPCMに変換するために、どうすればいいのか。そこから勉強し直さなければならなかったからだ。 「最初は想定しない色々な音が出てきました。サイン波をデコードしているはずなのに方形波が出たり、ノイズだらけで聴けたものじゃなかったり。処理の方法が間違っていたのだけど、1bit信号というのは、少しぐらい間違えても波形が少し歪む程度で、全く音にならないわけじゃない。だからバグを探すのが大変だった(村田氏)」 2.7MHzの1bit信号を88.2kHzのPCMに変換するデシメーションフィルタ処理をかけるだけ、といっても、やり方が全くわからない。PCMからPCMへのデシメーション例はたくさんあるが、DSDからPCMというと参考書になる資料もほとんど無かったようだ。 ここで頼りになったのが、ソニーのプロオーディオ機器開発部隊だった。石塚氏は「考え得る限り、思いつく限り、ソニーグループ内の人脈を追いかけて、DSDについて知っている人を手繰り寄せて話を聞いた」と振り返る。 DSD技術は、もともとソニーのプロオーディオ機器部隊が、スタジオ録音用システム向けに開発したフォーマットである。そのフォーマットを、そのままディスクに焼き込んでしまったのがSACDだ。だから、ソニー社内でもっとも音が良いと言われるDSD処理のアルゴリズムをもらってこれた。 プロオーディオ用のDSD-PCM変換をCellに移植したものの、そこにはバグが潜んでいる可能性がある。実は3~4カ月でDSTの伸長処理、DSDからPCMの変換までの処理をほぼ完成させた石塚氏だが、その後はデバッグに半年をかけた。 前述したように、異なる圧縮パターンの組み合わせが多数あるため、とにかく色々な音を聴いてみないと、バグ出しができないからだ。「世の中で発売されているSACDの1/3ぐらいは聴いています。レーベルごとに圧縮にクセがあるので、とりあえずすべてのレーベルを聴いてみないと再生できるかどうかがわからない(石塚氏)」 しかし、このデバッグを終えても、まだ開発は終わらなかった。ここからさらに、音質を高めるための努力を継続したためだ。 ●12月新ファームウェアでダイナミックレンジ170dBに ほぼバグが取り終えた頃、今度はソニー本社オーディオ事業部でアンプやCDプレーヤの設計に携わってきた音質評価とチューニングのスペシャリスト金井隆氏が、PS3の試作機と新設計のAVアンプTA-DA3200ESの組み合わせで音をチェックし始めたからだ。 “これは音がいい”と潜在力を確認した金井氏は、すぐにSCEに連絡して、デジタル処理の変更すべきポイントを指摘していった。この段階で、かなり高い完成度が得られたようだ。「実はDSDの技術者に、すべてソフトウェアでやると話したら、“デジタル領域で140dB以上のS/N比が出れば合格かな”と言われていました(石塚氏)」という。 実はこの頃のPS3からのSACD音声を、筆者は金井氏、それにSCE社長兼CEOの久夛良木健氏と一緒に確認したことがある。確かに素晴らしい、細かなニュアンスが失われていない情感溢れる音だった。それまでに聴いたSACDプレーヤーの、どれとも異なる細やかな質感表現である。全く音が良いなどと想像していなかったPS3から出てきた音だからこそ、よけいに高音質に聞こえたのかもしれないが、ハッキリ言えるのは、とても5万円の製品から出てくる音ではないということだ。 この時点(10月初旬)でのダイナミックレンジは140数dB。目標とされた数値に近い。しかし、現在のファームウェア(Ver.1.10)の音は、これに多少の改良を加えたものである。 しかし先週の金曜日のこと。その日は、AV誌の企画で久夛良木氏とSACDやBDの再生品質や、将来的な取り組みについて対談する予定になっていたのだが、そこに持ち込まれたSACDデコーダとデシメーションフィルタは、少し……ではなく、大幅に改善されたものだったのである。 現在のSACDデコーダ・デシメーションフィルタは、24bit/88.2kHzで出力されているが、新バージョンは24bit/176.4kHzとなる。元々、これぐらいの分解能はDSDに備わっているのである。加えてデシメーションフィルタの内部処理形式である64bit浮動小数点データを出力形式に丸める際、24bitではなく30~29bit相当の情報を載せるように改良したという。ディザ処理に似た手法で低域は30~29bitの情報をたたみ込む処理をリアルタイムで行った。 さて、ここまで高品質になって来れば、以前のバージョンが良いか、新しいバージョンが良いかは、好みによって意見が分かれるかも知れない...と思っていたのだが、明らかに新バージョンの方がいい。現金なものだが、現行バージョンの音が“悪く”聞こえるほど。
質感だけでなく、音数が増えて今まで聞こえなかった音が聞こえてくるようになったのだ。加えて、サンプリング周波数が高くなると感じることが多い、線の細さ、中域の厚みのなさが感じられず、音場を支配する空気感が自然に漂ってくる。このときのダイナミックレンジは、デジタル領域での数値とはいえ170dB以上にまで達しているというから驚きだ。30bit相当時の理論値が約180dB。これ以上の情報量は望めない。 わずか1カ月あまりで大きく進化した新ファームウェアは、BDリモコンが発売される12月7日に、BDリモコン対応ファームウェアとともにインターネットからダウンロード可能になる。今までの音楽プレーヤーには無かったことだ。 ●万人が喜ぶCDの高音質化は? SACD再生の音が良くなった理由は何だったのか? それはサンプリング周波数や分解能だけの問題ではない。スペックだけでは音は良くならないからだ。デジタル処理の中で出るノイズに対し、どのように対処していくのか。そして、デジタル処理で必ず出る演算誤差にどのように対応していくのか。 石塚氏自身は「おそらく通常、32bit浮動小数点で組まれるプログラムを64bit浮動小数点で行なったためだと思います。確信があったわけではありません。しかし、考えられる限り、あらゆる手段で音が悪くならないようにするために、Cellで処理可能なもっとも高精度なデータフォーマットを使うべきと考えたんです」と自己分析する。 よく知られているように、Cellはスパコンクラスと言われる32bit浮動小数点演算の速度に比べ、倍精度の64bit演算ではその6分の1のパフォーマンスしか出ない。加えてSIMD演算時にはデータ長が長いため同時に演算できる数が半分になる。トータル12分の1のパフォーマンス(それでも高速ではあるが)にしかならない。当然、32bitで演算する方がプログラムは楽に書ける。 しかし、遠回りしてギリギリのパフォーマンスチューニングを行なってでも、デコードの精度を重視した。その愚直なまでのまじめな作りが、誰も想像もしなかった高音質を生み出したのだ。 では、これだけの“コダワリ”を、もっとも多く流通するCD再生にも活かして欲しいものだ。光デジタル出力は、規格上、24bit/48kHzまでしか出力できないが、HDMI経由ならば2倍、4倍のオーバーサンプリング出力が可能になる。 「アップサンプリングだけならば、FIRフィルタを書けばすぐに実現可能です。しかし、もう少し時間がかかりそうです」 そう石塚氏が言葉を濁すのは、FIRフィルタでアップサンプリングする際の伝達関数の選び方や、アップサンプリング後のノイズシェイピングの処理方法いかんによって、音質が大きく変化するためだ。市販の高級CDプレーヤーでも、ノイズを潰す部分の手法によって音質が大きく変わる。 もう少し時間がかかるというのは、ノイズ処理の手法を試行錯誤しながら、オーディオ事業部とも協力して良い音に仕上げていきたいという考えがあるからだ。しかし、SACDでの成果を見れば、これまでの民生機器にはない優れた結果を導き出せる可能性は十分に高いだろう。 誰もが注目されるとは考えていなかった日陰の道だが、しかしにわかに注目を集める機能になってきた。果たしてどこまで良い音に仕上がるのか。PS3のCD再生がどこまで進化できるかに、今後も注目したい。
□関連記事 (2006年11月22日) [Text by 本田雅一]
【PC Watchホームページ】
|