山田祥平のRe:config.sys

Web会議の双方向同時通信を支えるCom-Fi

 オンラインコミュニケーションはハイブリッドな働き方や暮らし方を支える重要なテクノロジーだ。そしてそのシステムを支えるのが、手元で使う各種のオーディオビジュアル関連のデバイスだ。音が拾えて再生できればそれでいいというわけではない。オーディオビジュアル的なハイファイとは別の意味でのコミュニケーションハイファイについて考えてみた。

人の話は最後まで聴く

 上りと下りの通信が同時にできないトランシーバでは、話し終わったところで「どうぞ」とか「オーバー」などと発話して話の終わりを相手に伝えることで送話を終え受話待機に入る。相手はそれをきっかけに送話を始める。工事中の道路と同じ交互片側通行だ。昔ながらの通信はそんなものだ。相手が話しているときには自分は聴く専門で話に割り込むことはできない。

 今はどうだろう。リアルにどこか一カ所に集まっている場合は、そこにいる人の全員が一度に話しても大丈夫だ。聖徳太子なみの聞き分ける能力が必要かもしれないが、全員の声が聞こえてそのすべてが耳に届く。

 電話での通話のような場合も同様で、基本的には相手の声が聞こえているときにもこちらの声は相手に届く仕組みになっている。

 その一方で、Web会議などのオンラインコミュニケーションではどうか。

 これについては使っているデバイスに依存する。そして、多くの場合、こちらが発話している時には、相手の声は聞こえないし、逆に相手がしゃべっているときに、こちらの声は相手に聞こえない。双方向の通信ではあっても同時ではないのだ。

 相手がしゃべっているのか、自分がしゃべっているのかは、システムとアプリによって常に検知されているので、「ちょっと待って」などと話に割り込むようなことはできる。普通、そう言われたら相手はいったん黙るだろう。黙ったところで発話の主導権はこちらがつかめる。

良質なオーディオビジュアルとコミュ-ファイ

 今どき、音声通信における上りと下りの帯域幅を気にするようなことはないので、会話が一方通行の切り替えになっているのには別の理由がある。主にハウリングの防止だ。こちらが発話しているときに、同時に相手の音声が聞こえると、相手に届いた自分の声が相手の元で再生され、それを相手のマイクが拾って送られてきて、それがこちらのスピーカーで再生され、さらにその音声をこちらのマイクが拾って相手に送るといったことが起こる。ややこしい循環だが、つまるところはその循環によってハウリングが起こる。多くの方は、キーンという耳をつんざくような音が出て驚いた経験があるんじゃないだろうか。

 Web会議にはマイクとスピーカーが必要だ。カメラも必要だが、画像と音声、どちらが重要かというと、コミュニケーションについては音声を優先したほうがメリットは大きい。音声が悪いと何もかもぶち壊しだ。

 マイクとスピーカーは、集音と再生という逆方向の機能を持つデバイスだが、この2者は密接に関係している。ハウリング防止のためには、この2者がうまく連携し、Microsoft TeamsやZoomといった会議システムの制御にしたがって、オン/オフを頻繁に切り替え、弊害をもたらす音声トラフィックが起こらないようになっている。さらに最近では、AIベースのノイズキャンセルなども注目されている。

 さらに、フルデュープレックス対応のインテリジェントなデバイスもある。今、手元にはTeams認定を受けた「Jabra Speak 750」と、Dell AIノイズキャンセリングスピーカーフォン SP3022」がある。

 この2つのデバイスはフルデュープレックス対応のMicrosoft Teams認定デバイスだ。ほかのデバイスとどこが違うかというと、自分がしゃべっているときに相手の声がミュートされない。無音にならないのだ。それでもハウリングは起こらない。なぜなら、こちらのマイクがスピーカーからの再生音を拾っても、デジタル処理によって、その音を打ち消してキャンセルし、送らないようになっているからだ。つまり、届いた音を送らない賢さがある。

 こうした仕組みを持つマイクつきスピーカーは、フルデュープレックス対応とか、全二重とか、あるいはエコーキャンセルスピーカーフォンなどという名称で呼ばれている。ただ、エコーキャンセル/ハウリングキャンセルの仕組みはそれぞれデバイスごとに異なっているため、相手の声をミュートせずにこちらの声が相手に届けられるかどうかは、入念に製品特徴を読まないとわからないし、読んでも分からないことが多いのはやっかいだ。

 もし、遅延が起こらない理想的な環境でこうしたシステムを使えばオンライン合奏だってできる。会話ではほとんど気にならないかもしれないが、音楽での遅延は致命的だ。それ以前に、合奏はソロ演奏ではないので、他者の演奏が聞こえなければ成り立たない。

 相手がバックで音楽を流し続けている時に、それを聞こえる状態のままで、こちらが発話できるというのは、とても自然なことだが、それができるWeb会議環境を得るには、デバイスの選定などでいろいろな工夫が必要だ。そして、今の時点では、ノートPCに内蔵されているスピーカーとマイクでは、それが難しい。余計なストレスを感じない対面会議に少しでも近いコミュニケーションを望むのであれば、同時双方向通信に対応した外付けのデバイスを選ぶようにしたい。

 早い話が、合奏ができるくらいに遅延が少ない双方向のコミュニケーションができれば、それだけでWeb会議で感じるストレスは激減し、コミュニケーションの質は格段に向上する。それをCom-Fi(コミュ-ファイ)と呼ぶことにしよう。知らなくて当然、とりあえず、今作った単語だ。

Web会議で誰もが紳士淑女であるために

 そもそもWeb会議のシステムは、その参加者がすべて紳士淑女であることが前提になっている。人がしゃべっている時にはしゃべらない。相手の話は最後まできく。自分がしゃべる時には発話の許可を求めるといった具合だ。

 だが、リアルなコミュニケーションではなかなかそれができない。意図せずに、そして悪意もないのに相手の発言を邪魔してしまうこともあるだろう。そんなアクシデントを回避するために、発言に臆病になっていると、せっかくのオンラインコミュニケーションが本来のパフォーマンスを発揮できない。会話に配慮という遅延が起こるからだ。フルデュープレックス対応デバイスなら、そんな弊害を抑制し、ハイブリッドな会議において、対面と遠隔という参加者同士の居場所による不公平を、多少は解消できるかもしれない。