ニュース

Googleが聴覚障碍者向けに提供するAndroidの2つのAI機能

劉尭

2019年8月21日 16:25

Androidに提供される聴覚障碍者向けのさまざまな機能

　Googleは21日、都内で記者会見を開催し、来日したAndroid アクセシビリティプロダクトマネージャーのブライアン・ケムラー氏が、この1年半のあいだのアクセシビリティ機能に関する取り組みについて解説した。

　同社は、従来より掲げているミッションの1つに「情報を整理し、世界中のあらゆる人がアクセスできるようにする」ことを挙げているが、そのためにはアクセシビリティを向上させていかなければならないとする。

　そしてこれまで、同社は「選択して読み上げ」、「TalkBack」といった視覚障碍者向けの機能、そして「スイッチアクセス」や「ユーザー補助機能メニュー」といった運動機能に障碍を持つ人向けの機能を実装してきた。

　一方で、聴覚障碍を持つ人は4億6,600万人、つまり15人に1人の割合で存在し、世界人口で言えば、中国とインドに次ぐ数にものぼるのだという。そのためGoogleでは、この聴覚障碍をもつ人々向けに、Androidのアクセシビリティの改善を過去1年半のあいだで取り組んできたという。

ブライアン・ケムラー氏

情報を整理し、世界中のあらゆる人がアクセスできるようにするGoogleのミッション

これまで提供してきたアクセシビリティ機能

全世界の聴覚障碍者の数

　聴覚障碍に対するアクセシビリティについて、同社は2つのアプローチで取り組んでいる。1つ目が「Captions(字幕)」、もう1つが「Amplification(増幅)」だ。

聴覚障碍向けのアクセシビリティ機能には2つのアプローチがある

　字幕について、2月に投入した「音声文字変換」アプリが読者の記憶に新しいところだろう。これは人が喋っている声を文字に変換するものだが、6月のアップデートで、環境音も表示するようになった。例えば拍手が起きているさいは画面の下側に「拍手」、口笛を吹いているさいは「口笛」と表示されるものとなっている。

　この音声文字変換のアプリは、実際にGoogle社員の小林育未氏も活用している。同氏は9歳の頃に聴覚障碍を患った。Google入社後、会議に参加しても、周囲の意見がよく聞き取れず、困ることがあった。しかし音声文字変換を使いはじめたところ、別の社員の意見をスムーズに理解できるようになり、「当たり前のように会議ができる喜び」を体験したという。

　小林氏は「会議で複数人いた場合、文字の色を分けるなど表示を改善してほしいという要望をすでにGoogle本社にフィードバックした」としており、今後さらなる機能改善に期待したいところだ。

　ちなみに音声文字変換のアプリは、人の声と環境音を分離し、人の声はクラウドに転送して文字を変換し、環境音はオンデバイスで認識させ処理しているとのことだった。なお、クラウドに転送した声のデータは文字変換処理にのみ使われ、処理を終えると破棄されるとしている。

音声文字変換のデモ。日本語を選択すれば、ケムラー氏のように訛りが入った日本語でも問題なく認識される

環境音はオンデバイス、言葉はクラウドで処理

Google社員の小林氏も音声文字変換機能を使っている

　もう1つは、Android端末で現在流れている音声を文字に変換する「Live Caption」機能。これは6月のGoogle I/Oで発表された機能で、年内に英語から実装予定となっている。こちらは音声文字変換とは異なり、すべてオンデバイスで処理が行なわれるとのこと。

　現在、音声文字変換の学習データは数百GBにものぼっており、オンデバイスで処理するには不適切であるが、データモデルのシュリンク技術は確立されているため、デバイスの容量増加、およびSoCの性能向上に伴い、すべてオンデバイスで処理するのが今後のトレンドになるだろうとケムラー氏は説明した。

2019年後半に提供予定のLive Caption機能。まずは英語からだ

　一方のAmplificationについては、まず補聴器との連携について、いまはストリーマーという特殊な装置を介してスマートフォンと補聴器を接続しているが、Android QではBluetooth LEを駆使した低電力な接続をサポートしていくとした。今後、補聴器メーカーとの共同開発により、補聴器そのものをBluetooth LEに対応させ、連携していくという。

既存の補聴器とAndroid端末と接続するさいは、ストリーマーと呼ばれる別の機器が必要で、持ち運びが不便だった

Bluetooth LE対応の補聴器では消費電力を抑えながらスマートフォンとペアリング可能

　補聴器を使わずに、スマートフォンで増幅を行なう「音声増幅」アプリも、2月より提供開始している。同アプリでは機械学習とAIにより、環境音と人の声を分離させ、人の声だけを増幅する。このためユーザーはヘッドフォンを用意すれば、補聴器代わりに使える。レストランやくつろいでいるときなど、補聴器を装着したくない、していない場合に有用なものだとした。

音声増幅のアプリ

　先述のとおり、同社は情報へのアクセスを容易にさせていくミッションを掲げているため、アクセシビリティに関するコミットメントは確固たるものだと言っていい。一人でも多くの人がより多くの情報にアクセスできるよう、同社は今後も継続的に取り組んでいくだろう。