山田祥平のRe:config.sys
ほんやくコンニャク、生成AIがかなえるドラえもんの夢再び
2024年11月30日 06:16
AIの利活用シーンのうち、著しい進化を具体的に目の当たりにできるものの1つが、翻訳/通訳の分野だ。一般に、翻訳はテキスト相互、通訳は音声相互で異国語同士を置き換える。また、通訳には逐次と同時がある。生成AIの進化によって、これらの実用度が飛躍的に高まりつつある。
生命線のモバイルネットワークが必ず使えるとは限らない
メキシコにやってきた。初めての訪問だ。
旅行中のインターネット接続はドコモのahamoローミング頼りだ。容量も10月から30GBに増量されている。以前は、現地で各種のサービスを利用するのに訪問先国の電話番号が必要になることが多かったので、現地到着後、空港などで現地キャリアのSIMを調達するのが恒例だったが、今はもう、その必要性を感じることはあまりない。だからローミングに特別な料金がかからないahamoは実にリーズナブルだ。
正確には通話ができる電話番号さえあれば、それが日本のものでもいいのだが、タクシーアプリで配車して、その相手から居場所の問い合わせ電話などが入り、高額なローミング料金覚悟で応答しなければいけないといったリスクもあった。
だが、今は、一対一のコミュニケーションでは専用アプリやWhatsApp Messengerなどが使われることが多く、必要なのはインターネット接続のみで、データ通信さえできれば通話ができなくても支障がないため、現地電話番号をあまり必要としなくなっている。WhatsApp Messengerのサービスは電話番号をアカウントとして利用するので、相手のアカウントを登録して関連付けるといった手間もなく、キャリアネットワークとは関係なく、携帯電話番号でのコミュニケーションができる。
今回は、積極的に観光してみようと思い立っての旅行だ。出かける前にいろいろと情報を集めてみると、治安的に怖い話もたくさん出てきて躊躇もするのだが、長距離バスと国内航空便を組み合わせ、それで足りない部分をレンタカーで補うようにプランをたてて臨んだ。
計算外だったのは、あまりにも頻繁にモバイルネットワークが圏外になることだった。メキシコではahamoはTelcelやテレフォニカ傘下のMobisterなどのネットワークに接続する。ただ、ダメな場所はダメで総倒れだ。繁華街のようなところでも突然圏外になるのにも悩まされた。店舗での会話中に圏外になって往生したこともあった。また、接続は4Gがほとんどで、5Gでつながったことはなかったように思う。そして、米国方面はともかく、日本方面への接続ではその遅延も気になった。これについてはホテルのWi-Fiでも同様の傾向なので、ahamoのせいだけではないと思う。
レンタカーとして借りたクルマは、そのレンタカー業者が、その日初めてエンドユーザーに貸し出す新車だとスタッフに自慢されたりもしたわけだが、装備としてはカーナビがなかった。つまり生命線としてのモバイルネットワークが頻繁に切れつつのドライブを強いられた。あらかじめ地図をダウンロードしておいて、オフラインでナビゲーションできるようにするなどの対処が必要だ。ただ、市街地に入れば、普通の場所ではほぼ接続できたし、市街地から市街地への圏外圏移動は迷うことのないハイウェイ一本道だったので、それほど困ることはなかった。
だが、かなり名の知れた観光地でも頻繁に圏外になって不便を感じることは多かった。メキシコ観光といえばマヤ文明の象徴としての遺跡巡りがあるが、充実した観光にはインターネットが不可欠だ。とにかく目の前にある遺跡の解説を読みたい。そして、その充実を最大限にゲットしようと、今回は、私物に加え、各社にお願いして借り出し、いろいろと小道具を持参した。
ガイドの話す外国語説明を日本語で
まず、やってみたかったのは現地ツアーに参加し、ガイドが話す英語やスペイン語での観光案内をその場で日本語に訳し、内容を深く理解しようという試みだ。
メキシコではスペイン語が使われることが多いが、外国人向けには多くの場所で英語が通じる。観光ガイドもスペイン語と英語の両方を話すが、ガイドそのものは英語で行なわれることが多い。今回参加したツアーの1つは、ドイツ人、フランス人などを含む少人数のものだったことからガイドも英語をメインに使っていた。
まず、「Pixel 9 Pro XL」でGoogle翻訳を試す。日本で日常的に使っているメイン端末で、ahamoのeSIMもこのスマホに設定してある。それなりにちゃんとがんばって翻訳してくれるようだ。少なくとも遺跡に対して専門知識がない自分の英語力でガイドの言葉を理解するよりははるかにいい。リスニングモードに設定すれば、そのまま放置しても延々と相手の言葉を日本語の字幕として表示し続けてくれる。それを見ていれば、けっこう難解なガイドの解説も平気だ。
が、解説されている遺跡、ガイドの表情、スマホ画面を視線が行ったり来たりする。将来はきっと空間に字幕が表示されるとか、映画の吹き替えのようにイヤフォンで同時通訳音声が流れるような体験ができるようになるのだろう。
ただ、盲点があった。
スペイン語や日本語についてはインターネットに接続することなく翻訳ができるように、あらかじめ言語をダウンロードしておいたので、各国語のテキストを各国語に翻訳するのに不便はなかったのだが、圏外になると会話モードが使えなくなり、通常の翻訳も音声入力ができなくなってしまう。
だが、併用していた「Galaxy Z Flip6」でのGalaxyAI機能による通訳アプリを設定して使用する方法は頼もしかった。通知パネルのクイック設定ボタンで通訳機能を起動した上で言語を指定し、リスニングモードを実行すれば、マイクが拾った外国語をリアルタイムで日本語に翻訳して字幕表示してくれる。
今のところ、観光地のガイドなどは一方通行の同時通訳、しかも音声よりも文字での通訳が望ましい。そしてこちらがしゃべる日本語を外国語にして伝える必要はほとんどないのでリスニングモードが使いやすい。ただ、ちょっとした会話の時には会話モードも併用する。複雑な質問をしたい時以外、相手の言葉が理解できれば、イエスかノーで反応すればいいことがほとんどだが、質問したい時もある。このあたり、生成AIがうまく采配してくれるようになるまでにも、それほど時間はかからないのではないだろうか。
何よりも、Galaxy Z Flip6は圏外になってインターネット接続ができなくても期待した通りのことをオフラインで処理できる。いわゆるオンデバイスAIとして機能する。だから支障がまるでないのだ。この時代、世界中のほとんどの場所でインターネットに接続ができるものの、オンデバイス処理は心強い。また、乗り継ぎのために数時間しか滞在しない国でも、フリーWi-Fiなどに頼ることなく、ちょっとした通訳を頼れるのは心強い。
その場での一対一の対話ならポケトーク
旅行中、ちょっとしたトラブルもあった。宿泊したホテルのバスルームから異臭がただようので、ホテル側にクレームを入れた。メインテナンスマンが来てくれて処置してくれたのだが、どうやら芳香剤を使ってごまかしただけのようで、夜に部屋に戻った時にはまた異臭を感じる。フロントにそのことを伝えると、ハウスキーパーがやってきて、排水口などを丁寧に掃除してくれるのだが、やはり匂いは消えない。このホテルには2泊だけで、翌日にはチェックアウトだ。その時点ですで夜もふけている。別の部屋を用意できるかどうか確認するというが、その移動も面倒だ。何より、ホテル側の関係者はことごとく異臭を感じないというのには参った。
これらのコミュニケーションには、ポケトークが役に立った。AI通訳端末専用機のポケトークは10月に5年ぶりに新モデルとして「ポケトークS2」、ディスプレイサイズの大きな「ポケトークS2 Plus」が発表されている。あらかじめ選んだ2言語を自動判別して通訳するようになった。
重量は画面サイズ2.8型の無印機が75g、3.97型のPlusが125gと、専用機だけあって圧倒的な軽さだ。バッテリ運用で1週間程度の待機運用をキープできる、はずだ。はずというのは、電源を入れた状態でポケットに忍ばせておくのだが、使おうと思って取り出すと、画面がオンになってしまっていてバッテリを消費しつくし、ほどなくシャットダウンされてしまうという状況に何度も遭遇したからだ。本体を物理的にロックする機能がないので誤動作してしまうことが少なくないようだ。起動にもそれなりに時間がかかるので、使い終わったらシャットダウンしておくといった自衛策もとれない。できるのは無操作時スリープの設定くらいだ。
製品には専用のeSIMが内蔵され170以上の国に対応する。個人用製品の場合は2年間の通信費が含まれていて、この端末での利用は無制限だ。データ通信容量を気にせず、通訳処理ができる。また、2年後も延長契約が可能だ。いわば通訳のサブスクといったところか。スマホのテザリングやフリーWi-Fiのインターネット接続を頼ることなく、通訳処理ができる。ただし多少の遅延は覚悟が必要だ。
なにしろ専用機だ。必要なのはボタンを押して話すだけ。それだけで逐次通訳がかなう。騒がしいところで相手に通訳結果を聞かせるための音量も十分なボリュームだ。プライベートツアーに参加するときにはガイドにインタビューするように使って案内を逐次通訳するのにも役立った。1対1での異国語コミュニケーションに限定するならスマホのアプリよりもずっと使いやすいと思う。だが、このデバイスも圏外には勝てない……。
オンデバイスAI、意外に身近なところでのニーズがありそうだ。