ニュース

Google翻訳は機械学習で文を理解しより自然で流暢に

~機械学習を活用した製品/取り組みを紹介

 グーグル株式会社は、Googleの機械学習を活用した製品や取り組みについての記者説明会を開催した。

 グーグル株式会社 製品開発本部長の徳生裕人氏は冒頭で、機械学習を組み込んだことで、声を認識し文章化して検索を行なう「音声検索」で、音声認識のエラー率が25%減少したとアピール。これは騒音環境下での数値で、騒音と人間の声の判別精度が向上しているという。是非パーティー会場など騒がしい環境で使ってみて欲しいとした。

 また、Googleの提供するサービスでは、Gmailのスパムフィルターに機械学習が使われている。現在では、全スパムの内99.9%をフィルタリングできるようになっており、非スパムメールの誤認識率も0.05%以下といったレベルになっているという。

グーグル株式会社 製品開発本部長 徳生裕人氏
機械学習
音声検索に活用
Gmailのスパムフィルターにも

 直近では、「Google翻訳」に機械学習を活用。これについては、同社シニアエンジニアリングマネージャーの賀沢秀人氏が登壇し、説明を行なった。

 Googleがなぜ翻訳サービスを重視しているのかという点について、賀沢氏は、インターネット上のコンテンツの50%は英語だが、英語が不自由なく読めるのは、多く見積もっても世界の全人口の20%程度であると述べ、「世界中の情報へ誰もがアクセスできるようにする」というGoogleの掲げる目標の達成に向け、重要なためと説明した。

 現在では、Google翻訳は毎日10億回以上利用されており、月間ユーザー数は5億人以上だという。対応言語は103で、オンラインで利用されている言語に限れば、99%に対応しているとした。

 今まで会話モードやAndroid上でのタップ翻訳、オフライン対応などの機能追加を行なってきたが、今回のニューラルネットに基づく機械翻訳の導入は、翻訳精度の改善という根本的なものだが、賀沢氏がGoogle翻訳に関わるようになって以来、飛び抜けて大きな成果だと述べた。

 従来のフレーズベース機械翻訳では、単語単位で分割して個別に翻訳し、結果を組み合わせて翻訳文を生成するが、ニューラル機械翻訳では、文全体を見て翻訳を行なう。具体的には、単語をベクトルに変換し、それに近いベクトルを持つ翻訳先の言語を参照し翻訳する。この際、前のベクトルが記憶されたまま翻訳されていくため、結果として文のコンテキストを把握し、より正確な訳語の候補を見つけられるほか、言語に合わせた語順の調整を行ない、文法的により自然な翻訳文を返せるようになったという。

 今回のニューラルネットワークによる翻訳では、対訳データそのものは以前の翻訳時と変わっていないとのことで、賀沢氏は、まだ人間が翻訳した結果には追いつけていないが、肉薄する結果を出せるようになったとアピールし、以前触ってみてイマイチだと離れてしまった人にも、是非使ってみて欲しいとした。

同社シニアエンジニアリングマネージャー 賀沢秀人氏
ネット上の半分は英語のコンテンツ
月間ユーザー数5億人
機能
ニューラルネットに基づく機械翻訳
翻訳精度の劇的な改善
従来との違い
翻訳プロセス
結果を比較すると一目瞭然

 Google翻訳のほか、スマートフォンアプリのGoogleフォトに追加された編集機能にも機械学習が使われているとのことで、徳生氏がデモンストレーションを披露した。

逆光の写真
自動補正で明暗などを修正
手動の微調整もできる
傾いた写真もワンタップで水平に
色味調整も海の色だけを鮮やかにしたりできる
フィルタ機能も搭載
調整可能

 11月に提供開始されたスマートフォンアプリの「PhotoScan」は、全世界で2兆枚あるという現像された写真を簡単にデジタルデータ化し、Googleフォトとの連携で管理を容易にするというもの。手順に沿って同じ写真を複数回スマートフォンで撮影すると、機械学習を活用し1枚の写真に合成してくれるという。異なる角度から撮影したデータを組み合わせることで、映り込みなどを除去した綺麗なデータを生成できる。

PhotoScan
世界には2兆枚の現像写真が
現像写真をカメラで撮影すると映り込みが激しい
PhotoScanでは複数回撮影した結果を合成
綺麗なデータを生成
Googleフォトで管理すれば、顔認識や物体認識、自動アルバム作成などの豊富な管理機能を使える

 また、同社では自社サービスで活用するだけでなく、Google Cloud Platform(GCP)にて、他社や個人にも機械学習サービスを提供している。

 Google Cloud Platform日本事業統括の塩入賢治氏は、「GCPでは、トレーニング済みの機械学習モデルをAPIとして提供しているもの、自社データでモデルを構築するためのクラウド機械学習の2つの機械学習に関するサービスを提供している」と述べ、APIでは文章翻訳のCloud Translate API、画像処理のCloud Vision API、音声を文章化するCloud Speech API、自然言語解析処理を行なうNatural Language APIの4つを提供していると説明。

 Cloud Translate APIでは、新たにプレミアムプランとしてニューラルネットワークによる翻訳も提供されるという。また、Googleの開発した機械学習演算用カスタムASIC「TPU(Tensor Processor Unit)」により演算に必用なコストが抑えられたことで、Cloud Vision APIの利用料金を最大で8割値下げしたことをアピールした。

 また、機械学習で多用される行列演算にCPUからGPUへ計算機の主体が移ったことを受け、GCPの仮想マシンでGPUインスタンスを提供。現在はアルファ版だが、2017年から一般提供を開始する予定だという。

同社Google Cloud Platform 日本事業統括 塩入賢治氏
Google Cloud Platform
Googleでは何かに役立つか不明なものも開発。絵画のタッチを写真に適用するStyle Transfer
動画にも使える
美術品を2つ選ぶと、徐々に変形していくように形の似ているものをサジェストするサービス
写真を撮ると歌いながら被写体を認識するサービス
お題を20秒で描き、ニューラルネットワークに認識させるゲーム
キーボードのお題は書きかけでもすぐ認識
トイレは天使として認識されてしまっていた