ニュース
日本マイクロソフトら、双方向リアルタイム翻訳実現に向け協働を発表
~AI・機械学習を活用、2020年までにサービス提供を予定
2016年6月21日 18:46
国立大学法人豊橋技術科学大学、日本マイクロソフト株式会社、株式会社ブロードバンドタワーは、AI・機械学習を用いた多言語コミュニケーションの実現に向け、協働を開始することを発表した。
この三者による連携は、機械学習を利用したAIにより、日本語-他言語間のリアルタイム双方向翻訳を提供するために行なわれるもの。2020年に開催される東京オリンピック/パラリンピックで訪れる海外来訪者を対象に、2020年までにインターネット上のさまざまなサービスでリアルタイム翻訳を活用可能な状態にすることを目指す。
三者連携の概要は、豊橋技術科学大学が要素技術の開発、辞書作成/制限言語、サービスの管理運営、コミュニティ構築、社会に向けた窓口の役割を果たし、日本マイクロソフトは自社翻訳エンジンの改良、対訳データを活用した学習、システムの開発、ブロードバンドタワーはソフトウェア開発、応用分野へのビジネス展開をそれぞれ担う。
都内で開催された記者発表会には、豊橋技術科学大学副学長 原郁彦氏、日本マイクロソフト株式会社 執行役 CTO 榊原彰氏、株式会社ブロードバンドタワー代表取締役会長兼社長および株式会社エーアイスクエア取締役 藤原洋氏らが登壇。協働における各者の役割などを解説した。
登壇した原副学長は、今回の三者連携の目的は、三者のAIや機械学習、機械翻訳技術を持ち寄り、観光情報や滞在中に必要な医療/災害情報などをリアルタイムに多言語で提供する翻訳サービスシステムの提供を目指すことであると述べ、意義として、「三者がさまざまな業種/組織の協力を得てビッグデータの収集を行なうことで、翻訳サービスの品質向上、新サービスの提供など社会インフラへの高度な展開を期待できる」とした。
原副学長は、現状、機械翻訳は既に欧米言語間では実用レベルに達しており、グローバル企業での内部利用も進んでいるとしたが、日本語は他言語と構造が異なる点などから「リアルタイム翻訳は特に難しい」と述べ、日本語から他言語への機械翻訳は性能が低く、これが情報発信の大きな障壁になっていると指摘。
そこで、前述の問題点を解決するため、汎用の翻訳システムではなく、収集したデータを基にヘルスケアやツーリズム、ITなど、目的や分野に応じ最適化された機械翻訳を開発し、日本語からの機械翻訳を実用レベルまで高性能化するというアプローチを取るという。
例としては企業内のマニュアルなど、正確な対訳データを収集することで、高度な対訳コーパスを構築できる。しかし、そういった収集データの場合、企業秘密や個人のプライバシー情報などを含むため、配慮が必要となる。
豊橋技術科学大学は、分野選定とテキストデータ収集、固有名詞の自動認定/削除システムによるデータの匿名/非識別化、機械学習と分野毎の重要語句抽出と辞書化といった、安全なデータ活用によって対訳コーパスデータベースの構築を行なう。
原副学長は、データ収集の段階から、自治体や旅行関連団体などのサービス利用者と協力を目指していきたいと述べ、「非競争領域での協力により、競争領域での競争力強化に集中できることを実感して頂きたい」とした。
次いで登壇した榊原氏は、日本マイクロソフトはAI・機械学習テクノロジーと、データの安全な管理と活用のためのクラウド基盤「Microsoft Azure」を提供し、これにより高度なAI・機械学習によるデータ活用と、安全安心で拡張性の高いサービス提供を実現するとした。
同社はAzureを利用した人工知能を、Microsoft Cognitive ServicesとしてAPI経由でサービスを提供しており、榊原氏は、言語翻訳では日本語を含む50言語に対応しているとアピールした。
なお、今回の三者連携で得られる成果は(対訳コーパスであれば豊橋技術科学大が管理する)、Microsoft Translatorなどのコンシューマ向けサービスに組み込まれることはないが、得られた知見などを基に、独自に翻訳精度の向上などを行なうという。現在(Ver.3)は翻訳エンジンのみが提供されているが、Ver.4として音声認識、翻訳、会話分析、機械翻訳など入力から出力までサポートしたエンドツーエンドのサービスを提供する予定であると述べていた。
三者目のブロードバンドタワーは、IoT基盤となるサービス構築、AI・機械学習を活用した事業構築の為に設立された子会社エーアイスクエアを通じて、実際の社会インフラ、ビジネスへの導入を行なうという役割を果たす。
藤原氏は、インバウンドがもたらす経済効果に着目し、メディアなど国内の情報を発信していく基盤を作るといった利用を考えていると述べ、長い目で見れば、高度なAI技術による日本経済の産業構造の転換に繋がるとした。
エーアイスクエアでは、文章からテキスト解析で重要単語を抽出するシステムを既に開発しており、これと自動翻訳を組み合わせることで、日本についての外国語の投稿文などから、感想やレコメンドを抽出することが可能であるという。
デモンストレーションでは、多言語表示対応のWebページを例に、Azure経由で自動的に翻訳される様子や、Twitterからトレンドに関連する別ワードの抽出、文章から重要単語を抽出する様子などが披露された。