イベントレポート

【Inter BEE 2017】日本マイクロソフト、講演動画からAIが文字起こしや登壇者の認識までしてくれる「Video Indexer」

Video Indexer

 日本マイクロソフト株式会社は、千葉・幕張メッセで開催中の「国際放送機器展(Inter BEE 2017)」にてブースを出展し、サービスの紹介などを行なった。

 ブースではAzureを利用したパートナーのサービスなどが多数紹介されていたが、本稿ではMicrosoftの提供するAIを利用できるAPI「Cognitive Services」の1つである、「Video Indexer」のデモを紹介したい。

 Video Indexerは、5月に「Build 2017」で披露された、動画をクラウド上(Azure)の人工知能によって分析し、メタデータを抽出するというもの。

 機能としては、声の文字起こし、顔の追跡と識別、動画上の文字の認識、人間の発声の認識、キーワードの抽出などがあり、文字の翻訳も行なえる。また、発言内容がネガティブな内容かポジティブな内容かといった感情分析のような機能も備えているという。

 同社では、それらの機能を活用することで、講演映像をキーワードで検索して、そのキーワードが発言された時間にジャンプしたり、動画内容により即した広告を配信したりといった利用ができるとしている。

 Inter BEEのブースでは日本語の講演内容を文字起こししていたが、精度は完全ではないものの、意味を掴み取ることはできるレベルとなっていた。担当者によれば、英語であればより精度の高い認識が可能になっているという。

 実際にWebブラウザからプレビュー版のデモを体験できるので、興味のある諸兄は試してみてはいかがだろうか。

登壇者が米国の俳優であることを認識しているほか、講演内容からキーワードを抽出。その発言のあったタイミングへジャンプするといったこともできる