ニュース

Microsoftの音声認識技術が人間の能力を超える

~次なる目標は機械による言葉の意味の理解

Microsoftの研究チーム

 米Microsoftは18日(現地時間)、同社の人工知能研究チームが開発したシステムによる音声認識技術の精度が人間を超えたと発表した。

 Microsoftは、「Computational Network Toolkit」(CNTK)という名称の深層学習(ディープラーニング)システムを開発し、GitHubにてオープンソースライセンスで公開している。今回のシステムもこれを利用したもので、先月まで6.3%だった単語誤認率を5.9%にまで引き下げ、機械による音声認識の記録を更新するとともに、人間のプロの筆写家の精度を超えた。

 Microsoftは、この成果をCortanaの機能向上などに展開していくとしているが、今後は、騒音がある環境下での認識精度向上、異なる話者に対して自動的に名前を付ける機能、訛りのある発音への対応などの拡張を行なうほか、単に聞き取るだけでなく、その言葉の持つ意味を理解するステージへと研究を進めていくとしている。

 なお、同じ週にMicrosoftの別のチームは、コンピュータビジョンに関するCOCO画像分割チャレンジにおいて優勝している。