ニュース

富士通、鬼気迫る感情も表現できる音声合成技術

~活動限界的警報にも好適?

利用例
3月31日 発表

 株式会社富士通研究所は31日、状況に応じたトーンで人工音声を合成できる技術を開発したと発表した。

 従来の音声合成技術は、話速、声の高低など単純な調整しかできず、伝えたい情報やイメージが十分に伝わらなかった。これに対して富士通研究所の新技術は、声質、イントネーション、間の取り方などの複数の特徴をうまく捉えたパラメータに変換して合成する方式を開発。これにより、緊急度に応じて警告感のあるトーンにしたり、騒音レベルに応じて通りやすい声に変えたりできるようになった。

 また、パラメータへの変換技術と、機械学習を用いたアルゴリズムにより、特徴を効率的に抽出できるため、元になる音声の収録が少量で済み、高品質で多彩な声を従来の約30分の1の期間で作成できるという。

 この技術を使って、各種音声サービスにおいて、親しみある声やキャラクターのような特徴的な声など、サービスイメージに適した声を利用できるとしており、アニメなどでおなじみの声優の声を利用し、状況に応じたトーン調整できるサービスなどにも期待がかかる。また、あらかじめ収録しておくことで、病気で声を失った人が合成音声で会話できるといった用途も想定されている。

 富士通研究所では2014年度中の実用化を目指す。

利用シーン
開発技術による合成音声(警告感:低、中、高、最高)

(若杉 紀彦)