ニュース

京大、アイヌ語の音声を自動認識/合成するAIを開発

 京都大学は、アイヌ語の音声の自動認識・合成を行なう人工知能の開発に成功したと発表した。

 北海道のアイヌ文化によるアイヌ語は2009年にUNESCOにより極めて深刻な消滅危機言語に認定され、口頭伝承を録音・記録する活動が行なわれてきたが、膨大な手間と知識が必要なため、保存記録が進んでいなかった。

 京都大学の研究グループは、アイヌ民族博物館などから提供された約40時間の民話の音声データを使い、音声を分析。音節を単位としたディープラーニングに基づく解析によって、94%の音素認識率と80%の単語認識率を実現した。これにより、1時間のデータに対して、人手で1日を要する作業がほぼ完全に自動化できた。

 新しい話者の認識率が大きく低下する問題もあったが、日本語モデルの転移学習に加えて、学習データをその話者の声質に合わせて変換する仕組みを使い、音素認識率を90%まで高めることに成功した。

 今後はこのアイヌ語では初となる音声認識・合成システムを使い、アイヌ語の保存記録の効率化を進めるとともに、アイヌ語の伝承や学習など、幅広い場面での応用が期待されるとしている。