ニュース

富士通、GPUを活用し人間の脳を模した人工知能型手書き文字認識技術を開発

8月21日 発表

 富士通研究開発中心有限公司と株式会社富士通研究所は21日、GPUを活用し、人間の脳の働きを模した人工知能技術による業界最高精度の手書き文字認識技術を開発したと発表した。

 従来の手書き文字認識技術は、文字を構成する線の方向や数を特徴として捉えることで認識しているが、これでは変形の大きな文字を認識できなかったり、精度を高めるための学習に時間を要するという課題があった。

 今回富士通が開発した技術は、人間の脳細胞のように、階層的に連なるモデルを採用。まず、第1階層で文字の単純な特徴を、続いて第2階層で複雑な特徴を捉え、どの特徴に反応したかの学習結果が文字ごとに蓄積。認識の際は、やはり階層的に特徴を抽出し、文字の特定を行なう。

 富士通では、各階層間を繋ぐ結線数を7階層で約280万と、一般的に用いられる数の約7倍にまで増やすことで認識精度を高めた。結線数が増えると学習に時間がかかるが、この技術ではGPUによる並列処理を行なうことで、従来約4カ月かかっていた学習時間を約17分の1の約1週間に短縮することに成功した。

 これにより、文書画像処理の国際会議「ICDAR 2013」主催の手書き文字(中国語)認識コンテストで、過去最高となる94.8%の文字認識精度を達成し、1位となった。この技術は、日本語にも適用可能で、詳細は8月25日から米国で開催されるICDAR 2013で発表される。

(若杉 紀彦)