ニュース

軽量OCR「NDLOCR-Lite Web」がスマホにも対応

 国立国会図書館のNDLラボは、GPU非搭載のPCでも利用できる軽量/高精度OCR「NDLOCR-Lite」を2月24日に公開し、その後Webに移植した「NDLOCR-Lite Web」も公開したが、このたびNDLOCR-Lite WebがiPhone、iPad、Android端末でも利用可能になった。

 NDLOCR-Liteは、GPU不要で、かつAIにより高精度に文字/段組み認識が可能なOCRソフト。2月24日に発表された後、26日にもWeb移植版を発表。Web版ではONNX Runtime-Webを利用しており、Webブラウザからローカルのリソースを使い、OCRの機能を使うことができた。

 ただ、NDLOCR-Lite Webは当初、スマートフォンやタブレットでの利用を考慮しておらず、デバイスによってはセットアップで処理が止まってしまうほか、カメラを選択して撮影して取り込むこともできなかった。

 今回、この不満を解消する形で、新たにモバイルデバイスに対応。動作させることができるようになっただけでなく、カメラもしくは写真ライブラリから、処理対象の画像を選択できるようになった。

 作成者である国立歴史民俗博物館研究部准教授の橋本雄太氏によると、NDLOCR-Lite WebではWebWorkerを使い、文字列認識を最大8スレッドで並列処理化し高速化を図っている。しかしAndroidのChromeでは動作していたが、iOSのSafariではメモリ制限が厳しいためクラッシュしていた。このためモバイル版ではマルチスレッド処理を諦め、できるだけメモリ使用を抑えるよう修正した。このためPC版と比較すると処理速度が遅くなる。