ニュース

170言語対応の「Mistral OCR 4」発表。領域分類も高精度に

 Mistral AIは6月23日(仏時間)、170言語やバウンディングボックス、ブロック分類などに対応した高性能OCR「OCR 4」を発表した。現在、API、Document AI(Mistral Studio、Amazon SageMaker、Microsoft Foundry内)から利用可能。

 OCR 4は170言語に対応したOCR。同社が12言語以上/600以上の実ドキュメントを用いたテストをしたところ、ほかのOCRシステムよりも高性能で、勝率は平均72%だった。特にほかのシステムがスコアを落とす原因となっている希少言語や低リソース言語において優秀な結果を示した。

 また、バウンディングボックスで位置を特定し、タイトル、表、数式、署名といった領域を分類し、インラインの信頼度スコアを付与できる。

ほかのOCRシステムとの比較