ニュース
画像や数式、多言語も対応できるOCR「Mistral OCR」
2025年3月7日 13:21
フランスのAIスタートアップ企業Mistral AIは6日(現地時間)、複雑な文書を高速かつ正確に解析できる新しい光学式文字認識(OCR)「Mistral OCR」をリリースした。同社のチャットプラットフォーム「Le Chat」に統合済みで無料で試せるほか、APIとしても提供される。
画像/表/数式などが混在するドキュメントから、テキストだけでなく図版情報も抽出してマークダウン形式で出力可能なほか、多言語の文書にも対応し、幅広いスクリプトやフォントの解析が可能。ベンチマーク結果によれば、既存の主なOCRモデルを上回る精度を示した(ただし、日本語は含まれていない)。
また、1ノードにおいて1分あたり最大2,000ページを高速処理も可能な点も特徴。出力形式はテキストだけでなく、JSONなどの構造化データにも対応し、ドキュメントそのものをプロンプトとして利用できる機能が用意されている。さらに、機密性の高い情報を扱う組織向けに、オンプレミス導入のオプションも提供予定。