ニュース

Stability AI、日本語で画像を説明できるAIモデル

Japanese InstructBLIP Alpha

 Stability AIは、日本語向けの画像言語モデル「Japanese InstructBLIP Alpha」を公開した。入力した画像をテキストで説明したり、画像への質問にテキストで答えたりといったことが日本語で行なえる。なお、研究目的での利用に限定して公開している。

 Japanese InstructBLIP Alphaは、同社が10日に公開した日本語言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張し、画像ベースのテキスト生成などを可能にするAIモデル。日本語のテキストに対応するだけでなく、日本特有の建造物も正しく認識できる点が特徴となっている。画像に加え、テキストも同時に入力でき、入力された画像への質問に答えるといったこともできる。

 同社では、画像を用いた検索エンジン、情景説明や質疑応答のほか、目の見えない人に向けて画像を説明するといった用途でも活用できるとしている。

東京スカイツリーなど日本特有の建造物も認識可能
画像とともに質問を入力すると答えてくれる